实习生破坏大模型训练，损失上千万美元？字节跳动回应

2024年10月19日 17:05 21综合

今日（10月19日），“字节跳动大模型训练被实习生攻击，涉事者已被辞退”的消息，冲上多个平台热搜。

10月18日，多个微信群流传一则消息：“某头部大厂的大模型训练被实习生入侵，注入了破坏代码，导致其训练成果不可靠，可能需要重新训练。据称遭到入侵的代码注入了8000多张卡，带来的损失可能超过千万美元。”

对此，19日下午，字节跳动发布《关于“实习生破坏大模型训练”的事实澄清》，称涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务，但并不影响商业化的正式项目及线上业务，也不涉及字节跳动大模型等其他业务。网传“涉及8000多卡、损失上千万美元”严重夸大。

字节跳动还称，经核实，涉事人一直在商业化技术团队实习，并没有AI Lab实习经历。其社交媒体个人简介及部分媒体报道有误。另外，该实习生已在8月被公司辞退。公司也将其行为同步给行业联盟和所在学校，交由校方处理。

面临安全管理问题

据红星资本局此前报道，近日有消息称，某头部大厂的大模型训练被实习生入侵，注入了破坏代码，导致其训练成果不可靠，可能需要重新训练。据称遭到入侵的代码注入了8000多张卡，带来的损失可能超过千万美元。

传言称，该实习生利用了HF（huggingface）的漏洞，在公司的共享模型里写入破坏代码，导致模型的训练效果忽高忽低，无法产生预期的训练效果。

知情人士告诉红星资本局，该大厂为字节跳动，“注入8000多张卡”“损失上千万美元”等描述不实，太过夸大；受影响的业务也不是豆包大模型，而是商业化技术团队的模型训练任务，影响了广告部门的一些业务进展，但不影响线上业务。目前，字节跳动已对该实习生采取了辞退处理，并将此事通报给相关行业联盟和该实习生所在的学校。

据了解，此事发生在今年6月，起因是该实习生对团队资源分配不满，故使用攻击代码破坏团队的模型训练任务。

实际上，大模型在安全性方面的问题已经受到业内高度关注。今年8月，中国信通院发文称，近年来，以大模型为核心的人工智能技术飞速发展，成为数字经济增长新动能。然而，作为新质生产力的大模型在安全性方面仍存在较多缺陷，这为其大规模落地应用带来了不确定性。近期，中国信通院发布的大模型安全基准AI Safety Benchmark的测试结果显示，大模型（尤其是开源大模型）在恶意诱导手段下的攻击成功率均较原始输入有明显提升。因此，对大模型进行安全对齐防护刻不容缓。

加码大模型应用

今年以来，作为头部互联网大厂，字节跳动正在加码大模型建设和应用。5月15日，字节跳动豆包大模型在火山引擎原动力大会上发布。火山引擎是字节跳动旗下云服务平台，火山引擎总裁谭待现场介绍，豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一，目前日均处理1200亿Tokens文本，生成3000万张图片。豆包主力模型在企业市场的定价只有0.0008元/千Tokens，0.8厘就能处理1500多个汉字，比行业便宜99.3%。

此后，各大厂的大模型开启大幅降价，价格战愈演愈烈。

今年8月，字节跳动火山引擎宣布推出对话式AI实时交互解决方案，搭载火山方舟大模型服务平台，通过火山引擎RTC实现语音数据的采集、处理和传输，并深度整合豆包·语音识别模型和豆包·语音合成模型，简化语音到文本和文本到语音的转换过程，提供智能对话和自然语言处理能力，帮助应用快速实现用户和云端大模型的实时语音通话。

近期，字节跳动还宣告进军AI视频生成。9月24日，字节跳动旗下火山引擎发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型，面向企业市场开启邀测。据火山引擎介绍，全新设计的扩散模型训练方法攻克了多镜头切换的一致性难题。据火山引擎披露，截至9月，豆包语言模型的日均tokens使用量超过1.3万亿，相比5月首次发布时猛增十倍。

10月15日，在2024火山引擎视频云技术大会上，火山引擎正式发布大模型训练视频预处理方案，该方案能够有效解决视频大模型训练的成本、质量和性能等方面的技术挑战，并已应用于豆包·视频生成模型中。

（来源：字节跳动、证券时报、红星资本局）

实习生破坏大模型训练，损失上千万美元？字节跳动回应

2024年10月19日 17:05 21综合

面临安全管理问题

相关新闻

热文排行

财经日历

数读

每日智库看点

关注我们

公告