被斯嘉丽约翰逊指控刻意模仿声线,OpenAI将停用一款声线

2024年05月22日 17:20   21世纪经济报道 21财经APP   冯恋阁

21世纪经济报道记者 冯恋阁 广州报道

11年前的科幻电影《Her》讲述了这样一个故事,男主角与拥有自主感受、思考、学习、决策的能力的人工智能助手萨曼莎频繁交流,最后深陷爱河。而近日OpenAI发布的GPT-4o似乎肯定了这种幻想成为现实的可能——在屏幕的另一端,AI真的能够感知人类情感,与人交流。

这代产品或许正是受到了《Her》的启发。在产品发布后,并未出现在发布会现场的Sam Altman发布了一条只有一个词的推文:“Her”。 

然而,“双向奔赴”背后却并不太平。近日,在《Her》中饰演萨曼莎的演员斯嘉丽约翰逊指控OpenAI新产品中的其中一个声音与她的声音太过相似,让她感到“震惊、愤怒和难以置信”。

各执一词

OpenAI的GPT-4o比上一代能力更强,在文本之外,还能够实时推理音频和视频。这一代产品不但能根据要求在其声音中添加情感,还可以通过观看用户脸部的自拍视频来推断一个人的情绪状态。在音频交互功能中,ChatGPT提供了Breeze、Cove、Ember、Juniper和Sky五种声音。 

被斯嘉丽点名并要求下架是“Sky”。她认为,Sky与《Her》中AI助手萨曼莎的声音非常相似。 

根据斯嘉丽发布的长文,去年9月,ChatGPT推出语音模式时,OpenAI曾找过她希望为其配音,但当时她由于个人原因拒绝了。而在今年5月的发布会前两天,OpenAI再次试图联系斯嘉丽合作,但并未成功。 

然而,在产品发布后,许多人都认为Sky与斯嘉丽在电影中的声音极其相似。因此,斯嘉丽认为,OpenAI可能是刻意找人模仿了她的声音。 

斯嘉丽在长文中表示,由于OpenAI的侵权行为,她已经通过法律顾问要求OpenAI详细说明“Sky”语音的创作流程。 

OpenAI坚称该声音来自另一位专业配音演员。“Sky的声音并不是在模仿斯嘉丽·约翰逊,而是属于一位不同的专业女演员,她使用的是自己自然的声音。”OpenAI在其回应博文中表示。不过,公司同时指出,出于“保护隐私”的原因,OpenAI不会进一步透露配音演员的姓名。 

在官网回应中,OpenAI披露了ChatGPT中5个配音的详细创作流程。OpenAI征集了400多名配音演员,从情感、声音特质等方面审核所有参与人员的作品,并最终做出选择。 

在去年6-7月期间,选中的配音演员在洛杉矶完成了录制。而9月时,被选中的5个声音已经发布到ChatGPT中。 

不过,由于斯嘉丽的指控,目前OpenAI已经暂停使用“Sky”模式的声音。“我们认为AI声音不应该刻意模仿名人独特的声音。”OpenAI在同一篇澄清博文中表示。 

截至目前,两方各执一词,还未有新的回应或诉讼举动。 

“总的来说,还是不能肆意地搭名人的‘顺风车’。”在上海大邦律师事务所高级合伙人游云庭看来,如果使用了和名人比较像的人的声音进行训练,又利用了名人演过的电影营销,有“擦边”之嫌。

并非孤例 

OpenAI近日又迎来一轮人事变动。除了首席科学家Ilya Sutskever,该公司超级对齐团队负责人Jan Leike也宣布离职。超级对齐团队在OpenAI的主要职能之一就是为AI风险把关,负责对研发的AI进行评估并监督。因此,这一团队变动也引发了业界对AI技术伴生风险的担忧。 

事实上,斯嘉丽这类对于AI“剽窃”声音的犹疑与指控可能并不是少数人的杞人忧天。 

日前,美国配音演员 Paul Lehrman 和 Linnea Sage指控AI 初创公司 Lovo 在未经自己许可的情况下,在 AI 配音技术中非法使用和销售他们的声音。针对这一行为,两位演员要求该公司赔偿500万美元。这起诉讼之外,他们还试图联合其他声音被窃取的人,发起集体诉讼。 

同样在5月,索尼向700多家全球科技公司、音乐平台发布“警告信”,要求它们不要在没有明确许可的情况下使用其作品训练AI。据媒体报道,谷歌、微软、OpenAI等AI大厂均在被警告之列。索尼还在之后发布单独声明,强调在未经授权的情况下,禁止将集团音乐作品(包括歌曲、歌词、唱片封面等)用于与AI相关的任何内容。 

在更早的2023年,10月,环球音乐等三家唱片公司集体起诉Anthropic侵权使用了音乐作品训练大模型,并索赔7500万美元。 

而在我国,目前司法实践中,针对AI服务中个人声音的合规使用已有相关判例。 

4月,北京互联网法院公开全国首例“AI声音侵权案”判决。在该案中,被告将原告配音师声音被AI化后出售。最终,法院认定被告侵权,并强调,对录音制品的授权并不意味着对声音AI化的授权,未经权利人许可,擅自使用或许可他人使用录音制品中的声音构成侵权。 

在游云庭看来,保障AI产业中个人权益不被侵害的关键在服务提供者和研发者:其一是使用他人声音肖像进行训练需要获得授权,其二是,生成的内容应当标注由人工智能生成。“此外,就我国目前法律规章来看,人工智能服务商具有对平台生成内容的审查义务。”他指出。

关注我们