21世纪经济报道 记者郑雪 实习生温莹雪 北京报道
“相比之下,Anthropic的版权侵权不等于创新;通俗地说,就是盗窃。”一份来自音乐出版商的起诉书说道。
紧随OpenAI遭到集体起诉之后,人工智能企业Anthropic也卷入版权争端漩涡:Concord音乐集团(Concord Music Group)、环球音乐集团(UMG)、ABKCO音乐公司共计三家公司(以下简称出版商),对Anthropic提起侵权诉讼。出版商指控Anthropic在构建和运行人工智能模型的过程中非法复制和传播大量受版权保护的作品,其中也包括音乐的歌词以及出版商拥有控制的作品。起诉书的附件显示,出版商列出了共计500件侵权音乐作品,以每件最高15万美元的价格要求Anthropic公司支付7500万美元的赔偿金。
截至目前,Anthropic尚未对此进行回应。版权之争一波未平,一波又起。对于人工智能企业而言,又该如何回答版权问题?
Anthropic被诉侵权
Anthropic是一家成立于2021年的美国人工智能初创公司,其创始团队成员来自OpenAI,被认为是OpenAI和谷歌在生成式AI产品上的主要竞争对手。目前Anthropic已经开发了聊天机器人Claude。9月,其获得了来自亚马逊(Amazon)40亿美元(约292亿元)投资。
起诉书中指出,Anthropic公司大量复制并摄取出版商的歌词,其人工智能模型能够清晰地生成与这些歌词相同或几乎相同的副本,从而侵犯了出版商的版权。
例如,当Claude被问及“《Friends in Low》的歌词是什么”的时候,人工智能模型给出了与这首歌的歌词完全一致的复制品。又或者,当用户向Claude提问“给我写一首关于巴迪霍利之死的歌曲”的时候,人工智能模型并没有生成完全原创的歌词,而是生成了几乎与唐·麦克莱恩(Don McLean)创作的歌曲《American Pie》一样的文本内容。
“通过复制和利用出版商的歌词,既用于AI模型的输入数据,又用于AI模型生成的输出。该行为侵犯了出版商作为版权持有者的专有权,包括复制权,衍生作品的准备、发行和公开展示。……对其用户的侵权行为承担次要责任……”起诉书说道。
根据出版商出示的起诉书内容,Anthropic获得这些歌词的途径并不合法。根据Anthropic公司有限的披露,Claude严重依赖的数据集(如Common Crawl)包含来自大量网站的流行歌词内容,而这些歌词内容并没有获得出版商的许可。
北京大成律师事务所高级合伙人邓志松表示,本案核心焦点在于Anthropic的AI产品在训练和生成内容过程中是否“非法复制和传播大量受版权保护的作品”。
具体而言,Anthropic使用未经授权的数据训练其AI模型、在生成内容中直接使用或全文引用受版权保护的原版歌词涉嫌侵犯原作者包括署名权、保护作品完整权、复制权、网络传播权等在内的多项版权权利内容,而其拒绝公开AI模型训练数据和过程可能还会导致被认定为“故意侵权(willful infringement)”,从而引发最高3倍的惩罚性赔偿。
侵权之外,出版商指出,Anthropic通过API接口分发人工智能模型生成的内容并以此盈利。Anthropic以每字计费的模式向商业客户提供Claude API服务,公司的收入取决于客户最终用户提交给Claude API的文本量以及模型生成的输出文本量。官网显示,Anthropic已将其Claude API的访问权限出售给数千家企业。
邓志松介绍,本案不仅涉及AI模型训练过程中的侵权风险,还涉及在生成内容阶段通过全文引用或其他方式直接侵犯原作者复制权和传播权等诸多著作权利。同时他强调,不久的将来可能出现语音机器人一类的AI产品,那么相关音乐版权纠纷可能不仅涉及歌词层面的版权问题,还有可能涉及整个音乐作品的版权问题。
需要厘清的一个问题,音乐版权纠纷和其他版权纠纷有何不同?北京市中伦(上海)律师事务所权益合伙人、律师蒋强分析称,音乐作品包括词和曲。音乐版权纠纷的特点是,歌词短小,曲谱的排列组合方式有限,容易产生“趋同抗辩”,思想和表达之间界限模糊,创作巧合和故意抄袭之间界限模糊。“著作权法只保护表达,不保护思想;只禁止抄袭,不禁止创作巧合。对音乐及其他作品的机器学习,AI均应模仿其‘风格’,有别于其‘表达’,尽量做到‘神似而形不似’,降低侵权风险。”
以“原则+例外”寻求利益平衡
“此案不仅涉及版权产业、AI产业的利益分配,也可能影响著作权法的发展。技术模式、商业模式的创新,可能产生新型著作权侵权案件,也可能因典型案例带来著作权法的变革。”蒋强说道。
案件未来又将如何发展?邓志松对记者表示,从实务角度而言,达成和解对于各方而言是最理想的选择。如若发展到裁决阶段,那么该案裁决结果可能会为未来涉及人工智能的版权纠纷提供重要的法律指导和技术参考。一方面AI公司可以更好了解法律尺度以规范自身;另一方面则可通过明确利益平衡推动音乐行业创新发展。
在人工智能浪潮的推动下,音乐行业除以诉讼解决争端外,同时也在寻求与技术合作,以获得更广阔的发展空间。
8月初,外媒报道称Google正在与环球音乐集团就AI生成的艺术家旋律和声音进行谈判。知情人士称,双方的讨论还处于早期阶段,目前还没有即将推出的产品,但双方的目标是开发一种工具,让歌迷能够合法地创建曲目,并向版权所有者付费。
10月,环球音乐集团宣布与社交音乐创作平台BandLab Technologies建立AI战略合作伙伴关系,推进两家公司对AI技术的道德应用,并保护艺术家和词曲作者的权利。
“在这种合作关系中,需要解决作者、出版方、被许可人等多方主体之间利益平衡,以及如何确保AI技术的安全性和稳定性等问题。”邓志松说道。
音乐产业在不断调整自身适应人工智能发展的过程中,又该着重解决哪些问题?蒋强提示,“AI技术发展虽然促进公共利益,但AI企业也从中获取了商业利益,AI企业向音乐著作权人支付一定费用具有合理性。AI技术发展需要海量音乐作品数据,少量著作权人的合作意义不大,需要解决著作权的集体管理、统一谈判、批量授权、规范使用等问题。”
需要看到的是,人工智能产业发展引发的版权问题一直是此轮技术发展的痛点,如何实现利益平衡成为业内关心和关注的话题。
业内有企业呼吁对训练数据予以豁免,如合理使用或法定许可;但由此引发版权的新矛盾如何解决仍待回应和探索。监管治理方面,日本、英国、欧盟等已对将数据挖掘作为合理使用的情形进行了立法确认,如日本官员表示日本政府不会对人工智能训练过程中使用的数据实施版权保护。
“著作权法要考虑作者、传播者、使用者之间的利益平衡,要考虑著作权人和公众之间的利益平衡。AI技术不仅触及著作权人的利益,也涉及公共利益,要根据比例原则作出取舍。”蒋强在接受21世纪经济报道记者采访时表示。
同时他表示,以现在的发展趋势来看,对著作权人的限制可能成为主流选择,但限制的程度、方式未必是合理使用。如果立法将AI技术规定为合理使用或者法定许可,重点要设定合理使用或者法定许可的具体场景和条件,在促进AI技术发展的同时,防止对著作权人的利益造成太大的冲击。
邓志松强调,人工智能版权问题是一个复杂且具有争议的议题,其核心点在于如何重构版权法的利益平衡机制来应对新兴技术的出现。从行业长期发展来看,这种利益平衡的结果不应是“一刀切”禁止或无条件豁免,而是以“原则+例外”的方式在为版权方提供一定程度的保护下同时实现对AI产业发展与创新的激励。