艾瑞观察:“先侵权,后赔偿”的商业逻辑下,创作者的抗争改变了什么?

头条资讯
2026 03-24 14:59:01
分享

导语:3月13日,拥有250年历史的大英百科全书联合旗下韦氏词典指控OpenAI非法复制近10万篇百科文章和词典条目用于训练ChatGPT。

3月13日,拥有250年历史的大英百科全书联合旗下韦氏词典指控OpenAI非法复制近10万篇百科文章和词典条目用于训练ChatGPT。诉状指出,ChatGPT生成的回答有时"近乎逐字复制"原文,并通过生成内容摘要"蚕食"原本属于大英百科全书网站的流量,还在AI产生的"幻觉"中不当引用其品牌,误导公众认为错误内容获得了官方授权,损害其品牌声誉。

3月17日,OpenAI的竞争对手Anthropic也收到一份新的版权侵权诉讼,音乐版权管理公司BMG指控其未经授权使用贾斯汀・比伯、布鲁诺・马尔斯、爱莉安娜・格兰德等知名艺人的歌词训练其Claude大模型。

创作者的集体反抗

以上诉讼案例并非这两家科技巨头收到的版权侵权诉讼的全部,过去几年间,涉及AI训练数据侵权的案件数量急剧上升,受影响的创作者几乎涵盖全部内容创作领域。

文学领域的冲突由来已久。早在2023年12月,《纽约时报》就已经把OpenAI和微软一同告上法庭,指控它们未经授权使用其付费内容进行AI训练。2025年9月,Anthropic就因为一批作家的集体诉讼达成高达15亿美元的和解协议,作家们指控其用数十万本盗版图书来训练模型。

值得注意的是,看似天价的15亿美元即便是对当时的Anthropic而言也并非不可承受,达成和解协议的当月,该公司就完成了130亿美元融资,估值高达1830亿美元。对创作者而言,15亿美元平摊到每一部作品身上也只是3000美元,仅占美国版权法规定的每件故意侵权作品15万美元法定赔偿上限的2%,且在与出版商分成后作者实际所得更少。

因此这个天价和解方案也并未平息所有作家的愤怒。2025年12月,两届普利策奖得主、《坏血》作者约翰・卡雷鲁与另外五位作家选择退出Anthropic的15亿美元和解协议,分别对Anthropic、OpenAI、Google、Meta、xAI和Perplexity AI六家公司发起了新的个人著作权侵权诉讼。

作家们的集体抗议在2026年3月达到了一个新的高潮。数千名作家联合出版了一本名为《别偷这本书》(Don't Steal This Book)的特殊作品,参与者包括诺贝尔文学奖得主石黑一雄、畅销历史小说家菲利帕・格雷戈里以及犯罪小说作家理查德・奥斯曼等文坛重量级人物。这本书没有正文内容,只是列出了所有参与作家的姓名。3月10日开幕的伦敦书展上,这本书的拷贝被分发给参加书展的人士。书的封底写道:“英国政府绝不能为了使人工智能公司受益而将盗书行为合法化。”

在配音圈,最近中国的配音演员们正在经历一场艰难的集体维权。3月13日,国内知名配音工作室729声工场旗下20余位配音演员联合发布声明函,要求各方停止AI声音侵权行为。声明指出,各大平台上出现了大量未经授权采集其声音、生成高度相似AI音频的视频,这些行为已严重侵犯个人权益。知名配音演员季冠霖、边江等人相继公开发声,要求停止未经授权的AI仿声行为。

在影视领域,字节跳动因与迪士尼、派拉蒙等好莱坞巨头的版权纠纷而决定暂停其AI视频生成模型Seedance2.0的全球发布计划。与此同时,AI短剧引发的演员肖像权维权也在持续发生。3月20日,演员杨紫工作室发布声明,称某AI短剧未经授权使用AI换脸技术擅自使用杨紫肖像,已委托律师取证并将通过法律途径追究。同日,北京互联网法院就演员迪丽热巴诉某短剧AI换脸侵权案作出判决,认定短剧制作方使用深度合成技术生成与迪丽热巴高度相似的形象,侵害其肖像权。

先侵权,后赔偿的商业逻辑

面对大量的侵权指控,先侵权,后赔偿似乎成了大模型厂商们颇为成熟的应对逻辑。在模型竞赛的白热化阶段,时间和数据对大模型厂商的重要程度不言而喻,如果每一笔数据的使用都要先经过繁琐的授权谈判,模型训练的效率将大幅降低,企业可能在谈判桌上就被竞争对手淘汰。因此,许多厂商选择了一种“先斩后奏”的策略,直接抓取互联网上未经授权的公开数据进行训练。

当被告上法庭,AI公司普遍用“合理使用”抗辩,主张训练模型属于变革性使用,AI不会以原始形式再现作品,而是学习模式以生成新的独特输出。但版权持有方并不赞同,认为将整部作品复制到训练数据集已超出合理使用的范围,特别是当其被用于商业目的时。

即便AI公司败诉,他们付出的赔偿金也不过是商业成本的一部分。而只要模型足够强大,商业化变现带来的收益将远超版权赔偿。这样的模式之下,对AI公司而言,赔偿和和解费用已成为可量化的经营成本;对创作者而言,维权过程漫长且结果不确定,赔偿金额与其创作价值和市场损失相比往往不成比例。

协商或许是新的出路

版权争议的核心在于AI训练数据的获取方式与现有版权法律框架之间的张力。随着诉讼案件增加,司法判例的积累正在逐渐明确边界。2025年6月,美国北加利福尼亚地区法院在安德里亚・巴茨等三名作家对Anthropic的版权侵权诉讼中作出合理使用的裁决,将合法购买正版图书用于AI数据训练的行为定性为“高度转化性使用”,认为当AI数据训练过程对作品的使用并非旨在再现原作品的表达,而是将文本内容转化为模型参数,用于模型学习语言结构和语义关联时可以构成合理使用。2025年11月,德国慕尼黑第一地区法院在"GEMA诉OpenAI"案中作出欧洲首例明确认定AI训练侵权的判决,认定OpenAI在训练中"记忆"并可通过简单提示词再现歌词的行为构成复制与公开提供,不属于文本数据挖掘例外。

但司法裁决具有滞后性。如果AI公司希望避免陷入版权纠纷、同时平息创作者的抗议,协商或许是新的出路。

当前,行业内的协商与授权协议正在逐步增多。2025年9月,AI搜索引擎Perplexity宣布推出出版商收入分成计划,拿出4250万美元作为专项基金,向参与合作的媒体支付分成,成为首个提出直接分成模式的AI公司。2025年5月至7月,亚马逊与《纽约时报》、康泰纳仕、赫斯特等出版集团达成AI授权协议,允许其使用这些内容训练其AI模型与购物助手Rufus。2026年3月,新闻集团与Meta达成每年最高5000万美元的协议,Meta可在美国和英国地区使用新闻集团旗下《华尔街日报》等媒体的内容用于AI训练和输出。

对于创作者群体而言,尽管诉讼结果参差不齐、赔偿金额常不尽如人意,但其反抗的目的不在于阻止AI技术发展,而在于推动建立一种更可持续的商业模式,在这种模式下,技术发展和版权保护不必非要对立,完全可以通过市场和法律找到一个平衡点。


The End
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。