当ChatGPT“抄”走百科全书:不列颠百科全书起诉OpenAI,打响知识主权保卫战
在AI狂奔的时代,连《不列颠百科全书》——这本自1768年问世、见证过蒸汽机、电报与互联网诞生的“知识圣殿”——也终于按捺不住,拿起了法律武器。
本周五,这家拥有250多年历史的出版巨头,联合旗下权威词典品牌韦氏(Merriam-Webster),正式向美国纽约南区联邦地方法院提起诉讼,直指OpenAI:未经许可,大规模抓取并训练其受版权保护的内容,涉嫌系统性侵权。
这不是一场情绪化的抗议,而是一次有备而来的精准打击。诉状中明确指出:OpenAI在训练GPT系列模型过程中,非法复制了近10万篇《不列颠百科全书》在线条目、专题文章及韦氏词典定义——数量之巨,几乎覆盖其数字内容库的核心资产。
更令人警觉的是,这些“偷来”的知识,正以惊人的方式反向渗透回公众视野:
✅ ChatGPT在回答历史、科学或文化类问题时,曾多次生成与百科原文逐字一致甚至标点不差的段落;
✅ 用户在聊天框里一键获得“权威摘要”,便不再点击跳转至百科官网——结果?流量断崖式下滑,广告与订阅收入直接受损;
✅ 更棘手的是“幻觉归因”:当ChatGPT编造事实时,竟擅自署名“据《不列颠百科全书》”,把莫须有的错误结论,“嫁接”到百年品牌的公信力之上。
这已不只是版权问题,更是信任危机。原告援引《兰哈姆法案》(美国商标法核心),指控OpenAI构成虚假背书与声誉盗用——相当于让百科全书为AI的胡说八道“站台”。
值得注意的是,这并非孤立事件。早在去年,Britannica就曾起诉AI搜索公司Perplexity;而行业另一侧,Anthropic此前因使用盗版电子书训练模型,刚支付15亿美元和解金。法官在多起判例中已划出红线:AI训练的“变革性”不等于“豁免权”,未经许可的大规模复制,依然踩在侵权红线上。
对OpenAI们而言,这场官司撕开了长期回避的“黑盒”真相:你宣称的“公开网络数据训练”,是否真的尊重了“可抓取≠可商用”这一基本版权伦理?当《纽约时报》、美联社、Getty Images纷纷入局诉讼,传统知识生产者正从沉默的“原料供应商”,转身成为规则重定的博弈方。
知识不该被免费征用,权威也不该为幻觉买单。
这场官司不会立刻终结AI进化,但它或将首次在司法层面,为“谁拥有数字时代的知识主权”写下关键注脚——而答案,可能就藏在下一个庭审日的判决书里。
