美国民事生成式AI, 大语言模型 (LLM)版权侵权, 市场稀释进行中
两作家Susana v. Apple苹果使用盗版“影子图书馆”训练AI案

两作家Susana v. Apple苹果使用盗版“影子图书馆”训练AI案

重要性评级
法院:加州北区地方法院
当事方:原告:Susana (两位作家); 被告:苹果公司 (Apple)

两位作家起诉苹果公司未经许可使用盗版“影子图书馆”训练其生成式AI模型Apple Intelligence,指控其侵犯版权并稀释原告作品的AI训练数据许可市场。

内容目录
AI 风险雷达

五维风险综合评估

版权风险
数据合规
平台责任
算法责任
隐私侵权

最高风险维度:版权风险

案情概述

本案于2025年10月9日由两位作家在加州北区地方法院提起,指控苹果公司未经许可从网上下载包含原告作品的“影子图书馆”,并将其用于训练其生成式AI模型Apple Intelligence。原告的核心论点在于,被告非法使用其版权作品训练模型,模型在训练过程中“记忆”(即拷贝)了原告作品,训练后的模型将轻易输出大量与原告作品相同或相似的生成物。鉴于目前AI训练数据许可市场规模庞大,模型生成的海量类似物将直接影响并稀释原告作品本可以获得的AI训练数据许可费用,而非传统意义上的图书销售或电子书许可收入。原告还强调,从盗版网站下载版权材料这一行为本身即已违反版权法,无论后续如何使用。本案借鉴了Kadrey v. Meta案和Bartz v. Anthropic案的经验,特别强调了市场稀释和盗版下载行为的侵权性质。

核心争议焦点

  • 1苹果公司未经许可从盗版“影子图书馆”下载并使用原告版权作品训练AI模型是否构成版权侵权
  • 2AI模型训练过程中对版权作品的“记忆”或“拷贝”是否构成侵权
  • 3AI模型输出与原告作品的相似性是否导致原告作品在AI训练数据许可市场的稀释
  • 4从盗版网站下载版权材料的行为本身是否构成侵权

双方观点

原告主张

原告主张苹果公司未经许可从网上下载包含原告作品的盗版“影子图书馆”,并将其用于训练生成式AI模型Apple Intelligence,此行为构成版权侵权。原告特别指出,AI训练数据许可市场规模巨大,苹果公司的非法行为直接影响并稀释了原告作品在该市场上的潜在许可收入。此外,原告认为从盗版网站下载文本的行为本身即已违反版权法,无论后续如何使用这些训练数据。

关键证据

原告的事实举证部分集中在:Apple从网上下载了盗版影子图书馆,其中包括原告作品,并将下载的影子图书馆用于训练自己的生成式AI模型。原告在起诉书第38段指出LLMs普遍存在“记忆”训练材料并在输出中“反刍”或“复述”的问题,认为Apple Intelligence模型也不例外,且训练数据并非被高度转化,而是被模型“记忆”并编码进权重参数中,可被提取和复制。

法院说理

适用法律原则

版权侵权合理使用(预期被告抗辩)市场稀释原则

AI技术详情

技术类型:生成式AI, 大语言模型 (LLM)

技术实现说明

本案涉及生成式AI模型,特别是大语言模型(LLM),其训练过程被指控“记忆”并“拷贝”了训练材料,而非进行高度转化。模型输出被认为能够“反刍”或“复述”训练材料中的内容。

延伸阅读

法律意义

本案代表了生成式AI诉讼领域的新进攻策略,核心在于强调AI模型训练过程中对版权作品的“拷贝”性质,以及对“AI训练数据许可市场”的稀释影响。原告律师吸收了Bartz v. Anthropic和Kadrey v. Meta案的经验,着重指出从盗版网站非法下载训练数据本身即构成版权侵权。这可能为未来的AI版权诉讼提供新的理论依据和举证方向。

行业影响

如果原告的论点得到法院支持,可能会对AI模型的训练数据获取方式产生深远影响,促使AI公司更严格地审查其训练数据的来源合法性,并可能推动AI训练数据许可市场的进一步规范化和发展。同时,这也可能增加AI开发者的合规成本和法律风险。
阿来律师 AI分身
AI 分身