美国民事非生成式AI著作权侵权(AI模型训练数据使用)进行中
美国法院汤森路透诉罗斯智能(合理使用)案

汤森路透诉罗斯智能案

重要性评级
案号:1:20-cv-613-SB
法院:美国特拉华州地区法院
判决时间:2025年02月11日
当事方:原告:汤森路透(Thomson Reuters Enterprise Center GMBH and West Publishing Corp.);被告:罗斯智能(Ross Intelligence Inc.)

美国法院认定罗斯智能未经授权使用汤森路透的法律批注训练AI工具构成直接著作权侵权,并驳回合理使用抗辩。

内容目录
AI 风险雷达

五维风险综合评估

版权风险
数据合规
平台责任
算法责任
隐私侵权

最高风险维度:版权风险

诉讼时间轴
简易判决2023-09· 美国特拉华州地区法院

拒绝了原告关于认定侵权成立的简易判决的请求

简易判决2025-02-11· 美国特拉华州地区法院

认定部分涉案作品的侵权事实清楚,罗斯智能构成直接著作权侵权,并驳回合理使用抗辩。

案情概述

原告汤森路透是全球领先的法律信息服务商,拥有Westlaw数据库及其独创的“法律批注”与“关键号码系统”。被告罗斯智能是一家新兴法律科技公司,开发基于AI的法律检索搜索引擎。罗斯智能曾向汤森路透请求授权使用Westlaw数据训练其AI模型但遭拒,后转向第三方服务商LegalEase购买了25,000份“批量备忘录”作为替代训练数据,这些备忘录根据Westlaw的法律批注编写。汤森路透遂以著作权侵权为由提起诉讼,指控罗斯智能侵权了21,787项法律批注、500项判例的编辑内容及关键号码系统。法院在2025年2月11日作出简易判决,认为部分涉案作品的侵权事实清楚,不需要进行陪审团审理,认定罗斯智能未经授权使用汤森路透公司Westlaw数据库中的法律批注训练其AI法律研究工具构成直接著作权侵权,并驳回罗斯智能的合理使用抗辩。此次简易判决针对2,830项法律批注作出裁判,认定其中2,243项构成侵权。

核心争议焦点

  • 1法律批注、关键号码系统等案涉作品是否具备原创性,即权利基础问题
  • 2罗斯智能是否存在复制作品中具有原创性的组成部分的行为,即侵权行为问题
  • 3罗斯智能对AI模型训练数据的使用行为是否构成合理使用抗辩

双方观点

原告主张

汤森路透指控罗斯智能侵权了21,787项法律批注、500项判例的编辑内容及关键号码系统,认为罗斯智能未经授权使用其Westlaw数据库中的法律批注训练AI法律研究工具构成直接著作权侵权。

被告抗辩

罗斯智能提出合理使用(fair use)抗辩,认为其对AI模型训练数据的使用行为不构成侵权。罗斯智能辩称作为训练数据的法律批注未直接以最终产品的形式呈现给终端用户,复制行为出现在中间步骤,该中间复制数据的行为属于合理使用,并援引Google v. Oracle、Sony v. Connectix和Sega v. Accolade等计算机代码领域的经典判例。

关键证据

专家报告显示,2,830项法律批注所对应的批量备忘录问题与法律批注文本高度相似,并且法律批注文本与司法判决的原文存在显著差异。专家报告指出,这些批量备忘录问题是基于“复制”Westlaw法律批注产生的,并非是对司法判决原文的总结。双方对于LegalEase接触了Westlaw数据库并基于数据库内容准备了涉案批量备忘录的事实不存在任何争议。

法院说理

法院在侵权行为认定方面,采纳了“接触”加“实质性相似”标准。通过专家报告和文本比对,法院认定罗斯智能存在复制行为,因为批量备忘录问题与法律批注文本高度相似,且与司法判决原文存在显著差异,表明批量备忘录是基于复制Westlaw法律批注而非总结司法判决原文产生。在合理使用抗辩方面,法院基于四个要素进行分析。第一要素(使用目的和性质),法院认为罗斯智能使用法律批注训练AI模型以开发与Westlaw直接竞争的法律检索工具,具有商业属性且不构成转化性使用,因此倾向于不支持合理使用。法院区分了本案与计算机代码中间复制案例,强调Westlaw法律批注不涉及计算机代码,其基本思想可通过其他方式获取,复制并非必要。第四要素(市场影响),法院认为罗斯智能的行为直接冲击Westlaw现有市场及潜在AI模型训练数据市场,构成替代性竞争。尽管公众可能受益,但这不足以构成合理使用,公众对法律解析成果无免费获取权利。第二要素(作品性质),法院认为法律批注虽有最低限度创造性,但低于文学艺术作品,偏向罗斯智能。第三要素(使用数量和质量),法院认为罗斯智能未将Westlaw法律批注公开提供给用户,故此要素有利于罗斯智能。综合权衡,法院认为第一和第四要素权重较高,最终驳回合理使用抗辩。在原创性认定方面,法院认为法律批注整体构成汇编作品,单个法律批注通过提炼、综合或解释司法意见,即使逐字摘录,其筛选与编排过程也体现了“最低限度的创造性”,构成受著作权保护的原创性作品,以雕塑艺术为喻进行解释。

裁判要点

  • 1AI模型训练过程中未经授权使用受著作权保护的数据构成直接著作权侵权。
  • 2AI模型训练中对受著作权保护作品的复制行为,不能仅因其为中间步骤且未直接呈现给终端用户而适用合理使用抗辩。
  • 3合理使用抗辩的判断中,商业目的和对原作品市场及潜在市场的替代性影响是重要考量因素。
  • 4法律批注等对司法意见的提炼与编排,即使是从司法意见中逐字摘录,其筛选与编排过程仍体现“最低限度的创造性”,构成受著作权保护的原创性作品。
  • 5法院在判断AI模型训练过程中的合理使用时,严格区分了计算机代码的“技术必要性”与本案中法律批注的“商业竞争目的”。

最终判决结果

美国特拉华州地区法院作出简易判决,认定罗斯智能公司未经授权使用汤森路透公司Westlaw数据库中的法律批注训练其AI法律研究工具构成直接著作权侵权,并驳回罗斯智能的合理使用(fair use)抗辩。此次简易判决针对2,830项法律批注作出裁判,认定其中2,243项构成侵权。案件中剩余的18,957项法律批注、500项判例编辑内容及关键号码系统是否构成侵权,还有待案件的进一步审理。

适用法律原则

著作权侵权认定标准(接触+实质性相似)合理使用(fair use)四要素原则(使用目的和性质、作品性质、使用数量和质量、市场影响)作品原创性认定标准(最低限度的创造性)

AI技术详情

技术类型:非生成式AI
技术原理示意图 · 训练数据侵权链条
版权内容📚 书籍📰 新闻🎵 歌词🖼️ 图片💻 代码未经授权爬取/下载训练数据集· 数据清洗· 去重处理· 格式化模型训练· 梯度下降· 权重更新· 知识记忆· 能力涌现AI产品⚠️ 版权侵权链条:从未授权获取到商业化AI产品

技术实现说明

本案涉及的AI技术主要是非生成式AI,即AI模型训练过程中使用的数据,关注的是中间复制行为,不涉及生成式AI模型输出结果的著作权侵权风险问题。罗斯智能的AI法律研究工具通过训练数据开发,其输出功能与Westlaw类似,通过AI模型处理法律问题并返回相关司法判例。

延伸阅读

法律意义

本案是AI产业著作权侵权风险司法实践的重要进展,明确认定AI模型训练过程中存在侵犯著作权的复制行为并且不能适用合理使用抗辩,尤其是在商业竞争目的下。它奠定了该案后续裁判的基本法律框架,并对AI领域特定技术事实下的侵权行为和合理使用抗辩进行了分析和认定。本案对AI模型训练数据使用的法律边界提供了重要参考,尤其是在“技术必要性”与“商业竞争目的”的区分上,对未来AI相关著作权案件具有指导意义。此案也凸显了AI技术创新与著作权保护平衡的重要性。

行业影响

本案对AI行业,特别是AI模型开发者和数据提供者,具有深远影响。它提醒AI公司在获取和使用训练数据时,需更加审慎地评估著作权风险,并可能促使行业更加重视合法授权和自主研发替代数据。法院对合理使用抗辩的严格界定,尤其是对商业目的和市场影响的强调,可能导致AI公司在进行模型训练时面临更高的合规成本和法律风险。此外,本案可能促使AI产业链上游的数据提供商和下游的AI应用开发者重新审视其合作模式和知识产权协议。它也为全球其他法域,包括中国,在处理AI模型训练数据著作权侵权问题时提供了重要的司法实践参考。
阿来律师 AI分身
AI 分身