爱案例·全球AI诉讼风向标

随着人工智能技术的飞速发展和广泛应用，AI相关的法律纠纷也日益增多，其中举证责任的分配成为诉讼中的关键。由于AI技术的复杂性、黑箱特性以及跨国界性，传统的举证规则面临新的挑战。本文将围绕AI诉讼中的常见场景，深入探讨举证责任的分配原则，并从经济学角度总结举证成本最小化原则。

大模型训练案中的举证责任分配

在大模型训练引发的著作权侵权案件中，举证责任的分配是核心问题。通常情况下，原告需要承担初步举证责任，证明其权利内容与AI生成内容之间存在高度近似、关联或指向性。这可能包括：

生成内容与权利内容的高度相似性：通过比对AI生成文本、图像、音频等与原告享有著作权的作品，证明两者在表达形式、风格、内容结构等方面存在显著相似。

关联性：证明被告的大模型在训练过程中使用了原告的作品，例如通过公开报道、技术分析报告或特定证据表明原告作品被纳入训练数据集。

指向性：即使内容不完全相同，但AI生成内容明显指向或暗示了原告作品，例如对原告作品中的特定角色、故事情节进行变体创作。

一旦原告提供了上述初步证据，举证责任则转移至被告。被告需要举证其训练数据的合法来源，以证明其训练过程并未侵犯原告的著作权。这包括：

训练数据来源的合规性：证明其训练数据来源于公共领域、获得许可的数据集或自行创作的数据，且未包含侵权内容。

数据清洗和过滤措施：证明其在模型训练前采取了合理的数据清洗和过滤措施，以避免或减少侵权内容的纳入。

二、AIGC版权侵权案中的举证责任

在AIGC（人工智能生成内容）引发的版权侵权案件中，原告（通常是AIGC的创作者）需要证明其对生成内容享有版权。这需要原告对生成过程进行举证，以体现其在创作过程中的智力投入和独创性。具体包括：

多轮修订和优化：提供AI生成内容的多轮修订记录、参数调整过程、中间版本等，以证明原告在生成过程中进行了大量的编辑、修改和完善工作。

参数设置和提示词设计：详细说明其在模型生成过程中使用的独特参数设置、复杂提示词（prompt）设计以及对生成方向的精细控制，以证明其通过指令和引导，对最终生成内容产生了实质性影响。

与模型自带能力的区别：证明其生成的AIGC内容超越了模型本身的预设能力，或与仅依赖模型基础功能所生成的内容存在显著差异，从而凸显原告的独创性贡献。

被告在AIGC版权侵权案中，则通常会主张以下理由来反驳侵权指控：

不近似：举证其生成内容与原告的AIGC内容在表达形式、核心要素等方面不构成实质性相似。

无接触：证明其在创作AI生成内容时，没有接触过原告的AIGC作品，从而排除抄袭的可能性。

独立创作：举证其AIGC内容是独立完成的，与原告的AIGC内容不具有任何关联性，例如通过提供创作时间线、灵感来源等。

三、平台责任案中的举证责任

当AI模型或应用涉及侵权行为时，平台的责任认定成为一个复杂的问题。平台作为提供AI服务的第三方，需要对其注意义务和盈利模式进行举证。平台通常需要举证以下内容：

底座模型来源：明确其所使用的底层AI模型的来源，是自研、开源还是第三方授权，并提供相关证明。

应用层模型原理：详细解释其应用层模型的算法原理、功能设计以及内容生成机制，以证明其对模型运行的了解和控制能力。

事前事后注意义务：举证其在AI产品上线前和运营过程中所采取的合理注意义务，例如内容审核机制、侵权预警系统、用户举报处理流程、风险提示等。

盈利模式：明确其AI服务的盈利模式，是直接收益于侵权内容，还是通过提供技术服务而获得收益，这关系到其是否构成直接侵权或帮助侵权。

直接侵权用户：在可能的情况下，平台应举证并配合调查直接实施侵权行为的用户信息，以将责任导向具体侵权人。

实质性非侵权用途：证明其AI产品或服务具有除侵权行为之外的实质性非侵权用途，以反驳其为侵权行为专门设计的指控。

四、AI产品不正当竞争中的举证责任

在AI产品涉及不正当竞争的案件中，原告需要举证证明被告的AI产品存在侵权行为。这可能涉及：

侵权AI产品外观功能、效果：通过对比分析，举证被告AI产品在外观、核心功能、用户体验以及输出效果等方面与原告产品的高度相似性，从而构成混淆或引人误解。

技术上能够实现的原理还原：原告可以聘请专业机构进行技术分析，通过逆向工程、抓包分析、模型参数比对等方式，尝试还原被告AI产品的核心算法原理和数据处理流程，以证明其存在抄袭或不正当获取技术秘密的行为。

而被告则需要举证其产品的独立开发性与合法性，具体包括：

产品算法原理：详细说明其AI产品的核心算法原理、技术架构和开发过程，以证明其独立研发性。

后台数据：提供其AI产品运行的后台数据、训练数据来源、开发日志等，以证明其数据获取的合法性。

技术创新点：举证其AI产品的独特技术创新点和差异化功能，以反驳不正当竞争的指控。

五、涉及到境外的证据

在涉及开源模型、海外侵权应用等场景下，获取境外证据成为一大挑战。传统的公证认证程序耗时且成本高昂。在此类案件中，可以探索使用时间戳境外取证功能，理论上可以简化甚至替代公证认证程序。例如：

区块链存证：利用区块链技术对境外AI模型代码、训练数据、生成内容等进行时间戳存证，其不可篡改性和可追溯性可以有效增强证据的效力。

数字取证工具：借助专业的数字取证工具，对境外服务器、网站、应用等进行数据采集和固定，并生成具有法律效力的取证报告。

国际合作和司法协助：在必要时，可以通过国际司法协助请求、跨国律师团队合作等方式，获取境外的相关证据。

经济学角度的证据分配原则：最小举证成本原则

从经济学角度看，举证责任的分配应遵循最小举证成本原则，即由收集、提交证据成本最低的一方承担举证责任。这一原则旨在提高诉讼效率，降低社会资源浪费。

在AI诉讼中，这一原则具有重要指导意义：

信息不对称： AI技术往往存在严重的信息不对称。AI模型的开发者和运营者掌握着模型内部结构、训练数据来源、算法原理等核心信息，而权利人或受害者通常难以获取这些信息。因此，由掌握更多信息的被告承担举证责任，可以有效降低举证成本。

数据可及性：大模型训练数据、AI产品后台数据等，对于模型开发者和平台而言，获取和提供相对容易。而对于原告而言，逆向分析或获取这些数据则成本极高，甚至不可能。

技术复杂性： AI技术的复杂性使得非专业人士难以理解和举证。将举证责任分配给技术掌握方，可以减少对专业鉴定和分析的依赖，降低诉讼成本。

具体而言：

在大模型训练案中，被告作为大模型的开发者和运营者，最清楚其训练数据来源是否合法。因此，在原告初步举证后，将举证责任转移给被告，让其举证训练数据来源，符合最小举证成本原则。

在平台责任案中，平台最清楚其底座模型来源、应用层模型原理（是否在底座模型接触上进行了提示词编程或者定向训练）、事前事后注意义务等，由其举证可以有效降低社会总举证成本。

在AI产品不正当竞争案中，被告最清楚其产品算法原理和后台数据，由其举证更能降低信息获取和证明的成本。

总之，AI诉讼中的举证责任分配是一个复杂的系统工程，需要在兼顾公平正义的基础上，充分考虑技术特性和经济学效率。遵循最小举证成本原则，将有助于推动AI相关法律纠纷的有效解决，促进AI产业的健康发展。

涉AI诉讼中的举证及责任分配