AI诉讼举证责任责任分配

涉AI诉讼中的举证及责任分配

随着人工智能技术的飞速发展和广泛应用,AI相关的法律纠纷也日益增多,其中举证责任的分配成为诉讼中的关键。由于AI技术的复杂性、黑箱特性以及跨国界性,传统的举证规则面临新的挑战。本文将围绕AI诉讼中的常见场景,深入探讨举证责任的分配原则,并从经济学角度总结举证成本最小化原则。 大模型训练案中的举证责任分配

张延来律师
2026年3月13日约 8 分钟阅读76 次阅读

随着人工智能技术的飞速发展和广泛应用,AI相关的法律纠纷也日益增多,其中举证责任的分配成为诉讼中的关键。由于AI技术的复杂性、黑箱特性以及跨国界性,传统的举证规则面临新的挑战。本文将围绕AI诉讼中的常见场景,深入探讨举证责任的分配原则,并从经济学角度总结举证成本最小化原则。

大模型训练案中的举证责任分配

在大模型训练引发的著作权侵权案件中,举证责任的分配是核心问题。通常情况下,原告需要承担初步举证责任,证明其权利内容与AI生成内容之间存在高度近似、关联或指向性。这可能包括:

生成内容与权利内容的高度相似性: 通过比对AI生成文本、图像、音频等与原告享有著作权的作品,证明两者在表达形式、风格、内容结构等方面存在显著相似。

关联性: 证明被告的大模型在训练过程中使用了原告的作品,例如通过公开报道、技术分析报告或特定证据表明原告作品被纳入训练数据集。

指向性: 即使内容不完全相同,但AI生成内容明显指向或暗示了原告作品,例如对原告作品中的特定角色、故事情节进行变体创作。

一旦原告提供了上述初步证据,举证责任则转移至被告。被告需要举证其训练数据的合法来源,以证明其训练过程并未侵犯原告的著作权。这包括:

证明训练数据的合法授权: 提供与数据提供方签订的许可协议、版权声明或相关证据,证明其获得了合法使用训练数据的权利。

训练数据来源的合规性: 证明其训练数据来源于公共领域、获得许可的数据集或自行创作的数据,且未包含侵权内容。

数据清洗和过滤措施: 证明其在模型训练前采取了合理的数据清洗和过滤措施,以避免或减少侵权内容的纳入。

二、AIGC版权侵权案中的举证责任

在AIGC(人工智能生成内容)引发的版权侵权案件中,原告(通常是AIGC的创作者)需要证明其对生成内容享有版权。这需要原告对生成过程进行举证,以体现其在创作过程中的智力投入和独创性。具体包括:

多轮修订和优化: 提供AI生成内容的多轮修订记录、参数调整过程、中间版本等,以证明原告在生成过程中进行了大量的编辑、修改和完善工作。

参数设置和提示词设计: 详细说明其在模型生成过程中使用的独特参数设置、复杂提示词(prompt)设计以及对生成方向的精细控制,以证明其通过指令和引导,对最终生成内容产生了实质性影响。

与模型自带能力的区别: 证明其生成的AIGC内容超越了模型本身的预设能力,或与仅依赖模型基础功能所生成的内容存在显著差异,从而凸显原告的独创性贡献。

被告在AIGC版权侵权案中,则通常会主张以下理由来反驳侵权指控:

不近似: 举证其生成内容与原告的AIGC内容在表达形式、核心要素等方面不构成实质性相似。

无接触: 证明其在创作AI生成内容时,没有接触过原告的AIGC作品,从而排除抄袭的可能性。

独立创作: 举证其AIGC内容是独立完成的,与原告的AIGC内容不具有任何关联性,例如通过提供创作时间线、灵感来源等。

三、平台责任案中的举证责任

当AI模型或应用涉及侵权行为时,平台的责任认定成为一个复杂的问题。平台作为提供AI服务的第三方,需要对其注意义务和盈利模式进行举证。平台通常需要举证以下内容:

底座模型来源: 明确其所使用的底层AI模型的来源,是自研、开源还是第三方授权,并提供相关证明。

应用层模型原理: 详细解释其应用层模型的算法原理、功能设计以及内容生成机制,以证明其对模型运行的了解和控制能力。

事前事后注意义务: 举证其在AI产品上线前和运营过程中所采取的合理注意义务,例如内容审核机制、侵权预警系统、用户举报处理流程、风险提示等。

盈利模式: 明确其AI服务的盈利模式,是直接收益于侵权内容,还是通过提供技术服务而获得收益,这关系到其是否构成直接侵权或帮助侵权。

直接侵权用户: 在可能的情况下,平台应举证并配合调查直接实施侵权行为的用户信息,以将责任导向具体侵权人。

实质性非侵权用途: 证明其AI产品或服务具有除侵权行为之外的实质性非侵权用途,以反驳其为侵权行为专门设计的指控。

四、AI产品不正当竞争中的举证责任

在AI产品涉及不正当竞争的案件中,原告需要举证证明被告的AI产品存在侵权行为。这可能涉及:

侵权AI产品外观功能、效果: 通过对比分析,举证被告AI产品在外观、核心功能、用户体验以及输出效果等方面与原告产品的高度相似性,从而构成混淆或引人误解。

技术上能够实现的原理还原: 原告可以聘请专业机构进行技术分析,通过逆向工程、抓包分析、模型参数比对等方式,尝试还原被告AI产品的核心算法原理和数据处理流程,以证明其存在抄袭或不正当获取技术秘密的行为。

而被告则需要举证其产品的独立开发性与合法性,具体包括:

产品算法原理: 详细说明其AI产品的核心算法原理、技术架构和开发过程,以证明其独立研发性。

后台数据: 提供其AI产品运行的后台数据、训练数据来源、开发日志等,以证明其数据获取的合法性。

技术创新点: 举证其AI产品的独特技术创新点和差异化功能,以反驳不正当竞争的指控。

五、涉及到境外的证据

在涉及开源模型、海外侵权应用等场景下,获取境外证据成为一大挑战。传统的公证认证程序耗时且成本高昂。在此类案件中,可以探索使用时间戳境外取证功能,理论上可以简化甚至替代公证认证程序。例如:

区块链存证: 利用区块链技术对境外AI模型代码、训练数据、生成内容等进行时间戳存证,其不可篡改性和可追溯性可以有效增强证据的效力。

数字取证工具: 借助专业的数字取证工具,对境外服务器、网站、应用等进行数据采集和固定,并生成具有法律效力的取证报告。

国际合作和司法协助: 在必要时,可以通过国际司法协助请求、跨国律师团队合作等方式,获取境外的相关证据。

经济学角度的证据分配原则:最小举证成本原则

从经济学角度看,举证责任的分配应遵循最小举证成本原则,即由收集、提交证据成本最低的一方承担举证责任。这一原则旨在提高诉讼效率,降低社会资源浪费。

在AI诉讼中,这一原则具有重要指导意义:

信息不对称: AI技术往往存在严重的信息不对称。AI模型的开发者和运营者掌握着模型内部结构、训练数据来源、算法原理等核心信息,而权利人或受害者通常难以获取这些信息。因此,由掌握更多信息的被告承担举证责任,可以有效降低举证成本。

数据可及性: 大模型训练数据、AI产品后台数据等,对于模型开发者和平台而言,获取和提供相对容易。而对于原告而言,逆向分析或获取这些数据则成本极高,甚至不可能。

技术复杂性: AI技术的复杂性使得非专业人士难以理解和举证。将举证责任分配给技术掌握方,可以减少对专业鉴定和分析的依赖,降低诉讼成本。

具体而言:

在大模型训练案中,被告作为大模型的开发者和运营者,最清楚其训练数据来源是否合法。因此,在原告初步举证后,将举证责任转移给被告,让其举证训练数据来源,符合最小举证成本原则。

在平台责任案中,平台最清楚其底座模型来源、应用层模型原理(是否在底座模型接触上进行了提示词编程或者定向训练)、事前事后注意义务等,由其举证可以有效降低社会总举证成本。

在AI产品不正当竞争案中,被告最清楚其产品算法原理和后台数据,由其举证更能降低信息获取和证明的成本。

总之,AI诉讼中的举证责任分配是一个复杂的系统工程,需要在兼顾公平正义的基础上,充分考虑技术特性和经济学效率。遵循最小举证成本原则,将有助于推动AI相关法律纠纷的有效解决,促进AI产业的健康发展。

分享文章
阿来律师 AI分身
AI 分身