Logo

全球AI诉讼风向标

Global AI Litigation Compass

训练数据版权开源许可大模型

Llama2开源许可新范式与OSI

深度:“开放洗白”与大模型开源许可模式创新

张延来律师
2025年7月9日约 17 分钟阅读

深度:“开放洗白”与大模型开源许可模式创新

国际两大开源组织“开放源代码促进会(OSI)”和“自由软件基金会(FSF)”分别撰文《Meta’s LLaMa license is not Open Source》、《Llama 3.1 Community License is not a free software license》,态度惊人的一致,认为Meta公司的Llama模型所定制使用的社区许可协议不符合开源要求,质疑其存在“开放洗白”的嫌疑,在开源世界成为备受瞩目的热点话题。

Meta公司对外宣称Llama 2是“开源”且“可用于研究和商业用途”的一系列大型语言模型,但与模型一起发布的Llama 2社区许可协议却包含两项关键限制:一是针对月活跃用户超过7亿的实体设定的商业使用门槛,二是详尽的“可接受使用政策”(AUP),该政策禁止了特定应用,包括用于训练其他大型语言模型。

鉴于这些具体的限制,OSI和FSF均认为其不符合其各自对“开源”或“自由软件”的正式定义,这种分类上的差异对于法律合规性和战略决策至关重要。本文旨在深入解读Llama 2社区许可协议的各项条款,并详细阐述OSI和FSF对此协议的官方立场及其背后的理由,以期为相关利益方提供清晰的法律视角和实践指导。

Llama 2 社区许可协议纵览

以下是Llama 2社区许可协议中的关键条款,笔者做了相应的解读,较之传统的开源许可协议,这些条款在大模型开源场景下更具有针对性和体现模型开发者意志的内容:

1、“Llama 2” 包括Meta在ai.meta.com/resources/models-and-libraries/llama-downloads/分发的基础大型语言模型、软件和算法,包括机器学习模型代码、训练模型权重、推理启用代码、训练启用代码、微调启用代码以及其他相关元素 。

解读:这个定义非常广泛,涵盖了Meta提供的整个大型语言模型生态系统。它不仅包括核心模型本身(如训练权重),还包括支持其运行、训练和微调的所有相关软件和算法 。

2、权利授予: 您被授予在Meta的Llama材料中包含的知识产权或其他Meta拥有的权利下的非排他性、全球性、不可转让和免版税的有限许可。此许可允许您使用、复制、分发、拷贝、创建Llama材料的衍生作品并对其进行修改。

解读:Meta授予被许可人一项广泛但“有限”的许可。这意味着用户可以在全球范围内使用、复制、分发、创建衍生作品并修改Llama材料,而无需支付版税。然而,此许可并非独占,也不可转让 。

3、再分发和使用:您对Llama材料的使用必须遵守适用的法律法规(包括贸易合规法律法规)并遵守Llama材料的可接受使用政策(可在https://ai.meta.com/llama/use-policy获取),该政策通过引用并入本协议

解读:用户在使用Llama材料时,必须遵守所有适用的法律法规(包括贸易合规),并且必须严格遵守“可接受使用政策”(AUP)。AUP通过引用被纳入本协议,并列出了多项广泛的“禁止用途”,体现了Llama在追求“负责任AI”上的许可条款创新,同时也为OSI等开源组织指责其“开源洗白”埋下了伏笔。

4、禁止训练:您被禁止使用Llama材料或其任何输出/结果来改进任何其他大型语言模型,Llama 2或其衍生作品除外。

解读:这是一项非常重要的使用限制,用户不得使用Llama材料或其任何输出/结果来改进任何“其他大型语言模型”,这项条款对Llama 2的互操作性和竞争性开发施加了显著限制。

5、附加商业条款

如果在Llama 2版本发布之日,被许可人或被许可人关联公司提供的产品或服务的月活跃用户在前一个日历月超过7亿,您必须向Meta请求许可,Meta可自行决定是否授予该许可,在Meta明确授予该许可之前,您无权行使本协议项下的任何权利。

解读:这是协议中的一个关键条款。如果被许可人(或其关联公司)提供的产品或服务的月活跃用户(MAU)在Llama 2版本发布前一个日历月超过7亿,则该被许可人必须向Meta请求额外的许可 。Meta拥有是否授予此许可的完全酌情权。在此许可明确授予之前,该被许可人无权行使本协议项下的任何权利。这项条款实际上为大规模商业用户设置了有条件的商业许可。

6、知识产权:

b. 在Meta拥有Llama材料以及由Meta或为其制作的衍生作品的前提下,您将在您与Meta之间,拥有您创建的Llama材料的任何衍生作品和修改的所有权 。c. 如果您对Meta或任何实体(包括交叉索赔或反索赔)提起诉讼或其他程序,声称Llama材料或Llama 2输出侵犯您的知识产权或其他权利,则根据本协议授予您的任何许可将在提起此类诉讼或索赔之日终止 。您将赔偿Meta因您使用或分发Llama材料而产生的任何第三方索赔,并使其免受损害。

解读:在Meta拥有Llama材料及其衍生作品的前提下,被许可人将拥有其基于Llama材料创建的任何衍生作品和修改的所有权。同时将侵权责任转嫁给使用者。

整体评价

Llama 2社区许可协议在“权利授予”方面表现出广泛的开放性,但其与“禁止训练其他大型语言模型”、“7亿月活跃用户商业门槛”以及详尽的“可接受使用政策”相结合,揭示了该许可在可及性和免版税使用方面是“开放”的,但在大规模商业竞争和特定应用方面则受到“控制”。这种结构表明,Meta在促进广泛采用的同时,也战略性地保留了对其技术最关键应用和竞争格局的控制权。

开放源代码促进会(OSI)对Llama 2的态度

1、开放源代码定义(OSD)

开放源代码促进会(OSI)是一个致力于推广和保护开源软件及其协作价值观的非营利组织。OSI是“开放源代码定义”(OSD)的正式管理者,OSD包含十项标准,软件许可必须满足这些标准才能被OSI认证为“开放源代码促进会批准” 。与Llama 2分析相关的OSD关键原则包括:

自由再分发: 许可不得限制任何一方作为更大分发的一部分销售或赠送软件(OSD的隐含基本原则)。

源代码: 程序必须包含源代码,并且源代码必须是修改的首选形式。

不得歧视个人或群体(OSD第5点): 许可不得歧视任何个人或群体。这确保了无论身份或从属关系如何,都能普遍访问。

不得限制特定领域的使用(OSD第6点): 许可不得限制任何人将程序用于特定领域。这确保了商业、研究或任何其他类型使用的自由。

许可的分发(OSD第7点): 附加在程序上的权利必须适用于所有被再分发程序的人,而无需这些方执行额外的许可。

2、OSI对Llama 2的态度

OSI明确指出,“Meta的LLaMa 2许可并非开源” ,OSI执行董事Stefano Maffulli明确表示,Meta“制造了LLaMa 2是‘开源’的误解——它不是” 。

具体原因:

商业使用限制(>7亿月活跃用户): 对于月活跃用户超过7亿的组织,要求其向Meta寻求单独的、酌情授予的许可,这直接违反了OSD第5点(不得歧视个人或群体) 。OSI认为这是一种竞争限制,因为它针对的是Meta的潜在大型竞争对手(例如,Snapchat、Google、TikTok等),并损害了“人人皆可分享,无论你是谁”的原则 。它也违反了OSD第7点,因为权利不会自动授予所有再分发者。

可接受使用政策(AUP)限制: AUP中广泛的禁止用途列表,特别是明确禁止使用Llama材料训练“其他大型语言模型”(Llama 2衍生作品除外),构成了对“特定领域”的限制。这直接违反了OSD第6点 。OSI认为即使是看似无害的限制,例如“您必须遵守法律”,由于不同司法管辖区之间可能存在不一致或不公正,也会带来问题 。

OSI对“开放洗白”的立场

“开放洗白”的指控源于一种观念,即Meta正在利用“开源”的良好声誉和社区利益,同时施加类似于专有软件的控制,这从根本上损害了开放精神。

OSI的批评揭示了Meta希望战略性地控制其强大人工智能模型(例如,通过限制来自其他大型参与者的竞争和规定可接受的使用方式)与开源核心理念之间的根本张力。开源核心理念优先考虑不受限制的用户自由和普遍可及性。这表明Meta的“开放方法”是一种经过计算的商业策略,而非对传统开源原则的严格遵守。

自由软件基金会(FSF)对Llama 2的态度

1、自由软件定义

自由软件基金会(FSF)“自由软件”的定义基于用户自由的概念,强调“自由(liberty),而非免费(price)” 。如果一个程序赋予用户以下四项基本自由,则被视为自由软件:

运行程序的自由,无论出于何种目的。这意味着任何个人或组织都可以在任何计算机系统上,出于任何工作和目的使用程序,而无需与开发者或任何其他特定实体进行沟通。

研究程序如何工作并进行修改以使其按您希望的方式运行的自由。访问源代码是实现此自由的先决条件。

再分发副本的自由,以便您可以帮助他人。这包括分发副本的自由,无论是否收费。

分发您修改版本的副本给其他人的自由。通过这样做,您可以让整个社区有机会从您的更改中受益。访问源代码是实现此自由的先决条件。

2、FSF对Llama 2的官方评估

FSF评估了Llama 2(以及随后的Llama 3.x)社区许可协议,并得出结论,认为它“在授予基本权利方面以惊人的方式失败” 。

具体原因:

用于任何目的: FSF最主要的争议点是Llama 2的可接受使用政策(AUP)。AUP对模型的使用施加了诸多限制(例如,军事、关键基础设施、未经授权的专业实践,以及禁止训练其他大型语言模型) 。这些明确的禁令直接与“用于任何目的”相矛盾,后者赋予用户出于其希望的“任何目的”运行程序的权利,而开发者不得强加其自身的目的 。

歧视用户(与OSI第5点一致): 7亿月活跃用户商业限制,要求大型实体寻求单独的、酌情授予的许可,也被FSF视为一种对某些用户的歧视形式。

限制特定领域的使用(与OSI第6点一致): AUP对特定应用和行业的限制(例如,军事、关键基础设施)被视为限制了“特定领域”,这是与OSI共同的批评点 。

FSF对Llama 2的批评强调了其将用户自由视为道德义务的承诺,认为对使用的任何限制,即使是为了“负责任”的目的,也是对自由的根本性削弱。这突显了Meta的“负责任AI”方法与FSF对绝对用户控制的坚定立场之间的原则性分歧。

比较分析:OSI和FSF批评的重叠与差异

开放源代码促进会(OSI)和自由软件基金会(FSF)在根本上都得出结论,Llama 2社区许可协议不符合“开源”或“自由软件”的资格,尽管他们的结论相似,但侧重点有所不同。OSI关注的是对开源生态系统的实际影响,强调开发者主权以及无需与第三方打交道即可使用技术的自由 。FSF则将其批评的中心放在用户自由的伦理和必要性上,认为对目的或使用的任何限制都是对自由的根本性削弱 。

Meta公司将其Llama 2描述为“开放方法”,这表明其策略是广泛可及性并鼓励社区参与,为许多用户提供免版税的使用,并允许进行修改和创建衍生作品 。这与通常与专有软件相关的严格限制性许可明显不同。

然而,这种“开放性”存在于一个精心控制的框架内。战略性的商业门槛和全面的AUP意味着Meta对模型的大规模商业部署及其在某些敏感或竞争领域的应用保留了重大控制权 。这种混合模式,常被称为“带限制的许可”(permissive with restrictions) 或“开放访问AI”(open access AI) ,与“开源”或“自由软件”的严格正式定义不符,后者优先考虑最大的用户自由和对使用或再分发的最小限制 。

Llama 2许可协议体现了人工智能特定许可新类别的出现,这些许可通常被称为“负责任AI许可”。这些许可试图在广泛分发和社区协作的益处与减轻强大AI模型固有的风险(例如,滥用、伦理问题)和管理竞争动态之间取得平衡。这表明传统的软件许可框架可能不足以应对先进人工智能的独特特征和社会影响。与传统软件不同,AI模型涉及“源代码”的性质(模型权重、训练数据、架构)、潜在的有害输出以及开发和部署所需的大量计算资源等复杂问题。Meta的许可试图通过施加超出典型软件许可条款的特定控制(月活跃用户门槛、AUP)来解决这些独特问题。这表明现有的“开源”和“自由软件”定义,虽然对代码有效,但正在被扩展,可能无法完全捕捉AI模型所需的细微差别。因此,Llama 2许可可以被视为AI许可新范式的先驱或早期示例,它试图在“开放性”与“责任”和战略控制之间取得平衡,可能导致新的、AI特定许可标准的制定。

影响与建议

1、对用户和开发者的法律影响

增加的法律审查和尽职调查: 用户和开发者不能仅仅依赖“开放”的营销主张。他们必须对Llama 2等定制AI许可进行彻底的法律尽职调查,因为具体条款决定了实际的权利和义务。

更大的合规负担: 遵守广泛且有时主观的“可接受使用政策”是一项具有法律约束力的义务 。未能遵守可能导致立即终止许可 ,从而带来重大的运营和法律风险。AUP某些条款的模糊性(例如,不同司法管辖区中“违反法律”的定义 )增加了这一负担。

有条件的商业使用和不确定性: 接近或超过7亿月活跃用户门槛的企业面临一个“悬崖边缘”,因为他们继续使用Llama 2的权利将取决于Meta的独家酌情权。这带来了重大的商业不确定性,可能阻碍增长或需要昂贵且具有破坏性的迁移到替代模型。

知识产权和诉讼风险: 尽管被许可人拥有其衍生作品,但关于一旦对Meta提起知识产权侵权诉讼即终止许可的条款,对挑战Meta与Llama材料或输出相关的知识产权权利构成了强有力的威慑。这在潜在的知识产权纠纷中造成了权力不平衡。

限制竞争性创新: 对于Llama 2而言,禁止使用Llama材料或输出训练“其他”大型语言模型直接限制了Meta自身生态系统之外的竞争性开发和创新。

2、对企业的战略考量

理解“开放核心”模型: 企业应将Llama 2视为在“开放核心”或“免费增值”模型下运行,其中基础广泛可及,但战略控制点(例如,大规模商业使用、竞争性模型训练)由许可方(Meta)保留。这与旨在实现最大自由和最小控制的真正开源模式有着根本区别。

供应商锁定风险: 尽管Llama 2最初表现出“开放性”,但对Llama 2的依赖,特别是对于快速增长的企业而言,存在未来许可变更、Meta酌情控制或需要进行昂贵重新谈判的潜在风险,这可能导致某种形式的供应商锁定。

与组织价值观保持一致: 即使Llama 2在实践中具有益处和性能优势,但对于那些深切认同传统开源或自由软件原则的公司而言,Llama 2的许可可能与其核心价值观不符,这需要仔细评估行业声誉上的契合度。

3、应对AI模型许可的建议

充分的许可审查: 无论许可方营销宣传如何“开放”,始终对任何AI模型许可的完整文本进行细致的审查。不要假设“开放”等同于“开源”。

全面的风险评估: 根据您的具体业务模式、增长预测和风险承受能力,评估商业限制(例如,月活跃用户门槛)和可接受使用政策。考虑潜在许可终止或需要新协议的影响。

探索多样化的AI模型: 如果不受限制的使用、修改和竞争性开发对开发者的战略至关重要,应调查并考虑真正的开源AI模型或具有更宽松许可的模型。

寻求专业法律咨询: 对于复杂的用例、可能达到商业门槛的情况,或许可解释存在歧义时,请咨询专门从事AI和知识产权的法律专家。

五、 结论

总而言之,尽管Meta公司发布Llama 2及其社区许可协议代表着使强大大型语言模型更易于获取的重要一步,但必须认识到,该许可包含实质性限制,使其无法被开放源代码促进会(OSI)认定为“开源”,也无法被自由软件基金会(FSF)认定为“自由软件”。

Llama 2许可协议是AI许可领域一种新型混合方法的典范,它在广泛可及性与战略控制和负责任使用之间寻求平衡。对于开发者、企业和法律专业人士而言,这要求对不断演变的人工智能格局中的“开放性”概念有细致入微的理解。对许可条款的勤勉审查、对正式定义的认知以及积极寻求法律咨询,对于应对复杂性和确保在这一快速发展领域的合规性至关重要。