版权开源许可大模型

知名开源大模型最常用的_5_个开源协议

通过 GitHub CLI 查询了 15+ 个知名开源大模型项目的协议信息,并结合网络搜索补充了协议细节。调研对象包括 LLaMA、Qwen、DeepSeek、Mistral、ChatGLM、Yi、Gemma 等主流大模型。

张延来律师
约 6 分钟阅读13 次阅读

知名开源大模型最常用的 5 个开源协议

调研方法

通过 GitHub CLI 查询了 15+ 个知名开源大模型项目的协议信息,并结合网络搜索补充了协议细节。调研对象包括 LLaMA、Qwen、DeepSeek、Mistral、ChatGLM、Yi、Gemma 等主流大模型。

Top 5 最常用的开源协议

1. Apache License 2.0

使用频率:最高(约占 70% 的开源大模型项目)

代表项目:

Hugging Face Transformers (154K+ stars)

FastChat (39K+ stars)

ChatGLM3 (13K+ stars)

Mistral (10K+ stars)

Yi (7.8K+ stars)

GPT-NeoX (7.3K+ stars)

InternLM (7.1K+ stars)

GLM-4 (7K+ stars)

Gemma (5.5K+ stars)

Baichuan2 (4.1K+ stars)

Qwen 2.0+ 系列(小于 72B 的模型)

协议特点:

宽松的许可协议,允许商业使用

明确的专利授权条款,保护使用者免受专利诉讼

要求保留版权和许可声明

允许修改和再分发

是开源 AI 领域的"黄金标准"

2. MIT License

使用频率:较高(约占 10-15%)

代表项目:

DeepSeek-R1 (91K+ stars)

DeepSeek-R1-Distill 系列

协议特点:

最宽松的开源协议之一

几乎没有限制,允许任何形式的使用、修改和分发

仅要求保留版权声明

不提供专利授权(相比 Apache 2.0 的主要区别)

适合希望最大化开放性的项目

3. LLaMA Community License (Custom)

使用频率:中等(Meta 系列模型专用)

代表项目:

LLaMA 1/2/3 系列 (59K+ stars)

Meta 发布的所有 LLaMA 模型

协议特点:

Meta 定制的专有协议,不是传统开源协议

允许研究和商业使用,但有限制条件

禁止月活用户超过 7 亿的公司使用(针对大型科技公司)

不符合 OSI(开源倡议组织)的开源定义

被称为"准开源"或"开放权重"模型

4. BigScience RAIL License (Responsible AI License)

使用频率:中低(特定项目使用)

代表项目:

BLOOM 系列模型

BigScience 社区发布的模型

协议特点:

基于 OpenRAIL-M 框架的责任 AI 许可

宽松的知识产权授权 + 行为使用限制

禁止用于特定有害用途(如生成仇恨言论、虚假信息等)

强调负责任的 AI 开发和使用

是"有条件开源"的代表

5. Tongyi Qianwen License / Apache 2.0 混合

使用频率:中低(阿里系模型)

代表项目:

Qwen 系列(26K+ stars)

Qwen-72B 及更大模型使用 Tongyi 协议

Qwen 小于 72B 的模型使用 Apache 2.0

协议特点:

Tongyi Qianwen RESEARCH LICENSE:主要用于研究,商业使用需申请

Apache 2.0:较小模型完全开源

体现了"分层开源"策略:小模型完全开放,大模型有限制

商业使用需要联系阿里云获取授权

协议使用统计图表

关键发现

1. Apache 2.0 是绝对主流

超过 70% 的知名开源大模型采用 Apache 2.0 协议,这已成为开源 AI 领域的事实标准。其专利授权条款为企业使用提供了法律保障。

2. "真开源" vs "准开源"

真开源:Apache 2.0、MIT(符合 OSI 定义)

准开源:LLaMA Community License、Tongyi Qianwen License(有商业限制)

3. 责任 AI 协议兴起

BigScience RAIL 等协议引入了"行为使用限制",在开放性和责任之间寻求平衡,代表了未来趋势。

4. 分层开源策略

Qwen 等模型采用"小模型完全开源(Apache 2.0),大模型有限开源(自定义协议)"的策略,平衡开放性与商业利益。

5. 专利保护很重要

Apache 2.0 相比 MIT 的最大优势是明确的专利授权,这对企业使用 AI 模型至关重要,也是其成为主流的原因。

建议

对于开发者

优先选择 Apache 2.0 或 MIT 协议的模型,商业使用无障碍

谨慎使用 LLaMA 系列,确认是否符合 7 亿 MAU 限制

仔细阅读自定义协议,特别是商业使用条款

对于企业

Apache 2.0 是最安全的选择,提供专利保护

评估 RAIL 协议的使用限制是否符合业务需求

大型企业需注意 LLaMA 协议的 MAU 限制

对于模型发布者

Apache 2.0 能最大化社区采用率

如需商业保护,考虑分层开源策略

如强调责任 AI,可参考 RAIL 协议框架

数据来源

GitHub CLI 查询(2026年1月)

Hugging Face Model Hub

各项目官方 LICENSE 文件

开源社区文档和讨论

分享文章
阿来律师 AI分身
AI 分身