Deepseek被曝涉嫌抄袭OpenAI，通过“蒸馏”的方式抄袭ChatGPT模型？

AI 工具
2025年 2月 1日

2025年1月29日，OpenAI称发现有证据表明中国人工智能初创公司DeepSeek使用模型蒸馏技术来训练自己的模型，并暗示这可能违反了OpenAI的服务条款 ↗️。

DeepSeek的R1模型以极低成本（约5.6万美元）实现与ChatGPT相近性能，引发对其技术来源的质疑。OpenAI怀疑其训练数据包含ChatGPT的输出。

目录

Deepseek存在抄袭的观点

OpenAI声称掌握证据，指DeepSeek通过模型蒸馏（Model Distillation）技术，利用ChatGPT的输出训练自身的开源模型（R1）。这一过程被OpenAI认为违反其服务条款，构成知识产权侵权。
据《金融时报》报道，蒸馏技术允许小模型模仿大模型的输出，行业内虽常见，但用于开发竞品可能越界。
另外，OpenAI的David Sacks称有“大量证据”显示DeepSeek使用其模型知识，但目前为止并未公开细节。

Deepseek不存在抄袭的观点

模型蒸馏本身是通用技术，OpenAI也鼓励开发者使用其API优化模型。争议焦点在于”是否用于商业竞争”，而法律尚未明确界定此类行为的合法性。
Fast Company指出，此前OpenAI因使用受版权保护内容训练模型被起诉，如华盛顿时报，此时指控DeepSeek存在“双重标准”之嫌。
此外，Deepseek公司否认侵权，强调其模型基于自研技术，仅投入少量GPU资源（2,048块H800），与OpenAI的千亿级投资形成对比。

模型蒸馏技术是什么？

模型蒸馏是一种通过“知识迁移”将复杂大模型的能力压缩到轻量小模型的技术，其核心原理是让学生模型（student）模仿教师模型（teacher）的“思考方式”而非简单记忆答案。

举个不太恰当的例子。蒸馏技术相当于《天龙八部》中的无崖子在死前将毕生功力传给虚竹，这样虚竹就可以在短时间内达到武林高手的水平了。

Views: 427

留下评论取消回复