Deepseek被曝涉嫌抄袭OpenAI,通过“蒸馏”的方式抄袭ChatGPT模型?

2025年1月29日,OpenAI称发现有证据表明中国人工智能初创公司DeepSeek使用模型蒸馏技术来训练自己的模型,并暗示这可能违反了OpenAI的服务条款 ↗️

DeepSeek的R1模型以极低成本(约5.6万美元)实现与ChatGPT相近性能,引发对其技术来源的质疑。OpenAI怀疑其训练数据包含ChatGPT的输出。

China's DeepSeek Aims to Rival OpenAI's 'Reasoning' Model




Deepseek存在抄袭的观点

  • OpenAI声称掌握证据,指DeepSeek通过模型蒸馏(Model Distillation)技术,利用ChatGPT的输出训练自身的开源模型(R1)。这一过程被OpenAI认为违反其服务条款,构成知识产权侵权。
  • 据《金融时报》报道,蒸馏技术允许小模型模仿大模型的输出,行业内虽常见,但用于开发竞品可能越界。
  • 另外,OpenAI的David Sacks称有“大量证据”显示DeepSeek使用其模型知识,但目前为止并未公开细节。

 

Deepseek不存在抄袭的观点

  • 模型蒸馏本身是通用技术,OpenAI也鼓励开发者使用其API优化模型。争议焦点在于”是否用于商业竞争”,而法律尚未明确界定此类行为的合法性。
  • Fast Company指出,此前OpenAI因使用受版权保护内容训练模型被起诉,如华盛顿时报,此时指控DeepSeek存在“双重标准”之嫌。
  • 此外,Deepseek公司否认侵权,强调其模型基于自研技术,仅投入少量GPU资源(2,048块H800),与OpenAI的千亿级投资形成对比。




模型蒸馏技术是什么?

模型蒸馏是一种通过“知识迁移”将复杂大模型的能力压缩到轻量小模型的技术,其核心原理是让学生模型(student)模仿教师模型(teacher)的“思考方式”而非简单记忆答案。

举个不太恰当的例子。蒸馏技术相当于《天龙八部》中的无崖子在死前将毕生功力传给虚竹,这样虚竹就可以在短时间内达到武林高手的水平了。



Views: 78

留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注