OpenAI研究员称:Deepseek发现了他们在实现o1的过程中的一些核心理念
Mark Chen (@markchen90)1月28 日
祝贺 DeepSeek 成功开发出 o1级推理模型!他们的研究论文表明,他们发现了我们在实现o1的过程中的一些核心理念。
然而,我认为外界对这项成果的反应有些过度,尤其是在关于成本的叙述上。有两个范式(预训练和推理)意味着我们可以在两个轴线上优化能力,而不仅仅是一个,这降低了整体成本。
但这也表明我们可以沿两个方向扩展能力,而我们计划在这两个方向上积极投入计算资源!
随着蒸馏研究的进步,我们也发现降低成本和提升能力这两者之间的关系越来越独立。以更低成本提供服务(尤其是在较高延迟的情况下)并不代表能够实现更高的能力。
我们将继续优化模型以更低的成本提供服务同时对我们的研究计划保持乐观并专注于实施。今年第一季度以及全年,我们期待为大家带来更强大的模型!
相关文章
如何用Ollama安装DeepSeek?
2025-01-30
OpenAI奥特曼对Deepseek R1的回应
2025-01-29