OpenAI研究员称:Deepseek发现了他们在实现o1的过程中的一些核心理念

Mark Chen (@markchen90)1月28 日

OpenAI研究员称:Deepseek发现了他们在实现o1的过程中的一些核心理念.webp

祝贺 DeepSeek 成功开发出 o1级推理模型!他们的研究论文表明,他们发现了我们在实现o1的过程中的一些核心理念。

然而,我认为外界对这项成果的反应有些过度,尤其是在关于成本的叙述上。有两个范式(预训练和推理)意味着我们可以在两个轴线上优化能力,而不仅仅是一个,这降低了整体成本。

但这也表明我们可以沿两个方向扩展能力,而我们计划在这两个方向上积极投入计算资源!

随着蒸馏研究的进步,我们也发现降低成本和提升能力这两者之间的关系越来越独立。以更低成本提供服务(尤其是在较高延迟的情况下)并不代表能够实现更高的能力。

我们将继续优化模型以更低的成本提供服务同时对我们的研究计划保持乐观并专注于实施。今年第一季度以及全年,我们期待为大家带来更强大的模型!

收藏
最新工具
CodeName Goose
CodeName Goose

一款开源代码智能体Agent,Codename Goose不仅能...

NotebookLM
NotebookLM

一款基于Gemini 的AI笔记和研究助手,旨在帮助用户更高效地...

PengChengStarling
PengChengStarling

鹏城实验室开源的一款多语言语音识别系统开发工具包,PengChe...

kokoroTTS
kokoroTTS

一款开源、高性能的文本转语音(TTS)模型,Kokoro TTS...

宇树科技
宇树科技

是一家专注于足式机器人研发与生产的中国高科技企业,成立于2016...

YuE
YuE

一个全新的多模态音乐开源模型,YuE具有从歌词生成高质量音乐的能...

泥巴影院
泥巴影院

一个专为海外华人提供的在线视频平台,用户可以在此平台上免费观看最...

JanusFlow
JanusFlow

DeepSeek团队推出的一款先进的多模态人工智能模型,目的在于...

Janus-Pro
Janus-Pro

DeepSeek开发的多模态理解与生成模型,专注于图像生成和多模...

Refly Ai
Refly Ai

一款基于自由画布构建的AI原生内容创作平台,通过多线程对话、知识...