不经思考就直接输出推理结果的情况,DeepSeek官方做了最新使用说明

DeepSeek 官方对 R1 使用说明进行了更新。此前我们集群部署的 deepseek-r1 满血版,在众人使用期间,时常会出现模型的 output 不经思考就直接输出推理结果的情况。针对这一问题,DeepSeek 官方给出了如下解决方案:

1. 请将 Temperature 设定在 0.5 至 0.7 的范围内(建议设置为 0.6),以此避免产生无尽的重复或者不连贯的输出。

2. 不要添加系统提示;所有的说明都应当涵盖在用户提示符之中。

3. 针对数学问题,建议在您的提示里添加一个指令提示:“请逐步推理,然后将最终答案放在\ boxed {}中。”

4. 在评估模型性能时,建议开展多次测试并对结果进行平均。

5. 当响应某些查询时,DeepSeek-R1 系列模型容易绕过深度思考模式(也就是输出””),这有可能给模型性能带来不利影响。为了保障模型能够进行全面的推理,官方提议:在每个输出的开头强制执行“

不经思考就直接输出推理结果的情况,DeepSeek官方做了最新使用说明.webp

6、官方建议使用的搜索和文件上传提示模版: https://github.com/deepseek-ai/DeepSeek-R1/pull/399/files

7、DeepSeek-R1减轻模型跳过思考直接推理的指南: https://github.com/deepseek-ai/DeepSeek-R1/commit/7ca5e1e7f75e12a1c561fffaa6aa686708f881ae

DeepSeek官方也更新了readme,大家可以按照官方给的readme来配置即可获得最佳使用体验。

最新readme地址:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/README.md

收藏
最新工具
MGX
MGX

MetaGPT推出的全球首个模拟人类软件工作流程的多智能体开发平...

配音神器PRO
配音神器PRO

一款功能强大的配音软件,提供调整语速、插入停顿、检测敏感词、调节...

匡优Excel
匡优Excel

一个将AI与数据分析完美结合的Excel 分析工具。通过自然语言...

PhotoG
PhotoG

专为电商卖家打造的AI商拍工具。PhotoG可以轻松制作出专业级...

Phantom
Phantom

字节跳动基于跨模态对齐的主体一致性视频生成系统,Phantoms...

字体秀FontShow
字体秀FontShow

一款便捷的本地字体批量预览对比工具,支持个性化文案输入、多字体批...

Step-Video-T2V
Step-Video-T2V

一个由阶跃星辰与吉利汽车合作开源的先进文本到视频生成模型。支持中...

Step-Audio
Step-Audio

由阶跃星辰与吉利汽车集团联合研发的一个开源的集成语音识别、语义理...

SkyReels-V1
SkyReels-V1

中国首个面向AI短剧创作的视频生成模型,能够实现影视级人物微表情...

MakeAnything
MakeAnything

一个基于扩散变换器的序列生成模型,通过其强大的生成能力,生成一致...