DeepSeek-V3/R1-671B全参数微调指南及使用教程

DeepSeek-V3/R1-671B 全参数微调指南是什么?

DeepSeek-V3/R1-671B 全参数微调指南是一个关于 DeepSeek-V3/R1-671B 模型全参数微调的开源指南,由中国科学院自动化研究所和中科闻歌联合推出。项目提供了从训练到推理的完整代码和脚本,并总结了训练和部署过程中的经验和问题解决方案。

DeepSeek-V3/R1-671B全参数微调指南及使用教程.webp

功能特点

  • 全参数微调支持:提供从训练到推理的完整代码和脚本,支持数据并行和序列并行。

  • 硬件优化:提供详细的硬件配置建议和实验结果,帮助高效利用计算资源。

  • 数据格式适配:支持 Openai 标准数据格式,并扩展了对 reasoning 数据的兼容。

  • 推理部署:支持将模型权重转换为 Hugging Face 格式,并通过 vLLM 等框架进行推理部署。

DeepSeek-V3/R1-671B 全参数微调指南用途

  • 自然语言处理:适用于文本生成、机器翻译、情感分析等任务。

  • 复杂场景推理:能够处理长篇幅文档和多领域任务,如医疗辅助诊断、金融分析等。

  • 科研与技术探索:作为技术试验平台,探索通用人工智能(AGI)的潜在路径。

  • 企业级应用:可用于智能客服、文档分析等场景,提升企业效率和决策能力。

如何使用DeepSeek-V3/R1-671B 全参数微调指南

1. 硬件配置

  • 需要 32 台服务器,每台配置:

  • 8 x NVIDIA H100 80GB GPU

  • 96 核 CPU

  • 2TB 内存

  • 100TB 共享存储

  • InfiniBand 400G 网络

2. 环境配置

conda create -n ds_env python=3.10
conda activate ds_env
pip install -r requirements.txt
cp -r ./code/xtuner /path/to/env/site-packages

3. 数据准备

数据格式示例:

{
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "用户问题"},
{"role": "assistant", "content": "思考过程\n最终回答", "loss": true}
]
}

4. 启动训练

使用 pdsh 或 slurm 启动训练:

pdsh -R ssh -w node[0-31] 'bash ./code/scripts/sft_deepseek.sh'

5. 模型权重转换

将训练结果转换为 Hugging Face 格式:

bash ./code/scripts/convert_pth_to_hf.sh

6. 推理部署

使用 vLLM 部署:

# 启动 Ray
pdsh -R ssh -w node0 "conda activate vllm && ray start --head"
pdsh -R ssh -w node1,node2,node3 "conda activate vllm && ray start --address='node0:6379'"
# 启动 vLLM
pdsh -R ssh -w node0 "vllm serve /path/to/model --tensor-parallel-size 8 --pipeline-parallel-size 4"

GitHub仓库:https://github.com/ScienceOne-AI/DeepSeek-671B-SFT-Guide

收藏
最新工具
Awesome LangGraph
Awesome LangGraph

一份精心整理的 LangGraph 资源合集,涵盖了基础介绍、入...

VDSpeak
VDSpeak

一个专注于为YouTube视频提供多语言翻译和配音服务的在线工具...

PydanticAI
PydanticAI

一个Pydantic 团队开发的Python代理框架,可以通过生...

AutoGLM沉思
AutoGLM沉思

智谱推出的一款集深度研究与实际操作能力于一体的AI Agent产...

JustAI
JustAI

一款AI文案写作与营销工具,能生成多场景文案,包括小红书笔记、抖...

巧文书
巧文书

原通答AI,一款专为企业打造的AI智能写标书工具,通过AI大模型...

Ai2 Paper Finder
Ai2 Paper Finder

一款由艾伦AI研究所发布的基于LLM的文献搜索系统,Ai2 Pa...

Vivago AI
Vivago AI

北京智象未来科技有限公司面向全球市场推出的一款综合性在线 AI ...

Ghibli AI
Ghibli AI

一款专门用于生成吉卜力风格的AI图像生成器,能够根据用户的文本描...

快出题
快出题

金数据旗下的一款AI驱动的在线考试软件,能够快速生成题库并自动组...