Fin-R1:一款基于Qwen2.5的金融推理型大语言模型

Fin-R1是什么?

Fin-R1 是一款由上海财经大学统计与数据科学学院张立文教授团队(SUFE-aiFLM-Lab)联合财跃星辰开发的金融领域推理型大语言模型,Fin-R1模型以 Qwen2.5-7B-Instruct 为基座,利用 DeepSeek-R1 框架进行“数据蒸馏”与“双轮质量筛选”,通过高质量思维链数据的监督微调+ 强化学习,有效解决了金融领域中数据碎片化、推理逻辑不可控和业务泛化能力不足等问题,为金融行业的智能化转型提供了有力支持。

Fin-R1:一款专为金融领域设计的推理型大语言模型.webp

模型架构

Fin-R1 采用两阶段架构进行训练:

  • 数据生成阶段:通过数据蒸馏和筛选方法,从多个权威数据源构建高质量的金融推理数据集 Fin-R1-Data。

  • 模型训练阶段:基于 Qwen2.5-7B-Instruct 模型,通过监督微调(SFT)和强化学习(RL)进行训练。

Fin-R1数据集特点

  • 规模与质量:Fin-R1-Data 包含约 60,091 条完整的思考链(CoT),涵盖中英文金融垂直领域的多维度专业知识。

  • 模块化设计:数据集分为金融代码、金融专业知识、金融非推理类业务知识和金融推理类业务知识四大模块。

Fin-R1核心特点

  • 专业领域:专注于金融推理,涵盖金融代码、专业知识、业务知识等多个维度。

  • 数据驱动:基于高质量的金融推理数据集 Fin-R1-Data 进行训练,包含约 60,091 条完整的思考链。

  • 训练方式:采用监督微调(SFT)和强化学习(RL)相结合的方式,确保模型在金融推理任务中的准确性和可靠性。

  • 轻量化设计:参数量仅为 7 亿,但性能表现出色。

Fin-R1:一款专为金融领域设计的推理型大语言模型.webp

性能表现

  • 权威评测:在金融领域权威评测中,平均得分 75.2 分,位居第二。

  • 任务表现:在 FinQA 和 ConvFinQA 任务中分别获得 76.0 分和 85.0 分,位居参评模型第一。

  • 泛化能力:在其他金融基准测试中也展现出强大的跨任务泛化能力。

Fin-R1应用

  • 金融代码:用于实现金融模型、算法和分析任务的编程代码。

  • 金融计算:进行定量分析和计算,为金融决策提供依据。

  • 金融安全合规:防范金融犯罪,确保业务操作符合法规要求。

  • 智能风控:利用 AI 和大数据技术识别和管理金融风险。

  • ESG 分析:评估企业在环境、社会和治理方面的表现。

Fin-R1使用步骤

  1. 下载模型:通过 Hugging Face 页面下载模型权重。

  2. 启动服务:使用 vllm 工具启动模型服务。

  3. 推理运行:通过 OpenAI API 格式调用模型进行推理。

Fin-R1相关链接

模型下载:https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1

论文:https://arxiv.org/pdf/2503.16252

收藏
最新工具
AutoGLM沉思
AutoGLM沉思

智谱推出的一款集深度研究与实际操作能力于一体的AI Agent产...

JustAI
JustAI

一款AI文案写作与营销工具,能生成多场景文案,包括小红书笔记、抖...

巧文书
巧文书

原通答AI,一款专为企业打造的AI智能写标书工具,通过AI大模型...

Ai2 Paper Finder
Ai2 Paper Finder

一款由艾伦AI研究所发布的基于LLM的文献搜索系统,Ai2 Pa...

Vivago AI
Vivago AI

北京智象未来科技有限公司面向全球市场推出的一款综合性在线 AI ...

Ghibli AI
Ghibli AI

一款专门用于生成吉卜力风格的AI图像生成器,能够根据用户的文本描...

快出题
快出题

金数据旗下的一款AI驱动的在线考试软件,能够快速生成题库并自动组...

BotSharp
BotSharp

一个基于.NET开发的开源AI多智能体应用开发框架,它可以快速将...

Seede AI
Seede AI

一款简单易用的AI驱动设计工具,只需输入文字描述或上传参考图片,...

Colors
Colors

一个开源的学术期刊配色推荐器,收集整理了众多高质量论文插图的配色...