首页 > Ai资讯 > Ai产品

DeepSeek深夜发布全新多模态AI模型：Janus-Pro与JanusFlow

映技派于2025-01-28发布在Ai产品

DeepSeek 发布的 Janus-Pro 和 JanusFlow 是多模态 ai 领域的重大突破，这两款模型的设计旨在提升图像理解与生成的能力，尤其是在文本到图像的生成任务中表现出色。

Janus-Pro模型

Janus-Pro是一款统一的多模态理解与生成框架。其架构通过解耦视觉编码的方式，显著提升了模型在不同任务中的适配性与性能。根据DeepSeek的报告，Janus-Pro在多个基准测试中表现优异，尤其是在文生图的生成能力上，其准确率达到了80%和84.2%，超越了OpenAI的DALL-E 3等竞争对手。

此外，Janus-Pro的设计还注重灵活性与高效性，能够适配视觉问答、图像标注等多种多模态场景。这使得它在实际应用中具有广泛的潜力，尤其是在需要高质量图像生成的领域，如广告、游戏和艺术创作等。

Janus-Pro模型.webp

JanusFlow模型

与Janus-Pro相辅相成，JanusFlow则是一款通过生成流与自回归语言模型融合的框架。它的设计理念是实现视觉理解与生成的统一，能够在理解任务中表现出色，同时生成高质量的图像。JanusFlow的极简架构使得其在训练和推理过程中更加高效，适合大规模应用。

JanusFlow模型.webp

技术亮点与创新

Janus-Pro：

解耦视觉编码：通过将视觉编码过程拆分为独立的路径，分别处理多模态理解与生成任务，解决了传统模型中视觉编码器在两种任务中的功能冲突，显著提升了模型的适配性与性能。
统一 Transformer 架构：采用单一的 Transformer 架构处理多模态任务，简化了模型设计并提升了扩展能力。
高性能表现：在 GenEval 和 DPG-Bench 基准测试中，Janus-Pro-7B 的准确率分别达到 80% 和 84.2%，超越了 OpenAI 的 DALL-E 3 和 Stable Diffusion。

JanusFlow：

生成流与语言模型融合：通过将生成流（Rectified Flow）与自回归语言模型结合，JanusFlow 实现了极简但强大的多模态框架，无需复杂改造即可生成高质量图像。
高灵活性与可扩展性：支持多任务扩展，成为统一多模态框架的优秀选择。

Janus-Pro与JanusFlow.webp

性能表现

图像生成能力：Janus-Pro 和 JanusFlow 均支持 384x384 分辨率的图像生成，生成质量高，适配多种应用场景。

多模态理解能力：在视觉问答、图像标注等任务中，两款模型的表现均超越了任务专用模型，展现了强大的通用性。

基准测试成绩：在 GenEval 和 DPG-Bench 测试中，Janus-Pro-7B 的表现显著优于 DALL-E 3 和 Stable Diffusion，成为当前多模态领域的领先者。

模型名称	多模态理解性能	图像生成能力	灵活性与扩展性
Janus-Pro	超越专用模型，解耦更高效	优异生成能力，支持多场景应用	高度灵活，架构统一设计
JanusFlow	大语言模型与生成流高效融合	高质量生成，适配 384x384 分辨率	极简架构，灵活性更强