字节跳动OmniHuman模型已经在即梦上线内测

字节跳动上线的OmniHuman模型已经在即梦AI上线内测,该模型采用全新的多模态视频生成技术,用户只需输入一张图片和一段音频,就可以生成非常逼真真人视频动画,涵盖从面部表情到全身动作,无论是说话、唱歌、跳舞等。

未标题-1.webp

OmniHuman模型的主要功能:

  • 视频生成:能够将输入的单张照片转化为逼真的全身动态视频,叶可让数字人表现出讲话、唱歌等多种自然动作。

  • 多模态输入:同时支持肖像、半身及全身等不同尺寸的图片输入,结合音频内容,数据训练效果良好,能够生成高质量的动画视频。

OmniHuman模型不仅支持肖像和全身视频生成,还对不同类型的图片,如动漫和3D卡通等非真人图片输入,表现令人满意。即梦ai相关负责人表示,尽管OmniHuman已经表现出良好的效果,但在生成影视真实级别的视频方面仍有提升空间。OmniHuman也将将逐步开放使用,现在进行小范围内测,并设置严格的安全审核机制。

OmniHuman在哪里?

登录即梦AI,左侧栏选择视频生成。

我正在申请内测中...但用用户说是对口型,效果不是很好,但有些说很赞。

收藏
最新工具
HiveChat
HiveChat

一个专为中小型团队设计的开源AI聊天机器人项目,支持Deepse...

NeuraPress
NeuraPress

一款专注于微信公众号排版的Markdown编辑器,支持移动端,搭...

灵伴科技Rokid
灵伴科技Rokid

也和称Rokid,2014年成立,总部在杭州,创始人是前阿里巴巴...

Alpha派
Alpha派

讯兔科技打造的智能投研APP,主要面向投研人员提供一站式信息服务...

MultiPost
MultiPost

可辅助你通过自动化的方式规划自媒体的内容发布,一键将内容发布到多...

WeChat Bot
WeChat Bot

基于WeChaty结合OpenAI ChatGPT、Kimi、讯...

SVG Repo
SVG Repo

一个提供免费 SVG 矢量图和图标资源的网站,拥有超过 500,...

QuillWord
QuillWord

一款致力于学术和研究写作的AI工具。QuillWord提供了AI...

妙写
妙写

一款集智能排版、查重、纠错和管理于一体的论文写作辅助工具,适用于...

3MinTop
3MinTop

一款AI阅读助手,可以让用户在3分钟内高效地获取书籍的核心内容,...