Hallo:用于肖像图像动画的分层音频驱动视觉合成

Hallo,可以根据单张图像和音频输入生成唱歌和说话视频,并能控制人物表情和姿态,和EMO相比,Hallo由于使用了扩散模型来实现层次化的音频驱动视觉合成,它能够通过输入语音,生成对应的人物嘴唇同步、表情变化和姿态变化的动画。提高了语音与生成动画之间的对齐精度,使动画的嘴唇、表情和姿态与语音的同步

Hallo:用于肖像图像动画的分层音频驱动视觉合成.jpg

Hallo功能特征:

  • 虚拟角色动画生成:通过语音音频输入生成逼真的、动态的虚拟角色动画,并实现虚拟角色的口型、表情和姿态的精确同步。

  • 真实角色动画生成:将技术应用于真实人物的语音驱动动画生成,生成的动画能准确反映真实人物的表情和动作变化。

  • 多种运动控制:提供对角色表情、姿态和嘴唇运动的精确控制,支持多种表情和姿态的自适应控制,增强动画的多样性和真实性。

  • 跨演员应用:支持不同身份的个性化动画生成,通过音频输入,生成适应不同角色身份的动画效果。

  • 歌唱动画生成:通过语音和歌曲音频输入,生成同步的歌唱动画,动画能够准确反映歌唱时的口型和表情变化。

Hallo其它特点:

  • 实时性:采用扩散模型结构,增强了动画生成的实时性,使得生成的动画更加逼真和自然。

  • 个性化:可以根据不同的演员或角色定制不同的个性化的动画效果。

  • 多样性:提供多种运动控制,包括表情、姿态和嘴唇运动,使动画更加多样化和真实性。

Hallo项目地址:https://fudan-generative-vision.github.io/hallo

Hallo Github:https://github.com/fudan-generative-vision/hallo

Hallo 论文:https://arxiv.org/abs/2406.08801

HuggingFace:https://huggingface.co/fudan-generative-ai/hallo

收藏

相关文章

最新工具
谷歌趋势
谷歌趋势

一个由谷歌提供的免费分析工具,谷歌趋势允许用户搜索和比较关键词的...

GeeLark
GeeLark

一款专为移动端设计的多账号管理工具,GeeLark提供了一种创新...

Pony Diffusion
Pony Diffusion

一个擅长生成高质量、风格化、可爱动物主题的AI动漫艺术图片生成器...

心辰Lingo语音大模型
心辰Lingo语音大模型

实现了从语音输入到语音输出的全程无缝对接,心辰Lingo能够直接...

匡优AI出题
匡优AI出题

一款利用人工智能帮助用户根据需求生成试题的网站。模板出题内置了约...

BuzzSumo
BuzzSumo

一款功能强大的在线工具,专为内容营销人员、作家和 SEO 专业人...

Ehunt.Ai
Ehunt.Ai

一个帮助卖家全面剖析Etsy产品数据,掌握市场流行风向的工具。E...

豆包爱学
豆包爱学

字节跳动旗下的AI教育应用,原名为河马爱学。豆包爱学APP基于豆...

Kacha
Kacha

一款专注于图像处理的AI写真应用程序,Kacha通过简化复杂的照...

Super智能AI知识库
Super智能AI知识库

一款可以进行AI机器人角色设定、知识库训练、发布/分享智能体,同...