VIMI大模型

VIMI大模型

商汤科技推出的全球首个可控人物视频生成AIGC产品,VIMI模型基于商汤的日日新大模型技术,能够通过单张照片生成与目标动作一致的人物视频,实现精准的表情和肢体控制。

#Ai工具箱 #Ai平台模型
收藏

VIMI大模型简介

VIMI大模型,商汤科技推出的全球首个可控人物视频生成aiGC产品,VIMI大模型基于商汤的日日新大模型技术,可以通过动作视频、动画、声音、文字等多种驱动元素来驱动人物类图片,画面效果不会随着时间的变化而降低品质或失真,从而生成和目标动作一致的人物类视频。除了可控性外,Vimi在生成人物稳定性、生成视频时长上,也突破了其它大模型AI视频生成的限制,可以稳定的生成分钟级的单镜头人物视频。

VIMI:可控人物视频生成大模型

VIMI大模型不但可以实现精准的人物表情控制,还可控制照片中人物上半身的自然肢体动作,并自动生成与人物相符的头发、服饰及背景变化。同时光影变化也能做到合理生成,让人物动作和视觉效果流畅自然,画面和谐唯美,是稳定的可控人物视频生成产品。

VIMI大模型功能特征:

  • 可控人物:VIMI能够精确控制视频中人物的面部表情和肢体动作,生成与目标动作高度一致的视频内容。无论是微妙的面部表情变化,还是复杂的全身动作,VIMI都能够准确捕捉并再现。

  • 多种控制方式:VIMI提供了多样化的控制输入方式,包括人物视频、动画参数、语音文字等。使用户能够通过不同的输入方法来驱动视频生成,创造出更丰富和多样化的视频。

  • 分钟级单镜头:支持生成分钟级的单镜头人物视频

  • 合理的视频场景生成:VIMI不仅关注人物本身的表现,还能够生成合理的视频场景,包括人物的头发、服饰、背景等元素的补全,以及光影变化的支持。这使得VIMI生成的视频不仅人物表现自然,整个场景也和谐统一。

  • 稳定生成长视频:VIMI能够生成长达一分钟的单镜头人物视频,且画面效果稳定,不随时间劣化或失真。这是一个显著的突破。

VIMI大模型应用场景:

VIMI主要面向C端用户,适用于聊天、唱歌、舞动等多种娱乐互动场景。

  • 娱乐创作:满足广大用户的娱乐创作需求,如生成数字分身和写真视频和各种趣味的人物表情包。

  • 影视制作:为影视作品提供高质量的人物视频素材,减少制作成本和时间。

  • 动画制作:支持动画创作者使用骨架生成动作,提高动画制作效率。

Vimi大模型在2024年世界人工智能大会(WAIC)上发布,并入选大会展览展示最高荣誉“镇馆之宝”。Vimi大模型能够生成长达1分钟以上的单镜头人物视频,且画面效果不会随时间降低品质或失真,还能根据人物动作调整环境场景,模拟镜头角度变化和头发抖动,提供逼真的视觉效果。

Vimi将完全向广大用户开放使用。用户只需上传不同角度的高清人物照片,即可自动生成数字分身和不同风格的写真短片。针对喜爱自拍的用户,Vimi支援聊天、唱歌、舞动等多种娱乐互动场景。

与VIMI大模型相关工具