UniVG

UniVG

百度公司推出的视频生成模型,能够以文本和图像的任意组合作为输入条件进行视频生成。

#Ai工具箱 #Ai开源项目
收藏

UniVG简介

百度UniVG是一种统一模式ai视频生成系统,能够以文本和图像的任意组合作为输入条件进行视频生成。UniVG系统由百度团队开发,解决现有视频生成模型在处理单一任务或单一目标时的局限性。

UniVG开源地址:https://univg-baidu.github.io/

UniVG.jpg

UniVG主要功能和特点:

  • 高自由度视频生成:使用多条件交叉注意力机制,根据输入的图像或文本生成与语义一致的视频。

  • 低自由度视频生成:引入偏置高斯噪声替代完全随机的高斯噪声,以更好地保留输入条件的内容。

  • 多任务处理:系统内的视频生成模型被重新划分为高自由度生成和低自由度生成两类,分别适用于不同的生成任务。

  • 扩散模型:基于扩散的视频生成方法,在学术和工业界取得了显著成功。

UniVG应用场景和优势:

  • 灵活输入:用户可以灵活地输入图像和文本条件,单独或组合使用,满足实际应用场景的需求。

  • 高质量输出:在MSR-VTT数据库上实现了最低的FVD(Fréchet Video Distance),在人类评估中超过了当前开源方法,并与现有闭源方法Gen2相当。

  • 多样化任务:支持文本到视频、图像到视频以及文本和图像结合到视频等多种视频生成任务。

UniVG作为一个强大的工具,它通过整合文本和图像输入,推动了视频生成技术向更灵活、更高质量的方向发展,为内容创作、广告、娱乐等多个领域提供更大的推广思路。


与UniVG相关工具