Vidu

Vidu

中国首个长时长、高一致性、高动态性视频大模型,能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。

#Ai工具箱 #Ai视频生成
收藏

Vidu简介

Vidu是生数科技与清华大学合作开发的Vidu视频大模型,凭借其创新的U-ViT架构,成为国内首个达到Sora级别的视频大模型。该模型不仅在技术上具有全球首创性,而且通过开源的UniDiffuser模型,展示了其大规模可扩展性的验证。

Vidu 不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。Vidu 模型融合了 Diffusion 与 Transformer 技术,创新性地开发了 U-ViT 架构。能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。

生数科技 - www.shengshu-ai.com.jpg

Vidu功能特征:

  • 模型结构:Vidu 模型融合了 Diffusion 与 Transformer 技术,创新性地开发了 U-ViT 架构。

  • 视频生成能力:Vidu 能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。

  • 3D生成:基于简单文字输入,生成高质量、多样性和创造性的图像 图像生成 API调用 在线体验 基于文本或图像输入,生成个性化3D模型 | 基于已有3D模型,对贴图等进行自动化编辑。

  • 实际应用演示:在官方资料中,展示了一个视频示例,内容是“画室中的一艘船驶向镜头”,展现了船和海浪的逼真效果。

  • 高级功能:Vidu 不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。

北京生数科技有限公司(简称“生数科技”)成立于2023年3月,核心团队成员来自清华大学人工智能研究院,此外汇集了来自阿里、腾讯、字节等知名科技公司的顶尖人才,是全球范围内领先的深度生成式算法研究团队,拥有扩散概率模型底层创新研发能力。公司致力打造世界领先的多模态大模型,融合文本、图像、视频、3D等多模态信息,探索生成式ai在艺术设计、游戏制作、影视后期、内容社交等场景的商业赋能,通过AI提升人类的创造力和生产力。

与Vidu相关工具