Stable Virtual Camera:使用一张图片,可以生成360度旋转的3D视频

Stable Virtual Camera是什么?

Stable Virtual Camera 是由 Stability AI 推出的一款用于NVS 的多视角扩散模型。它能够根据任意数量的输入视角及其对应的相机参数,生成目标相机视角下的新图像。当所有相机形成一条轨迹时,生成的视角在 3D 上具有一致性、时间上平滑,并且正如其名称所暗示的那样——“稳定”,能够生成无缝的轨迹视频

Stable Virtual Camera:使用一张图片,可以生成360度旋转的3D视频.webp

Stable Virtual Camera功能

  • 多视角输入:可以接受从 1 到 32 张输入图像,性能随着输入视角的增加而提升,尤其是在处理大型场景时。

  • 灵活的图像分辨率:尽管模型仅在 576×576 的正方形图像上进行训练,但能够以零样本的方式生成不同宽高比的目标视角。

  • 长视频生成与闭环一致性:能够生成长达 1000 帧的视频,并在相机返回到同一位置时保持 3D 一致性。

  • 采样多样性:在给定稀疏输入视角时,能够捕捉视角合成的不确定性,并生成不同的可能场景。

  • 基准测试:建立了一个全面的基准,用于在不同数据集和设置下评估 NVS 方法。Stable Virtual Camera 达到了新的最佳性能。

Stable Virtual Camera应用

  • 广告和营销:快速生成吸引人的产品展示视频。

  • 内容创作:帮助艺术家和设计师将静态图像转化为动态视频。

  • 教育和培训:将教材中的静态插图转化为 3D 视频,增强学习体验。

  • 数字电影和 3D 动画:为影视制作提供新的可能性。

Stable Virtual Camera使用方法

1. 获取代码和模型

  • 代码:从 GitHub 克隆代码。链接见文章末尾。

  • 模型权重:从 Hugging Face 下载模型文件。下载链接见文章末尾。

2. 安装依赖

运行以下命令安装所需依赖:

pip install -r requirements.txt

3. 运行方式

  • 交互式使用(Gradio 演示)

启动 Gradio 演示:

python gradio_demo.py

通过图形界面上传图片并设置参数,生成 3D 视频。

  • 命令行使用(CLI)

使用命令行运行:

python demo.py --data_path  --output_path  --camera_path

示例:

python demo.py --data_path ./input_images --output_path ./output_video --camera_path spiral

4. 输入和输出

  • 输入:支持 1 到 32 张 2D 图像,需提供相机参数。

  • 输出:生成不同宽高比(如 1:1、9:16、16:9)的 3D 视频,支持长达 1000 帧。

GitHub 代码仓库:https://github.com/Stability-ai/stable-virtual-camera

Hugging Face 模型页面:https://huggingface.co/stabilityai/stable-virtual-camera

项目主页:https://stable-virtual-camera.github.io/

论文:https://arxiv.org/abs/2503.14489

收藏
最新工具
Awesome LangGraph
Awesome LangGraph

一份精心整理的 LangGraph 资源合集,涵盖了基础介绍、入...

VDSpeak
VDSpeak

一个专注于为YouTube视频提供多语言翻译和配音服务的在线工具...

PydanticAI
PydanticAI

一个Pydantic 团队开发的Python代理框架,可以通过生...

AutoGLM沉思
AutoGLM沉思

智谱推出的一款集深度研究与实际操作能力于一体的AI Agent产...

JustAI
JustAI

一款AI文案写作与营销工具,能生成多场景文案,包括小红书笔记、抖...

巧文书
巧文书

原通答AI,一款专为企业打造的AI智能写标书工具,通过AI大模型...

Ai2 Paper Finder
Ai2 Paper Finder

一款由艾伦AI研究所发布的基于LLM的文献搜索系统,Ai2 Pa...

Vivago AI
Vivago AI

北京智象未来科技有限公司面向全球市场推出的一款综合性在线 AI ...

Ghibli AI
Ghibli AI

一款专门用于生成吉卜力风格的AI图像生成器,能够根据用户的文本描...

快出题
快出题

金数据旗下的一款AI驱动的在线考试软件,能够快速生成题库并自动组...