首页 > Ai资讯 > Ai产品

Stable Virtual Camera：使用一张图片，可以生成360度旋转的3D视频

Stable Virtual Camera于2025-03-20发布在Ai产品

Stable Virtual Camera是什么？

Stable Virtual Camera 是由 Stability AI 推出的一款用于NVS 的多视角扩散模型。它能够根据任意数量的输入视角及其对应的相机参数，生成目标相机视角下的新图像。当所有相机形成一条轨迹时，生成的视角在 3D 上具有一致性、时间上平滑，并且正如其名称所暗示的那样——“稳定”，能够生成无缝的轨迹视频。

Stable Virtual Camera：使用一张图片，可以生成360度旋转的3D视频.webp

Stable Virtual Camera功能

多视角输入：可以接受从 1 到 32 张输入图像，性能随着输入视角的增加而提升，尤其是在处理大型场景时。
灵活的图像分辨率：尽管模型仅在 576×576 的正方形图像上进行训练，但能够以零样本的方式生成不同宽高比的目标视角。
长视频生成与闭环一致性：能够生成长达 1000 帧的视频，并在相机返回到同一位置时保持 3D 一致性。
采样多样性：在给定稀疏输入视角时，能够捕捉视角合成的不确定性，并生成不同的可能场景。
基准测试：建立了一个全面的基准，用于在不同数据集和设置下评估 NVS 方法。Stable Virtual Camera 达到了新的最佳性能。

Stable Virtual Camera应用

广告和营销：快速生成吸引人的产品展示视频。
内容创作：帮助艺术家和设计师将静态图像转化为动态视频。
教育和培训：将教材中的静态插图转化为 3D 视频，增强学习体验。
数字电影和 3D 动画：为影视制作提供新的可能性。

Stable Virtual Camera使用方法

1. 获取代码和模型

代码：从 GitHub 克隆代码。链接见文章末尾。
模型权重：从 Hugging Face 下载模型文件。下载链接见文章末尾。

2. 安装依赖

运行以下命令安装所需依赖：

pip install -r requirements.txt

3. 运行方式

交互式使用（Gradio 演示）

启动 Gradio 演示：

python gradio_demo.py

通过图形界面上传图片并设置参数，生成 3D 视频。

命令行使用（CLI）

使用命令行运行：

python demo.py --data_path  --output_path  --camera_path

示例：

python demo.py --data_path ./input_images --output_path ./output_video --camera_path spiral

4. 输入和输出

输入：支持 1 到 32 张 2D 图像，需提供相机参数。
输出：生成不同宽高比（如 1:1、9:16、16:9）的 3D 视频，支持长达 1000 帧。

GitHub 代码仓库：https://github.com/Stability-ai/stable-virtual-camera

Hugging Face 模型页面：https://huggingface.co/stabilityai/stable-virtual-camera

项目主页：https://stable-virtual-camera.github.io/

论文：https://arxiv.org/abs/2503.14489

SmolDocling：将复杂的文档转换为结构化文本的轻量型视觉语言模型

字节跳动的SeedEdit 和谷歌的Gemini 2.0 Flash对比，哪个更强

DSO：牛津大学公布的符合物理规律的3D模型优化框架

DSO：牛津大学公布的符合物理规律的3D模型优化框架

2025-04-02

HSMR：从单张图像重建人体3D骨架和网格模型的新方

HSMR：从单张图像重建人体3D骨架和网格模型的新方

2025-04-01

TripoSG：一款能够从单张输入图像生成高细节的3

TripoSG：一款能够从单张输入图像生成高细节的3

2025-03-31

Vibe Draw：一款开源的手绘草图快速转化为3D

Vibe Draw：一款开源的手绘草图快速转化为3D

2025-03-30

LHM：阿里推出的单张图像重建出可动画化的3D人体模

LHM：阿里推出的单张图像重建出可动画化的3D人体模

2025-03-22

腾讯Hunyuan3D-2推出的5个开源3D模型，各

腾讯Hunyuan3D-2推出的5个开源3D模型，各

2025-03-18

最新工具

Awesome LangGraph

一份精心整理的 LangGraph 资源合集，涵盖了基础介绍、入...

VDSpeak

一个专注于为YouTube视频提供多语言翻译和配音服务的在线工具...

PydanticAI

一个Pydantic 团队开发的Python代理框架，可以通过生...

AutoGLM沉思

智谱推出的一款集深度研究与实际操作能力于一体的AI Agent产...

JustAI

一款AI文案写作与营销工具，能生成多场景文案，包括小红书笔记、抖...

巧文书

原通答AI，一款专为企业打造的AI智能写标书工具，通过AI大模型...

Ai2 Paper Finder

一款由艾伦AI研究所发布的基于LLM的文献搜索系统，Ai2 Pa...

Vivago AI

北京智象未来科技有限公司面向全球市场推出的一款综合性在线 AI ...

Ghibli AI

一款专门用于生成吉卜力风格的AI图像生成器，能够根据用户的文本描...

快出题

金数据旗下的一款AI驱动的在线考试软件，能够快速生成题库并自动组...

用户登录