首页 > Ai资讯 > Ai产品

TripoSG：一款能够从单张输入图像生成高细节的3D模型

映技派于2025-03-31发布在Ai产品

TripoSG是什么？

TripoSG 是由VAST-ai-Research 团队开发的开源高保真3D形状合成技术，基于大规模校正流架构和混合专家Transformer 设计，能够从单张输入图像生成高细节的3D模型。

TripoSG是什么？.webp

大规模修正流变换器：TripoSG 首次将基于校正流（Rectified Flow, RF）的 Transformer 架构应用于 3D 形状生成。与传统的扩散模型相比，RF 提供了从噪声到数据之间更简洁的线性路径建模，有助于实现更稳定、高效的训练。
混合监督训练策略：结合符号距离函数（SDF）、法线和 Eikonal 损失，显著提升了 3D 变分自编码器（VAE）的重建性能。
高质量数据处理流程：开发了完善的数据构建与治理流水线，包括质量评分、数据筛选、修复与增强、SDF 数据生产等环节。通过这一流程，构建了一个包含 200 万高质量“图像-SDF”训练样本对的数据集。
高效的 VAE 架构：使用 SDF 进行几何表示，相较于此前常用的体素占用栅格具有更高的精度。
MoE Transformer 模型：TripoSG 是首个在 3D 领域发布的 MoE Transformer 模型。

1. 安装：

git clone https://github.com/VAST-AI-Research/TripoSG.git
cd TripoSG
conda create -n tripoSG python=3.10
conda activate tripoSG

pip install torch torchvision --index-url https://download.pytorch.org/whl/{your-cuda-version}
pip install -r requirements.txt

2. 快速开始：从图像生成 3D 网格：

python scripts/inference_triposg.py --image-input assets/example_data/hjswed.png