首页 > Ai资讯 > Ai产品

HSMR：从单张图像重建人体3D骨架和网格模型的新方法

映技派于2025-04-01发布在Ai产品

HSMR 是什么？

HSMR 是一种计算机视觉和深度学习技术，可以从单目或多目图像中恢复人体的骨架结构和三维网格模型。这项技术在虚拟现实、增强现实、游戏开发和运动分析等场景有很广泛的应用。

HSMR 是什么？.webp

模型架构：HSMR 采用基于 Transformer 的架构，输入为单张人体图像，输出为 SKEL 模型的姿势参数 q 和形状参数 β。
数据生成与训练：
由于缺乏足够的训练数据，作者构建了一个生成伪真实数据的流程，并通过迭代优化的方式逐步改进这些伪标签。
在训练过程中，通过优化 HSMR 的估计结果以对齐真实二维关键点（SKELify），并使用优化后的参数作为后续训练的监督目标。
生物力学准确性：SKEL 模型具有生物力学上合理的自由度，能够更真实地估计关节旋转，避免了传统方法中常见的关节角度限制违反问题。

HSMR：从单张图像重建人体3D骨架和网格模型的新方法.webp

端到端的单图像重建：HSMR能够直接从单张图像中恢复出人体的骨架参数，这是首个实现此类功能的方法。
生物力学准确性：采用SKEL参数化人体模型，该模型基于生物力学准确的骨架设计，能够提供更符合人体生理结构的关节旋转估计，避免了传统方法中常见的不自然旋转和生物力学不准确的问题。
伪真实数据生成与迭代优化训练：为了解决训练数据不足的问题，HSMR构建了一个生成伪真实数据的流程，并通过迭代优化的方式逐步改进这些伪标签，以提高模型的训练精度。
Transformer架构：使用基于Transformer的架构来处理输入图像，估计SKEL模型的姿势参数和形状参数，能够更好地捕捉图像中的复杂特征和人体姿态信息。