
GO-1大模型
GO-1大模型简介
GO-1是什么?
Genie Operator-1(GO-1)是智元启元大模型是智元机器人于2025年3月10日发布的中国首个通用具身基座模型。GO-1模型开创性地提出了Vision-Language-Latent-Action(ViLLA)架构,由多模态大模型(VLM)和混合专家(MoE)组成。
技术架构
ViLLA架构:VLM借助海量互联网图文数据,获得通用场景感知和语言理解能力;MoE中的Latent Planner(隐式规划器)通过跨本体和人类操作视频数据,获得通用的动作理解能力;Action Expert(动作专家)则通过百万真机数据,实现精细的动作执行。
人类视频学习:GO-1可以结合互联网视频和真实人类示范进行学习,增强对人类行为的理解。
小样本快速泛化:能够在极少数据甚至零样本的情况下快速适应新场景和任务,降低了具身智能的门槛。
跨本体应用:支持部署到不同机器人本体,实现快速适配和高效落地。
持续进化:通过数据回流系统,从实际执行中不断学习和进化。
主要特点
人类视频学习:GO-1可以结合互联网视频和真实人类示范进行学习,增强对人类行为的理解,更好地为人类服务。
小样本快速泛化:具有强大的泛化能力,能够在极少数据甚至零样本下泛化到新场景、新任务,降低了具身模型的使用门槛和后训练成本。
一脑多形:作为通用机器人策略模型,GO-1能够在不同机器人形态之间迁移,快速适配到不同本体,实现群体升智。
持续进化:搭配智元的数据回流系统,GO-1可以从实际执行遇到的问题数据中持续进化学习,越用越聪明。
实验表现
在五种不同复杂度任务上测试GO-1,相比已有的最优模型,GO-1的平均成功率提高了32%。其中,在“Pour Water”(倒水)、“Table Bussing”(清理桌面)和“Restock Beverage”(补充饮料)任务中表现尤为突出。
应用前景
家庭场景
家务劳动:GO-1可以执行家务清洁、物品整理、厨房任务等,例如倒水、烤吐司、整理房间等。
智能助手:通过自然语言交互,帮助家庭成员完成日常任务,如拿取物品、开关电器等。
商业场景
零售服务:在零售店中,GO-1可以根据顾客需求提供个性化服务,如物品上架、货物盘点、顾客引导等。
餐饮服务:在餐厅中,机器人可以完成送餐、清理桌面、补充饮料等任务。
工业场景
物流与分拣:模拟工业仓库与生产线环境,执行物料分拣、包装打包、物流搬运等任务。
生产辅助:在生产线上协助完成一些重复性或精细操作任务,如安装、检测等。
办公场景
文件管理:帮助整理文件、递送物品,提升办公效率。
会议辅助:在会议中协助拿取物品、记录信息等。
其他潜在场景
智元启元大模型GO-1项目官网:https://agibot-world.com/blog/go1
GO-1论文:https://agibot-world.com/blog/agibot_go1.pdf