智元机器人发布首个通用具身基座大模型

来源：东方网时间：2025-03-10 13:50:25 阅读量：16778次

3月10日，澎湃新闻记者从上海市经信委获悉，当天上午，智元机器人正式发布首个通用具身基座大模型——智元启元大模型GO-1。

智元提出了Vision-Language-Latent-Action架构，该架构由VLM(多模态大模型) + MoE(混合专家)组成。智元启元大模型GO-1借助人类和多种机器人数据，让机器人获得了学习能力，可泛化应用到各类环境和物品中，快速适应新任务、学习新技能。同时，它还支持部署到不同的机器人本体，并在实际的使用中持续进化。

智元机器人服务场景。

举例来说，用户给出指令告诉机器人要做的事情，比如“挂衣服”，模型就可以根据看到的画面，理解这句话对应的任务要求。然后，模型根据之前训练时看过的挂衣服流程，设想这个过程应该包括哪些操作步骤，最后执行这一连串的步骤，完成整个任务的操作。

在更深层的技术层面，GO-1大模型具备了通用的场景感知和理解能力。在构建和训练阶段，该大模型学习了互联网的大规模纯文本和图文数据，因此能够理解“挂衣服”在此情此景下的含义和要求；学习过人类操作视频和其他机器人的各种操作视频，所以能知道挂衣服这件事通常包括哪些环节；学习过仿真的不同衣服、不同衣柜、不同房间，模拟过挂衣服的操作，所以能理解环节中对应的物体和环境，并打通整个任务过程；最后，因为学习过真机的示教数据，所以机器人能完成整个任务的操作。

具体来说，该款大模型的特点可以归纳为4个方面。

一是人类视频学习:GO-1大模型可以结合互联网视频和真实人类示范进行学习，增强模型对人类行为的理解。

二是小样本快速泛化:该大模型具有泛化能力，能够在极少数据甚至零样本下泛化到新场景、新任务，降低了具身模型的使用门槛，使得后训练成本非常低。

三是一脑多形:该大模型是通用机器人策略模型，能够在不同机器人形态之间迁移，快速适配到不同本体。

四是持续进化:该大模型搭配一整套数据回流系统，可以从实际执行中遇到的问题数据中持续进化学习。

智元机器人在五种不同复杂度任务上针对GO-1的测试显示，相比已有的最优模型，GO-1的任务成功率领先，平均成功率提高了32%，其中在“Pour Water”(倒水)、“Table Bussing”(清理桌面)和“Restock Beverage”(补充饮料)的任务中表现尤为突出。

声明：本网转发此文章，旨在为读者提供更多信息资讯，所涉内容不构成投资、消费建议。文章事实如有疑问，请与有关方核实，文章观点非本网观点，仅供读者参考。

猜您喜欢

小米RedmiK60Pro手机限时 感谢IT之家网友瓦特Watt、偏科骚黄4100只眼、番茄炒西红柿的线索投递！8GB+256GB到手价3299元12GB+...

券商降薪网友表示很有必要｜思维生活 一直以来，国内银行、券商、基金行业的薪酬待遇就处于全行业的偏高水平。Choice数据显示，2021年上市券商中，有29家...

政策暖风劲吹，“三桶油”的新能源投 澎湃新闻获悉，4月4日，国家能源局组织召开加快油气勘探开发与新能源融合发展启动会。国家能源局党组成员、副局长任京东主持会...

OpenAI发帖介绍如何确保AI安 ，美国当地时间周三，OpenAI发帖，详细介绍了其确保AI安全的方法，包括进行安全评估、改进发布后的保障措施、保护儿童以...

任天堂经典游戏《宝可梦竞技场2》将 ，任天堂宣布，经典游戏《宝可梦竞技场2》将于4月12日加入到SwitchOnline+扩展高级会员所拥有N64游戏库中。...

导师带徒传薪火座谈交流送春风 4月3日，中铁武汉电气化局一公司潍烟项目部举行ldquo;导师带徒rdquo;拜师仪式暨2023年度大学生座谈会。ldq...

精彩推荐

亚马逊将调整薪酬

悦榕集团2022

九成收益飘红！一

KoboElip

首季银行同业存单

谷歌外包审核抱怨

华为拟向股东分配

又有6股创新高！

智元机器人发布首个通用具身基座大模型

热门排行

精彩推荐

今日聚焦