智元机器人推出GE平台,开启机器人控制统一世界模型新纪元
8 月 15 日消息,昨日,智元机器人通过其官方渠道宣布推出 Genie Envisioner(GE),这一平台是业内首个面向真实场景中机器人控制的统一世界模型平台。
据官方介绍,GE 有别于传统的“数据—训练—评估”分离模式,它首次将未来帧预测、策略学习和仿真评估整合进一个以视频生成为核心的闭环结构。该平台使机器人能够在同一个模型中实现从感知、思考到执行的全过程端到端操作。
GE 基于约 3000 小时的真实机器人操作视频进行训练,能够将语言指令直接转化为视觉空间信息,并完整保留机器人与环境交互过程中的时空特征。借助这一特性,GE-Act 在跨设备泛化和长时间任务执行方面表现优异,远超当前主流方案,为具身智能提供了从视觉识别到动作生成的新技术路径。
此外,GE-Act 凭借出色的视觉预训练能力,在仅有少量数据的情况下即可实现跨平台迁移。在 Agilex Cobot Magic 和 Dual Franka 等新机器人平台上,仅使用 1 小时(约 250 次演示)的远程操作数据,GE-Act 便能够高质量完成任务。
研发团队表示,GE 的推出标志着机器人技术从被动执行迈向主动“设想—验证—执行”的新阶段。未来,平台将进一步扩展对多模态传感器的支持,实现更复杂的移动与人机协同,持续助力智能制造和服务机器人领域的应用落地。
全部代码、预训练模型及评估工具将面向公众开放,相关资源链接如下:
Project page:https://genie-envisioner.github.io/
Arxiv:https://arxiv.org/abs/2508.05635
Github:https://github.com/AgibotTech/Genie-Envisioner