全球第一!智元斩获WorldArena世界模型总分冠军

上观新闻 05-30 17:19

近日,具身领域热门榜单 WorldArena Track1(世界模型感知与动作响应赛道)最新评测结果揭晓。智元自研的世界模型 Genie Envisioner-Sim 2.0(以下简称GE 2.0)凭借优异的综合表现,登顶榜单榜首。

“世界模型感知与动作响应”赛道聚焦具身智能最本质的“认知与行动”能力,是评判通用人形机器人智能化水平的核心标尺。在该赛道评测中,智元团队使用了原生的世界模型GE 2.0,并未针对赛题进行特殊设计优化,仅基于榜单数据进行了基础微调(Finetune)。

“轻装上阵”依然拔得头筹,充分印证了GE 2.0强大的通用适配性。面对近期世界模型方向的火热关注和创业浪潮,智元始终保持自己的节奏,从长远第一性原理出发 ,专注于打磨具身世界模型的坚实技术底座。此次登顶,是智元坚持长期技术演进的实力见证。

在GE 2.0技术报告中,智元团队对模型进行了全面的能力剖析。相比上一代模型,GE 2.0不仅在单点性能上实现了跃升,更真正演进为一个全功能、高可用的世界模拟器,可构建可试错、可迭代、可进化的虚拟仿真环境,让机器人策略在虚拟场景中自主积累经验、完成动态试错,规避真实场景的试错成本,最终高效迁移至真实物理世界稳定落地,真正实现从“感知预测”到“仿真进化、自主决策”的闭环升级。

功能矩阵全面补齐:GE 2.0在功能上首次全面覆盖了长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等核心环节,构建了世界模拟器完整的技术能力闭环。

长时序推演能力突破: 在长时序推理任务中,GE 2.0表现出极强的稳定性,画面质量随推理时长的衰减显著弱于行业基线方案。即使在连续推演40-50秒的长视频片段时,其生成质量依然超越了基线模型前10秒内的表现。

高可靠的闭环评测: 作为世界模拟器,核心在于能否真实反映物理世界。团队验证了大量闭环评测结果,证明GE 2.0在多项任务上均与真实世界保持着强相关性。这种相关性不止步于宏观统计意义上的“成功率一致”,团队还进行了逐案(Case-by-case)的 rollout 结果对比分析,并通过混淆矩阵(Confusion Matrix)提供了严谨的量化佐证,强有力地证明了GE 2.0作为策略评测器的可靠性。

打通数据回流反哺机制: 在奖励模型(Reward Model)的加持下,GE 2.0能够对闭环评测的 rollout 过程进行自动化筛选,将世界模型中产出的有效高质量数据精准回流给策略模型(Policy Model)。实验证明,这一机制在多项任务上均助力策略模型实现了显著的性能涨点。

2026年是具身智能“部署态”元年,机器人从实验室走向真实场景,规模化部署,真正发挥具身智能生产力,这也对算法提出了更高的要求。专注底层技术攻坚与产业价值落地,是智元一贯的技术理念。未来,智元将持续迭代世界模拟器技术体系,打通具身智能技术闭环,推动世界模型真正走进真实场景,为人形机器人规模化落地筑牢核心技术底座。

(文章来源:上观新闻)

文章来源:上观新闻
原标题:全球第一!智元斩获WorldArena世界模型总分冠军
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
特朗普称美伊或于一周内达成协议 延长停火并重开霍尔木兹海峡
特朗普称美伊或于一周内达成协议 延长停火并重开霍尔木兹海峡
中国基金报 229评论
全球市场:美股三大指数均创收盘新高 纳指首次收于27000点上方 国际油价大涨
全球市场:美股三大指数均创收盘新高 纳指首次收于27000点上方 国际油价大涨
东方财富Choice数据 111评论
宇树科技“闪电”过会 人形机器人商业化元年将至?融资客提前埋伏多股(名单)
宇树科技“闪电”过会 人形机器人商业化元年将至?融资客提前埋伏多股(名单)
东方财富研究中心 45评论
3910亿首批公募基准调整落地 A股市场风格切换是巧合还是因果?
3910亿首批公募基准调整落地 A股市场风格切换是巧合还是因果?
澎湃新闻 125评论
打开东方财富APP查看更多内容
24小时点击排行
深夜利空,21股大减持,14股提示风险,7股刚收监管函,别踩雷
近期高位追芯片的人亏麻了,但短期调整完毕后今年行情还是他
变盘,做好迎接中阳的准备!
半导体再回调,game over?
中东突发 英伟达领涨 晚间重大消息
点击查看更多内容
写评论 ...