开云体育(kaiyun)官方网站 小米发布并开源 Xiaomi OneVL 自动驾驶模子

官方示意,该模子在业内最初已毕VLA、寰宇模子、潜空间推理等多个手艺阶梯的妥洽,在具备XLA模子强悍推明智商的基础上,大幅升迁了推理的速率和精度,是行业内具备始创性的决议,在精度上超过显式CoT、在速率上对皆“仅谜底”揣测的潜空间CoT决议。
金沙电玩城app官方下载
昔时,VLA和寰宇模子是自动驾驶鸿沟两条相对独处的手艺阶梯:VLA专注于清爽场景并输出驾驶手脚,开云体育寰宇模子专注于揣测异日场景的演变。XiaomiOneVL通过潜空间推理,初次将两者妥洽到吞并套框架中。
在涵盖感知、推理与看法的多个主流基准上,XiaomiOneVL全面刷新了潜在推理措施的性能上限。

▲在ROADWork、Impromptu、Alpamayo-R1三项基准上均达到SOTA,在NAVSIM上赢得优厚性能
同期,XiaomiOneVL能为模子决策提供道话和视觉双维度的可诠释性——既能用笔墨阐述“为什么这么开”,也能用揣测画面展示“接下来会发生什么”。

▲为模子决策提供道话以及视觉的可诠释性
小米已将XiaomiOneVL的模子权重和查验、推理代码全面开源,IT之家汇总讨论如下:
手艺论说:https://arxiv.org/abs/2604.18486
开源代码:https://github.com/xiaomi-research/onevl开云体育(kaiyun)官方网站