加入收藏
|
设为首页
|
会员中心
|
我要投稿
|
RSS
首页
物联网
人工智能
机器人
大模型
智能体
app小程序
OPC社区
嵌入式
知识库
AI工具
您当前的位置:
首页
>
机器人
小米于2026 年 2 月 12 日正式发布并开源Xiaomi-Robotics-0
时间:2026-02-12 18:41:47 来源: 作者:
小米于
2026 年 2 月 12 日
正式发布并开源
Xiaomi-Robotics-0
,这是一款
47 亿参数
的
视觉语言动作(VLA)
机器人基座模型,主打
通用理解 + 实时动作执行
,可在消费级显卡上跑实时推理,在三大仿真基准中拿下全项 SOTA。
一、核心信息速览
发布时间
:2026 年 2 月 12 日
模型定位
:开源 VLA(视觉 - 语言 - 动作)基座模型
参数规模
:
47 亿参数
核心能力
:理解模糊指令 + 生成流畅、精准的物理动作
部署门槛
:
消费级显卡即可实时推理
开源范围
:代码、权重、技术文档已开放
二、核心架构:大脑 + 小脑(MoT 混合架构)
模型采用
Mixture-of-Transformers(MoT)
,模拟人脑 “感知决策 + 运动控制” 双系统:
视觉语言大脑(VLM)
理解模糊自然指令(如 “把毛巾叠好”)
从高清视觉中提取空间关系、物体属性
保留通用多模态能力(检测、问答、推理)
动作执行小脑(Action Expert)
基于
Diffusion Transformer(DiT)
输出 ** 动作块(Action Chunk)** 而非单步动作
用 ** 流匹配(Flow-matching)** 保证精度(误差≤0.3mm)
三、关键技术突破
异步推理 +Λ-shape 注意力掩码
解决推理延迟导致的 “动作断层”,让推理与机器人运行异步执行;强制模型聚焦当前视觉反馈,中断响应时间 **<80ms**。
两阶段训练
跨模态预训练:混合视觉 - 语言 + 动作数据,对齐语义与动作空间
后训练:冻结 VLM,专注训练 DiT 生成精准动作序列
海量训练数据
2 亿 + 机器人轨迹数据
8000 万 + 通用视觉 - 语言样本
专项数据:338 小时乐高拆解、400 小时毛巾折叠
四、性能表现
仿真测试
:在
LIBERO、CALVIN、SimplerEnv
三大基准中,
所有细分项 SOTA
真机任务
:积木拆解、毛巾折叠等长周期任务,手眼协调稳定、动作流畅
CALVIN 长周期任务完成率
:
92%
(行业平均约 67%)
五、行业意义
从硬件走向
算法核心
,补齐小米机器人 “大脑”
拉低具身智能落地门槛:
消费级显卡即可部署
开源推动生态,加速家用 / 服务机器人的实用化
来顶一下
返回首页
发表评论
共有
条评论
用户名:
密码:
验证码:
匿名发表
推荐资讯
Tabbit AI 浏览器代码
Optimus 愿景: 马斯克
相关文章
无相关信息
栏目更新
栏目热门
站内搜索:
资讯
下载
图库
教程
讲演
商品
文章
分类信息
高级搜索
AI产业链
|
银发经济
|
新能源
|
低空经济
|
高端制造
|
生物技术
|
大数据
|
航天卫星
|
智能城市
|
6G产业
|
智慧农业
|
手机站WAP
本站资料和信息均摘自互联网,如有侵权及其他原因,请及时告知删除,联系:25823258@QQ.com
工业和信息化部ICP
冀ICP备2024080107号-1
|
冀公网安备13100302001404号
Powered by
物联网-人工智能AGI-大模型AI技术!
8.0
© 2002-2026
Iot物联网 Inc.