深圳市促进民营经济发展综合服务平台

首页 > 专题专栏 > 其他专题专栏 > 深圳市促进民营经济发展综合服务平台 > 新闻动态 > 产业发展

全球首个具身智能世界模型架构在深发布 从竞技赛场到家庭,深圳机器人准备就绪

来源:深圳特区报 发布时间:2026-04-23
人工智能朗读:

  深圳新闻网2026年4月23日讯(深圳特区报记者 邹媛)当脏碗自动洗净、打翻的水杯悄然归位,深圳正率先叩开机器人家庭应用的大门。4月21日,自变量机器人发布全球首个基于世界统一模型架构的具身智能基础模型WALL-B,这款可自动训练、自我更新的新一代机器人,一月后将入驻真实家庭服务;而在近期人形机器人半程马拉松上,荣耀“闪电”机器人以50分26秒净时夺冠,超越人类男子半马世界纪录。

  赛场竞技与家庭应用双线突破,勾勒出深圳机器人产业跨越技术鸿沟、走进千家万户的务实路径:以具身智能技术突破,让机器人走出实验室直面家庭场景考验;以中试产线建设破解量产难题,推动机器人从手工调试走向标准化制造。

  家庭是公认的具身智能“终极考场”,相比规整的实验室、工业场景,真实家庭环境复杂多变,对机器人感知、决策、操作能力提出极致考验,深圳则率先带领机器人产业迈入这场实战检验。

  “机器人硬件已到位——双足、灵巧手、力控关节都很好。但大脑没有跟上。”自变量创始人兼CEO王潜坦言,当下多数机器人或是预设轨迹表演,或是在固定场景重复作业,“目前全球没有任何一台机器人可以在无遥控操作的情况下,独立完成家庭综合整理任务。”

  自成立以来,自变量专注机器人“大脑”研发,2024年底发布基于VLA(视觉—语言—动作)架构的第一代具身基础模型WALL-A。今年3月,自变量与企业合作将机器人送入真实家庭,与保洁阿姨协同作业,实现全球首次机器人进入家庭。但在真实场景部署下,VLA架构的局限性开始显现。自变量联合创始人兼CTO王昊解释道,视觉模块负责识别物体,语言模块理解指令,动作模块生成轨迹。信息在模块之间逐级传递,每经过一次边界,就会出现损耗和延迟。更关键的是,这类模型擅长模仿却不一定理解世界。“机器人知道把盘子放桌上,却未必知道半个盘子悬空意味着即将摔碎。”

  全新WALL-B模型打破技术局限,将视觉、语言、动作、触觉、物理预测等多类能力融入同一个网络联合训练,实现真实环境自主迭代,无需人工重新训练、无需返厂调试。王潜表示,当下家庭机器人虽仍有不足,但已在最复杂的场景中开启学习进化之路。

  技术突破是基础,量产能力是关键。以往人形机器人依赖手工调试,精度不一、成本高昂,难以规模化量产,深圳首条人形机器人中试产线的投用,彻底破解这一行业痛点。

  4月12日,深圳首条人形机器人中试产线正式投用,该产线目前接入乐聚机器人ROBAN 2的小批量试产,围绕“柔性化”“标准化”“智能化”三大方向进行量产前试制与验证。

  “中试验证是介于研发和小规模量产之间的一个检验关卡或者验证系统,主要验证工艺可行性,以及供应链的稳定性和配套能力。”乐聚机器人助理副总裁曹雨表示,如果没有中试这个环节,直接从研发导入量产,很可能就会面临“造不出来、造得太贵、造得不好、造得不稳”的尴尬局面。中试的核心目的是立标准、降成本。

  通过模块化组装,该产线单机装配节拍(CT)被压缩到120分钟以内,年规划产能达到500到1000台,数字化管理系统更形成标准化的SOP(标准作业程序),打通研发成果到量产落地的关键堵点,助力机器人走进多元场景。

  当前全球具身智能竞争激烈,深圳紧盯真实需求、破解实际问题,推动机器人从“能用”变“好用”、从“样品”变“产品”。如今机器人走进家庭的大幕已启,深圳早已做好准备。

分享到:
分享到: