🤜北航机器人研究所名誉所长王田苗:具身智能有望成为驱动社会进化的核心科技变量🌕

发布时间:2025-12-23 02:46:07 来源: 金台资讯

  

  中新网北京12月22日电(记者 吴家驹)近年来,我国具身智能产业迎来快速发展,并屡屡引起关注。具身智能有哪几条发展路径?未来需要进一步攻克哪些技术难点?

  近日,在第十八届中国工业论坛上,北京航空航天大学机器人研究所名誉所长、智友·雅瑞科创平台发起人、中关村智友研究院院长王田苗,就相关问题进行解答。

  王田苗表示,未来,一切数据将被AI激活,一切认知与决策将被AI参与,一切设备将被AI赋能,一切软件将被AI重构。而具身智能,作为连接物理世界与数字世界的桥梁,正成为驱动社会进化核心的科技变量。

  在他看来,具身智能有三条发展路径。

  第一条路径是“大脑优先”通用暴力派。效仿大语言模型(LLM)的成功路径,首先构建一个巨大的、基于互联网规模数据和仿真训练的通用基础模型,然后将其部署到通用的类人硬件上。

  这一路径的优势是极高的泛化能力,理论上一个模型可以学会任何任务。劣势是存在“仿真到现实”的鸿沟,能够理解莎士比亚的AI,却可能因为摩擦力建模的微小误差而无法完成一个简单的插销组装动作。此外,端到端模型的“黑盒”特性在工业认证上是巨大的挑战,成本巨大,周期很长。

  第二条路径是“身体优先”改良派。从传统机器进化到嵌入垂类大脑,在现有成熟工业机械臂集成突出竞争优势的基础上,增加AI视觉感知层和力控算法。保持底层的确定性控制回路,感知层面引入AI。

  这一路径的优势是具备现有的大量客户与信任关系,保障极高的可靠性和庞大的存量市场。劣势是会陷入局部最优,特别是当迁移到其他工业、商业、消费领域时,无法处理真正的开放世界任务或未预定义的变异。

  第三条路径是新势力“垂直智能体”务实派。借鉴自动驾驶的技术架构,利用BEV(鸟瞰图)感知、占用网络和预测规划算法,构建针对特定高价值垂直场景(如:汽车总装、物流等)的机器人,并采用“通用大脑”(高层推理)+“专家模型”(底层小脑/运动控制)的混合架构。

  这一路径的优势是平衡了泛化性与可靠性。劣势则是竞争十分激烈,取决于实控人对应用场景核心痛点的深刻理解与产品设计。

  “这三种发展路径都存在爆发性的成长机遇。”王田苗进一步表示,具身智能要实现从演示到日常使用的跨越,迫切需要攻克制约产业爆发的三个核心技术难点。

  一是要突破仿真到现实的泛化鸿沟,机器人在虚拟环境中可以经过数亿次训练学会完美抓取,但一旦部署到物理世界,光照变化、物体材质摩擦系数的微小差异、传感器噪声等都会导致任务失败。而物理世界的数据采集机器昂贵,如果不能在仿真中高效训练并迁移,机器人就无法应对现实世界的长尾场景。

  二是要实现高自由度灵巧手。灵巧手决定了“操作”。进入家庭做剥鸡蛋、穿针等家务,必须具备类似人手的触觉反馈和多指协同能力。

  三是提高端侧算力与能效比,具身智能需要实时处理多模态数据(视觉、触觉、听觉),对延迟极度敏感。完全依赖云端大模型,会导致通信延迟并带来安全隐患,而现有的端侧芯片难以支撑大参数量模型的推理,且功耗过高会严重缩短机器人续航。

  “未来,我们更应该注重垂类应用,以场景为王,只有这样才能真正服务于实体经济。”王田苗说。(完) 🏈