第8版:焦点关注

我们距离人形机器人真正普及还有多远?

□ 王耀南

网友提问:最近,具身智能机器人很火,我比较好奇,面对复杂的环境,它是如何保证高效安全工作的?我们距离人形机器人真正普及还有多远?

具身智能机器人的核心在于通过本体与环境的动态交互形成智能行为闭环,它的技术路径围绕“感知理解—交互决策—任务执行”展开。机器人利用多模态传感器(视觉、触觉等)采集环境信息,智能感知系统通过深度学习方法实现动态目标识别与语义理解,为后续决策提供认知基础。之后,交互决策层依托大模型技术将抽象指令转化为可执行的行动逻辑。最终,在任务执行阶段,深度学习驱动的强化学习和扩散策略算法将认知结果转化为精确的机电控制指令,完成物理世界的行为闭环。

总体而言,具身智能的本质是感知、认知与行动的深度耦合。深度学习作为人工智能的主要特征之一,提供从数据处理到功能实现的理论框架,是推动机器人突破单一任务限制的主要动力。

人工智能与人形机器人的融合,目前已经进入从实验室验证向商业化探索的关键过渡期。虽然以双足运动控制、环境交互和自主决策为关键的技术体系已取得一定突破,但距离真正普及仍有一段距离。首先,双足机器人的动态平衡与复杂地形适应能力尚未达到人类水平,在面对突发干扰或复杂环境时仍存在稳定性风险。其次,多模态感知系统的场景理解能力存在局限,一方面在光线变化、物品堆叠等现实场景中容易产生误判,另一方面也还未实现在复杂场景中的通用感知、认知和理解能力。最后,认知决策系统在开放式任务中的泛化能力不足,难以处理需要常识推理的复杂任务需求。

(作者为中国工程院院士、机器人视觉感知与控制技术国家工程研究中心主任,人民日报记者申智林采访整理)