“具身智能”加速人形机器人“进化”_科技

继大模型后，“具身智能”成为今年科技界的新热点，被认为是新一波人工智能(AI)浪潮中的重点方向。众多初创公司涌现、融资屡创新高、技术不断突破……人形机器人作为该领域最具代表性的实体，正在大模型催化下加速产业化落地。

如果将大模型视为“有趣的灵魂”，“具身智能”赋能的人形机器人则有了“好看的皮囊”，已在多个领域成为人类的有力助手。

重新定义机器人

作为连接虚拟空间和现实空间的桥梁，“具身智能”是指将AI融入机器人等物理实体，赋予它们像人一样感知、学习和与环境动态交互的能力。

“具身智能”一词本身具有浓厚的技术哲学色彩。1945年，法国哲学家莫里斯·梅洛-蓬蒂提出“具身性”概念，认为人类需通过身体与周围环境进行互动和感知，进而理解世界。1950年，被称为“AI之父”的英国计算机科学家图灵在论文《计算机器与智能》中首次提出“具身智能”这一概念。

事实上，智能化水平相对较低的工业机器人(机械臂)早已在制造业广泛应用，带来质效提升。但传统工业机器人是“固定程序+机械臂”的组合，而“具身智能”赋能的机器人则是“多模态感知+大脑决策”的迭代。

清华大学交叉信息研究院助理教授许华哲认为，未来机器人将呈现多姿多彩的形态：双足、四足、轮式，机械狗、智能无人机甚至机械小蜜蜂，但人形机器人对人类社会适配性最佳，将成为最能够帮助人类的机器人。

人形机器人可解决生产线“最后一公里”的问题。很多个性化、定制化的产品无法靠流水线统一组装，这就需要具有泛化能力的人形机器人来“帮忙”，把批量生产的零部件按客户的定制需求组装成产品。在家庭服务、公共服务等更复杂多变的场景中，人形机器人也更具优势，可适应不同的环境和需求完成多种任务。

三大难点待突破

人形机器人研发始于对人类的学习与模仿，其研发难点也可以比照人类的大脑、小脑和本体来理解。“大脑”主要是机器人负责自主学习、规划和决策的中枢;“小脑”负责运动控制，包括从行走到跑跳，以及从简单抓取到复杂的手部动作等;而“本体”部分则包括躯干四肢结构和灵巧手设计。

优必选科技副总裁、研究院院长焦继超告诉记者，目前这三大领域都有较多技术难点有待突破：“大脑”方面，云边端一体计算架构、多模态感知与环境建模等是近年技术焦点，“仿人最大难点在于对人脑的模仿，现有科学理论对人脑的研究远远不足”;“小脑”方面，人机交互能力、复杂地形通过、全身协同精细作业等是重要方向;“本体”方面，刚柔耦合仿生传动机构、高紧凑机器人四肢结构与灵巧手设计等关键技术，是人形机器人灵活运动所需的重要硬件基础。

大模型的出现让机器人“大脑”显著“进化”，大大提升了机器人的通用性和泛化性，有望降低人形机器人开发成本，加速其走入千家万户。

据优理奇机器人科技公司创始人兼首席执行官杨丰瑜介绍，现在业界主要使用预训练大模型对机器人进行预训练，让其具备更强学习能力;大模型可将特定任务的学习迁移到机器人任务上，提高其适应能力;另外还可利用大模型的多模态处理能力，结合视觉、听觉、触觉等各种输入，提升机器人对复杂场景的理解。

中国起跑不落后

环顾全球，人形机器人已进入产业化落地初期阶段，在工业制造、商用服务和家庭陪伴领域开始“试水”。无论是技术突破、落地进展还是融资规模，人形机器人研发竞赛基本以中美为主导。

优必选人形机器人Walker今年聚焦汽车、消费电子等制造业重点领域，已进入多家车厂实训;宇树科技的机器人实现了完全仿人的自然行走;优理奇机器人正在酝酿“进家”计划;波士顿动力的新版Atlas机器人实现了在工厂中不同储物柜之间灵活搬动零件;特斯拉人形机器人“擎天柱”计划2025年开始量产……

焦继超说：“如果把人形机器人行业比喻成一场马拉松，中国和欧美国家，目前几乎都处在前面1000米的起跑阶段。”

杨丰瑜持同样观点，大模型研发能力、感知技术的领先使美国企业在机器人决策系统和复杂任务处理方面具有更强竞争力。而中国的优势更多体现在工业机器人领域，特别是在制造业中的应用较为成熟。在人形机器人技术专利方面，中国也已走在前列。

虽然机器人“大脑”的核心算法和高端芯片仍存在挑战，但中国机器人行业拥有丰富的应用场景和庞大的潜在用户人口，数据是最大竞争优势之一。

如何在真实世界场景中采集大量数据，并将数据统筹流通和供给人形机器人行业是关键。许华哲介绍说，真实世界的数据一般都靠各家机器人公司自己采集。北京人形机器人创新中心有限公司正计划打造一个开源数据集供学界和业界使用。未来，高质量的共享数据集将大大助力行业发展。