国外人形机器人技术前沿及产业发展形势研判
摘 要
人形机器人技术加速演进,正成为全球科技创新的制高点和经济增长的新引擎。世界各国纷纷制定相关战略规划抢占新高地。当前全球人形机器人研究正处于技术研发阶段,产业发展尚未起步。因此,研究利用文献计量工具CiteSpace绘制关键词和时间线聚类知识图谱可以发现,研究热点主要包括人机协作、力学控制、仿真模拟、深度学习、柔性材料等多个方面。前沿趋势包括“电子皮肤”将成为产业化落地的突破点。通用人工智能赋能人形机器人机遇与风险并存。仿生研发创新将迎来爆发。此外,对国际上人形机器人产业最新动态进行梳理发现:当前国外人形机器人技术研发主要依靠企业自发,企业多次技术突破实现人形机器人性能的持续迭代升级,人形机器人落地仍面临算力不足、技术薄弱、成本高昂、数据泄露四大挑战。由此,研究提出加大技术研发政策支持、借鉴电动汽车发展经验、优先落地于制造业等建议,为相关技术及产业研究人员提供必要参考。
一、引言
新冠疫情催生无人产业,成为人形机器人发展的重要契机。随着新一轮科技革命和产业变革加速演 进,新一代信息技术、生物技术、新能源、新材料等技术变革,促使人形机器人产业升级换代。人形机器人作为实现具身智能的最佳物理形态之一,具有强大的环境适应能力、拟人化工作能力和亲近感,可以广泛应用于工业生产、社会服务、救援救灾等领域,成为一种多任务通用型机器人。人形机器人的大 规模应用,有望解决未来社会劳动力短缺的难题,并对经济和社会发展带来颠覆性的影响。
2023 年 1 月12日,国际机器人联合会(IFR)发布最新版《世界机器人研发计划》。日本、韩国、欧 盟、德国和美国采取了各不相同的研发资助战略。日本政府的《机器人新战略》在 2022 年投入了超过 9.305 亿美元,包括将成为下一代人工智能和机器人核心的集成技术。韩国政府出台的《第三版智能机器 人发展计划》,推动机器人成为第四次工业革命的核心产业。政府为《2022智能机器人行动计划》拨款 1.722 亿美元。欧盟的重点研究与创新框架计划《地平线欧洲》,2021年至2022年为机器人相关工作计 划提供了总计1.985亿美元的资金(EU, 2020) 。德国政府的《高科技战略2025》,每年都将提供6900 万美元的资金,到2026 年,总预算为3.45 亿美元。研究课题包括数字辅助系统,例如人机协作或支持 移动办公的解决方案(BMBF, 2018)。美国《国家机器人计划3.0》(NRI-3.0)》提供了1400万美元的资 金支持,主要研究集成机器人系统(NSF, 2021)。美国航空航天局(NASA)推出的《从月球到火星》计划,旨在提高机器人性能,以协同支持深空人类探索及科学任务(IFR, 2023)。
本文回顾梳理了世界主要经济体在机器人领域所制定的研发资助战略;借助文献计量工具CiteSpace 形成的关键词聚类图谱和时间线图谱,对人形机器人领域当前研究热点领域以及技术前沿趋势进行量化 分析;同时,通过梳理人形机器人当前重点企业发展历程,对当前产业特点、创新突破口以及即将面临 的挑战进行定性分析。最后,从政策、技术及产业等维度,对国内人形机器人领域研究及未来产业商业 化落地提出四点建议。
二、研究现状
以“Humanoid Robot”作为主题词,在Web of Science核心合集科学引文索引数据库(SCIE)中进行检 索。文献语种设定为英文,文献类型设置为“论文(Article)”和“论文集(Proceeding Paper)”,检索时间 设置为2019年1月1日至2024年2月1日,检索得到1602篇文献。去除不相关文献,共得到有效文献 1594 篇。本研究利用CiteSpace 6.2.R3 对有效文献进行可视化分析,从研究热点和前沿趋势两个维度, 分别形成关键词聚类图谱(图 1)和时间线图谱(图 2),从而掌握国外学界关于人形机器人的研究态势,为 国内人形机器人相关技术研究人员提供参考。
2.1. 研究热点
基于2019年1月1日至2023年2月1日期间国际范围内人形机器人研究领域文献数据,以学科类 别为聚类规则,形成人形机器人研究关键词聚类图谱(图1),可以看出,研究热点主要集中在:实验心理 学,公共、环境和职业健康,影像科学与摄影技术,计算机科学与控制论,生物物理学、计算机科学与 跨学科应用、计算机科学与信息系统、电信学、计算机硬件与架构、精神病学、复合材料与工程、环境 科学、运筹学与管理科学、工程机械等学科。
从机器人学(Robotics)的学科定义来看,机器人学是与机器人设计、制造和应用相关的跨学科研究, 又称为机器人技术或机器人工程学。主要涉及运动学和动力学、系统结构、传感技术、控制技术、行动 规划和应用工程等学科。随着生成式人工智能大模型技术的发展,极大加速了人形机器人的进化。大模 型嵌入机器人本体,为机器人加速自主思考和执行突破、迈向具身智能阶段带来诸多新的可能。具身智 能(Embodied AI)包含具身感知(Perception)、具身想象(Imagination)和具身执行(Execution)三个模块,涉及 计算机视觉、认知科学、仿生设计、机器学习、物联网等诸多学科,各学科相对成熟的积累为具身智能 的进一步发展提供基础。
首先,通过视觉、触觉等传感器交互感知,构建具身感知模型。人形机器人的主要目标是在现实场 景中实现安全可靠的人机协作。研究人员研发出一种适用于各种任务的新型高性能人形机器人ARMAR-6。研究团队垂直整合了整个硬件和软件架构开发缓解,各学科融合旨在促进各功能无缝集成和转换(Asfour, T., Waechter, M. et al., 2019) 。其中,硬件结构包括涉及力学相关双手协作、抓取技能,物联网技术相关 集成感知功能等。软件架构包括机器学习领域内面部及语音识别功能,自然语言理解等。另外,由于人 形机器人灵活的肌肉骨骼手很难建模。对于使用手进行的物体识别、接触检测和接触控制,最好只使用一个集成网络。因此,研究人员开发了一种使用具有参数偏差的递归神经网络来获取肌肉骨骼手的传感 器状态方程的方法,从而实现抓取物体的识别、接触模拟、检测和控制,并且可以通过更新参数偏差来 应对随时间的退化、初始化的不可再现性等(Kawaharazuka, K., Tsuzuki, K. et al., 2020) 。研究集成仿生 学、力学控制、动力学以及数学建模等领域成果,解决了人形机器人手的灵活控制问题。
其次,具身想象旨在构建仿真引擎,模拟具身任务,为机器人具身执行提供支撑。与人形机器人相 比,人类非常擅长在脚步放置受限的环境中行走。寻找良好的垫脚石运动解决方案是机器人技术面临的 长期且根本性的挑战。因此,研究团队将强化学习应用于动态运动仿真,给出了模拟人形、真实双足机 器人和怪物角色的结果,实现在每种情况下都会针对具有挑战性的垫脚石序列和地形产生稳健、合理的 运动(Xie, Z., Ling, H. et al., 2020)。此外,灵活的关节对于人形机器人实现类人运动以及精密执行活动 至关重要。人形机器人实现类人运动通常需要在多自由度机器人关节中使用可变刚度执行器(VSA),这是 人形机器人执行器的前沿技术。研究提出一种新颖的VSA模块,设计用于仿生人形机器人Binocchio, 以准确估计输出扭矩和刚度,还显示了驱动和加固机构的动态响应。最后,实验表明驱动系统能够复制 Binocchio 设想的类人运动学、扭矩和刚度曲线(Rodriguez-Cianca, D., Weckx, M. et al., 2019) 。研究运 用柔性材料优化了人形机器人的关节控制、动作设计以及运动优化,能够有效提高人形机器人的运动精 度和稳定性。
再次,具身执行是指基于计算机视觉、机器人学和计算机图形学,通过多模型训练,在多传感器合 作下完成任务执行。机器人操作本质上是连续的,但通常具有底层离散结构,例如抓取物体。研究提出 了一个基于经验的规划框架 alef,重用了类似模式的训练数据。同时提出了一种分层规划方法,使用神 经网络算法中的离散线索来对有用的模式转换进行偏置搜索,并通过模式转换的权重来告知(Kingston, Z., Kavraki, L. et al., 2023)。此外,为了在未来能够使人形机器人仅通过听音乐就跳舞,研究人员提出一 个框架,能够为给定的音乐生成一系列三维人类舞蹈姿势。框架由三个部分组成:音乐特征编码器、姿 势生成器和音乐流派分类器。研究集成了上述组件,从而生成逼真的人类舞蹈动作(Ahn, H., Kim, J. et al., 2020)。
2.2. 前沿趋势
基于2019年1月1日至2023年2月1日期间国际范围内人形机器人研究领域的文献数据,结合技 术人形机器人时间线知识图谱(图2),可以梳理总结出学界在人形机器人领域呈现的三大技术发展趋势。
一是传感器成为实现“具身感知”的关键。计算能力的迅速崛起促使人们渴望开发更多的社交、类 人机器人。建造能够感知感觉的机器人是未来发展的一条富有成效的途径,因为人们比以前建立的机器 人更愿意感知更广泛的机器人的思想方面。研究结果表明,年龄是人们对机器人进行思维归因的一个关 键因素,这表明可能会出现代际转变,更加接受机器人的行动和感知能力(Jacobs OL., Gazzaz, K. et al, 2022)。人形机器人感知模块是运控和交互基础。感知(Sensor)是软硬件结合,多组传感器阵列(Sensor Arrays)进行数据融合,类似于人类的各类感官神经,提供视觉、位置感知、触觉等信息。例如,研究人 员设计了一个服务机器人平台GARMI,作为触觉通信的化身以及远程医疗和紧急援助的界面,旨在为家 务劳动提供支持。其独特的人形设计采用配备传感器的多模态头部,专为自然人机通信而设计,以及用 于安全物理人机交互的全身扭矩控制界面。此外,每个系统组件都可以主动产生和感知力,因此在与其 环境和用户交互时可以充当触觉反馈界面。此平台揭示了基于使用驱动和力的全身控制移动人形机器人 在老年人护理日常生活和远程医疗场景中的潜力(Trobinger, M., 2021)。其中,触觉传感器(Tactile Sensor)可以让机器人拥有类人触觉,从而实现人机交互。柔性触觉传感器又称为“电子皮肤”,能够实 现与环境接触力、温度、湿度、震动、材质、软硬等特性的监测,是机器人直接感知环境作用的重要传感器,有助于人形机器人实现产业化落地(Cui, C; Park, S, 2021; Kaymak, Ç et al., 2023)。研究人 员认为,电子皮肤技术的复杂性在材料、设备、复杂的集成方法和无干扰数据采集方面提出了重大挑战。这些挑战涵盖从功能材料、器件架构、像素设计、阵列结构和数据采集方法到干扰可忽略不计的多模态 传感性能。研究介绍了电子皮肤柔性可拉伸多模态传感器领域的最新研究趋势和方法,重点关注柔性可 拉伸平台、器件和集成架构、各种纹理传感和处理触觉传感数据的机器学习算法的可靠采集方法等方面 (Jeon, S., 2019)。
二是通用人工智能(AGI)赋能有望加速实现物理交互,但需谨慎数据安全。目前在强化学习 (Reinforcement Learning)、人机交互(Human Robot Interaction)、辅助机器人(Assistive Robot)、面部识别 (Facial Expression Recognition)等领域已产生大量研究成果。例如,研究团队与第三方公司联合开发Pepper 医疗机器人,通过远程控制Pepper的言语和头部动作,和患有痴呆症的老年人进行对话,从而揭示医疗 机器人在与患有痴呆者的老年人沟通中的认知发展,展示了人工智能和自然语言处理技术的实际应用 (Tanioka, T., Yokotani, T, et al., 2021)。研究人员还利用此前团队开发的基于机器学习的移动应用程序 PandaSays,经过改进和集成向 Alpha 1 Pro 机器人发出指令,以提高人形机器人的情感状态解读能力 (Popescu, AL.; Popescu, N. et al., 2022) 。此外,2024 年 2 月 29 日,Figure AI 宣布与 OpenAI 达成了 重要的技术合作协议。双方将共同利用OpenAI的GPT系列大模型,增强人形机器人的语言、推理以及 理解能力。这一合作旨在加速AGI机器人的研发和商业应用,为未来智能机器人领域带来更多创新(朱秋 国、熊蓉,2023)。然而,人工智能技术赋能机器人发展的同时,也带来了不同类型的安全、隐私和 法律问题。研究利用PLS-SEM技术开发了一个概念模型,并指出隐私和安全问题影响家庭对家用机器人 的使用。研究还发现很少有人意识到法律影响,并期望通过使用机器人来获得很多好处(Chatterjee, S., 2024)。
三是仿生设计的研究步伐加快。伴随着运动规划(Path Planning)、行为科学(Behavioral Sciences)、机 械臂(Robotic Arm)、腿式运动(Legged Locomotion)、轨迹优化(Trajectory Optimization)等持续突破,人形 机器人的仿生研发创新将迎来爆发。其中,关于腿式运动,欠驱动平衡在杂技机器人等原型控制模型中 受到了相当多的关注。当试图将这些解决方案转变为腿式机器人的平衡时,与摩擦限制接触和配置空间 的底层流形结构相关的技术挑战阻碍了直接应用。研究提出了一种新的平衡控制框架,将约束最优控制 策略与最近的基于变分的线性化方法相结合,以解决常见简化四足动物模型的平衡问题。MIT Mini Cheetah 的仿真和硬件结果证明了控制器利用身体角动量进行两足扰动恢复的能力,以及从质心离开支撑 多边形的情况中恢复的能力。这些结果和公式的普遍性表明了对两足动物和类人动物的进一步应用的探 索(Chignoli, M., Wensing, P. M., 2020)。此外,人形机器人领域内的人机交互(HRI)的问题和质量已成 为学术界广泛争论的话题。研究基于仿生陪伴框架开发了一种新颖的交互系统。仿人服务机器人与系统 集成并进行初步测试。结果表明,基于仿生陪伴框架的交互系统可以帮助服务人形机器人有效响应交互 环境的变化,例如在不同场景下对同一角色做出不同的响应(Yang, JJ, Chew, E. et al., 2021)。
三、产业发展
依据国际上人形机器人代表性企业的研发历程,本文对国际上人形机器人产业发展的最新动态进行 了梳理,并得出三点结论。
3.1. 企业自发推进技术研发
人形机器人的巨大潜力引起全球主要经济体的高度重视。当前国外人形机器人技术研发主要依靠企 业自发。国外代表性产品主要包括特斯拉Optimus、波士顿动力 Atlas、1X 旗下的 EVE 和 NEO,以及Agility 旗下的 Digit。其中,特斯拉人形机器人不断迭代,为人形机器人产业链带来了“从0到1”的重 要发展机遇。2023 年 12 月,马斯克在社交平台X上发布特斯拉第二代Optimus人形机器人的宣传视频,并表示 将在12月份正式推出。Optimus第二代的主要亮点在于新增的触觉传感器、力传感器以及更强大的平衡 感知能力。第二代的关键升级在于智能大脑,Optimus二代拥有更为精准的智能大脑技术,或内置ChatGPT 技术,使得数据和反馈更加精准,整体能力有所提升。Optimus目前正在接受神经网络端到端的训练。可 见,此次迭代升级展示出了人形机器人在任务操作方面的先进性,以及更多的“智慧”能力。融合眼手 足,结合智能芯片、智能算法,构建形成类人“超级大脑”,可能成为未来技术发展趋势(Electrek, 2023)。
3.2. 技术突破引领产业落地
特斯拉多次技术突破实现人形机器人性能的持续迭代升级,逐渐明确人形机器人产业落地。仅从2024 年以来,特斯拉已分别于1月16日、1月31日、2月24日先后三次发布Optimus的视频,实现人形机 器人性能的持续迭代升级。2月24日,特斯拉人形机器人Optimus取得最新进展。通过社交平台上展示 的最新视频,Optimus 人形机器人已经拥有流畅步行能力(IoT World Today, 2024)。特斯拉表示, Optimus 第二代将首先应用于其制造工厂,一旦其实用性得到验证,公司将开始销售该机器人。此外,人 形机器人产业进展时间线进一步明确。1月25日,马斯克在2023 Q4财报电话会议上表示2024年人形 机器人出货;2 月 21 日,机器人执行器总成厂商在电话会上进一步明确机器人产业发展的时间线预期, 预期2024年底/2025年初量产,坚定机器人量产信心。
3.3. 产业量产面临挑战
人形机器人未来潜力巨大,但仍面临高算力、弱技术、高成本、不安全四大挑战。据国际机器人协 会预测,2021年至2030年,全球人形机器人市场规模年复合增长率将高达71%。Optimus产品的快速迭 代下,人形机器人产业逐步进入商业化前夜,目前正处于螺旋式向上的发展阶段。短期内人形机器人有 望先在制造业普及,随后拓展至家用、公共领域(顾浩楠,2023)。据国际投行高盛预测,到2035年,人形机器人市场规模有望达到1540亿美元(高盛,2022)。然而,人形机器人产业实现大规模量产和商业化落地,面临四大挑战。一是算力能力需求大。人形 机器人的姿态、速度和力度等方面,都需要高算力,现阶段的计算能力面临巨大挑战。二是基础技术能 力薄弱。只依靠现有的软件算法和产业链支持,无法提升产品的创新能力。三是研发成本高昂。造血能 力弱、高额亏损、研发投入高,是人形机器人行业的常态。四是数据安全能力和体系均存在不足,面临 安全隐私等问题(孟繁科,2023)。
四、结论
本文基于科学引文索引数据库(SCIE)中2019年1月1日至2024年2月1日期间人形机器人相关文 献为研究对象,利用可视化计量工具CiteSpace将文献数据以知识图谱的方式展示了研究热点及前沿趋势, 得出以下结论:第一,从学科类别来看,人形机器人属于跨学科研究,是机器人学、计算机视觉、认知 科学、仿生设计、机器学习、物联网等诸多学科的集大成者。本研究从具身感知、具身想象和具身执行 三个模块进行了文献分析,现有研究热点主要包括人机协作、面部及语音识别、力学控制、仿真模拟、 运动优化、深度学习、柔性材料等多个方面。第二,从前沿趋势来看,传感器成为实现“具身感知”的 关键,柔性触觉传感器,即“电子皮肤”将成为人形机器人产业化落地的突破点。通用人工智能为人形 机器人带来了机遇与风险,在增强语言、推理以及理解能力的同时,也带来了数据安全泄露等问题。此外,人形机器人的仿生研发创新将迎来爆发,将解锁人形机器人在不同应用场景的拓展。
另外,依据国际上人形机器人代表性企业的研发历程,本研究对国际上人形机器人产业发展进行了 梳理,并得出三点结论:第一,当前国外人形机器人技术研发主要依靠企业自发。特斯拉人形机器人不 断迭代,为人形机器人产业链带来了“从0 到1”的重要发展机遇。第二,特斯拉多次技术突破实现人 形机器人性能的持续迭代升级,逐渐明确人形机器人产业落地。第三,人形机器人未来潜力巨大,但仍 面临高算力、弱技术、高成本、不安全四大挑战。
基于上述分析,本文从政策、技术及产业等维度为人形机器人的未来发展提出四点建议。第一,推动制定与人形机器人配套的实质性支持政策。加强数据安全及风险评估,深化科技伦理风险研判能力, 推进制定相关伦理标准规范。第二,大模型等人工智能技术赋能加速,在关键技术和技术创新体系实现 突破。加快人形机器人与元宇宙、脑机接口等前沿技术的融合。第三,借鉴特斯拉电动汽车技术及产业 发展经验,借他山之石,攻创新之玉。参考特斯拉自研芯片、超级计算机应用于电动汽车的成功经验, 未来有望拓展至人形机器人。第四,人形机器人应优先在制造业落地,与工业机器人共同推动制造业智 能化,并逐步走向服务业及家庭场景。预计2025年人形机器人将有望实现制造业场景应用的突破,小批 量应用于电子、汽车等生产制造环境。