去年底,谷歌DeepMind发布了一期播客,英国数学家兼广播员汉娜·弗莱教授采访了该公司加州机器人实验室负责人卡尼什卡·拉奥。两人共同观看了人形机器人“阿波罗”(Apollo)分拣衣物、打开并装入面包至密封袋、按颜色将积木放入托盘等操作——这些动作均由弗莱现场指令下达,机器人以灵巧精准的方式完成。但此次演示并非传统预编程机器人执行固定脚本任务的常规展示,而是向世界呈现:当Gemini大规模多模态推理能力被嵌入实体机器人后所能实现的突破。
2024年12月,谷歌DeepMind与德克萨斯州人形机器人初创企业Apptronik达成合作,将自身物理人工智能技术集成至阿波罗机器人,使其具备在三维空间环境中感知与操作物体的能力。该方案中,视觉-语言-动作模型将视觉信息与指令转化为运动指令;而具身推理模型则对所见所闻进行逻辑推演,支持机器人完成多步骤规划与自主决策。
Apptronik产品负责人帕克·康罗伊从事机器人领域已逾十年。他表示:“人形机器人实质上是多年来积累的各类机器人技术的集大成者——自主性、灵巧性与操控能力在此交汇。但令我意外的是,物理人工智能的发展速度竟如此之快。”
他进一步指出:“过去依赖传统编程的机器,如今可借助生成式人工智能的飞跃式进步,不仅胜任实用工作,更能与人类自然互动。”
身高5英尺8英寸(约1.7米)、重160磅(约72.6公斤)的阿波罗,已在梅赛德斯-奔驰、捷普(Jabil,Apptronik全球制造合作伙伴)及其他未公开合作方的产线上开展试点,部分场景中甚至与工人协同作业。其主要任务包括搬运包裹、拣选与递送零部件,以及重复性作业,如物料搬运、设备看护与质量检测。
阿波罗的研发团队源自德克萨斯大学奥斯汀分校参与NASA“女武神”(Valkyrie)人形机器人项目的科研人员,其核心执行器系统——即机器人的“肌肉”——亦源于航天局技术积累。该系统融合旋转与直线执行器,构成30组“肌群”,使机器人能屈臂、抓取物品并像人类一样行走。
康罗伊强调:“我们高度聚焦能量密度——在更小体积执行器中实现更高输出——同时注重结构鲁棒性。多年来,团队已迭代开发超过60种不同版本的执行器。”
阿波罗的感知系统融合面部与躯干周围的立体深度摄像头与激光雷达(LiDAR),构建360度环境地图;肢体内的惯性测量单元(IMU)辅助平衡;关节处的力-扭矩传感器可实时感知外部作用力,使机器人依据反馈动态调整动作,安全应对不确定性环境。“其手部也配备传感器,即使无法目视高处货架上的物品,也能准确抓取。”康罗伊补充道。
数据处理依托阿波罗高密度计算系统,内置Nvidia Jetson边缘AI计算模块,既支持AI模型运行, 也赋能机器人通过人类示范学习新技能。
凭借Apptronik的具身硬件平台、Nvidia的算力与AI模型,以及谷歌DeepMind的多模态推理层,阿波罗形成一套软硬件深度耦合的分布式系统,实现感知、理解、规划与调度的高度协同。尤为重要的是,该机器人可在真实环境中展现一定程度的自主行为。
康罗伊表示:“让阿波罗进入制造环境意义重大——关键在于机器人能以非预设方式与环境互动,甚至在部署时未知的具体任务也能灵活响应。这对客户影响深远:例如,传统机器人产线换型成本高昂,而借助生成式AI,我们正开发能适应变化工况的机器人,使制造商快速响应客户需求调整产线。”
他特别强调数据的核心地位:“这不仅是构建模型的问题,更关乎数据采集规模与算力扩展。目前我们已在拣选、产线旁配送、设备看护等多个场景持续收集数据,并反哺AI模型训练……这正催生出性能优异、环境适应性强的物理人工智能系统。”
尽管高性能计算与AI能力日益成熟,开发者仍致力于提升人形机器人在日常、全天候、通用场景下的可靠性。现代汽车集团旗下人形机器人先驱波士顿动力(Boston Dynamics)机器人部门主管阿尔贝托·罗德里格斯在近期网络研讨会上坦言:“若论当前尚未攻克的最大挑战,便是实现工厂产线部署所需的极致可靠性——这是极具吸引力且需长期投入的课题。”
与此同时,供电系统同样至关重要。对于体重超百磅、需长时间站立、行走、扭转及举重,同时支撑边缘AI运算的机器人而言,电池续航能力直接决定其能否实现大规模商业化落地。
目前多数人形机器人单次续航仅2至4小时。Apptronik采用“热插拔”电池方案,单次续航约4小时,更换仅需2分钟;俄勒冈州Agility Robotics公司研发的Digit机器人则可在产线停机期间自主前往充电站补能。主流仍为液态锂离子电池,但TrendForce最新研究指出,长时运行与高负载需求将推动高能量密度固态锂电池加速普及。
康罗伊指出:“电池技术进步将是推动更多人形机器人走向现实应用、拓展应用场景的关键驱动力之一。”
Apptronik并非唯一在工厂落地成功的厂商。2024年9月,宝马开始在南卡罗来纳州斯帕坦堡工厂试用人形机器人Figure 02(由加州Figure AI开发),该机器人负责将金属板材置入焊接夹具,在10个月内参与逾3万辆SUV组装。西门子则使用英国Humanoid公司机器人在产线上堆叠周转箱;特斯拉亦已将其Optimus人形机器人部署于自家工厂。
中国车企如比亚迪、吉利、一汽-大众、东风及富士康均已引入人形机器人。数月前,现代汽车集团宣布将在全球制造基地部署波士顿动力Atlas机器人。虽未予置评,但其官方声明透露:Atlas将于2028年前在佐治亚州“现代汽车集团元工厂美国”(Metaplant America)电动车型产线承担重复性序列任务;至2030年,计划扩展至组件装配环节,并逐步覆盖全部制造基地。与阿波罗类似,Atlas也将集成谷歌DeepMind AI模型,现代汽车集团亦与Nvidia在物理人工智能领域展开合作。
现代汽车集团表示:“我们预期人形机器人将成为未来物理人工智能市场最大细分领域,并设定目标:大规模量产Atlas型号,作为成熟可用的人形机器人产品,规模化部署于工业现场。”
行业分析普遍看好该领域前景。今年1月,英国巴克莱研究(Barclays Research)发布《未来工作:AI具身化》报告,预测在最乐观情景下,全球市场2035年有望达2000亿美元;Mordor Intelligence亦预计2031年规模将接近180亿美元(当前市场估值约20亿至40亿美元)。强劲增长背后是海量风险资本注入:Apptronik融资近10亿美元,Figure AI超10亿美元,德国Neura Robotics超2亿美元,业内预测另有10亿美元资金即将到位。麦肯锡统计显示,全球约50家公司各自融资超1亿美元用于人形机器人研发。
然而,随着投资热潮推动更多机器人进入工厂,其实际自主程度仍待检验。弗莱在谷歌DeepMind播客中坦言:“有时这些机器人略显迟缓或笨拙,但必须记住:几年前,让机器人理解语义、获取场景上下文、推理复杂任务还完全不可想象。”
当前阿波罗可在工厂环境中自主执行多项任务,并借助AI学习持续拓展能力——这一水平代表了现阶段人形机器人的整体发展状态。而真正意义上的通用自主性——即无需监督、具备高层级推理能力、可在非结构化环境(如繁忙工地、杂乱家居或灾害救援现场)独立运作——仍是长期目标。
不过进展正在加速。康罗伊表示:“我们的目标是将顶尖硬件与顶尖AI融合,打造一款通用型人形机器人,使其能在单日内跨多个行业完成多样化工作。目前大量机器人正参与概念验证与试点项目,工业场景价值产出指日可待。”
他展望道:“人形机器人这一理念经得起时间考验——正如家家拥有汽车,未来人人也将拥有家用机器人协助生活。只是抵达这一阶段还需些许时日。”
www.eic.net.cn 提供的易IC库存管理软件,正助力制造业企业高效整合机器人产线与物料流,实现从订单到交付的全链路智能管控。