索尼 AI 把一台乒乓球机器人送上了更高证据等级。《Nature》论文披露,这台名为 Ace 的系统依靠 12 套视觉系统和 8 关节机械臂,已经能在遵守国际乒联(ITTF)正式规则的前提下,与顶尖人类球员对打;2025 年 4 月测试中,它对 elite players 五场赢了三场。后来据索尼和路透说法,Ace 还在 2025 年 12 月和 2026 年 3 月击败过职业球员。

这条新闻真正该看的,不是“机器人终于会打乒乓”这种热闹标题,而是具身智能最难的一关——高速、连续、带旋转、强实时的物理闭环——至少被索尼在一个严苛单项里啃下来了一块。棋类 AI 赢的是算力和策略空间;乒乓球赢球,赢的是毫秒级感知、轨迹预测和机械控制能否同时不掉链子。

Ace 做到了什么,证据到哪一步

Ace 不是通用人形机器人,也不是家用陪练机。它是一个高度定制的乒乓系统:9 个常规相机负责定位球在 3D 空间中的位置,3 个 gaze control 系统测角速度和旋转;8 个关节里,有的管球拍位置,有的管姿态,有的负责击球发力。

项目已知事实能说明什么不能说明什么
规则约束按 ITTF 正式规则比赛不是随便喂球的实验室表演不代表能适应所有现实环境
2025年4月战绩对 elite players 5 场赢 3 场已能和高水平人类真正对抗还谈不上稳定统治
对职业球员表现当时输给常打职业联赛的职业选手;后续据索尼/路透称曾击败职业球员能力还在提升,且已摸到职业门槛公开证据强度并不完全一致
系统形态12 套视觉 + 8 关节定制机械臂物理闭环能力很强不等于通用机器人成熟

我愿意给它比很多“会叠衣服、会端杯子”的演示更高评价。原因很简单:乒乓球几乎不给系统留思考时间。球快、旋转多、落点刁,任何一步慢半拍,结果就是扑空。古人说“失之毫厘,谬以千里”,这句话放在高速机器人控制上,几乎是工程手册。

这比棋类 AI 更重要,但离产业化还远

为什么我说它比棋类 AI 更重要?因为棋盘世界是离散的、可枚举的、规则封闭的;乒乓球桌虽然也有规则,但比赛过程是连续物理世界。球会旋,会飘,会受拍面、力度、角度影响。机器人不是只要“想明白”就行,它还得来得及“做出来”。

这也是具身智能这两年最容易被说大的一点。很多公司拿语言模型当大脑,配上一段机械臂视频,就急着暗示“通用机器人时代已近”。我不太买账。Ace 给行业的价值,恰恰是把话说实:要想在真实世界里赢,靠的不是一张 PPT 上的通用智能叙事,而是传感器、控制器、机构设计、时延管理、训练与校准一起过关。

这里可以拿 Omron 的 FORPHEUS 做个对照。后者早在 CES 2017 就很吸睛,也能和业余选手互动,但定位更偏陪练与人机协作展示。Ace 往前走了一步:目标不再是“能打”,而是“按正式规则和高水平选手打”。这一步不华丽,却更硬。

但也别过度拔高。工业机器人当年也是先在高度结构化场景里大杀四方,再慢慢逼近开放环境。Ace 和那段历史有点像,但只像一半。工厂焊接、搬运的环境可控得多,乒乓球虽然难,却仍是单任务、单场景、规则清晰。今天看到的是能力校准,不是通用胜利。

谁该在意,接下来盯什么

最该在意这件事的,不是想买陪练机的消费者,而是做机器人本体、控制系统、视觉感知和自动化落地的团队。对他们来说,Ace 提供了一个更现实的判断基线:高动态任务不是不能做,问题是成本、鲁棒性和复制性怎么算。

接下来我会盯三个变量:

  • 成本.12 套视觉系统加高度定制机械臂,今天大概率还是贵得离谱。贵,就难扩散。
  • 泛化.能不能换球馆光线、换桌面反光、换不同风格对手,性能还稳住?这才是离开实验条件后的真考题。
  • 可复制性.索尼能不能把这套能力迁到别的高动态任务上,比如装配、分拣、协作操作?如果迁不动,它更像一座技术奖杯。

“天下熙熙,皆为利来。”机器人行业最后拼的从来不只是那一记漂亮扣杀,而是谁能把能力做便宜、做稳定、做成别人也愿意掏预算的系统。论文能证明上限,订单才证明下限。