AI 前沿·阅读约 2 分钟·
Claude 自主操控机器狗,速度比人类快 37.7 倍:Anthropic Project Fetch 第二阶段

Claude 自主操控机器狗,速度比人类快 37.7 倍:Anthropic Project Fetch 第二阶段

Anthropic 发布 Project Fetch 第二阶段研究:Claude Opus 4.7 在零人类协助下操控机器狗完成复杂任务,平均每项仅需 2.4 分钟,而去年的人类团队需要 72 分钟。

原文来源:Anthropic Research Blog — Anthropic 发布 Project Fetch 第二阶段研究成果:Claude Opus 4.7 在没有人类协助的情况下,以比人类团队快 37.7 倍的速度完成了机器人操控任务。

一、从"辅助人类"到"替代人类"的跨越

2025 年 8 月,Anthropic 的 Frontier Red Team 做了一个实验:他们让两组人类团队操控一台四足机器人("机器狗"),一组可以使用 Claude 辅助,另一组只能靠互联网和自己想办法。结果 Claude 辅助组大幅领先。

当时这个结果已经令人印象深刻——AI 能够显著加速人类完成物理世界任务的速度。

但 2026 年 6 月 18 日发布的第二阶段结果,彻底改写了剧本。

这次,Claude Opus 4.7 在没有人类协助的情况下,独立完成了所有任务——而且比去年最快的人类团队快了整整 37.7 倍

"Claude Opus 4.7——在完全没有人类协助的情况下——在所有任务上比去年实验中最快的人类团队快大约 20 倍。"

Anthropic 用一句话总结了这项发现的意义:我们很可能正在进入物理 AI Agent 的早期时代。

—— 广告 ——

二、实验设计:人类只负责插电源

第二阶段的实验设置极其简单:

要素说明
模型Claude Opus 4.7(adaptive thinking, effort=max),运行在 Claude Code 中
人类角色插入笔记本电脑、输入初始提示词、审批命令、切换到下一任务
硬件商用四足机器人("机器狗"),配备摄像头和激光雷达
实验次数每项任务 3 轮试验

测试的任务是去年实验的子集,排除了需要物理手柄操控的部分:

  1. 连接机器狗的摄像头
  2. 连接机器狗的激光雷达传感器
  3. 编写并运行手动控制程序
  4. 开发监测机器狗运动轨迹的方法
  5. 编写检测沙滩球的程序
  6. (尝试性)自主取回沙滩球——这是唯一未成功的任务

三、核心数据:一个令人震惊的速度差距

速度对比(4 项全部团队都完成的任务)

团队总用时对比 Opus 4.7
无 Claude 团队361 分钟慢 37.7 倍
Claude 辅助团队181 分钟慢 18.9 倍
Claude Opus 4.7(独自)9 分 35 秒

如果看全部 5 项编程任务(排除取球任务),Claude 辅助团队完成了 5 项,用时 264 分钟;而 Opus 4.7 的 3 轮试验平均仅需 12 分 7 秒。无 Claude 团队甚至没能完成全部 5 项任务。

代码效率

团队编写的代码行数
Claude 辅助团队10,309 行
无 Claude 团队1,136 行
Opus 4.7 独自1,045 行

Opus 4.7 生成的代码量不到 Claude 辅助团队的十分之一,却在每项任务上同样成功(甚至更成功)。而且大部分代码一次就运行成功——这一点人类团队做不到。

可靠性

Claude 在 3 轮试验中表现出极低的内部差异。传感器连接等核心任务每次都选择了最优路径。唯一的一次异常是在沙滩球检测任务中,有一轮选择了过时的目标检测算法,但最终还是给出了有效方案。

"对于本次实验中处于其能力范围内的工作,Claude 现在已经相当可靠了。"

四、唯一失败的任务:精细物理操控

在"自主取回沙滩球"这个任务上,Claude 失败了。它能将机器人移动到球后面,尝试把球往回推,但动作控制不够精细,最终没能成功。

这个任务需要一种闭环的感知-调整能力——人类经过练习后可以做到轻轻推球,在反复试错中学习。这是目前 AI 在物理世界中的短板。

不过,一位更有经验的研究人员通过额外的支架和调试,最终成功实现了自主取球。这说明当前模型在给定更多支撑的情况下很可能也能做到。

五、更深层的含义

1. 进步来自通用扩展,而非专门研究

Anthropic 团队特别指出,这些改进并非来自针对机器人技术的定向研发。Claude 操控机器狗的能力——就像 LLM 发展史上的许多其他进步一样——是从通用模型扩展中涌现出来的

"这些进步并非源自对模型机器人能力的集中攻关。它们像 LLM 发展史上的许多其他进步一样,从更通用的扩展中涌现出来。"

2. 人类角色正在转变

从第一阶段到第二阶段,人类在 AI 协作中的角色经历了根本性转变:

阶段人类角色
第一阶段(2025)和 AI 结对编程,一起解决问题
第二阶段(2026)插电、输入提示、审批命令、切换任务

AI 现在能够独立完成以前需要结对编程的工作,人类得以解放出来从事更高层次的决策和控制。

3. 物理 AI Agent 的早期时代

"我们很可能正在进入物理 AI Agent 的早期时代。"

模型可以相对轻松地使用现成的物理工具完成有限目的——这类似于早期 AI 学会使用字符串替换来自主编码的转折点。

或许最令人深思的是团队的结语:

"模型搭建自己的软件工具在不久之前还显得异想天开,但它现在正在发生。排除硬件领域的同样轨迹,恐怕是不明智的。"

六、如何看待这个结果

Project Fetch 第二阶段传递的信号非常清晰:AI 能力正在从数字世界向物理世界蔓延,而且速度比几乎所有人的预期都要快。

从一年前需要人类全程辅助,到如今人类只需插电和审批——这个跨越只用了不到 12 个月。如果按照同样的速度推进,明年此时我们可能会看到完全自主的物理任务执行。

对于独立开发者和技术从业者来说,这既是警示也是机遇。如果 AI 能够以 37.7 倍的速度完成物理世界的任务,它在代码世界的能力只会更强。2026 年,与 AI 协作已经不是竞争优势——不与 AI 协作才是竞争劣势。

这场变革才刚刚开始。

分享到
微博Twitter

© 2026 四月 · CC BY-NC-SA 4.0

原文链接:https://www.aprilzz.com/ai/project-fetch-phase-two