为什么所有人都收敛在2027–2028（以及这可能不代表你以为的意思）

2026年4月首稿；2026年6月更新（METR v1.1、AI Futures Q1 更新、AI 2027 tracker 数据）。

只读 AI 2027 的话，很容易以为「2027年AGI」是一个前 OpenAI 研究员在带节奏。其实不是。算力 scaling、智能体能力曲线、R&D 自动化模型、专家调查、经济增长物理极限、实验室负责人判断——至少六条独立路径，现在都落在 2027–2028 附近。

这个交点值得认真对待。也值得追问：几种方法可能在共享同一组未言明假设。

我四月份开始整理研究笔记，等追踪器与作者更新把图景填清楚后才写成博客。下面是要点：每种方法实际在预测什么、分歧在哪、以及现实如何对照目前最细的场景。

「AGI」不是同一个里程碑

先澄清定义：

术语	量的是什么
HLMI（AI Impacts 调查）	无辅助机器在所有任务上比人类更好更便宜
METR time horizon	50% 成功率下智能体能独立工作多久
Automated Coder（AI Futures）	公司宁愿裁掉所有人类软件工程师也不停用 AI 编程
Weakly general AI（Metaculus）	满足 4 条公开标准（含部分机器人能力）
Minimal AGI（Shane Legg）	大多数典型人类认知任务

门槛不同。拿「2047」（专家 HLMI 中位）和「2028年4月」（Metaculus weak AGI）直接比，讨论就没有意义。

八种方法（不是八个人）

1. 算力 / 数量级外推

问：从 GPT-4 到 AGI 还要几个数量级的有效算力？

Aschenbrenner Situational Awareness（2024）：原始算力、算法效率、解除束缚（unhobbling）各 ~0.5 数量级/年。GPT-2→GPT-4 ≈ 4.5–6 数量级 / 4 年 → 2027 前 AGI 惊人地可信。

Cotra bio anchors（2020）：合并分布 10²⁴–10⁵⁰ FLOP；社区中位从 ~2050 前移到 ~2035–2037。

Epoch AI：前沿 ~10²⁶·⁵–10²⁷ FLOP（GPT-4 的 30–100×）；10²⁸ 次训练尚未确认。新约束：现有硬件下 >2×10²⁸ FLOP 训练效率可能触顶。

关键分歧点： 2024–25 预训练放缓是暂时波动还是天花板？

2. 能力曲线外推

经验性最强。METR time horizon（v1.1, 2026-01）：

窗口	翻倍时间
全历史	~196 天（~6.5 月）
≥2023	~131 天（~4.3 月）
≥2024	~89 天（~3 月）

朴素外推 → ~2028 年 AI 能独立完成一周工作。不需要精确到月。

80,000 Hours AGI guide 是更易读的版本。

关键分歧点： 2024+ 加速是持久的 RL/智能体范式，还是一次性解除束缚？

3. R&D 自动化反馈环

AI 2027 的增量：不只外推算力或任务时长，而是 AI 自动化 AI 研究 → 复合加速。

AI Futures Model（2025-12）最初比 AI 2027 推后 3–5 年；Q1 2026 更新因 METR v1.1 + Opus 4.6 + Claude Code 拉回 1.5–2 年：

预测者	AC 中位 (Dec 2025 → Apr 2026)
Daniel Kokotajlo	late 2029 → mid 2028
Eli Lifland	early 2032 → mid 2030

作者自检：现实若以 AI 2027 速度的 ~65% 运行 → AC ~2028。

METR 简化 8 参数模型更保守：2032 底 >99% R&D 自动化。

关键分歧点： R&D multiplier 真在复合，还是主要是并行编程提升、研究品味仍由人类把关？

4. 专家调查 + 预测市场

外部视角。AI Impacts 2023 ESPAI（n=2,778）：HLMI 50% @ 2047（比 2022 早 13 年）；仍是最保守的正式路径。10% HLMI @ 2027。

Metaculus（2026-06）：weak AGI 中位 2028 年 4 月；full general AGI 中位 2032 年 10 月。

RAND AGI Forecasting Synthesis (2025)：基础设施不成熟；政策问题是准备多种情景，不是选定某年。

关键分歧点： 群众和圈内人 2023 以来大幅前移；专家调查的 90 分位尾部（~2150）几乎不动。

5. 经济增长 / 物理极限

Karnofsky Most Important Century（2021）：~2%/年 GDP 增长无法持续千年（Roodman 2020）。21 世纪必须是停滞、爆发或崩溃三选一。概率：>10% transformative AI by 2036；~50% by 2060。

经济学路径，紧迫性方向和 AI 圈内推理类似，论证完全不同。

6. 近景预测 / 情景

不是「何时」，而是「若 TAI 在类似今日的世界出现，则怎样？」Karnofsky 开创；AI 2027 是最细实例。

情景 ≠ 预测。ASI 中位 2028.4，80% CI 2027.6 – >2100。叙事让你忘记置信区间。

AI 2027 critique（中文）讲对齐作为前提与经济/心理缺席；本文补整个预测生态。

7. 实验室负责人内部判断

定性，但动资本。2020 年代末收敛：Dario 2026–27、Hassabis 2028–30、Legg 2028 50%、Musk 2026 底（离群值）。

FutureSearch timeline tracker：2025 推后，2026 Q1 智能体进展后又拉前。

8. 起飞速度（AGI 之后多快）

Yudkowsky vs Hanson (2008)：周–月 FOOM vs 数十年渐进多极。AI 2027 假设超人类程序员 → ASI ~1 年。到达日期之外的轴，但决定紧迫性。

收敛 vs 相关

2020 年代末交点可能只意味着大家都假设：scaling + unhobbling 继续、资本部署继续、能力可与原始预训练 FLOP 解耦。

任一断裂，交点崩塌。Acemoglu：十年 ~5% 任务有利可图地自动化——「迫在眉睫的 AGI」是风投炒作，不是宏观现实。

现实对照：AI 2027 Tracker（2026 年 6 月）

Johannes Haus 独立追踪器追踪 53 条预测。完整记分卡：notes/ai_2027_tracker_scorecard_2026-06.md。

指标	数值
速度比	0.70×
已确认	16 / 53
超前	3
落后	4

智能体侧快（METR 翻倍超前）；算力 / 起飞侧慢（10²⁸ FLOP、3× R&D 乘数仍不可检验）。方向对，节奏不均。起飞论题——极端风险真正关心的——仍未证实。

恒定 0.70× → 起飞 mid-2029（原 late 2027）；Kokotajlo AC 中位 mid-2028。

我会带走什么

2027–28 是多种方法的交点，不是同人小说。但定义不同，2047 和 2028 可以同时「对」。AI 2027 当压力测试；AI Futures Model 才是作者真正在更新的预测（而且在震荡）。2026 年中：智能体/部署快于算力扩展；完整 R&D 反馈环未验证。RAND：准备多种情景。

我目前的判断

最信 METR time horizon——可测量、可更新、可证伪。朴素外推 → ~2028 年独立干一周的活，已经够变革性。

最不信精确到月的日期。追踪器证实形态，不是时钟。

当前关键分歧点：2024+ 增益是可重复的智能体范式，还是一次性解除束缚？METR v1.1 和 Claude Code 偏前者；Epoch 10²⁸ 瓶颈和 RE-Bench 滞后偏后者。还不知道。

若要下注：自动化编程 ~2028–2030；HLMI 式全劳动自动化更晚；起飞速度仍是首个门槛之后最大未知。

看分布，不是日期。