2026年4月首稿;2026年6月更新(METR v1.1、AI Futures Q1 更新、AI 2027 tracker 数据)。
只读 AI 2027 的话,很容易以为「2027年AGI」是一个前 OpenAI 研究员在带节奏。其实不是。算力 scaling、智能体能力曲线、R&D 自动化模型、专家调查、经济增长物理极限、实验室负责人判断——至少六条独立路径,现在都落在 2027–2028 附近。
这个交点值得认真对待。也值得追问:几种方法可能在共享同一组未言明假设。
我四月份开始整理研究笔记,等追踪器与作者更新把图景填清楚后才写成博客。下面是要点:每种方法实际在预测什么、分歧在哪、以及现实如何对照目前最细的场景。
「AGI」不是同一个里程碑
先澄清定义:
| 术语 | 量的是什么 |
|---|---|
| HLMI(AI Impacts 调查) | 无辅助机器在所有任务上比人类更好更便宜 |
| METR time horizon | 50% 成功率下智能体能独立工作多久 |
| Automated Coder(AI Futures) | 公司宁愿裁掉所有人类软件工程师也不停用 AI 编程 |
| Weakly general AI(Metaculus) | 满足 4 条公开标准(含部分机器人能力) |
| Minimal AGI(Shane Legg) | 大多数典型人类认知任务 |
门槛不同。拿「2047」(专家 HLMI 中位)和「2028年4月」(Metaculus weak AGI)直接比,讨论就没有意义。
八种方法(不是八个人)
1. 算力 / 数量级外推
问:从 GPT-4 到 AGI 还要几个数量级的有效算力?
Aschenbrenner Situational Awareness(2024):原始算力、算法效率、解除束缚(unhobbling)各 ~0.5 数量级/年。GPT-2→GPT-4 ≈ 4.5–6 数量级 / 4 年 → 2027 前 AGI 惊人地可信。
Cotra bio anchors(2020):合并分布 10²⁴–10⁵⁰ FLOP;社区中位从 ~2050 前移到 ~2035–2037。
Epoch AI:前沿 ~10²⁶·⁵–10²⁷ FLOP(GPT-4 的 30–100×);10²⁸ 次训练尚未确认。新约束:现有硬件下 >2×10²⁸ FLOP 训练效率可能触顶。
关键分歧点: 2024–25 预训练放缓是暂时波动还是天花板?
2. 能力曲线外推
经验性最强。METR time horizon(v1.1, 2026-01):
| 窗口 | 翻倍时间 |
|---|---|
| 全历史 | ~196 天(~6.5 月) |
| ≥2023 | ~131 天(~4.3 月) |
| ≥2024 | ~89 天(~3 月) |
朴素外推 → ~2028 年 AI 能独立完成一周工作。不需要精确到月。
80,000 Hours AGI guide 是更易读的版本。
关键分歧点: 2024+ 加速是持久的 RL/智能体范式,还是一次性解除束缚?
3. R&D 自动化反馈环
AI 2027 的增量:不只外推算力或任务时长,而是 AI 自动化 AI 研究 → 复合加速。
AI Futures Model(2025-12)最初比 AI 2027 推后 3–5 年;Q1 2026 更新 因 METR v1.1 + Opus 4.6 + Claude Code 拉回 1.5–2 年:
| 预测者 | AC 中位 (Dec 2025 → Apr 2026) |
|---|---|
| Daniel Kokotajlo | late 2029 → mid 2028 |
| Eli Lifland | early 2032 → mid 2030 |
作者自检:现实若以 AI 2027 速度的 ~65% 运行 → AC ~2028。
METR 简化 8 参数模型 更保守:2032 底 >99% R&D 自动化。
关键分歧点: R&D multiplier 真在复合,还是主要是并行编程提升、研究品味仍由人类把关?
4. 专家调查 + 预测市场
外部视角。AI Impacts 2023 ESPAI(n=2,778):HLMI 50% @ 2047(比 2022 早 13 年);仍是最保守的正式路径。10% HLMI @ 2027。
Metaculus(2026-06):weak AGI 中位 2028 年 4 月;full general AGI 中位 2032 年 10 月。
RAND AGI Forecasting Synthesis (2025):基础设施不成熟;政策问题是准备多种情景,不是选定某年。
关键分歧点: 群众和圈内人 2023 以来大幅前移;专家调查的 90 分位尾部(~2150)几乎不动。
5. 经济增长 / 物理极限
Karnofsky Most Important Century(2021):~2%/年 GDP 增长无法持续千年(Roodman 2020)。21 世纪必须是停滞、爆发或崩溃三选一。概率:>10% transformative AI by 2036;~50% by 2060。
经济学路径,紧迫性方向和 AI 圈内推理类似,论证完全不同。
6. 近景预测 / 情景
不是「何时」,而是「若 TAI 在类似今日的世界出现,则怎样?」Karnofsky 开创;AI 2027 是最细实例。
情景 ≠ 预测。ASI 中位 2028.4,80% CI 2027.6 – >2100。叙事让你忘记置信区间。
AI 2027 critique(中文) 讲对齐作为前提与经济/心理缺席;本文补整个预测生态。
7. 实验室负责人内部判断
定性,但动资本。2020 年代末收敛:Dario 2026–27、Hassabis 2028–30、Legg 2028 50%、Musk 2026 底(离群值)。
FutureSearch timeline tracker:2025 推后,2026 Q1 智能体进展后又拉前。
8. 起飞速度(AGI 之后多快)
Yudkowsky vs Hanson (2008):周–月 FOOM vs 数十年渐进多极。AI 2027 假设超人类程序员 → ASI ~1 年。到达日期之外的轴,但决定紧迫性。
收敛 vs 相关
2020 年代末交点可能只意味着大家都假设:scaling + unhobbling 继续、资本部署继续、能力可与原始预训练 FLOP 解耦。
任一断裂,交点崩塌。Acemoglu:十年 ~5% 任务有利可图地自动化——「迫在眉睫的 AGI」是风投炒作,不是宏观现实。
现实对照:AI 2027 Tracker(2026 年 6 月)
Johannes Haus 独立追踪器 追踪 53 条预测。完整记分卡:notes/ai_2027_tracker_scorecard_2026-06.md。
| 指标 | 数值 |
|---|---|
| 速度比 | 0.70× |
| 已确认 | 16 / 53 |
| 超前 | 3 |
| 落后 | 4 |
智能体侧快(METR 翻倍超前);算力 / 起飞侧慢(10²⁸ FLOP、3× R&D 乘数仍不可检验)。方向对,节奏不均。起飞论题——极端风险真正关心的——仍未证实。
恒定 0.70× → 起飞 mid-2029(原 late 2027);Kokotajlo AC 中位 mid-2028。
我会带走什么
2027–28 是多种方法的交点,不是同人小说。但定义不同,2047 和 2028 可以同时「对」。AI 2027 当压力测试;AI Futures Model 才是作者真正在更新的预测(而且在震荡)。2026 年中:智能体/部署快于算力扩展;完整 R&D 反馈环未验证。RAND:准备多种情景。
我目前的判断
最信 METR time horizon——可测量、可更新、可证伪。朴素外推 → ~2028 年独立干一周的活,已经够变革性。
最不信精确到月的日期。追踪器证实形态,不是时钟。
当前关键分歧点:2024+ 增益是可重复的智能体范式,还是一次性解除束缚?METR v1.1 和 Claude Code 偏前者;Epoch 10²⁸ 瓶颈和 RE-Bench 滞后偏后者。还不知道。
若要下注:自动化编程 ~2028–2030;HLMI 式全劳动自动化更晚;起飞速度仍是首个门槛之后最大未知。
看分布,不是日期。