← 返回

为什么所有人都收敛在2027–2028(以及这可能不代表你以为的意思)

2026年4月1日

2026年4月首稿;2026年6月更新(METR v1.1、AI Futures Q1 更新、AI 2027 tracker 数据)。

只读 AI 2027 的话,很容易以为「2027年AGI」是一个前 OpenAI 研究员在带节奏。其实不是。算力 scaling、智能体能力曲线、R&D 自动化模型、专家调查、经济增长物理极限、实验室负责人判断——至少六条独立路径,现在都落在 2027–2028 附近。

这个交点值得认真对待。也值得追问:几种方法可能在共享同一组未言明假设。

我四月份开始整理研究笔记,等追踪器与作者更新把图景填清楚后才写成博客。下面是要点:每种方法实际在预测什么、分歧在哪、以及现实如何对照目前最细的场景。


「AGI」不是同一个里程碑

先澄清定义:

术语量的是什么
HLMI(AI Impacts 调查)无辅助机器在所有任务上比人类更好更便宜
METR time horizon50% 成功率下智能体能独立工作多久
Automated Coder(AI Futures)公司宁愿裁掉所有人类软件工程师也不停用 AI 编程
Weakly general AI(Metaculus)满足 4 条公开标准(含部分机器人能力)
Minimal AGI(Shane Legg)大多数典型人类认知任务

门槛不同。拿「2047」(专家 HLMI 中位)和「2028年4月」(Metaculus weak AGI)直接比,讨论就没有意义。


八种方法(不是八个人)

1. 算力 / 数量级外推

问:从 GPT-4 到 AGI 还要几个数量级的有效算力?

Aschenbrenner Situational Awareness(2024):原始算力、算法效率、解除束缚(unhobbling)各 ~0.5 数量级/年。GPT-2→GPT-4 ≈ 4.5–6 数量级 / 4 年 → 2027 前 AGI 惊人地可信。

Cotra bio anchors(2020):合并分布 10²⁴–10⁵⁰ FLOP;社区中位从 ~2050 前移到 ~2035–2037。

Epoch AI:前沿 ~10²⁶·⁵–10²⁷ FLOP(GPT-4 的 30–100×);10²⁸ 次训练尚未确认。新约束:现有硬件下 >2×10²⁸ FLOP 训练效率可能触顶。

关键分歧点: 2024–25 预训练放缓是暂时波动还是天花板?

2. 能力曲线外推

经验性最强。METR time horizonv1.1, 2026-01):

窗口翻倍时间
全历史~196 天(~6.5 月)
≥2023~131 天(~4.3 月)
≥2024~89 天(~3 月)

朴素外推 → ~2028 年 AI 能独立完成一周工作。不需要精确到月。

80,000 Hours AGI guide 是更易读的版本。

关键分歧点: 2024+ 加速是持久的 RL/智能体范式,还是一次性解除束缚?

3. R&D 自动化反馈环

AI 2027 的增量:不只外推算力或任务时长,而是 AI 自动化 AI 研究 → 复合加速。

AI Futures Model(2025-12)最初比 AI 2027 推后 3–5 年;Q1 2026 更新 因 METR v1.1 + Opus 4.6 + Claude Code 拉回 1.5–2 年:

预测者AC 中位 (Dec 2025 → Apr 2026)
Daniel Kokotajlolate 2029 → mid 2028
Eli Liflandearly 2032 → mid 2030

作者自检:现实若以 AI 2027 速度的 ~65% 运行 → AC ~2028。

METR 简化 8 参数模型 更保守:2032 底 >99% R&D 自动化。

关键分歧点: R&D multiplier 真在复合,还是主要是并行编程提升、研究品味仍由人类把关?

4. 专家调查 + 预测市场

外部视角。AI Impacts 2023 ESPAI(n=2,778):HLMI 50% @ 2047(比 2022 早 13 年);仍是最保守的正式路径。10% HLMI @ 2027。

Metaculus(2026-06):weak AGI 中位 2028 年 4 月;full general AGI 中位 2032 年 10 月。

RAND AGI Forecasting Synthesis (2025):基础设施不成熟;政策问题是准备多种情景,不是选定某年。

关键分歧点: 群众和圈内人 2023 以来大幅前移;专家调查的 90 分位尾部(~2150)几乎不动。

5. 经济增长 / 物理极限

Karnofsky Most Important Century(2021):~2%/年 GDP 增长无法持续千年(Roodman 2020)。21 世纪必须是停滞、爆发或崩溃三选一。概率:>10% transformative AI by 2036;~50% by 2060。

经济学路径,紧迫性方向和 AI 圈内推理类似,论证完全不同。

6. 近景预测 / 情景

不是「何时」,而是「若 TAI 在类似今日的世界出现,则怎样?」Karnofsky 开创AI 2027 是最细实例。

情景 ≠ 预测。ASI 中位 2028.4,80% CI 2027.6 – >2100。叙事让你忘记置信区间。

AI 2027 critique(中文) 讲对齐作为前提与经济/心理缺席;本文补整个预测生态。

7. 实验室负责人内部判断

定性,但动资本。2020 年代末收敛:Dario 2026–27、Hassabis 2028–30、Legg 2028 50%、Musk 2026 底(离群值)。

FutureSearch timeline tracker:2025 推后,2026 Q1 智能体进展后又拉前。

8. 起飞速度(AGI 之后多快)

Yudkowsky vs Hanson (2008):周–月 FOOM vs 数十年渐进多极。AI 2027 假设超人类程序员 → ASI ~1 年。到达日期之外的轴,但决定紧迫性。


收敛 vs 相关

2020 年代末交点可能只意味着大家都假设:scaling + unhobbling 继续、资本部署继续、能力可与原始预训练 FLOP 解耦。

任一断裂,交点崩塌。Acemoglu:十年 ~5% 任务有利可图地自动化——「迫在眉睫的 AGI」是风投炒作,不是宏观现实。


现实对照:AI 2027 Tracker(2026 年 6 月)

Johannes Haus 独立追踪器 追踪 53 条预测。完整记分卡:notes/ai_2027_tracker_scorecard_2026-06.md

指标数值
速度比0.70×
已确认16 / 53
超前3
落后4

智能体侧快(METR 翻倍超前);算力 / 起飞侧慢(10²⁸ FLOP、3× R&D 乘数仍不可检验)。方向对,节奏不均。起飞论题——极端风险真正关心的——仍未证实。

恒定 0.70× → 起飞 mid-2029(原 late 2027);Kokotajlo AC 中位 mid-2028。


我会带走什么

2027–28 是多种方法的交点,不是同人小说。但定义不同,2047 和 2028 可以同时「对」。AI 2027 当压力测试;AI Futures Model 才是作者真正在更新的预测(而且在震荡)。2026 年中:智能体/部署快于算力扩展;完整 R&D 反馈环未验证。RAND:准备多种情景。


我目前的判断

最信 METR time horizon——可测量、可更新、可证伪。朴素外推 → ~2028 年独立干一周的活,已经够变革性。

最不信精确到月的日期。追踪器证实形态,不是时钟。

当前关键分歧点:2024+ 增益是可重复的智能体范式,还是一次性解除束缚?METR v1.1 和 Claude Code 偏前者;Epoch 10²⁸ 瓶颈和 RE-Bench 滞后偏后者。还不知道。

若要下注:自动化编程 ~2028–2030;HLMI 式全劳动自动化更晚;起飞速度仍是首个门槛之后最大未知。

看分布,不是日期。


相关