← 返回

自我纠错的 Dataism,能逃出蓝图陷阱吗?

2026年5月30日

我脑子里一直卡着一个半成型的直觉:

我们反对蓝图,或许不是因为「规划」本身,而是因为静态规划无法适应。 真实社会需要有机行为、地方知识,以及 自我纠错机制——选举、同行评议、宪法修正案、用亏损惩罚错误的市场。与此同时,任何成文合约或制度都 必然不完全Hart & MooreSimon 1951):不可能为世界的每一种未来状态写条款,所以在边缘处总会 牺牲 一些东西——某些人、某些情境、某些无法写进条文的价值。

由此引出一个很诱人的下一步:

如果把社会看成信息处理系统(Dataism),再内置显式的自我纠错,会不会是第一个「没有那些缺陷的蓝图」? 不是冻结的宪法,而是活环路:测量、更新、再优化。分布式节点而非中央计划者。连续反馈而非一次性乌托邦改造。

我倾向于认为:按字面意思,这行不通。 但这个直觉戳中了 AI 治理、对齐与制度设计里真实的张力——而更有价值的产出可能是 问题,不是纲领。

下面是一篇 研究议程式 的博文。


「反蓝图」到底在反什么

我读乌托邦经典(ScottPopperOstrom)时,常见误读是「不要规划」。不对。

Popper 反的是 历史主义 + 乌托邦式社会工程:有人声称掌握历史终点,并因此镇压异议。他主张 零星改良(piecemeal):试验、失败、修正、保留回滚权(历史主义的贫困)。

Scott 反的是 可读化优先 的改造:国家或平台把复杂社会生活压成单一可测网格,摧毁 mētis(地方默会知识),再遇上高调现代主义 + 强制权力 → 灾难。

Ostrom 反的是公地问题只有利维坦或私有化两条路。多中心制度——嵌套规则、本地监测、分级制裁——可以在没有总蓝图的情况下适应。

共同线索: 好秩序是 过程形态,不是 蓝图形态

问题

  1. 「反蓝图」究竟反的是 终局感价值一元论,还是 强制力?三者政策含义不同。
  2. Ostrom 的设计原则、Beer 的 VSM,算「原则」还是 Popper 意义下的另一种蓝图?
  3. AI 因为 可训练、可更新 就改变了博弈,还是在规模部署时更快复现 Scott 式的可读化暴力?

不完全合约与无法写进合同的牺牲

Grossman & Hart (1986)Hart & Moore (1990) 形式化了法律人早已知道的:合约不可能列尽一切偶发情形。关键是谁持有 剩余控制权——在合同没写到的地方谁说了算。

人类雇佣靠默示条款补洞:声誉、内疚、社会制裁、「别打翻花瓶」。 Baker, Gill, Korinek (AIES 2019) 把 AI 对齐读成同构问题:你写不全自主智能体的规格,谁能在意外状态下干预、重谈、推翻 才是制度性版的对齐。

新热潮又加一层:AI 智能体会写出完美合同吗? 起草成本下降或许缩小 某种 不完全性——但 证据、概率行为、文本外的规范 仍在。完备 ≠ 正义。

Sen 的 能力方法 补规范性维度:同样收入/同样基本财货,因 转换因子(残障、歧视、公共品缺失)而生活不同。合约形式上公平,仍可能在能力意义上 牺牲 自由。

问题

  1. 若 AI 缩小 起草 不完全性,却扩大 测量 不完全性(什么被记录、什么算数),净不完全性真的在下降吗?
  2. 模型的剩余控制权在实验室、监管者、用户之间如何分配时,未指定状态 的牺牲落在谁身上?
  3. AI 的「默示条款」(社会规范、责任、声誉)能否在不拟人化的前提下复制人类缔约?
  4. 「制度总会牺牲」是 规模 定理、价值多元 定理,还是 认知有限 定理?什么观测能证伪?

自我纠错机制:反蓝图的「正面内容」

Yuval Harari 在公开演讲与访谈里普及了 自我纠错机制(如 Big Think 2025Lex Fridman #390 有相近主题):机构能 自己发现并改正 错误,而不必等到崩溃。

典型例子:

  • 选举 —— 试一届,选票箱纠错
  • 科学 —— 期刊发勘误;进步靠反驳
  • 宪法修正案 —— 规则承认人会错(「We the People」,非不可错的经文)
  • 对照: 独裁与传统教条缺乏内部纠错

这是 Popper 的公众版:猜想与反驳、开放社会、可证伪性从科学迁移到政治。

Hayek 的 知识问题 补另一刀:纠错需要 信息流。价格、盈亏是把分散知识去中心化的信号。Kiesling 总结:市场是 发现程序,不是静态均衡(2023)。

Harari 在 Homo Deus 里更进一步:政治 = 比较信息处理 —— 资本主义与民主是分布式网络;集中计划脆弱易碎(章节梗概)。Galbraith 的 组织信息处理理论 在管理学里做类似事:不确定性高 → 要更丰富的横向信息系统,不是更厚的规则手册。

问题

  1. 自我纠错对合法性是 构成性的(Sen:参与即自由)还是 工具性的(少饥荒、科学更快)?冲突时谁优先?
  2. Harari 警告 假人 淹没民主对话(Lex #390 ~00:38)——攻击的是纠错机制本身,还是 前提(可信赖的言论)?
  3. Popper 的纠正是 社会的(批评者、选民、审稿人);机器学习的推理时「生成—验证—修订」是 模型内部 的。同一族类,还是把社会合法性偷换进工程学的范畴错误?
  4. 谁裁定「已经纠错」?科学有撤稿,民主有选举,市场有破产。以用户参与度为优化目标的平台上,错误信号是什么?

诱人假设:Dataism + 纠错 = 非蓝图式的蓝图?

Dataism(Harari 造词,非学术学派)把宇宙当 数据流,把 最大化处理/连接 抬成最高善——人文主义之后的后继宗教(Homo Deus)。批评者读成技术宗教:有透明而无政治,有优化而无尊严(Crossings 2020Chapman Center)。

用户的假设把两边拼起来:

反蓝图洞察数据主义承诺
有机 / 地方适应从数据持续学习
反馈环实时指标与 A/B 测试
不完全合约动态重谈 / 强化学习更新
无单一计划者分布式算力 + 市场

为何诱人:做对的 控制论治理——Stafford Beer 的 VSM 有反馈,不是 Glushkov OGAS 式全国最优计划。Medina 的 Cybernetic Revolutionaries:智利 Cybersyn 是 自适应 工业控制——活下来的是政治,不是布线。

我持怀疑态度的原因:移动目标函数 换静态蓝图,并没有消除牺牲——只是把牺牲 挪进 损失函数、日志模式、以及对技术栈的剩余控制权。

问题

  1. Dataism 是 无终极目的,还是用工程中立性偷运 新终极目的(吞吐量)?
  2. 系统能否同时 单一奖励优化 又在 Sen 意义 扩展多元能力?RLHF 已在代理指标上古德哈特化——那是纠错还是 指标固化
  3. Scott:可测变量繁荣,不可测的消亡。数据驱动的自适应系统是否比愚钝的纸面监管 更快 放大可读化偏见?
  4. 自下而上的算法治理:「自适应」何时 民主(可质疑性、可退出),何时 技术官僚(透明但不可问责)?
  5. Wiener 在 Human Use of Human Beings 警告:无伦理承诺的控制论反馈是 放大的控制,不是解放。Wiener 在今天落在哪里?

「自适应」当蓝图时的三个陷阱

陷阱 1:纠错但不可质疑

更新权重的循环 ≠ 承认 政治上的失败。Popper 需要败方还能再争论。若「纠错」= 系统推动用户顺从,那是 自适应强制——韩炳哲 说的透明社会:把异议的否定性剥掉。

陷阱 2:剩余权利堆栈化

大语言模型生成合同消不掉不完全缔约。谁拥有数据、定基准测试、付算力、握紧急关停开关 仍在。 AEI agent-contract 文 对起草乐观;Baker et al. 对智能体出格时的 控制权 更清醒。

陷阱 3:牺牲被推迟,未被取消

每次纠错都预设已有错误——常由生命、生计、能力集先买单。Harari 论 AI:我们在跑 无法实验室模拟 的历史实验;纠错启动前错误可能 终结性Nexus 相关 Wired 访谈)。

问题

  1. 自适应 AI 机构的 最低可质疑性门槛 是什么——类似修正案 + 司法审查 + 自由媒体?
  2. 对齐里的可纠正性(Russell, Human Compatible)是社会自我纠错的 机器类比,还是更大社会纠错环里的 一个组件
  3. 能否 事前 命名牺牲(指标更新时谁最可能输),像环评命名生态权衡?
  4. 「无蓝图」与 宪法式 AI(固定原则、自适应适用)兼容吗,还是营销更好的蓝图?

更尖锐的框架:设计原则,非终端社会

若 Dataism + 纠错作为 完美蓝图 失败,什么还站得住?

候选:元制度原则 —— 不是「历史终点社会」,而是 规则如何可改 的约束:

  • 多中心(Ostrom):多个决策中心、嵌套反馈
  • 可证伪的渐进改良(Popper):可逆实验、失败被记录
  • 能力审计(Sen):改革是否扩展了最差者的真实选项?
  • 友善性底线Illich):工具不能长到人类无法理解、无法拒绝
  • 残余人工推翻权:正式权威与真实权威可分离(Aghion & Tirole, 1997)

这更接近 治理研究,不是 Harari 式 Dataism——数据是渐进式探究的 输入之一,不是 神圣输出

笔记里的三角(Popper × Acemoglu × Gebru/Torres)相关:反历史主义、可引导技术方向但不宣称终局社会、拒绝用救世叙事推迟当下伤害。未经大幅修正的 Dataism-as-blueprint 三条都难过。

问题

  1. 基础模型部署的 Ostrom 检查清单 长什么样——可监测、本地、分级制裁?
  2. Acemoglu 使命导向 vs Popper 渐进改良:「引导 AI 增强劳动」何时变成 Popper 怕的新乌托邦工程?
  3. 数据合作社、公共数字基础设施(自下而上的算法治理)能否供给分布式纠错,而不必 Dataist 形而上学?
  4. 哪些实证案例最能检验 AI 的自适应 vs 蓝图失败模式——Cybersyn、社会信用、EU AI Act、RLHF 迭代?

AI 特有的压力点

对齐: 量产栈优化标量奖励;Gabriel 2020 提醒选目标即政治。模型内部的批判—修订—再生成回答不了 谁写宪法

智能体经济: 机器速度上的自主智能体复制 不完全缔约 + 要挟,快于法院适应。自适应智能合约可能 自动化 重谈,却把剩余权利留给协议设计者。

速度 vs 民主: 信息处理加速 1000×,选举与审议周期不变——瓶颈是 制度延迟 吗?Galbraith 说重新设计组织以应对不确定性——但 谁参与重新设计 是 Harari 一直问的民主问题。

问题

  1. 若推理时扩展算力算自我纠错,用户是否有权看 纠错前的草稿——像看立法辩论而不只看成文法?
  2. 智能体经济协议自动改条款,是 渐进式工程 还是 抽地毯式治理
  3. 超人类思想生成(Harari on LLMs, Lex #390)是否让人失去 抵制观念 的能力——柏拉图洞穴变成工程问题?
  4. 什么观测能证伪「分布式 AI 推理 在政治上等价于 Hayek 式价格发现」?

若你要接着做:研究轨道

轨道方法产出
制度案例:Cybersyn、OGAS 碎片、平台申诉、EU AI Act对比宣称 vs 真实的纠错循环
经济Hart/Moore 用于模型所有权、API 条款、智能体钱包机器学习供应链上的剩余控制权地图
哲学Popper / Sen / Harari / Wiener「纠错」类型学(社会 / 科学 / 算法)
实证 AIRLHF/RLAIF 周期扩展还是压缩用户能力集Sen 式指标,不只伤害分数
法律智能体起草合同 + 可执行性压测「完美合同」乐观主义

结语:与一个好问题共处

有机反馈优于静态蓝图 —— 这直觉成立。
Dataism + 自我纠错 = 第一个无牺牲的 design —— 不成立,不是因为适应无用,而是因为 没有争议性价值的适应只是更快的优化

更值得研究的问题或许是:

在什么条件下,高频反馈 能改进制度学习,同时不集中剩余控制权、不压平 mētis、不关闭「什么算错误」的政治问题?

我不知道答案。希望更多人把这句话当 研究纲领——尤其是那些正在定义「错误」为何的人。

若你从法律、控制论、对齐、发展经济学任一角度在做相关工作,欢迎补充案例与文献;这篇会随部署与文献更新。


延伸阅读

  • James C. Scott,《国家的视角》Seeing Like a State (1998)
  • Karl Popper,《开放社会及其敌人》(1945);〈科学:猜想与反驳〉(1963)
  • Amartya Sen,《以自由看待发展》(1999)
  • Elinor Ostrom,《公共事物的治理之道》(1990)
  • Yuval Noah Harari,《未来简史》Homo Deus (2016);Nexus (2024)
  • Norbert Wiener,《人有人的用处》(1950)
  • Friedrich Hayek,〈社会的知识利用〉(1945)
  • Baker, Gill, Korinek, “Incomplete Contracting and AI Alignment” (AIES 2019)
  • Veale & Borgesius, “Algorithmic Governance from the Bottom Up” (BYU Law Review, 2023)