自我纠错的 Dataism，能逃出蓝图陷阱吗？

我脑子里一直卡着一个半成型的直觉：

我们反对蓝图，或许不是因为「规划」本身，而是因为静态规划无法适应。 真实社会需要有机行为、地方知识，以及 自我纠错机制——选举、同行评议、宪法修正案、用亏损惩罚错误的市场。与此同时，任何成文合约或制度都 必然不完全（Hart & Moore、Simon 1951）：不可能为世界的每一种未来状态写条款，所以在边缘处总会牺牲一些东西——某些人、某些情境、某些无法写进条文的价值。

由此引出一个很诱人的下一步：

如果把社会看成信息处理系统（Dataism），再内置显式的自我纠错，会不会是第一个「没有那些缺陷的蓝图」？ 不是冻结的宪法，而是活环路：测量、更新、再优化。分布式节点而非中央计划者。连续反馈而非一次性乌托邦改造。

我倾向于认为：按字面意思，这行不通。 但这个直觉戳中了 AI 治理、对齐与制度设计里真实的张力——而更有价值的产出可能是问题，不是纲领。

下面是一篇 研究议程式 的博文。

「反蓝图」到底在反什么

我读乌托邦经典（Scott、Popper、Ostrom）时，常见误读是「不要规划」。不对。

Popper 反的是 历史主义 + 乌托邦式社会工程：有人声称掌握历史终点，并因此镇压异议。他主张 零星改良（piecemeal）：试验、失败、修正、保留回滚权（历史主义的贫困）。

Scott 反的是 可读化优先 的改造：国家或平台把复杂社会生活压成单一可测网格，摧毁 mētis（地方默会知识），再遇上高调现代主义 + 强制权力 → 灾难。

Ostrom 反的是公地问题只有利维坦或私有化两条路。多中心制度——嵌套规则、本地监测、分级制裁——可以在没有总蓝图的情况下适应。

共同线索： 好秩序是 过程形态，不是 蓝图形态。

问题

「反蓝图」究竟反的是 终局感、价值一元论，还是 强制力？三者政策含义不同。
Ostrom 的设计原则、Beer 的 VSM，算「原则」还是 Popper 意义下的另一种蓝图？
AI 因为 可训练、可更新 就改变了博弈，还是在规模部署时更快复现 Scott 式的可读化暴力？

不完全合约与无法写进合同的牺牲

Grossman & Hart (1986)、Hart & Moore (1990) 形式化了法律人早已知道的：合约不可能列尽一切偶发情形。关键是谁持有 剩余控制权——在合同没写到的地方谁说了算。

人类雇佣靠默示条款补洞：声誉、内疚、社会制裁、「别打翻花瓶」。 Baker, Gill, Korinek (AIES 2019) 把 AI 对齐读成同构问题：你写不全自主智能体的规格，谁能在意外状态下干预、重谈、推翻 才是制度性版的对齐。

新热潮又加一层：AI 智能体会写出完美合同吗？起草成本下降或许缩小某种不完全性——但 证据、概率行为、文本外的规范 仍在。完备 ≠ 正义。

Sen 的能力方法补规范性维度：同样收入/同样基本财货，因 转换因子（残障、歧视、公共品缺失）而生活不同。合约形式上公平，仍可能在能力意义上牺牲自由。

问题

若 AI 缩小起草不完全性，却扩大测量不完全性（什么被记录、什么算数），净不完全性真的在下降吗？
模型的剩余控制权在实验室、监管者、用户之间如何分配时，未指定状态 的牺牲落在谁身上？
AI 的「默示条款」（社会规范、责任、声誉）能否在不拟人化的前提下复制人类缔约？
「制度总会牺牲」是规模定理、价值多元 定理，还是 认知有限 定理？什么观测能证伪？

自我纠错机制：反蓝图的「正面内容」

Yuval Harari 在公开演讲与访谈里普及了 自我纠错机制（如 Big Think 2025；Lex Fridman #390 有相近主题）：机构能 自己发现并改正 错误，而不必等到崩溃。

典型例子：

选举 —— 试一届，选票箱纠错
科学 —— 期刊发勘误；进步靠反驳
宪法修正案 —— 规则承认人会错（「We the People」，非不可错的经文）
对照： 独裁与传统教条缺乏内部纠错

这是 Popper 的公众版：猜想与反驳、开放社会、可证伪性从科学迁移到政治。

Hayek 的知识问题补另一刀：纠错需要 信息流。价格、盈亏是把分散知识去中心化的信号。Kiesling 总结：市场是 发现程序，不是静态均衡（2023）。

Harari 在 Homo Deus 里更进一步：政治 = 比较信息处理 —— 资本主义与民主是分布式网络；集中计划脆弱易碎（章节梗概）。Galbraith 的组织信息处理理论在管理学里做类似事：不确定性高 → 要更丰富的横向信息系统，不是更厚的规则手册。

问题

自我纠错对合法性是 构成性的（Sen：参与即自由）还是 工具性的（少饥荒、科学更快）？冲突时谁优先？
Harari 警告假人淹没民主对话（Lex #390 ~00:38）——攻击的是纠错机制本身，还是前提（可信赖的言论）？
Popper 的纠正是 社会的（批评者、选民、审稿人）；机器学习的推理时「生成—验证—修订」是 模型内部 的。同一族类，还是把社会合法性偷换进工程学的范畴错误？
谁裁定「已经纠错」？科学有撤稿，民主有选举，市场有破产。以用户参与度为优化目标的平台上，错误信号是什么？

诱人假设：Dataism + 纠错 = 非蓝图式的蓝图？

Dataism（Harari 造词，非学术学派）把宇宙当 数据流，把 最大化处理/连接 抬成最高善——人文主义之后的后继宗教（Homo Deus）。批评者读成技术宗教：有透明而无政治，有优化而无尊严（Crossings 2020；Chapman Center）。

用户的假设把两边拼起来：

反蓝图洞察	数据主义承诺
有机 / 地方适应	从数据持续学习
反馈环	实时指标与 A/B 测试
不完全合约	动态重谈 / 强化学习更新
无单一计划者	分布式算力 + 市场

为何诱人： 像 做对的 控制论治理——Stafford Beer 的 VSM 有反馈，不是 Glushkov OGAS 式全国最优计划。Medina 的 Cybernetic Revolutionaries：智利 Cybersyn 是 自适应 工业控制——活下来的是政治，不是布线。

我持怀疑态度的原因： 用 移动目标函数 换静态蓝图，并没有消除牺牲——只是把牺牲挪进损失函数、日志模式、以及对技术栈的剩余控制权。

问题

Dataism 是 无终极目的，还是用工程中立性偷运 新终极目的（吞吐量）？
系统能否同时 单一奖励优化 又在 Sen 意义 扩展多元能力？RLHF 已在代理指标上古德哈特化——那是纠错还是 指标固化？
Scott：可测变量繁荣，不可测的消亡。数据驱动的自适应系统是否比愚钝的纸面监管更快放大可读化偏见？
自下而上的算法治理：「自适应」何时民主（可质疑性、可退出），何时 技术官僚（透明但不可问责）？
Wiener 在 Human Use of Human Beings 警告：无伦理承诺的控制论反馈是 放大的控制，不是解放。Wiener 在今天落在哪里？

「自适应」当蓝图时的三个陷阱

陷阱 1：纠错但不可质疑

更新权重的循环 ≠ 承认 政治上的失败。Popper 需要败方还能再争论。若「纠错」= 系统推动用户顺从，那是 自适应强制——韩炳哲说的透明社会：把异议的否定性剥掉。

陷阱 2：剩余权利堆栈化

大语言模型生成合同消不掉不完全缔约。谁拥有数据、定基准测试、付算力、握紧急关停开关 仍在。 AEI agent-contract 文对起草乐观；Baker et al. 对智能体出格时的 控制权 更清醒。

陷阱 3：牺牲被推迟，未被取消

每次纠错都预设已有错误——常由生命、生计、能力集先买单。Harari 论 AI：我们在跑 无法实验室模拟 的历史实验；纠错启动前错误可能 终结性（Nexus 相关 Wired 访谈）。

问题

自适应 AI 机构的 最低可质疑性门槛 是什么——类似修正案 + 司法审查 + 自由媒体？
对齐里的可纠正性（Russell, Human Compatible）是社会自我纠错的 机器类比，还是更大社会纠错环里的 一个组件？
能否事前命名牺牲（指标更新时谁最可能输），像环评命名生态权衡？
「无蓝图」与 宪法式 AI（固定原则、自适应适用）兼容吗，还是营销更好的蓝图？

更尖锐的框架：设计原则，非终端社会

若 Dataism + 纠错作为 完美蓝图 失败，什么还站得住？

候选：元制度原则 —— 不是「历史终点社会」，而是 规则如何可改 的约束：

多中心（Ostrom）：多个决策中心、嵌套反馈
可证伪的渐进改良（Popper）：可逆实验、失败被记录
能力审计（Sen）：改革是否扩展了最差者的真实选项？
友善性底线（Illich）：工具不能长到人类无法理解、无法拒绝
残余人工推翻权：正式权威与真实权威可分离（Aghion & Tirole, 1997)

这更接近 治理研究，不是 Harari 式 Dataism——数据是渐进式探究的 输入之一，不是 神圣输出。

笔记里的三角（Popper × Acemoglu × Gebru/Torres）相关：反历史主义、可引导技术方向但不宣称终局社会、拒绝用救世叙事推迟当下伤害。未经大幅修正的 Dataism-as-blueprint 三条都难过。

问题

基础模型部署的 Ostrom 检查清单 长什么样——可监测、本地、分级制裁？
Acemoglu 使命导向 vs Popper 渐进改良：「引导 AI 增强劳动」何时变成 Popper 怕的新乌托邦工程？
数据合作社、公共数字基础设施（自下而上的算法治理）能否供给分布式纠错，而不必 Dataist 形而上学？
哪些实证案例最能检验 AI 的自适应 vs 蓝图失败模式——Cybersyn、社会信用、EU AI Act、RLHF 迭代？

AI 特有的压力点

对齐： 量产栈优化标量奖励；Gabriel 2020 提醒选目标即政治。模型内部的批判—修订—再生成回答不了 谁写宪法。

智能体经济： 机器速度上的自主智能体复制不完全缔约 + 要挟，快于法院适应。自适应智能合约可能 自动化 重谈，却把剩余权利留给协议设计者。

速度 vs 民主： 信息处理加速 1000×，选举与审议周期不变——瓶颈是 制度延迟 吗？Galbraith 说重新设计组织以应对不确定性——但 谁参与重新设计 是 Harari 一直问的民主问题。

问题

若推理时扩展算力算自我纠错，用户是否有权看 纠错前的草稿——像看立法辩论而不只看成文法？
智能体经济协议自动改条款，是 渐进式工程 还是 抽地毯式治理？
超人类思想生成（Harari on LLMs, Lex #390）是否让人失去 抵制观念 的能力——柏拉图洞穴变成工程问题？
什么观测能证伪「分布式 AI 推理 在政治上等价于 Hayek 式价格发现」？

若你要接着做：研究轨道

轨道	方法	产出
制度	案例：Cybersyn、OGAS 碎片、平台申诉、EU AI Act	对比宣称 vs 真实的纠错循环
经济	Hart/Moore 用于模型所有权、API 条款、智能体钱包	机器学习供应链上的剩余控制权地图
哲学	Popper / Sen / Harari / Wiener	「纠错」类型学（社会 / 科学 / 算法）
实证 AI	RLHF/RLAIF 周期扩展还是压缩用户能力集	Sen 式指标，不只伤害分数
法律	智能体起草合同 + 可执行性	压测「完美合同」乐观主义

结语：与一个好问题共处

有机反馈优于静态蓝图 —— 这直觉成立。
Dataism + 自我纠错 = 第一个无牺牲的 design —— 不成立，不是因为适应无用，而是因为 没有争议性价值的适应只是更快的优化。

更值得研究的问题或许是：

在什么条件下，高频反馈能改进制度学习，同时不集中剩余控制权、不压平 mētis、不关闭「什么算错误」的政治问题？

我不知道答案。希望更多人把这句话当 研究纲领——尤其是那些正在定义「错误」为何的人。

若你从法律、控制论、对齐、发展经济学任一角度在做相关工作，欢迎补充案例与文献；这篇会随部署与文献更新。