普世价值？一张社会科学与历史地图

Anthropic 2023 年「宪法式 AI」（Constitutional AI）原则清单，开头八条来自《世界人权宣言》。OpenAI 的模型规范、Google 安全政策、欧盟 AI 法案，都在同一套词汇附近打转：尊严、反歧视、免于酷刑、隐私。

这个手势并不中性。它悄悄塞进了一套 人类道德理论——1948 年锻造、此后一直被争、社会科学此后只部分支持。

这篇文章是给要在 AI 对齐、治理或宪法设计里谈「普世价值」的人用的地图。不是裁决普世是否存在，而是厘清：说普世时到底指什么、经典文本从哪来、价值为何冲突、文化如何分化、整包东西如何演化。

「普世」的三种含义（别混）

含义	主张	例子	对 AI 的意义
形而上学	某些规范对所有理性主体为真	自然法、康德定言命令	「我们发现了正确道德」
经验-薄	人类共享某些道德心理机制	Haidt 道德基础；Moral Machine「救更多人」	「训练信号可跨文化泛化」
政治-薄	在「好生活」深分歧下仍重叠的共存规则	Rawls 重叠共识；《世界人权宣言》	「合法性底线，不是完整伦理学」

AI 宪法实际需要 第三种——可辩护的公共底线——话语上却常暗示 第一种。社会科学大致支持 第二种，但附带大量保留条件。三者之间的缝，是多数简单化「直接用人权」方案死掉的地方。

经典价值文本：人们实际引用的文献

第一层：古代与宗教经典

德性伦理（亚里士多德、孔子、孟子）：品格与角色义务，不是权利清单
宗教法（犹太 Halakha、伊斯兰 Sharia、教会法、印度 Dharmaśāstra）：与启示或传统绑定的全面规范
金律变体：论语、利未记、圣训里都有——常被当作跨文化道德内核证据

它们在 传统内部 有权威，但 难以互操作。儒家孝可能与个人隐私冲突；宗教饮食法与世俗自主框架冲突。

第二层：启蒙权利与功利

现代「普世价值」词汇多半来自 17–19 世纪欧洲：

自然权利（洛克）→ 生命、自由、财产
康德：人是目的；可普遍化准则
功利主义（边沁、密尔）：最大化福利——与「权利作为硬约束」直接冲突
1789《人权与公民权宣言》

这一层发明了 个人作为权利主体、国家作为担保者——特定政治本体论，不是田野里「发现」的文化普遍项。

第三层：1945 后人权经典（AI 实验室真正会点的）

文本	年份	主张什么
《世界人权宣言》	1948	30 条：尊严、平等、生命、自由、反酷刑、公平审判、隐私、表达、工作、教育…
公民及政治权利国际公约 / 经济社会权利国际公约	1966	公民政治权与经济社会权分裂为两份公约
文化相对主义辩论	1947–今	联合国教科文组织 vs 人类学家：普世 vs 文化自主

Anthropic 脚注：193 国（至少部分）批准、多元法律文化背景代表起草——选的是 最具代表性 的人类价值来源。这是 合法性 论证，不是「人权宣言 = 全部道德」。

宣言擅长： 支配、身体完整性、歧视、基本法律人格。

几乎没覆盖（大语言模型天天撞）： 冒充、合成媒体、越权建议、平台骚扰、存在风险权衡、AI 道德地位。

所以 Anthropic 2023 年宪法又加了 Apple 平台规范层——数字滥用里长出来的 运营规范，不是第 19 条能推导的。

第四层：社会科学里的「价值」经典

Schwartz 基本价值（1992）：十个动机性价值（自我导向、刺激、享乐、成就、权力、安全、顺从、传统、仁慈、普世主义），排成相容/冲突环。70+ 国样本。

世界价值观调查 / Inglehart–Welzel 文化地图（2005）：传统↔世俗理性、生存↔自我表达 两维，国家聚类。

Haidt 道德基础（2007）：关怀、公平、忠诚、权威、神圣（+自由）。同一 心理模块，不同权重——WEIRD 自由派与社会保守派差距大。

Moral Machine 道德机器实验（Awad 2018，PNAS 2020）：4000 万+ 电车判断。三个 薄普世原则：救更多、人>动物、救年轻人——权重文化差异巨大。

这是最接近 证据基础 的普世价值清单，但是 薄的、统计的——不能整段粘贴进宪法。

冲突：「普世」在哪里碎

不可通约的道德理论

权利 vs 功利：诺齐克 vs 辛格。刑讯一个恐怖分子救一座城？权利说绝不；行为功利说也许。
义务论 vs 德性：康德禁止撒谎 vs 亚里士多德 phronesis（情境实践智慧）。
程序 vs 实质正义：Rawls 公平程序 vs 接受结果但拒绝程序的人。

Gabriel 2020 的 AI 要点：强化学习优化 标量奖励，结构上接近功利聚合。权利、硬约束、「总福利上升这动作仍错」——在纯奖励最大化器里很难稳健实现。

Schwartz 式价值对（任何文化内部都此消彼长）

自我导向  ↔  顺从 / 传统
刺激      ↔  安全
成就      ↔  仁慈
权力      ↔  普世主义

每个 AI 产品决策都踩这些：开放 vs 安全、用户自主 vs 防伤害、增长 vs 稳定。没有同时最大化全部 Schwartz 值的设定。

社会选择：聚合在精确意义上不可能

Arrow 不可能定理（1951）：即使每人偏好自洽，也没有排序聚合同时满足无限制域、帕累托效率、无关选项独立性与非独裁。

Sen 自由悖论：最小自由可与帕累托效率冲突。

Conitzer 2024：RLHF 把众包两两比较当「人类价值」，掩盖 250 年 的不可能性结果。CEV 式理想化偏好 不自动 修复第二层聚合。

政治现场张力（不是边缘案例）

领域	拉力 A	拉力 B
言论	第 19 条表达	伤害、尊严、群体诽谤
隐私	第 12 条	公卫监测、儿童安全
自主	个人选择	家长主义（药物、自杀、医疗）
平等	反歧视	平权行动、文化豁免
未来世代	当下福利	长期主义、气候、灭绝风险

AI 对齐逃不掉这些；它只是把它们 压进训练数据。

文化差异：变什么、什么理论解释

主导经验模式

1. WEIRD 偏差 — Henrich 等 2010：心理学被试多来自 西方、受教育、工业化、富裕、民主（WEIRD）社会——2010 年前多数「普世道德发现」其实是 WEIRD 普世。

2. 个人主义 ↔ 集体主义 — Hofstede 文化维度：权力距离、个人主义、男性气质、不确定性规避等。粗糙但在跨国政策里耐用。Moral Machine：个人主义地区与集体主义地区对「救年轻人」「守法行人」权重不同。

3. Inglehart–Welzel 文化演化 — 工业化→世俗理性；后工业安全→自我表达。不是简单的「西方 vs 其余」，是 发展轨迹 + 路径依赖。同一套可持续发展目标话术在北欧、海湾、撒哈拉以南落地不同。

4. Haidt：形式普世、内容在地 — 人人都有关怀/公平模块；忠诚、权威、神圣 在非 WEIRD 地区权重更高。道德语塞（无害禁忌判错但说不出理由）→ 口头原则 ≠ 真实生成机制——把宪法当文本训练是坏消息。

5. 薄 vs 厚道德 — Walzer、Rawls 重叠共识：可在 政治原则（反酷刑、公平审判）上重叠，在 形而上学、性、家庭、救赎 上深分歧。《世界人权宣言》多半是薄的（thin）。把厚生活方式规范塞进「无害性」会打合法性仗。

解释差异的理论（选你的因果故事）

理论	机制	预测	弱点
文化学习	制度传递规范	慢变、路径依赖	低估物质利益
物质/结构（马克思主义、世界体系）	价值跟踪经济位置	精英 vs 大众分裂	文化还原为阶级
进化心理（Haidt, Tooby & Cosmides）	共享模块 + 本地校准	形式普世、权重在地	难证伪；事后合理化风险
制度（North, Acemoglu）	规则塑造「合理」	法律传统持久	少谈深层价值
后殖民批判（Mutua 2002）	「普世」权利作为帝国输出	对宣言中立性怀疑	对设底线较不建设性
世界主义（Appiah）	跨差异对话	多元而不相对主义	硬权衡上模糊

对 AI 治理的实用分裂：

经验心理 → 预期聚类，不是单一全球效用函数（支持聚类式 CEV 思路）
政治哲学 → 求 公平程序，不是发现道德真理（Gabriel, Rawls）
后殖民 → 问宪法 谁写、谁不在场（Anthropic 四条「非西方受众」内部措辞、无外部文献——是反面教材）

历史演化：AI 实验室引用的经典怎么来的

1945 前：从帝国到灾难

1648 威斯特伐利亚：主权规范——国家而非个人是首要单位
1776 / 1789：权利语言绑革命与财产
1863–1945：废奴、劳工、妇女选举权、种族灭绝——每一波扩展或抵触早期「普世」
殖民主义：欧洲输出法律、否认殖民地主体权利——后殖民学者不让《世界人权宣言》忘记这套虚伪

1948：人权宣言时刻

起草委员会含 Cassin、张彭春、Malik、Eleanor Roosevelt——刻意多元，也有真哲学冲突（儒家社会和谐 vs 西方个人权利）。

宣言是 宣示性文件，非条约；愿景是「共同成就标准」。冷战把公民政治权（美国强调）与经济社会权（苏联/全球南方）拆成 1966 双公约。

合法性赢：几乎各国都援引。实质赢：反酷刑、灭绝罪公约、残疾人/儿童权利——有真法律后裔。

限：执行靠政治；「人权」选择性变成地缘政治武器。

1970s–2000s：全球化与反弹

1970s：英语世界哲学 Rawls 转向——正义即公平、合理多元主义
1980s–90s：「亚洲价值观」辩论（李光耀 vs 大赦国际）——秩序 vs 权利
1990s：Huntington「文明冲突」——简化过度，但抓到真断层
2000s：Sen / Nussbaum 能力方法——从法律权利转向 人有理由珍视的功能

2010s–今：数字规范与 AI

平台服务条款（Apple、Meta、Google）成数十亿人 事实上的全球言论法——律师写，不是哲学家
Moral Machine (2018)、欧盟可信 AI 伦理指南 (2019)、UNESCO AI 伦理 (2021)
集体宪法式 AI (2024)：约 1000 美国人经 Polis 平台公议——民主实验，非正式版 Claude
2026 年 Claude 宪法：叙事性格文档——诚实、可纠正性、AI 福祉——超出人权宣言词汇

弧线：神圣法 → 自然权利 → 国际人权 → 经验道德心理 → 平台运营 → AI 宪法。每一层加上前一层看不见的领域专属规则。

收尾

问题不是「普世价值存不存在」——人类显然共享某些道德反应和某些政治语言。问题是：你需要哪种意义上的普世、为哪种决策、谁的排除 为共识买了单。

社会科学说：薄普世、厚多元、不稳定聚合。

历史说：AI 实验室引用的经典文献 80 岁、诞生于战争与帝国，在数字伤害上已过时。

这不是反对 AI 里用人权语言，而是主张精确——并把下一版宪法当政治，不是发现。

来源

《世界人权宣言》(1948): https://www.un.org/en/about-us/universal-declaration-of-human-rights
Gabriel (2020): https://arxiv.org/abs/2001.09768
Conitzer et al. (2024): https://arxiv.org/abs/2406.07814
Awad et al. (2018): https://doi.org/10.1038/s41586-018-0637-6
Haidt & Graham (2007): https://doi.org/10.1037/1089-2680.11.4.368
Henrich et al. (2010): https://doi.org/10.1037/a0018418
Schwartz (1992): https://doi.org/10.1016/0092-6566(92)90081-K
世界价值观调查: https://www.worldvaluessurvey.org/
Anthropic (2023): https://www.anthropic.com/research/claudes-constitution
仓库：readings/anthropic_constitution_sources/、readings/cev_pluralism/00_CEV_PLURALISM_CANON.md