← 返回

普世价值?一张社会科学与历史地图

2026年6月17日

Anthropic 2023 年「宪法式 AI」(Constitutional AI)原则清单,开头八条来自 《世界人权宣言》。OpenAI 的模型规范、Google 安全政策、欧盟 AI 法案,都在同一套词汇附近打转:尊严、反歧视、免于酷刑、隐私。

这个手势并不中性。它悄悄塞进了一套 人类道德理论——1948 年锻造、此后一直被争、社会科学此后只 部分 支持。

这篇文章是给要在 AI 对齐、治理或宪法设计里谈「普世价值」的人用的地图。不是裁决普世是否存在,而是厘清:说普世时到底指什么、经典文本从哪来、价值为何冲突、文化如何分化、整包东西如何演化。


「普世」的三种含义(别混)

含义主张例子对 AI 的意义
形而上学某些规范对所有理性主体为真自然法、康德定言命令「我们发现了正确道德」
经验-薄人类共享 某些 道德心理机制Haidt 道德基础;Moral Machine「救更多人」「训练信号可跨文化泛化」
政治-薄在「好生活」深分歧下仍重叠的 共存规则Rawls 重叠共识;《世界人权宣言》「合法性底线,不是完整伦理学」

AI 宪法实际需要 第三种——可辩护的公共底线——话语上却常暗示 第一种。社会科学大致支持 第二种,但附带大量保留条件。三者之间的缝,是多数简单化「直接用人权」方案死掉的地方。


经典价值文本:人们实际引用的文献

第一层:古代与宗教经典

  • 德性伦理(亚里士多德、孔子、孟子):品格与角色义务,不是权利清单
  • 宗教法(犹太 Halakha、伊斯兰 Sharia、教会法、印度 Dharmaśāstra):与启示或传统绑定的全面规范
  • 金律变体:论语、利未记、圣训里都有——常被当作跨文化道德内核证据

它们在 传统内部 有权威,但 难以互操作。儒家孝可能与个人隐私冲突;宗教饮食法与世俗自主框架冲突。

第二层:启蒙权利与功利

现代「普世价值」词汇多半来自 17–19 世纪欧洲:

  • 自然权利(洛克)→ 生命、自由、财产
  • 康德:人是目的;可普遍化准则
  • 功利主义(边沁、密尔):最大化福利——与「权利作为硬约束」直接冲突
  • 1789《人权与公民权宣言》

这一层发明了 个人作为权利主体、国家作为担保者——特定政治本体论,不是田野里「发现」的文化普遍项。

第三层:1945 后人权经典(AI 实验室真正会点的)

文本年份主张什么
《世界人权宣言》194830 条:尊严、平等、生命、自由、反酷刑、公平审判、隐私、表达、工作、教育…
公民及政治权利国际公约 / 经济社会权利国际公约1966公民政治权与经济社会权分裂为两份公约
文化相对主义辩论1947–今联合国教科文组织 vs 人类学家:普世 vs 文化自主

Anthropic 脚注:193 国(至少部分)批准、多元法律文化背景代表起草——选的是 最具代表性 的人类价值来源。这是 合法性 论证,不是「人权宣言 = 全部道德」。

宣言擅长: 支配、身体完整性、歧视、基本法律人格。

几乎没覆盖(大语言模型天天撞): 冒充、合成媒体、越权建议、平台骚扰、存在风险权衡、AI 道德地位。

所以 Anthropic 2023 年宪法又加了 Apple 平台规范层——数字滥用里长出来的 运营规范,不是第 19 条能推导的。

第四层:社会科学里的「价值」经典

Schwartz 基本价值1992):十个动机性价值(自我导向、刺激、享乐、成就、权力、安全、顺从、传统、仁慈、普世主义),排成相容/冲突环。70+ 国样本

世界价值观调查 / Inglehart–Welzel 文化地图2005):传统↔世俗理性生存↔自我表达 两维,国家聚类。

Haidt 道德基础2007):关怀、公平、忠诚、权威、神圣(+自由)。同一 心理模块,不同 权重——WEIRD 自由派与社会保守派差距大。

Moral Machine 道德机器实验Awad 2018PNAS 2020):4000 万+ 电车判断。三个 薄普世原则:救更多、人>动物、救年轻人——权重 文化差异巨大。

这是最接近 证据基础 的普世价值清单,但是 薄的、统计的——不能整段粘贴进宪法。


冲突:「普世」在哪里碎

不可通约的道德理论

  • 权利 vs 功利:诺齐克 vs 辛格。刑讯一个恐怖分子救一座城?权利说绝不;行为功利说也许。
  • 义务论 vs 德性:康德禁止撒谎 vs 亚里士多德 phronesis(情境实践智慧)。
  • 程序 vs 实质正义:Rawls 公平程序 vs 接受结果但拒绝程序的人。

Gabriel 2020 的 AI 要点:强化学习优化 标量奖励,结构上接近功利聚合。权利、硬约束、「总福利上升这动作仍错」——在纯奖励最大化器里很难稳健实现。

Schwartz 式价值对(任何文化内部都此消彼长)

自我导向  ↔  顺从 / 传统
刺激      ↔  安全
成就      ↔  仁慈
权力      ↔  普世主义

每个 AI 产品决策都踩这些:开放 vs 安全用户自主 vs 防伤害增长 vs 稳定。没有同时最大化全部 Schwartz 值的设定。

社会选择:聚合在精确意义上不可能

Arrow 不可能定理(1951):即使每人偏好自洽,也没有排序聚合同时满足无限制域、帕累托效率、无关选项独立性与非独裁。

Sen 自由悖论:最小自由可与帕累托效率冲突。

Conitzer 2024:RLHF 把众包两两比较当「人类价值」,掩盖 250 年 的不可能性结果。CEV 式理想化偏好 不自动 修复第二层聚合。

政治现场张力(不是边缘案例)

领域拉力 A拉力 B
言论第 19 条表达伤害、尊严、群体诽谤
隐私第 12 条公卫监测、儿童安全
自主个人选择家长主义(药物、自杀、医疗)
平等反歧视平权行动、文化豁免
未来世代当下福利长期主义、气候、灭绝风险

AI 对齐逃不掉这些;它只是把它们 压进训练数据


文化差异:变什么、什么理论解释

主导经验模式

1. WEIRD 偏差Henrich 等 2010:心理学被试多来自 西方、受教育、工业化、富裕、民主(WEIRD)社会——2010 年前多数「普世道德发现」其实是 WEIRD 普世。

2. 个人主义 ↔ 集体主义Hofstede 文化维度:权力距离、个人主义、男性气质、不确定性规避等。粗糙但在跨国政策里耐用。Moral Machine:个人主义地区与集体主义地区对「救年轻人」「守法行人」权重不同。

3. Inglehart–Welzel 文化演化 — 工业化→世俗理性;后工业安全→自我表达。不是简单的「西方 vs 其余」,是 发展轨迹 + 路径依赖。同一套可持续发展目标话术在北欧、海湾、撒哈拉以南落地不同。

4. Haidt:形式普世、内容在地 — 人人都有关怀/公平模块;忠诚、权威、神圣 在非 WEIRD 地区权重更高。道德语塞(无害禁忌判错但说不出理由)→ 口头原则 ≠ 真实生成机制——把宪法当文本训练是坏消息。

5. 薄 vs 厚道德Walzer、Rawls 重叠共识:可在 政治原则(反酷刑、公平审判)上重叠,在 形而上学、性、家庭、救赎 上深分歧。《世界人权宣言》多半是 薄的(thin)。把厚生活方式规范塞进「无害性」会打合法性仗。

解释差异的理论(选你的因果故事)

理论机制预测弱点
文化学习制度传递规范慢变、路径依赖低估物质利益
物质/结构(马克思主义、世界体系)价值跟踪经济位置精英 vs 大众分裂文化还原为阶级
进化心理(Haidt, Tooby & Cosmides)共享模块 + 本地校准形式普世、权重在地难证伪;事后合理化风险
制度(North, Acemoglu)规则塑造「合理」法律传统持久少谈深层价值
后殖民批判Mutua 2002「普世」权利作为帝国输出对宣言中立性怀疑对设底线较不建设性
世界主义Appiah跨差异对话多元而不相对主义硬权衡上模糊

对 AI 治理的实用分裂:

  • 经验心理 → 预期 聚类,不是单一全球效用函数(支持 聚类式 CEV 思路)
  • 政治哲学 → 求 公平程序,不是发现道德真理(Gabriel, Rawls)
  • 后殖民 → 问宪法 谁写、谁不在场(Anthropic 四条「非西方受众」内部措辞、无外部文献——是反面教材)

历史演化:AI 实验室引用的经典怎么来的

1945 前:从帝国到灾难

  • 1648 威斯特伐利亚:主权规范——国家而非个人是首要单位
  • 1776 / 1789:权利语言绑革命与财产
  • 1863–1945:废奴、劳工、妇女选举权、种族灭绝——每一波扩展或抵触早期「普世」
  • 殖民主义:欧洲输出法律、否认殖民地主体权利——后殖民学者不让《世界人权宣言》忘记这套虚伪

1948:人权宣言时刻

起草委员会含 Cassin、张彭春、Malik、Eleanor Roosevelt——刻意多元,也有真哲学冲突(儒家社会和谐 vs 西方个人权利)。

宣言是 宣示性文件,非条约;愿景是「共同成就标准」。冷战把公民政治权(美国强调)与经济社会权(苏联/全球南方)拆成 1966 双公约。

合法性赢:几乎各国都援引。实质赢:反酷刑、灭绝罪公约、残疾人/儿童权利——有真法律后裔。

:执行靠政治;「人权」选择性变成地缘政治武器。

1970s–2000s:全球化与反弹

  • 1970s:英语世界哲学 Rawls 转向——正义即公平、合理多元主义
  • 1980s–90s:「亚洲价值观」辩论(李光耀 vs 大赦国际)——秩序 vs 权利
  • 1990s:Huntington「文明冲突」——简化过度,但抓到真断层
  • 2000sSen / Nussbaum 能力方法——从法律权利转向 人有理由珍视的功能

2010s–今:数字规范与 AI

弧线:神圣法 → 自然权利 → 国际人权 → 经验道德心理 → 平台运营 → AI 宪法。每一层加上前一层看不见的领域专属规则。


收尾

问题不是「普世价值存不存在」——人类显然共享 某些 道德反应和 某些 政治语言。问题是:你需要哪种意义上的普世为哪种决策谁的排除 为共识买了单。

社会科学说:薄普世、厚多元、不稳定聚合。

历史说:AI 实验室引用的经典文献 80 岁、诞生于战争与帝国,在数字伤害上已过时。

这不是反对 AI 里用人权语言,而是主张 精确——并把下一版宪法当 政治,不是发现。


来源