Skip to content
知识

/knowledge/fairness-bias

机器学习中的公平与偏差

一个在有偏的世界上训练的模型,学会那份偏差,并以数学的权威把它大规模地施加出去。让一个模型变公平,比听起来要难——部分是因为「公平」有好几个无法同时为真的定义。

学于
机器学习中的公平与偏差实务 · 公平的决定
时间
政府分析 · 持续进行
应用于
公平的模型辅助判断
阅读 / 复习
约 15 分钟阅读2026-06-26

一个机器学习模型从数据中学习模式——而如果那些数据反映的是一个不公平的世界,模型就学会那份不 公平、并把它复制出来,更快、更便宜,还裹着一层数学客观性的外衣,让它更难被质疑。算法偏差不是一个假设:风险评估工具、招聘筛选、放贷模型,全都被证明会系统性地区别 对待一群群的人。机器学习中的公平是检测并减少那个的技术学科——而它真的很难,原因让 大多数人吃惊:「公平」有好几个精确的定义,而你没法同时满足它们全部。

这一页紧挨着数据治理页——那一页是政策与伦理;这 一页是机械:偏差如何进入、如何测量公平、核心那个数学上的不可能,以及你可以在哪里干预。它在任何 模型辅助的决定影响到人之处都要紧,而在政府的环境里,这差不多就是重点所在。

01

有后果的偏差

这里的「偏差」一词,不是指建模页里那种偏差-方差——它指的是对一群人的系统性不公平,通常是由一个受保护属性(种族、性别、年龄、残障)所界定的一群。危险很具体:一个模型一致地、大规模地把它学到的偏差施加出去,施加给每一个人、瞬间完成,却看起来中立。一个有偏的人类决策者影响他 遇到的人;一个有偏的模型可以影响数百万人,并且难争辩得多,因为「算法这么说的」带着虚假的 权威。

02

偏差如何进入

偏差很少来自一个心怀恶意的建模者。它通过数据和框定渗进来,大多是看不见的:

  • 历史偏差——数据忠实地记录了一个本就不平等的世界。一个在「以前谁被录用了」上 训练的招聘模型,把过去的偏见学得仿佛它们是才能。
  • 代表性偏差——某些群体被采样不足,所以模型对他们运作得更差(带着人的赌注的覆盖问题)。
  • 测量偏差——标签本身就是一个有缺陷的代理。「再次被捕」与「犯了罪」不是一回事, 但一个在逮捕数据上训练的模型,学到的是警务模式,而非犯罪。

贯穿其中的主线:模型是有偏数据的一面准确的镜子。垃圾进,偏差出——而模型接着 把它放大、并使之根深蒂固。

03

代理陷阱:你没法只是删掉那个变量

那个直觉性的第一个修法——「干脆别把种族或性别给模型」——行不通,而弄懂为 什么,是这一页上单一最重要的想法。受保护属性几乎总是通过代理变量,冗余地编码在其他特征里。

种族(已移除)✗邮编姓名学校消费模型偏差照样流过
代理陷阱。移除受保护属性(种族)并不移除它的影响——邮编、姓名、学校、消费模式全都与它相关,所以模型从它的代理变量重建出受保护属性,偏差照样流过。

邮编与种族相关;名字透露性别;你上过的学校、你的消费模式、你的措辞——它们中任何一个,都能让 一个模型重建出那个它从未被给过的受保护属性,并从后门进行歧视。这就是为什么公平没法 靠视而不见来达成;你必须主动地测量各群体之间的结果、并干预,这意味着这份分析绝非 简单。

04

定义「公平」:那些指标

要修好公平,你必须先定义它——而有好几个合理的、彼此竞争的定义。主要的群体公平准则:

  • 人口平价——每个群体以相同的比率得到正面结果(各群体间相等的批准率), 无关其他任何东西。
  • 机会均等——在那些真正应当得到正面结果的人当中,每个群体以相同的比率被 捕获(相等的真阳性率)。
  • 均等几率——更严格:各群体间相等的真阳性假阳性率。

每一个都编码了一个不同的、可辩护的公平观念——而麻烦恰恰从这里开始,因为它们可以彼此拉扯。

05

不可能性结果

这是这个领域核心那个深刻而发人深省的事实:当各群体有不同的基础率时,你无法同时满足 所有的公平准则。这是一个数学上的不可能(由 Chouldechova、以及 Kleinberg 及同事们 形式化),而非一个工程上的缺口——校准、相等的假阳性率、相等的假阴性率,无法同时成立,除非 基础率完全相同、或模型完美。

06

在哪里干预

一旦你选定了一个公平定义、并测量了那个差距,缓解可以在流水线的三个阶段行动:

  • 预处理——在训练之前修数据:给代表不足的群体重新加权、重新采样,或变换特征,以 在源头减少那个差距。
  • 处理中——把公平建进训练本身,给目标函数加上一个公平约束或惩罚,好让模型同时 优化准确度公平(例如对抗性去偏)。
  • 后处理——事后调整模型的输出,例如用群体特定的阈值来拉平所选的指标。

没有一个是银弹,而每一个都拿一些准确度、或一个公平观念,去换另一个——这就是为什么公平工作与解释(你必须看见模型在做什么)、以及一个有记录 的、可辩护的关于「你接受了哪个权衡、为什么」的决定,密不可分。

07

它在我工作中的体现

08

60 秒回顾

代理/冗余编码陷阱、群体公平指标、不可能性结果,以及 COMPAS 案例,反映了当前机器学习公平性的 参考文献以及亲身的工作。