什么是人工智能偏见？

人工智能无处不在——悄无声息地进行排序、评分和建议。这固然方便……但有时它也会助长某些群体的领先，而将另一些群体抛在后面。如果您想知道什么是人工智能偏见，为什么即使在精心设计的模型中也会出现偏见，以及如何在不降低性能的前提下减少偏见，那么本指南正是为您准备的。

您可能还想阅读以下文章：

🔗 GPT 代表什么？
用通俗易懂的语言解释 GPT 的名称和由来。

🔗 什么是预测性人工智能
预测模型如何根据历史数据和实时数据预测结果。

🔗 什么是开源人工智能
定义、主要优势、挑战、许可和项目示例。

🔗 如何将人工智能融入您的业务
分步路线图、工具、工作流程和变更管理要点。

简要定义：什么是人工智能偏见？

人工智能偏见是指人工智能系统的输出结果系统性地偏袒或歧视某些人或群体。它通常源于数据不平衡、衡量标准狭隘，或系统构建和使用的更广泛的背景。偏见并不总是出于恶意，但如果不加以控制，它会迅速造成危害。[1]

一个有用的区别是：偏见是指决策中的偏差，而歧视是指这种偏差在现实世界中可能造成的有害影响。你不可能完全消除偏见，但你必须加以控制，使其不会导致不公平的结果。[2]

为什么了解偏见实际上会让你变得更好💡

观点有点奇怪，对吧？但了解什么是人工智能偏见会让你：

设计能力更强——你会更早发现不成立的假设。
更擅长治理——你会记录权衡取舍，而不是敷衍了事。
与领导人、监管机构和受影响人员进行沟通

此外，学习公平性指标和政策方面的术语也能节省日后的时间。说实话，这就像自驾游前买张地图——虽然不完美，但总比凭感觉强得多。[2]

你在实际应用中会遇到的AI偏见类型🧭

偏见贯穿人工智能的整个生命周期。团队经常会遇到以下几种模式：

数据抽样偏差——某些群体代表性不足或缺失。
标签偏见——历史标签反映了偏见或嘈杂的人类判断。
测量偏差——无法反映你真正重视的东西的替代指标。
评估偏差——测试集遗漏了某些人群或情境。
部署偏差——一个优秀的实验室模型被用在了错误的环境中。
系统性和人为偏见——更广泛的社会模式和团队选择渗透到技术领域。

标准机构提出的一个有用的思维模型将偏见归类为人为因素、技术因素和系统因素，并建议进行社会技术管理，而不仅仅是模型调整。[1]

偏见是如何悄悄潜入供应链的🔍

问题界定——目标群体定义得太窄，就会排除掉产品应该服务的人群。
数据来源——历史数据往往反映了过去的种种不平等现象。
特征选择- 敏感属性的代理可以重新创建敏感属性。
训练目标旨在优化平均准确率，而非公平性。
测试——如果你的保留数据集存在偏差，那么你的指标也会存在偏差。
监控——用户或环境的变化可能会重新引入问题。

监管机构强调，要在整个生命周期中记录公平性风险，而不仅仅是在模型拟合阶段。这是一项全员参与的工作。[2]

我们如何才能在不陷入循环论证的情况下衡量公平性？📏

没有一种指标可以适用于所有情况。请根据您的使用场景和想要避免的危害来选择。

人口统计均衡——各组的选拔率应该相似。这对分配问题有利，但可能与准确性目标相冲突。[3]
等比概率——错误率（例如假阳性和真阳性）应该相似。当错误成本因群体而异时，这种方法很有用。[3]
校准——对于相同的分数，不同群体出现相同结果的概率应该相等。当分数影响人类决策时，校准非常有用。[3]

工具包通过计算差距、绘制图表和创建仪表盘，使这项工作变得切实可行，从而避免您进行猜测。[3]

切实有效的减少偏见的实用方法🛠️

应该采取多层次的缓解措施，而不是单一的灵丹妙药：

数据审计和丰富——识别覆盖范围缺口，在合法情况下收集更安全的数据，记录抽样。
重新加权和重采样- 调整训练分布以减少偏斜。
处理过程中的约束——将公平性目标添加到目标中，以便模型直接学习权衡取舍。
对抗性去偏——训练模型，使敏感属性无法从内部表示中预测。
后处理- 在适当且合法的情况下，校准每个组的决策阈值。
人机交互检查——将模型与可解释的摘要和升级路径相结合。

AIF360和Fairlearn这样的开源库提供了指标和缓解算法。它们并非万能，但可以为你提供一个系统的起点。[5][3]

现实生活中偏见确实会产生影响 📸💳🏥

面部分析——被广泛引用的研究表明，商业系统中不同性别和肤色群体之间的准确率存在较大差异，这促使该领域朝着更好的评估方法发展。[4]
高风险决策（信贷、招聘、住房）——即使并非出于故意，带有偏见的决策结果也可能与公平和反歧视义务相冲突。换句话说：你不仅要对代码负责，还要对结果负责。[2]

一个来自实践的简短案例：在一次匿名招聘筛选审核中，一个团队发现女性技术岗位的回忆能力存在差距。通过一些简单的措施——更合理的层级划分、功能审查以及针对不同群体设定阈值——在准确率略有下降的情况下，基本缩小了差距。关键不在于某个技巧，而在于一个可重复的测量-缓解-监控循环。

政策、法律和治理：何为“善”🧾

你不需要成为律师，但你确实需要设计出公平且易于解释的方案：

公平原则——以人为本的价值观、透明度和非歧视原则贯穿整个生命周期。[1]
数据保护与平等——涉及个人数据时，您需要履行公平、目的限制和个人权利方面的义务；行业规则也可能适用。尽早明确您的义务。[2]
风险管理——利用结构化框架来识别、衡量和监控偏见，作为更广泛的人工智能风险管理计划的一部分。记录下来。回顾。重复。[1]

顺便提一句：文书工作不仅仅是官僚主义；如果有人问起，它还能证明你确实完成了工作。

对比表格：用于控制人工智能偏见的工具和框架🧰📊

工具或框架	最适合	价格	它为什么有效……某种程度上是这样
AIF360	需要指标和缓解措施的数据科学家	自由的	大量算法集中在一处；原型制作速度快；有助于建立基准线并比较修复方案。[5]
费尔莱恩	团队需要在准确性和公平性限制之间取得平衡	自由的	清晰的评估/缓解 API；实用的可视化功能；兼容 scikit-learn。[3]
NIST AI（SP 1270）	风险、合规与领导力	自由的	用于人为/技术/系统性偏见和生命周期管理的通用语言。[1]
ICO指南	英国团队处理个人数据	自由的	人工智能生命周期中公平性/歧视风险的实用检查清单。[2]

这些工具通过提供结构、指标和共享词汇，帮助您回答在您的环境中什么是 AI 偏见

简短而略带个人见解的工作流程🧪

说明你想避免的伤害——分配伤害、错误率差异、尊严伤害等等。
选择与该损害相符的指标——例如，如果误差平衡很重要，则选择均等赔率。[3]
运行基准测试。保存公平性报告。
首先尝试一些摩擦较小的解决方法——更好的数据分割、阈值处理或重新加权。
上报至处理中限制因素。
使用代表真实用户的预留数据集重新评估
监控生产环境——分销渠道会发生变化；仪表盘也应该随之更新。
记录权衡取舍——公平性是因情况而异的，因此请解释为什么选择方案 X 而不是方案 Y。[1][2]

监管机构和标准制定机构不断强调生命周期思维是有原因的。它确实有效。[1]

利益相关者沟通技巧🗣️

避免只用数学公式解释——先展示简单的图表和具体的例子。
使用通俗易懂的语言——说明该模型可能会做出哪些不公平的行为，以及哪些人可能会受到影响。
表面上的权衡——公平性限制可能会改变准确性；如果这能减少伤害，那就不是错误。
制定应急预案——如果出现问题，如何暂停或回滚。
接受审查——外部审查或红队演练可以发现盲点。虽然没人喜欢，但它确实有帮助。[1][2]

常见问题：人工智能偏见究竟是什么？❓

偏见难道不就是糟糕的数据吗？
不只是。数据固然重要，但建模选择、评估设计、部署环境和团队激励机制都会影响结果。[1]

我能完全消除偏见吗？
通常不能。你的目标是控制偏见，使其不造成不公平的影响——要着眼于减少和治理偏见，而不是追求完美。[2]

我应该使用哪种公平性指标？
根据危害类型和领域规则来选择。例如，如果误报对某个群体造成的危害更大，则应关注错误率平衡（概率均等）。[3]

我需要法律审查吗？
如果你的系统涉及人们的机会或权利，那么答案是肯定的。以消费者和公平为导向的规则可以适用于算法决策，你需要展示你的工作成果。[2]

最后总结：太长了，没看完🧾✨

如果有人问你什么是人工智能偏见，这里有个简明扼要的答案：它是人工智能输出中存在的系统性偏差，可能会在现实世界中造成不公平的影响。你需要用符合情境的指标来诊断它，用分层技术来缓解它，并在整个生命周期中进行管控。这并非一个可以轻易修复的单一漏洞——它涉及产品、政策和人员等多个方面，需要持续不断地进行测量、记录和保持谦逊的态度。我想，这并非万全之策……但我们可以制定一些有效的检查清单，做出诚实的权衡，并养成更好的习惯。当然，加几个表情符号也无妨。🙂

参考

NIST 特别出版物 1270——人工智能偏见识别与管理标准概述。链接
英国信息专员办公室——公平性、偏见和歧视问题如何解决？ 链接
Fairlearn 文档 -常用公平性指标（人口统计平等、赔率均衡、校准）。链接
Buolamwini, J., & Gebru, T. (2018).性别阴影：商业性别分类中交叉性准确性差异。FAT* / PMLR。链接
IBM研究院——推出AI公平性360（AIF360） 。链接

在官方人工智能助手商店查找最新人工智能产品

关于我们

返回博客

国家/地区