我敢肯定,你肯定听过各种各样的说法,从“人工智能每回答几个问题就要喝掉一瓶水”到“基本上也就几滴水”。但事实远比这复杂得多。人工智能的用水量会根据其运行地点、提示信息的长度以及数据中心服务器的冷却方式而有很大差异。所以,虽然存在一个大致的数字,但它背后隐藏着诸多不确定因素。
下面我将详细解读清晰、便于决策的数据,解释为什么估算结果会有分歧,并展示建筑商和普通用户如何在不成为可持续发展苦行僧的情况下减少用水量。
您可能还想阅读以下文章:
🔗 什么是人工智能数据集
解释了数据集如何实现机器学习训练和模型开发。
🔗 人工智能如何预测趋势
展示了人工智能如何分析模式以预测变化和未来结果。
🔗 如何衡量人工智能性能
详细分析评估准确性、速度和可靠性的关键指标。
🔗 如何与人工智能对话
指导有效的提示策略,以提高清晰度、效果和一致性。
人工智能用水量是多少?一些实用的小数据📏
-
目前,每个提示的文本量差异很大:主流系统中,一个中等长度的文本提示的文本通常不到毫升;几十毫升。例如,谷歌的生产统计数据显示,文本提示的文本量中位数约为 0.26 毫升(包含完整的服务开销)[1]。Mistral 的生命周期评估表明,一个包含400 个令牌的助手回复的文本量约为 45 毫升(边际推断)[2]。上下文和模型至关重要。
-
训练一个前沿规模的模型可能需要数百万升的水,主要来自冷却和发电过程中消耗的水。一项被广泛引用的学术分析估计,训练一个GPT级别的模型大约需要540万升水现场冷却消耗的约70万升水
-
一般而言,大型数据中心:大型站点每天用水量达数十万加仑,某些园区的用水量峰值更高,具体取决于气候和设计[5]。
说实话,这些数据乍一看似乎前后矛盾。的确如此。而且这其中有充分的理由。

AI用水指标✅
一个好的答案应该满足以下几个条件:人工智能用水量是多少?
-
边界清晰度:
它是否仅包括现场冷却水,还是也发电厂用于发电的场外水取水量与用水量,并划分范围 1-2-3,类似于碳核算 [3]。 -
位置敏感性:
每千瓦时用水量因地区和电网组合而异,因此,同样的提示可能会因服务地点不同而产生不同的用水影响——这是文献建议进行时间和地点感知调度的[3]。 -
工作负载的现实性:
该数字反映的是中位数生产请求,包括空闲容量和数据中心开销,还是仅反映峰值加速器?谷歌强调对整个系统进行全面统计(空闲、CPU/DRAM 和数据中心开销)以进行推断,而不仅仅是 TPU 的计算 [1]。 -
冷却技术方面
,蒸发冷却、闭环液冷、空气冷却以及新兴的芯片级直接技术极大地改变了用水量。微软正在推出旨在某些下一代数据中心冷却用水的 -
一天中的时间和季节、
温度、湿度和电网状况都会影响用水效率;一项有影响力的研究表明,应在用水强度较低的时间和地点安排主要工作[3]。
取水量与用水量对比详解💡
-
取水量= 从河流、湖泊或含水层中取水(部分水会返回)。
-
消耗量=未返回的,因为水会蒸发或被纳入生产过程/产品中。
冷却塔主要消耗水。发电厂可能会抽取大量水(有时会消耗一部分),具体取决于电厂和冷却方式。一个可信的AI水量数值会标注它所报告的数值[3]。
人工智能中的水流向:三个水桶🪣
-
范围 1 - 现场冷却
可见部分:数据中心本身蒸发的水。蒸发式冷却与空气冷却或闭环液体冷却设定了基准 [5]。 -
范围 2 - 发电
每千瓦时 (kWh) 都可能携带一个隐藏的水标签;混合比例和位置决定了您的工作负载所继承的每千瓦时升数信号 [3]。 -
范围 3 - 供应链
芯片制造依赖于超纯水进行制造。除非边界明确包含隐含影响(例如,完整的生命周期评估),否则您不会在“每次提示”指标中看到它[2][3]。
供应商数据,细致入微🧮
-
Google Gemini 提示采用
全栈服务方法(包括空闲时间和设施开销)。文本提示的中位数约为 0.26 毫升水和0.24 瓦时能量;这些数字反映了生产流量和综合边界 [1]。 -
Mistral Large 2 生命周期
一项罕见的独立 LCA(与 ADEME/Carbone 4 合作)显示,训练和早期使用需要约 281,000 立方米400 个令牌的推理边际约为 45 毫升[2]。 -
微软的零水冷却目标:
下一代数据中心的设计目标是实现零水冷却,采用直接对芯片冷却的方式;管理用途仍然需要一些水[4]。 -
一般数据中心规模
主要运营商公开报告称,平均每天用水量达数十万加仑;气候和设计因素会使用水量上下波动[5]。 -
早期的学术
基准“渴求人工智能”分析估计需要数百万升水来训练 GPT 类模型,并且10-50 个中等答案大约相当于500 毫升的瓶子——这很大程度上取决于它们运行的时间/地点 [3]。
为什么估算结果会有这么大的分歧🤷
-
不同的边界。
有些数据只计算现场冷却;另一些数据则加上了电力用水;生命周期评估可能还会加上芯片制造。苹果、橘子和水果沙拉[2][3]。 -
不同的工作负载
短文本提示不是长时间的多模态/代码运行;批处理、并发和延迟目标会改变利用率 [1][2]。 -
不同的气候和电网
在炎热干燥地区采用蒸发冷却≠在凉爽潮湿地区采用空气/液体冷却。电网水强度变化很大[3]。 -
供应商方法论方面
,谷歌发布了系统级服务方法;Mistral 发布了正式的生命周期评估 (LCA)。其他供应商则使用稀疏方法提供点估计。一项备受瞩目的“每次提示使用十五分之一茶匙”的说法曾一度成为新闻头条——但由于缺乏边界细节,该说法不具有可比性 [1][3]。 -
技术
发展日新月异。微软正在部分站点试点无水冷却技术;即使上游电力仍然依赖水,推广这些技术也将减少现场用水量[4]。
今天你可以做些什么来减少人工智能的水足迹🌱
-
合理调整模型规模。规模
更小、针对特定任务优化的模型通常能在保持准确率的同时,减少计算资源消耗。Mistral 的评估强调了模型规模与资源占用之间的强相关性,并公布了边际推断值,以便用户权衡利弊[2]。 -
选择节水地区
优先选择气候凉爽、制冷效率高、每千瓦时用水强度较低的电网地区;“渴求用水的人工智能”研究表明,时间和地点感知调度有助于节水 [3]。 -
按时间
调整工作负载 将训练/繁重的批量推理安排在节水时段(凉爽的夜晚、有利的电网条件)[3]。 -
向供应商索取透明的指标,
例如每次用水需求量、边界定义,以及数据是否包含闲置产能和设施运营成本。政策团体正在推动强制披露这些信息,以便进行公平的比较[3]。 -
冷却技术很重要。
如果您运行硬件,请评估闭环/直接芯片冷却;如果您在云端,请优先选择投资于轻水冷设计的[4][5]。 -
利用灰水和再利用方案
许多校园可以替代非饮用水源或在循环系统中回收利用;大型运营商描述了平衡水源和冷却选择,以最大限度地减少净影响[5]。
举个简单的例子来说明(并非普遍规律):将一项夜间培训工作从盛夏炎热干燥的地区转移到春季凉爽湿润的地区,并在非高峰时段进行,可以同时改变现场用水量和外部(电网)用水强度。这就是合理安排工作能够带来的切实有效的成果[3]。
对比表格:快速降低人工智能用水量的最佳方案🧰
| 工具 | 观众 | 价格 | 为什么有效 |
|---|---|---|---|
| 更小的、针对特定任务调整的模型 | 机器学习团队、产品负责人 | 低至中等 | 每个令牌的计算量越少 = 冷却、电力和水的消耗就越少;LCA 风格的报告证明了这一点 [2]。 |
| 按水/千瓦时划分区域 | 云架构师、采购 | 中等的 | 转向更凉爽的气候和用水强度较低的电网;配合需求感知路由[3]。 |
| 一天中的不同时段训练窗口 | MLOps、调度器 | 低的 | 凉爽的夜晚和更好的电网条件降低了有效水强度[3]。 |
| 芯片直接冷却/闭环冷却 | 数据中心运维 | 中高 | 尽可能避免使用蒸发塔,从而大幅减少现场消耗[4]。 |
| 提示长度和批量控制 | 应用开发者 | 低的 | 限制失控的令牌,智能地批量处理,缓存结果;减少毫秒数,减少毫升数[1][2]。 |
| 供应商透明度核查清单 | 首席技术官、可持续发展负责人 | 自由的 | 强制明确边界(现场与非现场)和进行同类报告[3]。 |
| 灰水或再生水源 | 设施、市政当局 | 中等的 | 用非饮用水替代饮用水可以缓解饮用水供应的压力[5]。 |
| 热能再利用伙伴关系 | 运营商、地方议会 | 中等的 | 提高热效率可间接降低制冷需求,并建立当地良好声誉[5]。 |
(“价格”一词本身就比较模糊——具体情况因部署而异。)
深度分析:政策鼓声越来越大🥁
工程机构呼吁强制披露数据中心的能源和用水情况,以便买家和社区能够评估成本和收益。建议包括范围定义、站点级报告和选址指导——因为如果没有可比的、与位置相关的指标,我们就如同在黑暗中争论[3]。
深度解析:数据中心的饮水方式各不相同🚰
一直以来都有一种误解,认为“空气冷却不需要水”。其实不然。空气冷却系统通常需要更多电力,而在许多地区,电力供应中包含了来自电网的隐性水源水冷系统虽然可以减少电力消耗和排放,但代价是需要消耗现场用水。大型运营商会根据具体情况,明确权衡这些利弊[1][5]。
深度解析:快速辨别网络谣言的真相🧪
你可能见过一些大胆的说法,比如一次提示相当于“一瓶水”,或者“只需几滴”。更好的做法是:对数学保持谦逊。如今,可信的提示量范围约为中等量提示(包含全部服务开销)约为0.26 毫升约为 45 毫升[2]。广为流传的“十五分之一茶匙”的说法缺乏明确的界限/方法;把它当作没有具体城市的天气预报来看待吧 [1][3]。
简明问答:人工智能用水量是多少?(再次用通俗易懂的语言解释)🗣️
-
那么,我在会议上应该怎么说呢?
根据型号、时长和运行地点,每次训练的用水量从几滴到几小口训练需要的是大水池,而不是小水坑。” 然后举出上面提到的一两个例子。 -
人工智能真的就一定不好吗?
它的独特之处在于其高度集中性:高功率芯片密集排列会产生巨大的冷却负荷。但数据中心也往往是效率最高的技术最先应用的地方[1][4]。 -
如果我们把所有东西都改成空气冷却呢?
这样可能会减少现场用水,但可以通过电力增加外部用水。经验丰富的运营商会权衡这两方面[1][5]。 -
那么未来的技术会如何呢?
避免冷却水的设计将彻底改变范围 1 的格局。一些运营商正在朝着这个方向发展;上游电力仍然携带水信号,直到电网发生变化 [4]。
最后总结——太长了,我没看完🌊
-
每次提示:根据模型、提示长度和运行位置的不同,提示量从亚毫升到几十毫升在一个主要堆栈中,提示的中位数约为 0.26 毫升 400 个令牌的回复约为 45 毫升 [1][2]。
-
培训: 数百万升用于前沿模型,使得调度、选址和冷却技术至关重要[3]。
-
应该怎么做:选择合适的型号,选择节水区域,将繁重的工作转移到较冷的时间段,优先选择能够提供节水设计的供应商,并要求透明的边界[1][3][4][5]。
最后用一个略有瑕疵的比喻:人工智能就像一支渴求水分的交响乐团——旋律是计算,鼓点是冷却系统和电网的供水。调整好乐团,观众就能在不被洒水器干扰的情况下欣赏到美妙的音乐。🎻💦
参考
-
Google Cloud 博客 - Google 的 AI 消耗多少能源?我们计算了一下(方法论 +约 0.26 毫升中位数提示,完整服务开销)。链接
(技术论文 PDF:衡量 Google 规模下 AI 交付的环境影响。)链接 -
Mistral AI——我们为全球人工智能环境标准所做的贡献(采用 ADEME/Carbone 4 进行生命周期评估;训练和早期使用约 281,000 立方米每次400 个词元的回复约需 45 毫升链接
-
Li等人——让AI减少“渴水”:揭示并解决AI模型的隐秘用水足迹(训练数百万升水、时间地点感知调度、取水与消耗)。链接
-
微软——下一代数据中心冷却过程无需用水(采用直接芯片冷却设计,针对特定地点实现无水冷却)。链接
-
谷歌数据中心——可持续运营(逐个站点的冷却权衡;报告和再利用,包括再生水/灰水;典型的每日站点级使用量级)。链接