【全球ESG连麦】人工智能另一面:能耗巨大可持续性堪忧_数据_中心
界面***编辑 | 郑萃颖
建立更繁芜的环境和气候模型可以帮助人们理解景象变革的机理,利用前辈的模型去优化整合低碳能源系统,用算法去剖气绝象和农作物的长势从而做事精准农业……在由OpenAI带领的这一波人工智能热潮中,AI能给社会经济带来可持续发展的助力。AI的运用因此被放在聚光灯下,引发许多未来的美好期待。
少有人知的是,在人工智能技能的根本研究和产品设计过程中,须要耗费大量的水电等自然资源,产生非常高的碳足迹和水足迹。就像AI给人类社会带来效率提升的同时也带来管理和道德危急一样,在环境影响和可持续发展命题上,AI亦是一把“双刃剑”。
“在微软最前辈的美国数据中央演习 GPT-3 ,可直接蒸发70万升清洁淡水,但这些信息一贯被保密,这一点非常令人担忧。”加州大学河滨分校电气与打算机工程系副教授任绍磊(Shaolei Ren)在接管界面***专访时说。任绍磊的研究紧张聚焦于“人工智能+可持续性”,致力于使人工智能和打算技能带领我们的社会走向更加可持续和公正的路径。他尤其聚焦人工智能的用水问题,并早在2013年起就开始研究。
任绍磊先容,人工智能(AI)模型,尤其是像 GPT-3、GPT-4 这样的大型模型,其碳足迹越来越大,这点一贯受到公众年夜众关注。但人工智能模型同样主要而巨大的水足迹仍未引起足够重视。目前,淡水匮乏已成为环球共同面临的最紧迫寻衅之一。到2027年,环球人工智能需求可能会产生42-66亿立方米的打水量,这相称于丹麦每年打水总量的4-6倍。
如何提高AI大厂在能耗方面的信息表露透明度、如何通过合理的数据中央地理布局来降落能耗?更主要的,如何将可持续的理念植入AI开拓设计阶段,从而避免这个革命性行业重蹈老工业化时期“先污染再管理”覆辙?任绍磊透过对微软和谷歌的案例剖析试图供应一些办理方案。对付同样在人工智能领域迅猛布局的中国来说,也有启示意义。
GPT-3一次对话至少要“喝”10毫升水
界面***:我读过您的一篇研究,是关于GPT-3耗水量的,印象深刻。能跟我们详细先容一下这个研究么?
任绍磊:我在2013年就做过数据中央耗水的研究,但当时这个研究离普通人的生活太远了,没有得到很多关注。由于AI行业发展迅猛,很多学者近几年开始关注AI的碳足迹,但是关注水足迹的人很少。我就想,是不是可以做AI水资源花费的文章?根据我之前的研究根本,AI在水资源方面的花费该当是非常巨大的。
AI的发展都基于大规模的数据中央,而数据中央耗电量巨大,95%以上的电能会转化成热能。降热降温须要花费大量的水。现在紧张有两种办法降温:一种是利用水蒸发带走热量,也便是利用冷却塔,这个过程须要花费大量的水;还有一种是直接用空气流动散热,普通地说便是“用风吹”,但在景象热的时候须要用水预凉,景象干燥的时候须要用水加湿。
在微软环球数据中央,均匀来算大概每用一度电就要蒸发掉一升水。而这一度电大概能支撑数据中央一台做事器事情20分钟到一个小时。这一升水还只是数据中央直接用水。为了产生这一度电,在发电环节还要花费大量的水。按照业界均匀水平,每发一度电要花费大约3-6升水。
根据微软公布的官方数据,GPT-3每产生100页的对话内容,要花费0.4千瓦时的电。经由我们的打算,GPT-3每进行10-50次的基本讯问对话,就须要花费500毫升的水。也便是说,每一次讯问对话,它至少要“喝”10毫升以上的水。在微软最前辈的美国数据中央演习GPT-3可直接花费70万升清洁淡水,足够生产 370辆宝马汽车或370辆奔驰汽车。而且,这些水不是“打水”,而是花费掉并不可再生的。
界面***:现在数据中央耗水量的差别,紧张是温度引起的么?
任绍磊:是的,温度和冷却办法会对耗水量有较大影响。比如说,微软宣告GPT-4是在美国爱荷华州进行数据演习的,那里均匀气温比较低。根据我们的研究,如果是在景象较热的美国亚利桑那州演习,耗水量将是爱荷华的11倍。
温度的影响不难明得,相对较低温有利于散热。在冷却办法方面,在气温适宜的地方,可以采取直接引入室外冷空气降温的办法,不用冷却塔水蒸发带走热量,也不须要预先冷却空气,就减少了大部分耗水。
界面***:因此,AI要减少耗水,可以在数据中央的地点选择上做文章?
任绍磊:对,我们在研究中就提出了建议,由于人工智能的事情是通过互联网进行的,因此可以很大略地采纳诸如交流任务发送等办法,更加灵巧地利用数据中央。将打算要求转移到由清洁能源供电的数据中央,或者转移到用水量较少的较冷地区的数据中央,这是一种对景象有利的变革。而从用户体验的角度来看,也没有太大影响。
如何兼顾效率与公正?呼吁大厂提高能源花费信息透明度
界面***:您的另一项研究磋商了人工智能模型的加速增长可能加剧环境不平等,能跟我们先容一下这项研究么?
任绍磊:总的来说,人工智能的环境足迹在某些地区比其他地区高得多。这是由于在实际培植数据中央或干系大型根本举动步伐时,公司大多选择相对偏远的地区。比如在美国,很多数据中央的选址都是经济相对没那么发达,人口没那么稠密的地区。反过来说,如果是在经济实力比较强的社区,数据中央每每会由于噪音、空气、水热污染等问题招来强烈的民意反弹,导致培植操持流产。
因此,这就导致了一个恶性循环。越是欠发达社区,越有可能培植那些带来负面环境影响的AI根本举动步伐,从而进一步恶化当地的环境,加剧环境不平等。
界面***:但是如我们之前谈论的,从减少能耗角度看,数据中央也适宜培植在温度比较低、地广人稀的地方。如果这些地方恰好是比较薄弱的社区,我们怎么去平衡效率和公正的问题?
任绍磊:是的,有时候很难两全,须要去平衡。我们须要把稳,环境要素不是免费的,“凉爽”不是免费的。由于发电和数据中央运行还无法做到100%清洁能源供电,怎么衡量环境要素投入的经济代价?怎么为负面环境影响,对当地居民做出生态补偿?这些都是我们该当思考的问题。比如说在美国,微软在很多地区会培植数据中央配套的污水处理厂或风力发电厂,这便是对当地环境的一种补偿。
我把稳到许多美国科技公司已经非常关注环境公正问题,有时候乃至把公正放在效率和本钱之前。比如Meta(Facebook)在自己的ESG报告里,便是把环境公正放在紧张考虑位置,它的能源花费的信息表露也是最全面的。微软操持在印度培植的数据中央,乃至已经宣告不直接用水冷却,而改用利用空气冷却的冷凝器,这可能是考虑到印度缺水又很热。用冷凝器降温可以避免在当地直接耗水,但却大大增加了制冷能耗,导致发电环节用水大幅上升,因此总体用水量是否减少还不好判断。总之,在社会舆论压力下,许多大厂都不得不更多地去考虑社会环境效益。
界面***:您的文章点名了一些大厂,以是产生了比较大的影响力。您的研究中还提到谷歌在2022年,仅自有数据中央就花费近200亿升水用于现场冷却,个中大部分是饮用水,总体用水量较2021年增加约20%。您的研究都是基于公开数据么?研究揭橥后,这些大厂跟您联系过么?
任绍磊:微软没有联系过我,但是在干系媒体宣布出来之后,微软有进一步公布更详细的提高水资源利用效率的办法。谷歌有间接联系过我们大学,对研究所用的数据提出了一些质疑,但又谢绝供应自己更详细的数据。我们终极版论文的所有数据均来自官方数据、政府数据或者业界有名的研究机构数据,去掉了所有我们自己根据模型推算的数据。
界面***:故意思。对付这些大厂的能源花费信息表露,您是否定为足够透明呢?
任绍磊:还有提升空间。比如说微软表露了自己每个数据中央的用水效率,没有表露相应的用水量和用电量;谷歌表露了每个数据中央的用水量,又没有表露用水效率。有一种阐明是,如果用水用电量和效率都表露了,就能算出它的实际用水用电量,从而得出企业支配在当地的业务量。但这也不是什么商业机密,Meta就详细公布了每个业务地点的用电量、用水量,有的地方乃至包括了发电环节的用水量。
只有更充分的信息表露,才能给"大众知情权,也会给公司带来更多的改进压力。从这方面看,高科技大厂特殊是耗能较大的AI大厂该当提高能耗表露透明度。
在软件开拓阶段引入可持续理念,才能“治本”
界面***:除了数据中央所在地温度和冷却办法会影响耗水量外,还有什么方法能改进AI家当发展的可持续性呢?
任绍磊:另一个方法实在便是少用点儿能耗,也便是不用那么大的打算模型,用小一些的模型去构建你的AI产品,用水用电自然会降落。其实在GPT的演习过程中,微软也会利用大小不一样的模型去仿照,小模型便是大模型压缩出来的,去掉了一些不太主要的参数,它也能回答绝大多数基本问题。乃至小模型的相应速率更快,也便是回答问题更快,由于它更灵巧,打算量更小了。这就好比消费者买车,奔驰车和***车实在都能知足基本需求,那也不一定任何消费者都须要去买奔驰。
界面***:但是AI现在的发展阶段,仿佛是各个大厂在搞算力上的“武备竞赛”,追求更大、更强、更智能,基于实际需求的、可持续发展的理念彷佛还很少在产品开拓阶段被关注到。
任绍磊:对,这便是我想说的问题。AI发展要可持续,若何才是“治本”之道?现在大厂在数据中央选址上做文章,在大楼培植上做文章,实在都是治标不治本。特殊是考虑到AI的实质,便是“更聪明”、利用更少资源去干事。这些大厂其实在可持续开拓方面,根本没有用到自己的专长。在软件开拓阶段,码农们不会考虑能耗问题,而是怎么高大上怎么来;程序写出来了,先上线跑再说,先能赚到钱再说。至于须要多少电、须要多少水,那就让公司去买;负面环境影响大了,公司再去想怎么抵消环境影响。
前几天我刚去开了一个会议,大家非常关注一个理念,叫做Software Sustainability by Design,也便是具有可持续性的软件设计,美国已经有一些协会和组织在实行这个理念。很多人已经把稳到,不计环境本钱的软件开拓带来了很多能源资源摧残浪费蹂躏和不可逆的环境影响。这就好比第一步走错了,楼建歪了,你是可以再修补,但修补本钱就会很高。而如果在软件设计阶段就考虑到节能,综合本钱会低得多。
界面***:您说的这个太主要了,也很有启示性。由于大家直觉上会以为软件开拓不是一个重自然资源花费的行业,也就随意马虎忽略百口当链的环境负面影响,忽略了把可持续理念前移到开拓阶段的主要性。您跟一些“码农”聊过么?他们怎么看Software Sustainability by Design?
任绍磊:实在很难哀求一些传统的“码农”去把稳节能问题,由于从他们的学习、演习来看,都不会打仗到能源的议题。这须要企业从顶层设计上,引入一些专业人士,去平衡各方面的成分,也是一个比较繁芜的决策过程,涉及到从ESG角度去做公司管理和生产流程的改变。
我不雅观察到微软已经引入了一些这方面的外部专家,比如说前罗格斯大学的教授Ricardo Bianchini,以前我们一起做可持续打算方面的研究,现在在微软卖力数据中央能耗及绿色打算;去年底,微软还挖来了前白宫总统能源助理Melanie Nakagawa任首席可持续发展官,她在微软的紧张事情之一便是卖力水资源优化。
界面***:您关注过中国的AI公司在可持续发展方面的情形么?有没有什么建议?
任绍磊:中国的AI家当发展当然也是非常快的,数据中央的家当规模也非常大。海内很多数据中央的培植也已经考虑了环境成分,比如贵州、内蒙的数据中央比较多,这也在一定程度上减少了能耗。但与此同时,海内还有很多大厂委托的第三方数据中央,也有相称一部分分布在长三角、京津冀等地区。
在AI分配打算任务时,也可以考虑更为灵巧地在各个地方的数据中央转换。以前可能更多考虑速率问题,比如北京的用户要看一个***,那当然调用北京的数据中央最快;但现在的网络延时已经非常小了,考虑到能耗问题,是不是也可以调用内蒙的数据中央?这个韶光差用户是感想熏染不到的,但是综合起来对做事器的负载有很大影响。尤其是对AI的演习,这个太灵巧了,全国各地数据中央转一圈儿都可以,要充分考虑环境成本来考虑选址。
本文系作者个人观点,不代表本站立场,转载请注明出处!