界面新聞記者 | 蔡木子
界面新聞編輯 | 鄭萃穎
建立更復雜的環境和氣候模型可以幫助人們理解氣候變化的機理,利用先進的模型去優化整合低碳能源系統,用算法去判定天氣和農作物的長勢從而服務精準農業……在由OpenAI帶領的這一波人工智能熱潮中,AI能給社會經濟帶來可持續發展的助力。AI的應用因此被放在聚光燈下,引發許多未來的美好期待。
少有人知的是,在人工智能技術的基礎研究和產品設計過程中,需要耗費大量的水電等自然資源,產生非常高的碳足跡和水足跡。就像AI給人類社會帶來效率提升的同時也帶來治理和道德危機一樣,在環境影響和可持續發展命題上,AI亦是一把“雙刃劍”。
“在微軟最先進的美國數據中心訓練 GPT-3 ,可直接蒸發70萬升清潔淡水,但這些信息一直被保密,這一點非常令人擔憂。”加州大學河濱分校電氣與計算機工程系副教授任紹磊(Shaolei Ren)在接受界面新聞專訪時說。任紹磊的研究主要聚焦于“人工智能+可持續性”,致力于使人工智能和計算技術帶領我們的社會走向更加可持續和公平的路徑。他尤其聚焦人工智能的用水問題,并早在2013年起就開始研究。
任紹磊介紹,人工智能(AI)模型,尤其是像 GPT-3、GPT-4 這樣的大型模型,其碳足跡越來越大,這點一直受到公眾關注。但人工智能模型同樣重要而巨大的水足跡仍未引起足夠重視。目前,淡水匱乏已成為全球共同面臨的最緊迫挑戰之一。到2027年,全球人工智能需求可能會產生42-66億立方米的取水量,這相當于丹麥每年取水總量的4-6倍。
如何提高AI大廠在能耗方面的信息披露透明度、如何通過合理的數據中心地理布局來降低能耗?更重要的,如何將可持續的理念植入AI開發設計階段,從而避免這個革命性行業重蹈老工業化時代“先污染再治理”覆轍?任紹磊透過對微軟和谷歌的案例分析試圖提供一些解決方案。對于同樣在人工智能領域迅猛布局的中國來說,也有啟發意義。
GPT-3一次對話至少要“喝”10毫升水
界面新聞:我讀過您的一篇研究,是關于GPT-3耗水量的,印象深刻。能跟我們詳細介紹一下這個研究么?
任紹磊:我在2013年就做過數據中心耗水的研究,但當時這個研究離普通人的生活太遠了,沒有得到很多關注。由于AI行業發展迅猛,很多學者近幾年開始關注AI的碳足跡,但是關注水足跡的人很少。我就想,是不是可以做AI水資源消耗的文章?根據我之前的研究基礎,AI在水資源方面的消耗應該是非常巨大的。
AI的發展都基于大規模的數據中心,而數據中心耗電量巨大,95%以上的電能會轉化成熱能。降熱降溫需要消耗大量的水。現在主要有兩種方式降溫:一種是利用水蒸發帶走熱量,也就是利用冷卻塔,這個過程需要消耗大量的水;還有一種是直接用空氣流動散熱,通俗地說就是“用風吹”,但在天氣熱的時候需要用水預涼,天氣干燥的時候需要用水加濕。
在微軟全球數據中心,平均來算大概每用一度電就要蒸發掉一升水。而這一度電大概能支撐數據中心一臺服務器工作20分鐘到一個小時。這一升水還只是數據中心直接用水。為了產生這一度電,在發電環節還要消耗大量的水。按照業界平均水平,每發一度電要消耗大約3-6升水。
根據微軟公布的官方數據,GPT-3每產生100頁的對話內容,要消耗0.4千瓦時的電。經過我們的計算,GPT-3每進行10-50次的基本詢問對話,就需要消耗500毫升的水。也就是說,每一次詢問對話,它至少要“喝”10毫升以上的水。在微軟最先進的美國數據中心訓練GPT-3可直接消耗70萬升清潔淡水,足夠生產 370輛寶馬汽車或370輛奔馳汽車。而且,這些水不是“取水”,而是消耗掉并不可再生的。
界面新聞:現在數據中心耗水量的差別,主要是溫度引起的么?
任紹磊:是的,溫度和冷卻方式會對耗水量有較大影響。比如說,微軟宣布GPT-4是在美國愛荷華州進行數據訓練的,那里平均氣溫比較低。根據我們的研究,如果是在天氣較熱的美國亞利桑那州訓練,耗水量將是愛荷華的11倍。
溫度的影響不難理解,相對較低溫有利于散熱。在冷卻方式方面,在氣溫適宜的地方,可以采用直接引入室外冷空氣降溫的辦法,不用冷卻塔水蒸發帶走熱量,也不需要預先冷卻空氣,就減少了大部分耗水。
界面新聞:因此,AI要減少耗水,可以在數據中心的地點選擇上做文章?
任紹磊:對,我們在研究中就提出了建議,由于人工智能的工作是通過互聯網進行的,因此可以很簡單地采取諸如交換任務發送等方式,更加靈活地使用數據中心。將計算請求轉移到由清潔能源供電的數據中心,或者轉移到用水量較少的較冷地區的數據中心,這是一種對氣候有利的變化。而從用戶體驗的角度來看,也沒有太大影響。
如何兼顧效率與公平?呼吁大廠提高能源消耗信息透明度
界面新聞:您的另一項研究探討了人工智能模型的加速增長可能加劇環境不平等,能跟我們介紹一下這項研究么?
任紹磊:總的來說,人工智能的環境足跡在某些地區比其他地區高得多。這是因為在實際建設數據中心或相關大型基礎設施時,公司大多選擇相對偏遠的地區。比如在美國,很多數據中心的選址都是經濟相對沒那么發達,人口沒那么稠密的地區。反過來說,如果是在經濟實力比較強的社區,數據中心往往會因為噪音、空氣、水熱污染等問題招來強烈的民意反彈,導致建設計劃流產。
因此,這就導致了一個惡性循環。越是欠發達社區,越有可能建設那些帶來負面環境影響的AI基礎設施,從而進一步惡化當地的環境,加劇環境不平等。
界面新聞:但是如我們之前討論的,從減少能耗角度看,數據中心也適宜建設在溫度比較低、地廣人稀的地方。如果這些地方恰好是比較薄弱的社區,我們怎么去平衡效率和公平的問題?
任紹磊:是的,有時候很難兩全,需要去平衡。我們需要注意,環境要素不是免費的,“涼快”不是免費的。因為發電和數據中心運行還無法做到100%清潔能源供電,怎么衡量環境要素投入的經濟價值?怎么為負面環境影響,對當地居民做出生態補償?這些都是我們應該思考的問題。比如說在美國,微軟在很多地區會建設數據中心配套的污水處理廠或風力發電廠,這就是對當地環境的一種補償。
我注意到許多美國科技公司已經非常關注環境公平問題,有時候甚至把公平放在效率和成本之前。比如Meta(Facebook)在自己的ESG報告里,就是把環境公平放在首要考慮位置,它的能源消耗的信息披露也是最全面的。微軟計劃在印度建設的數據中心,甚至已經宣布不直接用水冷卻,而改用利用空氣冷卻的冷凝器,這可能是考慮到印度缺水又很熱。用冷凝器降溫可以避免在當地直接耗水,但卻大大增加了制冷能耗,導致發電環節用水大幅上升,因此總體用水量是否減少還不好判斷。總之,在社會輿論壓力下,許多大廠都不得不更多地去考慮社會環境效益。
界面新聞:您的文章點名了一些大廠,所以產生了比較大的影響力。您的研究中還提到谷歌在2022年,僅自有數據中心就消耗近200億升水用于現場冷卻,其中大部分是飲用水,總體用水量較2021年增加約20%。您的研究都是基于公開數據么?研究發表后,這些大廠跟您聯系過么?
任紹磊:微軟沒有聯系過我,但是在相關媒體報道出來之后,微軟有進一步公布更詳細的提高水資源利用效率的方式。谷歌有間接聯系過我們大學,對研究所用的數據提出了一些質疑,但又拒絕提供自己更詳細的數據。我們最終版論文的所有數據均來自官方數據、政府數據或者業界知名的研究機構數據,去掉了所有我們自己根據模型推算的數據。
界面新聞:有意思。對于這些大廠的能源消耗信息披露,您是否覺得足夠透明呢?
任紹磊:還有提升空間。比如說微軟披露了自己每個數據中心的用水效率,沒有披露相應的用水量和用電量;谷歌披露了每個數據中心的用水量,又沒有披露用水效率。有一種解釋是,如果用水用電量和效率都披露了,就能算出它的實際用水用電量,從而得出企業部署在當地的業務量。但這也不是什么商業機密,Meta就詳細公布了每個業務地點的用電量、用水量,有的地方甚至包括了發電環節的用水量。
只有更充分的信息披露,才能給公眾知情權,也會給公司帶來更多的改進壓力。從這方面看,高科技大廠特別是耗能較大的AI大廠應該提高能耗披露透明度。
在軟件開發階段引入可持續理念,才能“治本”
界面新聞:除了數據中心所在地溫度和冷卻方式會影響耗水量外,還有什么方法能改進AI產業發展的可持續性呢?
任紹磊:另一個方法其實就是少用點兒能耗,也就是不用那么大的計算模型,用小一些的模型去構建你的AI產品,用水用電自然會降低。其實在GPT的訓練過程中,微軟也會使用大小不一樣的模型去模擬,小模型就是大模型壓縮出來的,去掉了一些不太重要的參數,它也能回答絕大多數基本問題。甚至小模型的響應速度更快,也就是回答問題更快,因為它更靈活,計算量更小了。這就好比消費者買車,奔馳車和QQ車其實都能滿足基本需求,那也不一定任何消費者都需要去買奔馳。
界面新聞:但是AI現在的發展階段,仿佛是各個大廠在搞算力上的“軍備競賽”,追求更大、更強、更智能,基于實際需求的、可持續發展的理念似乎還很少在產品開發階段被關注到。
任紹磊:對,這就是我想說的問題。AI發展要可持續,怎樣才是“治本”之道?現在大廠在數據中心選址上做文章,在大樓建設上做文章,其實都是治標不治本。特別是考慮到AI的本質,就是“更聰明”、使用更少資源去做事。這些大廠其實在可持續開發方面,根本沒有用到自己的專長。在軟件開發階段,碼農們不會考慮能耗問題,而是怎么高大上怎么來;程序寫出來了,先上線跑再說,先能賺到錢再說。至于需要多少電、需要多少水,那就讓公司去買;負面環境影響大了,公司再去想怎么抵消環境影響。
前幾天我剛去開了一個會議,大家非常關注一個理念,叫做Software Sustainability by Design,也就是具有可持續性的軟件設計,美國已經有一些協會和組織在推行這個理念。很多人已經注意到,不計環境成本的軟件開發帶來了很多能源資源浪費和不可逆的環境影響。這就好比第一步走錯了,樓建歪了,你是可以再修補,但修補成本就會很高。而如果在軟件設計階段就考慮到節能,綜合成本會低得多。
界面新聞:您說的這個太重要了,也很有啟發性。因為大家直覺上會覺得軟件開發不是一個重自然資源消耗的行業,也就容易忽視全產業鏈的環境負面影響,忽視了把可持續理念前移到開發階段的重要性。您跟一些“碼農”聊過么?他們怎么看Software Sustainability by Design?
任紹磊:其實很難要求一些傳統的“碼農”去注意節能問題,因為從他們的學習、訓練來看,都不會接觸到能源的議題。這需要企業從頂層設計上,引入一些專業人士,去平衡各方面的因素,也是一個比較復雜的決策過程,涉及到從ESG角度去做公司治理和生產流程的改變。
我觀察到微軟已經引入了一些這方面的外部專家,比如說前羅格斯大學的教授Ricardo Bianchini,以前我們一起做可持續計算方面的研究,現在在微軟負責數據中心能耗及綠色計算;去年底,微軟還挖來了前白宮總統能源助理Melanie Nakagawa任首席可持續發展官,她在微軟的主要工作之一就是負責水資源優化。
界面新聞:您關注過中國的AI公司在可持續發展方面的情況么?有沒有什么建議?
任紹磊:中國的AI產業發展當然也是非常快的,數據中心的產業規模也非常大。國內很多數據中心的建設也已經考慮了環境因素,比如貴州、內蒙的數據中心比較多,這也在一定程度上減少了能耗。但與此同時,國內還有很多大廠委托的第三方數據中心,也有相當一部分分布在長三角、京津冀等地區。
在AI分配計算任務時,也可以考慮更為靈活地在各個地方的數據中心轉換。以前可能更多考慮速度問題,比如北京的用戶要看一個視頻,那當然調用北京的數據中心最快;但現在的網絡延時已經非常小了,考慮到能耗問題,是不是也可以調用內蒙的數據中心?這個時間差用戶是感受不到的,但是綜合起來對服務器的負載有很大影響。尤其是對AI的訓練,這個太靈活了,全國各地數據中心轉一圈兒都可以,要充分考慮環境成本來考慮選址。