如果你覺得自己的游戲電腦發(fā)熱量很大,那你是沒見過真正“發(fā)燒”的家伙——現(xiàn)代人工智能數(shù)據(jù)中心。為了訓練GPT這類大模型,成千上萬的AI芯片在數(shù)據(jù)中心里日夜不停地運算,產(chǎn)生的熱量極其驚人。一個AI服務(wù)器機架的功耗,動輒就能超過幾十個家庭的總和。熱量,已經(jīng)成為鎖死AI發(fā)展的終極瓶頸。傳統(tǒng)的風冷早已力不從心,甚至常規(guī)的水冷也快要觸頂。怎么辦?科技巨頭微軟給出的解決方案,聽起來有點瘋狂:把整個服務(wù)器主板,直接“泡”在特殊的液體里。微芯片背面蝕刻的凹槽可讓冷卻劑流過
當然,服務(wù)器泡的可不是普通的水,那會引發(fā)短路,釀成災(zāi)難。這種液體是一種不導電、絕緣的特殊工程流體。
其原理是,當發(fā)熱的AI芯片完全浸沒在這種液體中時,液體能通過直接接觸,比空氣高效成百上千倍地將熱量帶走。但這還不是最絕的。微軟與OpenAI等伙伴合作探索的,是一種更為極致的“兩相”浸沒式液冷。這種液體的沸點很低,大約在50℃左右。當它接觸到高溫的芯片表面時,會瞬間沸騰,從液體變?yōu)闅怏w。這個“沸騰”的過程,能吸收掉巨量的熱量,散熱效率極高。隨后,蒸汽上升遇到冷凝器,又重新變回液體,完成一個高效的循環(huán)。
如果只是把現(xiàn)有的服務(wù)器扔進液體桶里,那還只能算是一種“改良”。微軟真正的野心,是從芯片設(shè)計之初,就將散熱作為核心架構(gòu)來考慮。這就是報道中提到的“微流體”技術(shù)。我們可以把它想象成在芯片的內(nèi)部或底部,用激光蝕刻出比頭發(fā)絲還細的微型管道網(wǎng)絡(luò)。這些管道就像芯片自己內(nèi)置的“毛細血管”循環(huán)系統(tǒng),讓冷卻液能夠直接流經(jīng)最核心、最炙熱的發(fā)熱單元,實現(xiàn)“精準降溫”。這好比是給一位高強度運動的運動員,直接在他的肌肉纖維里植入微型冷卻管,而不是僅僅對著他吹風扇。這種從“外部降溫”到“內(nèi)生散熱”的范式轉(zhuǎn)移,才是這項技術(shù)最革命性的地方。
熱量是性能的枷鎖。一旦散熱不再是問題,AI芯片就可以在更高的功率下持續(xù)“狂飆”,再也不用因為過熱而降頻。未來訓練一個大模型,時間可能從幾個月縮短到幾周。
而能效革命則是最直接的收益。據(jù)報道,這種液冷系統(tǒng)能夠?qū)⒂糜诶鋮s的能耗降低超過90%。對于微軟、谷歌這樣擁有龐大數(shù)據(jù)中心的企業(yè)來說,這不僅是巨大的成本節(jié)約,更是實現(xiàn)碳中和目標的關(guān)鍵一步。擺脫了風扇和風道,服務(wù)器可以像書架上的書一樣被緊密地排列在一起,在更小的空間內(nèi)提供更強的算力。微軟的這場“液體革命”清晰地表明,在AI算力激烈競賽的今天,散熱已從一個需要被解決的“問題”,進化成了提升核心競爭力的“戰(zhàn)場”。當冷卻效率提升90%,它節(jié)省的不僅是電費,更是解鎖了AI未來發(fā)展的無限可能。下一次AI模型實現(xiàn)巨大飛躍的背后,或許就有這一池看似平靜、實則沸騰的“冷卻液”的功勞。

標簽:
芯片元器件 液冷、數(shù)據(jù)中心等 點擊:
版權(quán)聲明:除非特別標注,否則均為本站原創(chuàng)文章,轉(zhuǎn)載時請以鏈接形式注明文章出處。