在算力芯片需求持續升溫的背景下,曙光數創正以創新技術引領液冷散熱的新風潮。在2025中國智算中心全棧技術大會上,曙光數創隆重推出了“新服務、新技術、新架構”三大新品,旨在通過一體化、全生命周期的服務模式,破解液冷行業當前面臨的諸多難題。
曙光數創副總裁兼CTO張鵬在接受媒體采訪時表示,液冷即服務的理念在行業中早已有需求,但由于缺乏統一標準,從設計到服務器,各家對液冷數據云架構的理解各異,施工質量也參差不齊。對客戶而言,理想的解決方案應涵蓋優質服務、先進技術和可靠架構,無需在這三者間做出取舍,而是尋求一個覆蓋全生命周期的服務。
根據國際數據公司(IDC)今年4月發布的《中國半年度液冷服務器市場(2024下半年)跟蹤報告》,2024年中國液冷服務器市場規模已達23.7億美元,同比增長67.0%,其中冷板式解決方案的市場占有率進一步提升。IDC預測,從2024年至2029年,中國液冷服務器市場的年復合增長率將達到46.8%,到2029年市場規模有望達到162億美元。
液冷產業的蓬勃發展離不開上下游企業的協同合作。從芯片、服務器到液冷系統,各個環節需共同把控安全、推動技術融合,并亟待建立統一標準。隨著AI大模型的快速發展,智算中心已逐步取代傳統數據中心,成為新型基礎設施的核心。然而,算力芯片的功耗與發熱量急劇增加,給數據中心的散熱系統帶來了巨大挑戰。
英偉達CEO黃仁勛曾透露,其2026年將推出的Rubin芯片單顆功耗將達到1.6千瓦,而AMD新發布的Instinct MI355系列芯片功耗也已接近1.4千瓦。行業專家預測,未來幾年內,單芯片功耗可能會突破二千瓦大關。算力密度的快速增長使得傳統風冷方案陷入瓶頸,液冷憑借其高效的換熱效率成為當前最現實且迫切的選擇。
芯片廠商已經率先行動。英偉達早在2022年就推出了液冷版A100芯片,并在去年的B100、H200芯片上正式升級為液冷散熱。今年英偉達發布的新一代Blackwell Ultra和AMD新發布的MI355X,同樣采用了液冷散熱設計,性能表現更為強勁。百度智能云IDC建設運維部副總經理郝玉濤認為,當機柜功率超過40千瓦時,風冷將徹底失去競爭力,液冷將憑借其能效和密度優勢,成為數據中心高密散熱的主流技術。
然而,液冷技術的應用并非易事。液冷數據中心在架構和原理上與傳統風冷數據中心存在本質差異。傳統風冷有明確的標準,而液冷技術卻缺乏統一的行業標準,不同設備廠商在液冷接口、壓力等級、冷媒類型乃至監控協議上各不相同,這給客戶在設備選擇和系統集成時帶來了困擾。液冷服務器種類繁多,各家廠商在關鍵參數和架構設計上的標準不一,導致設備兼容性差,跨機房遷移業務時管道接口匹配成為一大難題。
張鵬介紹,液冷系統中冷卻液直接進入服務器內部,對液體的純凈度和水質要求非常嚴格。如果施工過程中發生二次污染,水質管理不到位,或運維出現失誤,都可能導致芯片損壞或系統宕機等嚴重后果。液冷系統還需面對系統壓力的挑戰,冷卻液循環流動需要使用泵產生一定壓力來推動,受熱膨脹后系統壓力增加,存在潛在的安全風險。
目前,數據中心液冷技術全產業鏈條的標準正在制定中。曙光數創牽頭編制的國家標準《數據中心冷板式液冷系統技術規范》已正式啟動,旨在引導和規范冷板式液冷數據中心的高質量、標準化發展。截至目前,曙光數創已牽頭或參與編制了多項國家標準、地方標準、行業標準和團體標準。
在大會上,曙光數創首次推出了相變間接液冷數據中心解決方案C7000-F,為智算中心的發展提供了新的思路和方向。該方案采用一體化架構,集成了高效冷板、模塊化分布式換熱單元、智能壓力調控與冷媒循環系統,并基于統一協議接口標準,實現設備層到系統層的端到端聯動。
曙光數創的這套設備可為八臺服務器同時服務,并提供從設計規劃到運維保障的全過程、全方位、全鏈條服務。曙光數創正將液冷從單純的散熱工具,升級為系統級的算力支撐平臺。張鵬表示,在算力時代,計算基于全生命周期的單千瓦冷卻成本變得非常重要。曙光數創的測試顯示,在高密度部署時,只有浸沒式相變冷卻才能有效應對AI算力所需的高熱量。
曙光數創是國內首個推出相變浸沒式液冷數據中心的廠商,PUE值最低可達1.04,接近于1。此次,曙光數創首次將相變間接液冷技術產品化落地,推出C7000-F解決方案。該方案使用特制的浸沒式冷媒在冷板循環管道內工作,通過相變過程吸收大量熱量,實現高效散熱。曙光數創自主研發的冷媒在熱物性參數、安全性、環保和毒理方面均表現良好,即便出現泄漏也不會對GPU芯片產生破壞性影響。
與普通冷板解決方案相比,相變間接液冷數據中心整體解決方案可有效降低冷板換熱熱阻,整體溫度收益下降,但成本漲幅卻能控制在合理范圍內。如果考慮長期運營成本,整體單千瓦冷卻成本反而是下降的,為數據中心的高效運行提供了有力保障。