新電子雜誌
2026年07月02號
在資料、AI和複雜運算任務需求爆增的推動下,資料中心正經歷快速轉型與擴張。伺服器機架中硬體密度的不斷提高,使資料中心面臨兩項關鍵挑戰:如何高效供電和散熱。
在現代AI系統中(尤其是專為AI與機器學習打造的系統),大量運算資源被壓縮於愈來愈有限的空間內。更多的電晶體、更密集的GPU叢集和高性能加速器,不僅導致功耗攀升,也使得有限空間內的熱累積問題愈發棘手。
資料中心的瓶頸已從機房面積和供電變成散熱能力。放眼整個產業,從傳統營運業者到超大規模雲端服務商,此一散熱管理轉折點正迫使業界從根本上重新思考系統的設計、管理和最佳化方式。
「散熱牆」困境
密度持續快速提升
傳統機架的運行功率在數十千瓦等級。AI工作負載,例如ChatGPT就需要40kW到60kW的GPU機架功率。新興的超大規模AI工廠專為AI訓練和推理而建造,單機架功率已突破100kW,未來的目標更是直指500kW乃至1MW。
風冷無法有效擴展
空氣是低效的傳熱介質。在高算力密度下,空氣無法迅速帶走熱量,只能提高氣流速度、風扇功率和機架級複雜度,但這種做法無法持續。單機架功率超過約50kW至100kW時,傳統CRAC (Computer Room Air Conditioner )/ CRAH (Computer Room Air Handler) 系統既不可行又不划算。
熱風險不斷放大
散熱不足會導致性能下降、元件壽命縮短和營運成本增加,正成為限制性能、系統可用性及容量的主要因素。每多花一瓦電在散熱,就少一瓦電在算力。
重新思考供電與散熱
隨著處理器功率的增加和晶片密度的提升,系統發熱量超出了傳統風冷系統能夠高效或經濟應對的極限。此一瓶頸促使資料中心採用液冷技術,從根本上重新設計散熱管理,使散熱效率顯著優於傳統風冷系統。如今,散熱技術與供電、機架佈局和氣流設計協同發展。正是這種系統化整合,使超大規模AI資料中心得以突破既有的密度限制。
液冷方案
液體憑藉優異的導熱性能,能夠在熱源處直接帶走熱量。雖然採用液冷會帶來額外的複雜性和成本,但這種轉型已經勢不可擋。超大規模雲端服務商正在建置100%液冷式設施。現有資料中心則採用混合策略:高密度機架採用液冷,其他區域保留風冷。液冷不僅對解決當下熱負荷問題非常重要,更是各種規模的資料中心持續支撐AI工作負載增加的關鍵。
提升供電效率降低熱損耗
營運業者必須在移除熱量與防止熱量產生之間取得平衡。這不僅是一個熱管理問題,更涉及整個供電鏈路。更關鍵的手段是從源頭抑制熱量產生:透過提高電源轉換效率、減少阻性損耗、電壓調節最佳化,減少以熱能形式損耗的能源。如此一來,散熱壓力在成為問題之前,就已經被提前化解。
為未來賦能:800V直流配電
AI大規模叢集機架對傳統電力系統構成嚴峻挑戰:12V、48V和415VAC依賴大量銅線、笨重的電源單元和效率低下的轉換鏈路,這些都會增加發熱量。業界正向800V直流供電架構,目的是降低導體用量、降低阻性損耗並簡化供電鏈路。
ADI為800V直流架構提供了熱插拔控制器、高效DC-DC轉換、電源監控和進階保護功能,確保供電穩定高效。
智慧監控與維運
先進的監控功能可即時追蹤電壓、電流和溫度,進而實現資源精準分配。當散熱泵無需全速運行時,若仍讓其保持滿負荷運轉,將造成不必要的能源浪費。透過高精度計量元件及低雜訊放大器等關鍵元件量測電流分流訊號,是實現高效率供電與散熱管理的重要基礎。
為了確保可靠性,營運業者通常將系統運行功率控制在99.95%左右,而非100%。ADI監控解決方案會即時追蹤這些功率變化,讓營運業者能夠動態調整負載結構,在性能與系統壽命之間取得平衡。
AI的進步,一方面加劇了對電力與高效能資料中心的需求,另一方面也提供了高效管理這些需求所需的智慧。AI扮演著智慧助理的角色,透過處理感測器資料來識別模式、預測故障並自動完成調整,進而提升維運效率。因此,營運業者能夠在當機前偵測到異常情況,並根據即時工作負載動態調整散熱策略, 將被動維護轉變為主動管理。
在機架層面,一系列專用元件使性能提升成為可能:
1. 熱插拔控制器和保護IC:管理熱插拔作業流程,限制衝擊電流,防止尖峰,偵測故障,確保安全運行,這些對800V供電和兆瓦級負載非常重要。
2. 電壓調節和DC-DC轉換:利用高效率穩壓器和多相控制器,將800V直流電壓降至GPU、CPU、記憶體和元件所需的電壓。ADI解決方案可優化轉換效率,將損耗和熱負載盡可能降低。
3. 遙測監控和熱監測:在高密度環境中提供即時可見性和控制,使營運業者能夠發現問題並管理系統熱限制。
4. 電池和電容備用電源系統:能夠監控為IT機架供電的背板電壓。當電力發生波動或中斷時,這些系統會根據需要提供電力或吸收電荷。ADI的電池管理解決方案最初為汽車應用開發,能夠在電源切換期間確保不間斷運行。
這些元件共同支撐起穩定的高壓分配和精準的功率/熱控制,使高密度液冷機架變得實用、安全且易於管理。
智慧資料中心商業效益
1. 液冷技術帶來的效率提升,使整體能源需求降低15%至20%[1]
2. 效率提升,表示電力成本降低
3. 減少15%至21%的碳排放,同時降低了水資源和輔助電力功耗[1]
4. 新的架構和先進技術促進資料中心實現顯著的效能提升
5. 高精度感測和AI驅動的維護有助於減少停機時間並延長設備壽命
6. 智慧控制系統根據需求調配資源, 提升能源利用效率
7. 液冷技術可實現更高的算力密度
企業和組織採用這些方法後,通常能夠降低營運成本、減少故障次數,並穩步推進永續發展目標的實現。隨著整體營運規模的擴大,由此帶來的效益也會放大。
未來的資料中心將是一個精密協同的生態系統,從電源管理、感測技術到光學連接和電池管理,各類先進元件無縫配合。如此系統化整合既能因應當下的挑戰,又能支撐未來的運算需求。無論是改造老舊設施還是規劃新建專案,液冷技術能在各種規模的資料中心發揮關鍵作用,使資料中心繼續作為數位創新的關鍵樞紐。
資料中心的轉型,不僅聚焦於散熱管理與能源效率提升,更著眼於支撐未來持續成長的AI運算需求。
【免責聲明】
本文章內容僅代表作者個人觀點,與馗鼎無關。
內容性、文字闡述和原創性未經本站證實,對本文章及全部或部分內容、真實性、完整性、及時性本站不作任何保證或承諾,僅供讀者參考,請自行核實相關內容。
本文章內容僅代表作者個人觀點,與馗鼎無關。
內容性、文字闡述和原創性未經本站證實,對本文章及全部或部分內容、真實性、完整性、及時性本站不作任何保證或承諾,僅供讀者參考,請自行核實相關內容。
馗鼎奈米科技股份有限公司 Creating Nano Technologies,Inc.
59 Alley 21 Lane 279, Chung Cheng Road, Yung Kang City, Tainan, TAIWAN
TEL:886-6-2323927 FAX:886-6-2013306 URL: http://www.creating-nanotech.com