ICC訊 東數西算的提出,不僅是為了建立一個(gè)一體化的數據體系,也是一個(gè)綠色節能,促進(jìn)碳達峰、碳中和等目標實(shí)現的手段。畢竟在西部地區可以充分發(fā)揮可再生能源和環(huán)境上的優(yōu)勢,同時(shí)減少人口密度高地區的用電緊張。
但東數西算,以及類(lèi)似的東數西訓、東云西庫等概念和政策,都只是針對一些對時(shí)延并不敏感的應用來(lái)說(shuō)的。然而對于一些要求低時(shí)延、大存儲容量和大算力的實(shí)時(shí)應用來(lái)說(shuō),比如自動(dòng)駕駛、工業(yè)物聯(lián)網(wǎng)、邊緣計算等,仍然需要本地數據中心的支持。但在各大城市紛紛對數據中心的規模加以限制下,如何讓中小型數據中心降本增效就成了關(guān)鍵問(wèn)題。
數據中心是如何成為耗電大戶(hù)的?
雖然不同的統計口徑給出的數據多有不同,但在中國國內,數據中心用電量大概在全社會(huì )耗電總量的1.5%到3%左右,可以說(shuō)是名副其實(shí)的“國家電網(wǎng)戰略合作伙伴”了。隨著(zhù)現在各行各業(yè)對于流量和算力的需求繼續上漲,未來(lái)這個(gè)占比必然會(huì )持續走高。
那么究竟是什么讓數據中心有著(zhù)如此龐大的耗電量呢?原因有不少,其中之一是存在于各大數據中心的“僵尸”服務(wù)器。利用率是每個(gè)數據中心都不得不面臨的問(wèn)題,由于數據中心本身追求大容量,尤其是對于云服務(wù)廠(chǎng)商的數據中心來(lái)說(shuō),有不少服務(wù)器都是處于“閑置”狀態(tài)的。
再加上如今數據中心的架構已經(jīng)實(shí)現了解耦,利用率最高的反倒是網(wǎng)絡(luò )設備,其次是存儲設備,利用率最低的反倒是處理器。這些“僵尸”服務(wù)器的存在并不會(huì )對其數據中心的運營(yíng)造成任何不利影響,但它們在閑置的情況下仍會(huì )占用電源、空間和散熱資源。
雖說(shuō)現在通過(guò)虛擬化等手段已經(jīng)提高了服務(wù)器的利用率,但仍有比較大的提升空間。要知道,從2017年到2022年,國內和地方政策中對大型數據中心的PUE要求就從1.5提升至了1.25,有不少新建的數據中心甚至做到了1.1的PUE。所以未來(lái)盡管耗電大戶(hù)的身份雖然還是不會(huì )變,但數據中心必須想盡辦法去提升能效比。
數據中心降本增效的解決思路
其實(shí)數據中心要想在實(shí)現節能的同時(shí),保持性能和容量的增長(cháng),方法也相當直接,那就是升級。升級新的冷卻系統、變壓設備、處理器芯片等,比如取締或改造升級老數據中心,給IT設備、供電系統、冷卻系統都進(jìn)行徹頭徹尾的升級。
就拿處理器芯片的升級來(lái)說(shuō),雖說(shuō)數據中心硬件換代的周期并不算短,但要想滿(mǎn)足日益增長(cháng)的算力需求,就不得不用上最新的CPU、GPU和一眾AI加速器??蔀榱讼胱非髽O致的能效比,不少數據中心都開(kāi)始選擇基于A(yíng)rm架構的服務(wù)器,而不再是傳統的x86服務(wù)器,隨著(zhù)Arm在服務(wù)器軟件生態(tài)上慢慢成熟,這一趨勢會(huì )變得愈發(fā)明顯。
另一種方式就是用上更高效的服務(wù)器電源,隨著(zhù)第三代半導體材料的出現,消費級電源產(chǎn)品的效率已經(jīng)提升了上來(lái),而服務(wù)器電源也能享受這一優(yōu)勢。尤其是基于碳化硅的服務(wù)器電源,在應對高壓和大功率的場(chǎng)景上,也能輕松達到鈦金級別的效率。
冷卻系統同樣有著(zhù)極大的降本增效空間,也更加適合“因地制宜”。目前不少數據中心都在選用液冷的方式散熱,因為這種方式散熱效率高,可以減少傳統風(fēng)冷帶來(lái)的電力消耗。以中科曙光的全浸式液冷服務(wù)器為例,就可以講PUE值做到趨近于1.0的理論極限。但也有的數據中心為了進(jìn)一步節省水資源,也想出了新的空氣冷卻系統。
AWS自然空氣冷卻系統 / 亞馬遜
比如亞馬遜的AWS數據中心就主要以蒸發(fā)冷卻為主,在炎熱的天氣下,熱空氣經(jīng)過(guò)過(guò)濾器和消耗少量水資源的潤濕冷卻墊,蒸發(fā)產(chǎn)生涼爽的空氣來(lái)散熱。而亞馬遜在愛(ài)爾蘭和瑞典的AWS數據中心,則是靠的自然空氣的過(guò)濾冷卻,因為氣溫較低的原因,它們一年之中有95%都不是靠水來(lái)冷卻服務(wù)器的。
小結
我們通常將數據中心看做是“算力工廠(chǎng)”,但正如工廠(chǎng)的污染排放監測一樣,數據中心的能效也需要持續關(guān)注。在各種政策規定下,雖然不少數據中心在建成之際就已經(jīng)滿(mǎn)足了PUE目標,但對于從不停轉的數據中心來(lái)說(shuō),在降本增效的同時(shí),也需要持續公開(kāi)這些數據,確保不會(huì )因為設備老化、負載增加等原因偏離原本的PUE。