Iccsz訊 在昨天召開(kāi)的“2017開(kāi)放數據中心峰會(huì )”上,阿里巴巴基礎設施事業(yè)群總經(jīng)理周明表示,阿里巴巴基礎設施團隊,支持了來(lái)自整個(gè)淘寶、天貓為基礎的電商集團,以螞蟻金服、支付寶為核心的金融集團,以及以菜鳥(niǎo)網(wǎng)絡(luò )為核心的物流板塊,遇到了一些壓力和挑戰。
周明說(shuō),阿里巴巴擁有國際化的基礎設施和全球化的網(wǎng)絡(luò ),有巨大的服務(wù)器的保有量以及每年有相當數量新增的服務(wù)器量,如何去運營(yíng),如何提供技術(shù),都是一個(gè)非常大的壓力。他認為,降低成本是最原始的驅動(dòng)力,但其實(shí)不夠,更重要的是如何構建技術(shù)競爭力。
據周明介紹,阿里巴巴通過(guò)三個(gè)方面來(lái)應對這些挑戰。首先是白盒化,除了降低成本,還實(shí)現了很多優(yōu)秀技術(shù)的疊加;其次是架構一體化,實(shí)現了從芯片到硬件,到基礎軟件平臺乃至上層應用的一體化設計;第三是智慧化,不僅僅提供一個(gè)設備、技術(shù)或者軟件,還提供7×24小時(shí)、365天的不中斷的服務(wù),解決Online服務(wù)對基礎設施穩定性的挑戰。
從數據中心的風(fēng)火水電層面來(lái)看,最重要的是降低PUE,提高用電效率,因為能源成本已經(jīng)成為數據中心OPEX的大頭。阿里巴巴從最初的租用數據中心,到后來(lái)的自建,一直在不斷的摸索,比如杭州的數據中心將引入千島湖湖底冷水作為冷源,而在張北建立的數據中心則引入自然風(fēng)冷,阿里巴巴做了非常多細致的工作。
從數據中心服務(wù)器層面來(lái)看,阿里巴巴從最開(kāi)始購買(mǎi)整臺服務(wù)器,到后來(lái)的整機柜,甚至到服務(wù)器的部件、芯片,都逐步在做白盒化工作。從整機定制變成CPU定制,最初規格的定制,到微架構的定制,包括采用越來(lái)越多的智能網(wǎng)卡,網(wǎng)絡(luò )已經(jīng)開(kāi)始從交換機逐步落到服務(wù)器,最后落到網(wǎng)卡。當前,結合AI,比如FPGA、NPU等異構技術(shù),也已經(jīng)進(jìn)入考慮的范疇。
從數據中心網(wǎng)絡(luò )層面來(lái)看,阿里巴巴也在加快自研速度,從最下面的傳輸到模塊自研,到上層交換機,甚至是OS層面的自研;在一些基礎軟件,比如涉及到VPC、虛擬網(wǎng)絡(luò )以及服務(wù)化QoS,包括整個(gè)流量的調度,把每一項技術(shù)深入到每一層來(lái)做白盒化的解決方案。
“事實(shí)證明白盒化是不夠的,白盒化只是解決了工作,我們的目的是架構一體化,實(shí)現競爭能力。比如把PUE降低了夠不夠?不夠!還需要跟服務(wù)器、網(wǎng)絡(luò ),怎么有機的結合起來(lái)。從白盒化到架構一體化,這是非常重要的核心,也是我們技術(shù)競爭力的體現。”周明說(shuō)。
在談到智慧化時(shí),周明指出,白盒化的設備和一體化的技術(shù)架構,要保證7×24小時(shí)的服務(wù),依然會(huì )出現很多問(wèn)題和故障,有了故障之后會(huì )對業(yè)務(wù)造成什么影響,如何快速的發(fā)現故障,定位故障,修復故障,這是非?,F實(shí)的演進(jìn)過(guò)程。規模小的時(shí)候手工搞定就可以,規模大了一定是不行的,只有實(shí)現信息化和自動(dòng)化,才能提高效率,走向未來(lái)的智慧化。