在本周的開(kāi)放計算項目(OCP)峰會(huì )上,一個(gè)反復出現的話(huà)題是數據中心內部東西向流量的大幅增加。為了應對這種情況,超大規模數據中心運營(yíng)商正在規劃從100 GbE向400 GbE的演進(jìn)。為了在短期內處理東西向流量問(wèn)題,Facebook創(chuàng )建了名為Fabric Aggregator的分布式網(wǎng)絡(luò )系統。
Fabric Aggregator是一個(gè)立足于已有的Facebook的Wedge 100交換機簡(jiǎn)單構建塊和開(kāi)放式交換系統(FBOSS)軟件組成的分布式網(wǎng)絡(luò )系統,以適應社交媒體巨頭的快速增長(cháng)。這種分布式的網(wǎng)絡(luò )系統能夠讓數據中心運營(yíng)商適應更大的區域和不同的流量模式,同時(shí)提供適應未來(lái)增長(cháng)的靈活性。
Facebook軟件工程總監Omar Baldonado表示,Facebook的對外流量與其內部的東西向流量相比顯得相形見(jiàn)絀,該社交巨頭的流量,不管是東西向還是南北向都由網(wǎng)絡(luò )聚合層處理,但是流量增長(cháng)正在對端口密度和每個(gè)節點(diǎn)的容量方面造成壓力。
Facebook的技術(shù)產(chǎn)品經(jīng)理Sree Sankar表示,Facebook的東西向流量大幅增加,至少需要三倍的容量,即使已經(jīng)使用了最大的交換機仍然無(wú)法解決東西向流量的問(wèn)題,迫切需要一個(gè)能夠提供能源效率并具有靈活設計的系統。
為了跟上流量的增長(cháng),Facebook將Fabric Aggregator設計成通用網(wǎng)絡(luò )機箱的替代品。它將多個(gè)Wedge 100S交換機疊加在一起,這與Facebook已經(jīng)使用的交換機相同。然后運行Facebook開(kāi)放式交換系統(FBOSS)。該公司開(kāi)發(fā)了四種背板布線(xiàn)模式來(lái)模擬經(jīng)典背板,所有背板選件的規格已提交給OCP。
Fabric Aggregator在沒(méi)有集中控制器的情況下,在所有子交換機之間運行邊界網(wǎng)關(guān)協(xié)議(BGP)。每個(gè)子交換機獨立運行、發(fā)送和接收流量時(shí)不對節點(diǎn)中的其他子交換機有任何交互或依賴(lài),通過(guò)這種方式,Facebook可以根據需求的變化快速擴張容量,更換構建模塊和電纜組件。
ree Sankar說(shuō):“Fabric Aggregator主要的設計標準是靈活性,在過(guò)去九個(gè)月中,Facebook已經(jīng)在數據中心部署了這一分布式網(wǎng)絡(luò )系統,它重新定義了Facebook處理網(wǎng)絡(luò )容量的方式?!?
Facebook工程師在博客文章中詳細描述了Fabric Aggregator。他們將所有背板選件的規格提交給OCP,繼續他們的共享傳統。Facebook對OCP的網(wǎng)絡(luò )貢獻包括其Wedge交換機和Edge Fabric流量控制系統。
七年前,Facebook率先創(chuàng )建了開(kāi)放計算項目,重點(diǎn)放在開(kāi)放數據中心組件(如機架和服務(wù)器)上。OCP CEO Rocky Bullock表示,OCP目前擁有超過(guò)4000名工程師參與其各種項目和超過(guò)370個(gè)規格和設計包,并吸引了約3000名與會(huì )者參加。