注:本文根據2018年5月ODCC數據中心光網(wǎng)絡(luò )技術(shù)大會(huì )耿競一(騰訊高級網(wǎng)絡(luò )架構師)演講內容整理。
ICCSZ訊 IPOC(IP Optical Convergence,IP與光融合)是騰訊城域互聯(lián)的重要技術(shù)路線(xiàn),100G非相干彩光方案也是基于此進(jìn)行的設計。
IPOC方案在城域網(wǎng)的應用,首先要明確騰訊在城域互聯(lián)場(chǎng)景的技術(shù)背景和需求,或者可以歸納為對超大規模的分布式數據中心之間的城域互聯(lián)的場(chǎng)景分析。
下圖1是騰訊國內某核心城市的真實(shí)組網(wǎng)圖,8個(gè)IDC集群園區之間的Fullmesh連接,每?jì)蓚€(gè)園區之間都是點(diǎn)到點(diǎn)的光纖互聯(lián),光纖距離小于120公里。
根據目前的流量規劃和帶寬規劃,我們可以看到在未來(lái)的2019年,整個(gè)騰訊骨干網(wǎng)的城域部分帶寬建設量會(huì )達到300T級別,并且這個(gè)數據是以超過(guò)100%的年增長(cháng)率持續增長(cháng)。所以騰訊在光傳輸網(wǎng)絡(luò )領(lǐng)域面臨著(zhù)非常龐大的挑戰,即在如此巨大規模的網(wǎng)絡(luò )下,我們需要構建一個(gè)什么樣的方案來(lái)解決光傳輸的問(wèn)題。
這個(gè)問(wèn)題可以從三個(gè)維度來(lái)分析,即運維、性能和互聯(lián)場(chǎng)景。
IPOC運維需求
目前騰訊在網(wǎng)運營(yíng)的網(wǎng)絡(luò )設備數量已超過(guò)七萬(wàn)臺,服務(wù)器已經(jīng)超過(guò)一百萬(wàn),網(wǎng)絡(luò )運營(yíng)團隊正面臨著(zhù)海量運營(yíng)的挑戰。因此在方案設計和選擇的時(shí)候,運營(yíng)支撐能力的考慮是非常重要的因素之一。
一方面,光傳輸方案做到所有節點(diǎn)部署操作簡(jiǎn)單,以盡量減小建設及運營(yíng)的復雜度。
另一方面,方案需要具備適應不同光纖環(huán)境和大規模靈活拓展能力。傳統的OTN系統多服務(wù)于電信運營(yíng)商,設備形態(tài)和硬件設計包括散熱方式等都是面向傳統運營(yíng)商的機房,這些設備對于分布式數據中心機房而言,需要進(jìn)行電力改造、散熱通道改造、甚至機架的改造等,會(huì )大大延長(cháng)數據中心機房的交付時(shí)間。隨著(zhù)云計算時(shí)代的到來(lái),我們需要光傳輸網(wǎng)絡(luò )具備更好的靈活性和可拓展性。
另外設備的硬件形態(tài)也希望統一。越來(lái)越多的網(wǎng)絡(luò )設備和型號對于運營(yíng)的挑戰是持續增長(cháng)的,所以我們需要在把網(wǎng)絡(luò )變得更加開(kāi)放的同時(shí),讓所有的設備,無(wú)論是IP設備還是光傳輸設備,都具備硬件形態(tài)的統一。
IP+光的統一運營(yíng),其實(shí)是IPOC方案最核心的出發(fā)點(diǎn)之一,也是解決海量運維問(wèn)題的必經(jīng)之路。只有讓運維域更加扁平化,將IP和光融合,才能實(shí)現對光和IP進(jìn)行統一運營(yíng),甚至未來(lái)的統一調度。
IPOC互聯(lián)場(chǎng)景需求
長(cháng)久以來(lái)網(wǎng)絡(luò )為業(yè)務(wù)提供的服務(wù)能力,是城域之內120公里以?xún)?到3毫秒,我們更多的聚焦在當網(wǎng)絡(luò )發(fā)生故障時(shí),如何加快網(wǎng)絡(luò )的收斂速度。但隨著(zhù)云計算時(shí)代的到來(lái),伴隨著(zhù)騰訊云在國內和海外的快速擴張,網(wǎng)絡(luò )中越來(lái)越多的承載了ToB業(yè)務(wù),這些業(yè)務(wù)通常是中小型或初創(chuàng )企業(yè),其在業(yè)務(wù)上通常不會(huì )像大型OTT企業(yè)的主流業(yè)務(wù)一樣具備完整的冗余或負載能力,所以要求基礎網(wǎng)絡(luò )提供更加極致的低時(shí)延環(huán)境。
因此,IPOC方案首先需要低時(shí)延,通過(guò)減少光傳輸系統中的電處理等方式,追求亞毫秒級的時(shí)延節省。
其次是低功耗。交換機直出彩光方案意味著(zhù)交換機可以通過(guò)光模塊或者板卡直接發(fā)出不同波長(cháng)的彩光,隨之帶來(lái)的是光模塊和板卡需要更高的功耗和更強的散熱需求,這些都會(huì )影響交換機的端口密度。所以IPOC方案需要做到低功耗,甚至是接近灰光模塊的功耗,從而保證網(wǎng)絡(luò )設備的整機吞吐量。
IPOC光傳輸方案要覆蓋到城市內跨園區的、點(diǎn)到點(diǎn)的、光纖距離小于120公里的互聯(lián)場(chǎng)景。另外通過(guò)方案的簡(jiǎn)化,可以降低城域帶寬建設成本。
光傳輸的本質(zhì)是光信號在物理介質(zhì)上的傳輸,所以在方案設計和選擇時(shí)光纖距離是重要因素。圖2是騰訊目前城域互聯(lián)光纖距離的一個(gè)統計。
現在已有超過(guò)40%的光纖距離是在60公里之內,國內除了北上廣深四個(gè)超大型城市外,其他大部分城市城域光纖互聯(lián)的距離都可以在60公里之內。
騰訊作為公有云服務(wù)提供商,以為用戶(hù)提供極致網(wǎng)絡(luò )為目標,這意味著(zhù)騰訊的網(wǎng)絡(luò )要盡量的貼近用戶(hù),公有云用戶(hù)大量的集中在北上廣深,所以騰訊需要將IDC集群在這四個(gè)城市落地。而這些城市資源相對緊張,很難部署超大規模的IDC園區,取而代之的是更多的中小型的園區,所以60km以?xún)鹊墓饫w占比未來(lái)會(huì )變得更高,這也是100G QSFP28非相干彩光方案的一個(gè)重要場(chǎng)景。
超過(guò)60公里的光纖范圍內仍然采用傳統的相干方案,一種是100G/200G CFP2 DCO的交換機直出彩光方案,另一種是基于傳統OTN的簡(jiǎn)化,我們稱(chēng)之為Pizzabox OTN。
圖3是基于100G QSFP28 非相干技術(shù)實(shí)現的交換機直出彩光方案示意說(shuō)明。
兩個(gè)交換機通過(guò)QSFP28彩光模塊直接出彩光,中間OLS系統進(jìn)行光放和合分波。我們聚焦于運營(yíng)系統的設計,將整個(gè)系統定義成一個(gè)以太網(wǎng)的設備運維域,并從三個(gè)維度進(jìn)行故障監控和分析。
在交換機上通過(guò)對彩光模塊提供的豐富接口進(jìn)行監控,監控每一個(gè)光模塊或者每一個(gè)波長(cháng)的性能參數;當發(fā)生故障時(shí)聯(lián)動(dòng)OLS系統的告警信息,初步完成問(wèn)題定界,并根據OLS自身的報警信息和故障影響范圍可基本完成故障點(diǎn)的判斷;極端故障場(chǎng)景下,可以在OLS外掛OSA進(jìn)行逐波檢測以確認故障原因。
Tencent Defined IPOC解決方案
IPOC的目標是讓網(wǎng)絡(luò )變得更加開(kāi)放,這意味著(zhù)未來(lái)會(huì )有更多的供應商能夠以白盒或灰盒的方式,幫助騰訊構建網(wǎng)絡(luò ),同時(shí)這也對網(wǎng)絡(luò )運營(yíng)提出了更高的挑戰。
一方面,IPOC包含了光設備和IP設備,所以我們需要所有的IP設備或者光傳輸設備在硬件層面上盡可能保持統一。
另一方面,無(wú)論是IP設備還是光傳輸設備,都需要具備軟硬件解耦能力。這樣讓用戶(hù)可以通過(guò)在商用OS之上的應用開(kāi)發(fā),完成定制化的需求開(kāi)發(fā)和快速迭代。