本文轉載微信公眾號“鵝廠(chǎng)往事”,原創(chuàng )作者:李方超
ICC訊 TOOP(Tencent open optical platform),近日TOOP硬件家族又添新的成員,TPC-4開(kāi)放電層產(chǎn)品!其實(shí)它是基于原有OPC-4平臺子框進(jìn)行開(kāi)發(fā)的,通過(guò)設計一款電層板卡T2X4C8來(lái)實(shí)現傳送功能,其特點(diǎn)是采用基于400G CFP2-DCO線(xiàn)路側方案,實(shí)現相干器件分離設計。每塊T2X4C8單板可以支持兩個(gè)400G線(xiàn)路口,8個(gè)100GE客戶(hù)側端口。在2U的機架空間內可以容納4塊業(yè)務(wù)板卡,600W+的功耗能提供3.2Tbit/s的互聯(lián)業(yè)務(wù)容量。每個(gè)線(xiàn)路口使用64 GBaud 16QAM調制,在單個(gè)波長(cháng)上傳輸400Gbps的數據,并且可以在75GHz波道間隔上調諧至64個(gè)波長(cháng)通道,從而在單根光纖上實(shí)現高達25.6Tbps的總傳輸容量。
對于多跨段系統或大損耗跨段,可以采用200G QPSK調制方式來(lái)提升傳送性能實(shí)現復雜跨段場(chǎng)景的應用 。凡支持Tencent CFP2-DCO MSA的DCO模塊均可在T2X4C8上應用,即電層核心器件也是開(kāi)放解耦的!至此我們的TOOP算是實(shí)現了波分系統的全部功能模塊,同時(shí)徹底的將原有波分系統的封閉實(shí)現了全面的開(kāi)放。
TOC(騰訊光網(wǎng)絡(luò )控制器)+ OPC-4(開(kāi)放光層產(chǎn)品)+ TPC-4(開(kāi)放電層產(chǎn)品)將為騰訊今后數據中心互聯(lián)提供強有力的基礎能力支持。但這一切也僅僅是開(kāi)始,后面還有很長(cháng)的路要走,TOOP到底做了個(gè)什么事?為什么要做TOOP?為什么要徹底開(kāi)放?今天我們就來(lái)聊聊,TOOP以及它的未來(lái)。
TOOP誕生的背景
大家看到,隨著(zhù)數據中心業(yè)務(wù)的爆發(fā)式增長(cháng),數據中心互聯(lián)需求已經(jīng)在過(guò)去的若干年里給光傳輸設備帶來(lái)顯著(zhù)而不同以往的特點(diǎn)。不同于傳統電信級光通信設備,數據中心互聯(lián)設備有高帶寬,接口開(kāi)放,簡(jiǎn)化運維,快速部署,網(wǎng)絡(luò )應用模式固定等特點(diǎn)。傳統的波分設備,各商用設備差別較大,在產(chǎn)品應用設計上沒(méi)有統一標準。就像MAC OS和Windows的差異一樣,每一個(gè)廠(chǎng)商有自己的一套邏輯。這樣的差異化導致使用者要付出額外的學(xué)習成本。每多一個(gè)廠(chǎng)商,需要重新的培訓。這就導致傳統波分系統在多廠(chǎng)商、規?;渴饡r(shí)對運營(yíng)成本帶來(lái)了很大的挑戰。
同時(shí),我們注意到在數據中心互聯(lián)場(chǎng)景應用中,如上圖所示,波分系統在數據中心網(wǎng)絡(luò )結構中位于最底層,提供節點(diǎn)間的互聯(lián)。單個(gè)網(wǎng)絡(luò )平面內,IP設備可以是多供應商來(lái)源混合部署,即不同節點(diǎn)的IP設備可以是來(lái)自于不同供應商。波分設備通常每個(gè)平面采用單一供應商進(jìn)行組網(wǎng),波分系統長(cháng)期以來(lái)處于一個(gè)相對封閉的系統。一個(gè)平面全部為單一來(lái)源時(shí),當發(fā)生供應商風(fēng)險時(shí),運營(yíng)團隊將面臨十分棘手的狀態(tài)。TOOP也正是基于這樣的原因而誕生,為降低數據中心互聯(lián)這一類(lèi)用戶(hù)的運營(yíng)復雜度與提高系統健壯性的痛點(diǎn)而生。
那TOOP給我們帶來(lái)了什么?
波分系統是由光層、電層設備組成,到底他們的區別是什么呢?從功能上區分,光層設備是提供不同波長(cháng)的光信號的合并與分離、光信號的監控與管理,以及光信號的放大的作用。簡(jiǎn)單的來(lái)理解就好比是高速公路,光層設備合分波器件就相當于高速公路入口與出口的收費站,將不同車(chē)道的車(chē)匯聚進(jìn)入高速公路,同時(shí)收費站也提供從高速公路駛離的出口。高速公路沿途的電子眼、道路指示牌就類(lèi)似光層設備提供的監控與管理功能,保證每一輛車(chē)都按照規定速度行駛,各司其咎。沿途的加油站就相當于光層設備的光放大器,提供光信號的供功率補償。而波分系統電層設備功能就很專(zhuān)一了,就是負責將客戶(hù)側信號(交換機/路由器的100GE/400GE端口)通過(guò)一系列的信號處理算法調制成可以在光纖中傳送的光信號,例如TOOP的自研電層產(chǎn)品,T2X4C8單板可以提供2路400G
16QAM信號,即可將8個(gè)100GE的交換機端口數據封裝到2個(gè)400G的波分線(xiàn)路側端口中用于傳送。電層設備呢就好比跑在高速公路上的貨車(chē),一輛輛車(chē)傳輸著(zhù)來(lái)自交換機的數據包。
TOOP可以解決什么呢?傳統的波分系統就好比,波分廠(chǎng)商自己修建了自己的高速公路,且這條高速公路只能跑自己廠(chǎng)的貨車(chē),其他廠(chǎng)商的貨車(chē)即使能駛入,也無(wú)法被監控和管理系統所識別,導致維護這條高速公路交通的工作變得十分麻煩,如果車(chē)輛發(fā)生召回事件或者批次問(wèn)題時(shí),面臨很大的系統穩定隱患。TOOP呢改變了這個(gè)游戲規則,我們自己修建了可以支持任意貨車(chē)的高速公路(OPC-4),并且通過(guò)對每輛貨車(chē)簡(jiǎn)單的加裝標準化監控協(xié)議(Tencent Yang module)實(shí)現了多廠(chǎng)商車(chē)輛在我們的道路上安全有序的行駛,在TOC(騰訊光網(wǎng)絡(luò )控制器)的指揮下讓指揮調度人員(NOC運營(yíng)人員)可以快速、安全的無(wú)差異化的監控不同廠(chǎng)商的貨車(chē)并將貨物送抵目的地。這就是TOOP第一階段所解決的問(wèn)題,無(wú)論下面硬件是來(lái)自“方塊、圓圈、三角、菱形”,都可以無(wú)差異化的在統一的TOOP控制器下管理,“軟硬解耦,大道至簡(jiǎn)!”即,傳輸系統在TOOP框架下是一個(gè)開(kāi)放的場(chǎng)景,光層與電層完全分離,需求量與成本最高的電層產(chǎn)品在TOC(控制器)的協(xié)助下通過(guò)打破封閉從而將單一來(lái)源的風(fēng)險解除。同時(shí)TOC配合Tencent Yang的管控模型,將差異化在控制器與設備北向層面完全屏蔽,極大的減少了我們對不同供應商產(chǎn)品的學(xué)習成本。
光電解耦喊了很多年了,為什么還要搞TOOP,搞自研波分硬件?
隨著(zhù)14年~18年移動(dòng)互聯(lián)網(wǎng)的全面發(fā)展,數據中心互聯(lián)帶寬急劇增長(cháng),隨之而來(lái)的網(wǎng)絡(luò )規模也成倍增長(cháng)。因為出于成本與供應鏈安全角度,我們引入了多供應商的策略,但隨之而來(lái)的管控與運營(yíng)成本問(wèn)題愈發(fā)凸顯。同時(shí)波分系統的封閉性,也導致老系統擴容成本居高不下;這些因素導致我們需要更好的解決方案來(lái)應對如此爆發(fā)式的增長(cháng),在傳統方案局限性凸顯的情況下,我們走上了TOOP的道路。
18年的時(shí)候我們啟動(dòng)了TOOP,也定下了一個(gè)愿景,“讓價(jià)值回歸其根本,讓技術(shù)回歸其應有的位置?!蔽覀兊哪繕耸谴蛟煲豢詈糜玫墓饩W(wǎng)絡(luò )產(chǎn)品,我們對此還是很有信心的。因為沒(méi)有人比我們更了解我們的需求,我們是在打造更符合我們需求的軟硬件產(chǎn)品。包括在成本上幫助我們節約CapEx和OpEx即資產(chǎn)采購成本和運營(yíng)成本。我們開(kāi)始給波分設備作減法,因為它太復雜。我們從幾個(gè)角度來(lái)對TOOP硬件產(chǎn)品進(jìn)行設計:
● 刪減不必要功能,例如TPC設計時(shí),我們不做overhead開(kāi)銷(xiāo)處理,降低復雜度,僅通過(guò)MDIO對DCO寄存器對應PM數據進(jìn)行抓取,包括LLDP、PM等全量數據進(jìn)行抓取;
● 增加人性化設計,增加LCD、Button等提示與反饋按鍵,實(shí)現現場(chǎng)操作時(shí)可以與NOC相互確認,避免誤操作;
● 增加精細化運營(yíng)功能,通過(guò)gRPC反饋回臂,實(shí)現1秒telemetry推送,OPC與TPC每秒上報各采集點(diǎn)的性能數據,這些數據將協(xié)助我們做告警事件分析;
● 提升快速交付能力,通過(guò)高器件集成度設計,減少板卡類(lèi)型與架內尾纖的數量,提升交付效率。同時(shí)產(chǎn)品含包裝小于23kg重量符合單人搬運限制規定,連接器與安裝套件精心設計減少部署環(huán)節的時(shí)間成本;
TOOP采用集中化控制的思路,TOC為國王角色,OPC與TPC為臣民的角色。硬件設計就如同傳感器一樣,采集數據回傳給控制器,由控制器進(jìn)行決策。這樣減少硬件OS內開(kāi)發(fā)工作量,降低bug與系統的復雜度。
安全方面我們設計選用了符合電器規范的帶屏蔽蓋的LC法蘭,當光纖拔出時(shí)端口會(huì )立即自動(dòng)閉合,實(shí)現Class 1M的激光安全規范。同時(shí)所有功率會(huì )超過(guò)Class 1M限定的端口均支持APR功能(自動(dòng)功率衰減),對于OA單板的系統口我們也設計了反向ARP功能防止意外發(fā)生。
當然這些描述起來(lái)是很容易,但做起來(lái)是十分復雜和困難的,器件的選擇、功能的取舍都是難點(diǎn),在這過(guò)程中也體現了光器件行業(yè)的痛。以單波速率400G的電層產(chǎn)品來(lái)說(shuō),oDSP的開(kāi)發(fā),IC-TROSA的開(kāi)發(fā)國內少有人做,在深入到ADC/DAC的IP基本上還是來(lái)自于北美。說(shuō)到國產(chǎn)化程度最高的光層器件,高維度WSS也還沒(méi)有成功攻克,甚至一個(gè)LC法蘭也是有專(zhuān)利保護。這些問(wèn)題在與商用系統廠(chǎng)商溝通中或多或少的影響我們定制化需求,這也是我們做自己的硬件的原因。我們理解商用系統廠(chǎng)商面對眾口難調的難處,導致目前的產(chǎn)品面對IDC應用的需求還有一些優(yōu)化的空間。當然TOOP也歡迎各商用系統商一起加入進(jìn)來(lái),希望可以一起推動(dòng)產(chǎn)業(yè)的發(fā)展。
TOOP用互聯(lián)網(wǎng)思維方式設計通信產(chǎn)品
OPC-4是TOOP產(chǎn)品的第一個(gè)硬件產(chǎn)品,這個(gè)是一個(gè)通用的光層平臺產(chǎn)品。我們在設計這款產(chǎn)品時(shí)選用了很多創(chuàng )新產(chǎn)品與一些高品質(zhì)器件,就像我們的愿景一樣,讓價(jià)值回歸其根本,讓技術(shù)回歸其應有的位置。其主要特性如下:
● 體積小巧,便于部署,可以安裝在19英寸、600mm深的機柜內,同時(shí)散熱與安裝方式適合數據中心場(chǎng)景等多種不同場(chǎng)景應用
● 高集成度設計,單個(gè)子框實(shí)現OMSP的部署
● 端口標識具備防錯插/拔設計,減少誤操作造成的業(yè)務(wù)損失
● PANEL設計有狀態(tài)顯示LCD屏幕,顯示當前告警狀態(tài),屏幕依據告警級別進(jìn)行對應顏色顯示,同時(shí)常態(tài)顯示本機管理IP地址,用于定位子框使用
● 設計有反饋按鍵,按鍵操作會(huì )觸發(fā)Notifaction至NOC,TOC上會(huì )顯示該設備被操作,配合PANEL的LCD屏幕,每次現場(chǎng)對設備進(jìn)行操作時(shí)可以通過(guò)反饋確認,并根據屏幕顯示開(kāi)始/停止內容進(jìn)行操作,減少誤操作的可能。同時(shí)按鍵支持查看重要線(xiàn)路狀態(tài)信息,包括OPS工作路由,A/B路接收功率等
● OPC 系統邏輯設計有維護狀態(tài)模式,便于現場(chǎng)人員確認并識別子框信息與狀態(tài),即子框、子卡、電源、風(fēng)扇單元具備提示指示燈,NOC人員可以通過(guò)預設提示狀態(tài)指引現場(chǎng)人員進(jìn)行對應部件的識別確認操作
● 無(wú)源背板設計,減少子框故障的可能,設備主控單元CU支持1+1熱備,CU選用多核高性能處理器,單板與器件內置flight recorder功能,實(shí)現硬件原生支持故障異??伤菰?,器件壽命到期前警告
● 電源單元支持1+1熱備,支持多種電源規格,AC 100~230v / HDC 230v,DC -48V電源系統
● 支持50GHz間隔96波系統 / 75Ghz間隔64波系統 / 以及Flex Grid(50GHz +/- 6.25GHz)的系統
● 高性能 OCM 支持500ms內完成 C 波段掃描,OTDR 支持 36dB 跨段的探測能力
● 高性能 EDFA 覆蓋多場(chǎng)景跨段需要,寬增益調節范圍7~32dB可調節,其中15~30dB為平坦增益范圍 (NF<6.5板卡SIG ?àLINE)
● 1s 級別的 Telemetry 能力,全部 PM 采集點(diǎn)支持 1s 級別的數據推送(包括OCM、各節點(diǎn)端口PD、溫度、風(fēng)扇轉速、增益、平坦度、激光器溫度、偏置電壓電流等全部可讀取節點(diǎn))
● 1GE的OSC交互帶寬,靈活的管理網(wǎng)接入方案及DCN方案,支持OSPF協(xié)議
● 支持基于Netconf協(xié)議的管控方案,以及Tacacs+的認證機制
● 原生支持 Tencent Yang model
● 支持電層板卡混插實(shí)現TPC-4功能
化繁為簡(jiǎn),減少誤操作的可能
OPC-4的一些功能源于現場(chǎng)運營(yíng)的痛點(diǎn),我們在設計時(shí)犧牲前面板寬度增加了一個(gè)PANEL子卡。
PANEL板卡上有LCD屏幕與Button按鍵。PANEL會(huì )顯示當前運行告警,按照告警級別匹配對應顏色。Button作為交互信息按鍵,提供網(wǎng)絡(luò )運營(yíng)中心NOC與現場(chǎng)維護人員的確認/反確認的能力。出于安全考慮IDC可能沒(méi)有做手機信號覆蓋,亦或噪音很大的情況下難以通過(guò)電話(huà)說(shuō)清信息。通過(guò)button,現場(chǎng)運營(yíng)人員點(diǎn)按Button后,NOC會(huì )在TOC上收到事件提示,顯示該設備被人觸碰,從而確認所維護的設備是否正確。NOC也可以下發(fā)簡(jiǎn)單命令信息如“GO,STOP,NEXT STEP,OK”等信息,通知現場(chǎng)人員可以進(jìn)行操作或者停止,來(lái)避免產(chǎn)生誤操作的可能。
真能有人找錯機框?會(huì )有人拔錯板卡嗎?不幸的是,這個(gè)答案是肯定的。其實(shí)我也有過(guò)類(lèi)似的疑問(wèn),經(jīng)歷過(guò)這么巧合的故障后發(fā)現,人是運營(yíng)環(huán)節中的一個(gè)不可靠因素。其實(shí)就如同法航447空難一樣,人在緊張的情況下是不可靠因素,特別是面對復雜的設備很容易發(fā)生誤操作?,F在大多采用雙平面組網(wǎng)方案,平面A故障時(shí),如果誤操作了平面B帶來(lái)的損失將是極大的。如何通過(guò)系統有效規避誤操作是OPC-4設計時(shí)重點(diǎn)考慮的一個(gè)因素。
除了PANEL之外,對于OPC-4上的端口,通過(guò)絲印設計進(jìn)行提示,OPC與TPC產(chǎn)品的絲印遵循色標含義。連接外線(xiàn)光纖的端口為紅色絲印;本子框內互聯(lián)的端口為藍色絲印;不同子框間互聯(lián)的端口為綠色絲印。同時(shí)默認配發(fā)的是單管雙芯跳纖,成倍數的減少光纖布防的數量,精簡(jiǎn)現場(chǎng)操作。相比傳統設備安裝調測可能需要數天,我們曾經(jīng)計時(shí)對比,開(kāi)通1.6T帶寬業(yè)務(wù),從庫房拆箱開(kāi)始計時(shí),1個(gè)人耗時(shí)2個(gè)半小時(shí)完成單個(gè)站點(diǎn)的調試與業(yè)務(wù)開(kāi)通,極大的縮短了業(yè)務(wù)交付的時(shí)間。
將復雜留給設備內部,精簡(jiǎn)留給用產(chǎn)品的人
波分設備長(cháng)久以來(lái)是需要專(zhuān)業(yè)人員運維的,即使波分系統一直是通過(guò)UI界面的網(wǎng)管進(jìn)行操作,但不同廠(chǎng)商的網(wǎng)管也有著(zhù)各樣的設計。從架構方案設計、現場(chǎng)工程交付、后期故障運營(yíng)維護,人性化缺失在各個(gè)環(huán)節??偨Y其原因,還是單一系統承載了太多需求,同時(shí)滿(mǎn)足各家需求時(shí)往往產(chǎn)品會(huì )非常繁冗。因此需要專(zhuān)業(yè)團隊來(lái)維護這樣一個(gè)封閉的,復雜的系統。我們能否化繁為簡(jiǎn)?答案也是肯定的,通過(guò)內繁外簡(jiǎn)的思路,將傳統設備眾多功能的板卡集成在一塊板卡中實(shí)現。精簡(jiǎn)信號流關(guān)系,減少架內連纖數量,我們可以看到,傳統設備一個(gè)光方向可能需要36根光纖,而OPC-4 將這些復雜的功能小型化集成在單一板卡內時(shí),一個(gè)標準OMSP應用也僅僅需要5根雙芯纖實(shí)現。節省下來(lái)的是復雜度,在進(jìn)行故障排查時(shí)會(huì )減少難度,對于工程建設也會(huì )縮減工作量。
OPC系統是如何做到這一點(diǎn)的呢?
以線(xiàn)路放大器單板ILA-SWG為例,一塊單板相當于傳統設備5塊業(yè)務(wù)單板的功能。OPC-4的OA-SWG單板內置2塊高性能OCM、OTDR、OSC、VOA、無(wú)緣濾波器、雙向的PA單元。每一個(gè)器件在傳統設備中都是單獨以板卡形態(tài)存在。以BA/PA為例,我們選用了高功率Switchable gain EDFA,輸出功率高達23dBm,增益范圍支持7~32dB可調節,其中平坦增益段支持15~30dB可調(NF < 6.5),這個(gè)噪聲系數是EDFA單板的噪聲系數,相當于傳統設備的一個(gè)光方向的噪聲系數。
采用可切換分段增益EDFA的好處是,一塊板卡實(shí)現適應眾多跨段,傳統的光層產(chǎn)品,以華為OSN系列為例,光放種類(lèi)高達十余種,即使是較為常用的也有OAU101~OAU107之多。每次進(jìn)行架構設計時(shí)需要根據光纜工勘結果進(jìn)行配置,不同跨段損耗,配置不同增益范圍、輸出功率的OA,對應備件也應配置相應的OA,因此對于系統設計復雜度,維護便利性均帶來(lái)了很大的挑戰。傳統波分系統的各功能均采用獨立單板設計,單板之間通過(guò)架內尾纖進(jìn)行連接,維護人員需要根據圖紙進(jìn)行操作,端口設計密集操作難度大。OPC-4的單光放設計規避了這些問(wèn)題,高集成度,一塊單板解決眾多應用場(chǎng)景,精簡(jiǎn)設備連纖,端口采用色標標記,邏輯清晰方便開(kāi)站應用。采用新器件、新技術(shù)來(lái)解開(kāi)操作的繁瑣的難題。器件與設計繁冗但操作簡(jiǎn)便,是OPC-4的一個(gè)特點(diǎn),我們相信隨著(zhù)網(wǎng)絡(luò )規模增長(cháng)降低運營(yíng)成本將會(huì )更劃算。
對于OPS光保護單板我們也做了全新的設計,并融入了重量級功能——倒換精準計時(shí)。我們在OPS單板的每個(gè)端口均增加了PD,這個(gè)也賦予我們一個(gè)能力,OPS在發(fā)生了主備路由切換時(shí),OPS單板可以精確的計算出切換的時(shí)間,即光切換瞬間丟失信號多次時(shí)間,并通過(guò)切換時(shí)間上報給TOC騰訊光網(wǎng)絡(luò )控制器。結合TPC的同樣的保護倒換瞬態(tài)業(yè)務(wù)丟失計時(shí)功能,我們可以精確的知道,一個(gè)保護倒換在光層上丟失了多少ms,在電層上丟失了多少ms。并借此可以定位故障,比如當OPS顯示0.7ms完成切換,而電層設備的DSP記錄到resync時(shí)間達到了1-2秒,那我們有理由相信,可能OTU單板的入光功率接近靈敏度了,或者線(xiàn)路OSNR余量不足,需要進(jìn)行線(xiàn)路或者系統優(yōu)化。這樣我們可以精準的記錄系統的每一個(gè)細節變動(dòng),這是精細化運營(yíng)的基本要素。每一次網(wǎng)絡(luò )抖動(dòng)我們都希望知道真實(shí)的發(fā)生了什么,波分層、underlay層網(wǎng)絡(luò )、overlay層網(wǎng)絡(luò ),每一層上面業(yè)務(wù)損失了多少時(shí)間。為什么損失我們希望調查明白,這樣當發(fā)生故障時(shí),我們知道整個(gè)系統的SLA是否可以保證,分配給波分系統的50ms是否可以守住,這個(gè)從硬件層面我們做了這些工作來(lái)理解切換的那一瞬間到底發(fā)生了什么。
其實(shí)類(lèi)似的細節設計還有很多,我們重新定義了光網(wǎng)絡(luò )硬件設備的PM信息。OA、ILA、OPS、WSS、T2X4C8電層單板,包括即將發(fā)布的CMUX-64(支持Flex-grid的合分波板卡)均支持全量PM數據的1秒級別的Telemetry。
TOOP硬件層面原生支持1秒及telemetry的性能采集是什么意思?傳統波分設備僅有15分鐘及24小時(shí)性能記錄,這樣的數據經(jīng)常的給我們帶來(lái)故障判斷的困擾。從故障分析、硬件故障預判方面1秒級的telemetry讓TOOP系統大有可為。這個(gè)賦能讓我們頭一次徹底的在微觀(guān)層面,在秒級尺度上進(jìn)行了故障描述。以前我們常遇到光纜抖動(dòng)一下,瞬間業(yè)務(wù)有丟包,但是尋找故障并無(wú)法得知具體原因,因為PM數據無(wú)法給到更精確的信息,這些故障統一的歸類(lèi)給光纜抖動(dòng)因素。但是現在,我們可以在光域、電域內進(jìn)行更微觀(guān)尺度的檢查,精準定位到底是光纜真的發(fā)生了瞬間的抖動(dòng)還是激光器存在異常。
所謂大道至簡(jiǎn),衍化至繁。當前TOOP的成功部署,其實(shí)僅僅是個(gè)開(kāi)始,我們用了2年時(shí)間,日以繼夜的設計、開(kāi)發(fā)、測試實(shí)現了這個(gè)系統由0至1的遷躍,而這也為TOC(騰訊光網(wǎng)絡(luò )控制器)帶來(lái)了無(wú)盡的想象,我們做到了對光網(wǎng)絡(luò )的數字化轉變。TOC這里我們有太多的創(chuàng )新與設計,待后續單獨呈現這部分內容?;诜答伝乇鬯鶐?lái)的海量PM數據,我們現在每周可以抓取到數百G的運行數據,這些數據都是基于我們類(lèi)似傳感器一樣的各個(gè)器件所反饋回來(lái)的性能數據。我們希望能夠通過(guò)機器學(xué)習的方式將這些數據利用起來(lái),我們有燃料,我們需要火箭來(lái)燃燒他們,與我們尋找未知的高度。有相關(guān)愿景的小伙伴們可以聯(lián)系我們哦,歡迎加入我們一起改變世界!
(例如,下圖中的每一個(gè)細點(diǎn)都是那一秒的PMD數據。讓我們試想一下,光纜收到應力作用PMD會(huì )發(fā)生變化,原理是光纜因施工或其他因素產(chǎn)生應力變化,從而產(chǎn)生雙折射。進(jìn)而有沒(méi)有可能我們從DSP的數據中采集到這個(gè)變化,基于這個(gè)數值,我們是否可以推斷出現場(chǎng)有施工?或者兩條光纜是否統一時(shí)刻產(chǎn)生了類(lèi)似的問(wèn)題,是否是同路由?當然從更精確的角度來(lái)看,我們也在推動(dòng)DSP供應商上報SOP等信息,震動(dòng)是否可以帶來(lái)更具有價(jià)值的數據?)
電層核心器件解耦,TOOP徹底擁抱開(kāi)放
在19年OFC上,我們看到業(yè)內在7nm芯片DSP(數字信號處理芯片)上推出了兩款產(chǎn)品,即低功耗版本和高性能版本。其中低功耗版本應用于DCO模塊,主要是為400G-ZR產(chǎn)品設計,應對80km的傳送距離的需求。但是如大家所知,國內的環(huán)境與海外有很大的不同,海外的城市規模較小,數據中心相距較近,光纜損耗相對較小,因此400G-ZR的應用十分適合。而國內城市相對大很多,輕輕松松的在城市內光纜距離超過(guò)100km,同時(shí)光纜損耗較大以及光層保護的加入使得400G-ZR性能不足以滿(mǎn)足場(chǎng)景需求。我們發(fā)現這款低功耗的DSP如果采用高性能的FEC(前向糾錯編碼)配合模塊內置SOA或EDFA實(shí)現高功率輸出時(shí),其性能相比傳統的波分設備并沒(méi)有相差太多,可以輕松的應對城域網(wǎng)的應用環(huán)境,而成本相比400G-ZR并未增加太多,同時(shí)考慮到100GE的應用還有大量需求,因此TPC-4平臺的第一塊業(yè)務(wù)板卡T2X4C8的設計概念就浮現出來(lái)?;谶@個(gè)背景,我們又結合了此前我們已經(jīng)自研的光層設備OPC-4產(chǎn)品,采用相同的平臺子框去支持這塊T2X4C8板卡,減少重復研發(fā)的成本,并加速研發(fā)速度。
不同的光學(xué)前端ITTRA+DSP的組合讓我們有了更多的選擇余地,我們可以更好的挑選相應的組合,也可以更好的把握不同器件的特點(diǎn),比如硅光的低功耗,磷化銦高帶寬性能。從最底層進(jìn)行波分系統的設計從而實(shí)現對需求的準確把控,這也是TOOP所帶來(lái)的價(jià)值。相比傳統的5x7英寸相干模塊來(lái)說(shuō),DCO的方案成本具有一定優(yōu)勢(相同速率情況下),兩者的發(fā)貨量有著(zhù)非常大的差距。雖然5x7模塊的性能更好,短距離應用可以提供更大單波速率,但是在光纜距離較長(cháng),應用OMSP保護的場(chǎng)景下400G DCO可以充分發(fā)揮其價(jià)值。我們輸出了Tencent CFP2-DCO MSA,繼而實(shí)現單一OTU板卡支持多廠(chǎng)商相干模塊的能力,在避免供應商危機、批次故障方面具備了相當靈活的可能性。硬件解耦后最大的收益是控制器開(kāi)發(fā)工作降低,以前每一款新的板卡引入,均需要對其進(jìn)行適配、軟件測試、硬件系統測試等一系列工作。通過(guò)在板卡層面屏蔽硬件差異性,標準的MSA保證電器性能與管理接口可控,極大的釋放了控制器研發(fā)的需求量。對于運營(yíng)也十分便捷,統一軟、硬件架構,像管理客戶(hù)側光模塊一樣簡(jiǎn)單。這就是擁抱開(kāi)放所帶來(lái)的好處,也是TOOP的愿景“讓價(jià)值回歸其根本,讓技術(shù)回歸其應有的位置?!?,讓我們通過(guò)技術(shù)方案的創(chuàng )新來(lái)降低成本,而不是通過(guò)使用廉價(jià)器件,正所謂工欲善其事必先利其器,好的設計與品質(zhì)器件選擇將幫助我們降低故障發(fā)生的可能。
TOOP的未來(lái)
軟硬解耦,大道至簡(jiǎn)之后,便是衍化至繁。這里的繁是繁華的意思,功能多而不雜,產(chǎn)品優(yōu)而簡(jiǎn)潔是我們TOOP設計的目標。TOOP硬件產(chǎn)品有2個(gè)事情近期將實(shí)現,一個(gè)是對于Flex-grid的支持,一個(gè)是20維方向調度能力的支持。以前對波分業(yè)務(wù)開(kāi)通調整,需要現場(chǎng)配合,擴容和故障替換的效率也因此而受到影響,能否做到真的Zero-Touch,資源池儲備后按需投產(chǎn),通過(guò)技術(shù)換來(lái)一種從容感。
另一方面,開(kāi)放解耦后我們面臨一個(gè)問(wèn)題,即OTU是否需要互聯(lián)互通,即FEC的統一。我們知道OIF等一些組織在推動(dòng)FEC的標準化,但我們認為,FEC和其他一些算法的差異性也恰恰是波分系統的精髓,趨同有時(shí)未必是一件好事。同時(shí)巨頭的壟斷可能讓市場(chǎng)喪失創(chuàng )新性,標準成立前和成立后對不同玩家會(huì )帶來(lái)不同的影響。因此騰訊不會(huì )強迫各廠(chǎng)商去支持相同的FEC,可由此而來(lái)的端到端設備同供應商的問(wèn)題我們通過(guò)TOOP產(chǎn)品解決。即Colorless實(shí)現現場(chǎng)電層設備無(wú)規則任意連接,電層設備安裝后,可以隨意的在CMUX-64單板對應的端口上進(jìn)行連接,無(wú)需考慮波長(cháng)的因素,連接好后系統會(huì )自動(dòng)的對齊兩端波分設備,實(shí)現即使沒(méi)有相同FEC,系統也可以自動(dòng)的無(wú)需人員干預的實(shí)現端到端業(yè)務(wù)的創(chuàng )建。
對于更遠的未來(lái),多維度大容量CDC、L-band、800G,我們會(huì )根據需求進(jìn)行開(kāi)發(fā),TOC會(huì )給予整個(gè)網(wǎng)絡(luò )更靈活與更智能的變化,我們相信光網(wǎng)絡(luò )的未來(lái)會(huì )朝向智慧互聯(lián)發(fā)展,期待著(zhù)大家一起來(lái)討論,共同推動(dòng)產(chǎn)業(yè)的發(fā)展。