ICC訊 我們對帶寬無(wú)盡的欲望驅使這個(gè)行業(yè)發(fā)展得更快,不斷地讓網(wǎng)絡(luò )擺脫延遲的影響
我記得在2010年,IEEE批準了40Gb和100Gb的數據,當時(shí)我就想,我們根本沒(méi)有必要使用這么高的速度。以今天的標準來(lái)看,那時(shí)的寬帶簡(jiǎn)直就是可憐——就像試圖用吸管來(lái)吹一個(gè)巨大的氣球一樣——但在當時(shí)已經(jīng)夠用了,因為當時(shí)我的帶寬消耗量遠不及我今天生活所需的帶寬需求。但當我的孩子們開(kāi)始使用他們的手機、平板電腦和在線(xiàn)游戲平臺時(shí),我可憐的小銅線(xiàn)連接就開(kāi)始抱怨別人對它的要求了。謝天謝地,現在光纖傳輸速度超過(guò)了過(guò)去的30倍,雖然家里的設備越來(lái)越多,但是我總是可以做的更多,很多,很多!
讓我給大家介紹一下技術(shù)路線(xiàn)圖的背景,讓大家了解一下我們今天的情況。直到2010年,生活都很簡(jiǎn)單。我們在光纖網(wǎng)絡(luò )上運行10Gb,使用1芯光纖發(fā)射和1芯光纖接收。無(wú)論什么樣的終端設備,還是部署了哪個(gè)收發(fā)器,都不重要,因為它們的操作都是一樣的。然后IEEE批準了40Gb,使用了一個(gè)不同的PMD(Physical Media Dependent)接口與并行光學(xué)方案。
并行光學(xué)
與串行(雙工)傳輸不同,并行光學(xué)使用8芯或更多的光纖,而不是傳統的2芯光纖。我們在4芯光纖上發(fā)射信號,每芯光纖10Gb,在另外4芯光纖上接收,每芯光纖10Gb,以達到我們的40Gb聚合速度(稱(chēng)為40G-SR4)。由于2010年速率最快的交換機ASIC(application-specific integrated circuits)是10Gb,要達到100Gb(即100GBASE- SR10)且同時(shí)得到批準,我們需要20芯光纖,每10芯傳輸10Gb,另外10芯接收10Gb。值得慶幸的是,在2015年IEEE批準了100G-SR4通過(guò)4芯光纖傳輸25Gb,并通過(guò)另外4芯光纖接收25Gb,使用了與40GBASE-SR4相同的8芯光纖平臺,從而達到了我們的100Gb總速。隨后我們向200G邁進(jìn),最終實(shí)現了400G,且光纖數量和通道的一致性仍在繼續。
因此,現在這個(gè)永不間斷的行業(yè),讓網(wǎng)絡(luò )管理者和用戶(hù)需要作出選擇:隨著(zhù)越來(lái)越多的技術(shù)和解決方案選項的出現,需要針對部署什么樣的基礎架構解決方案做出關(guān)鍵決策,以確保無(wú)縫地遷移到更高的速度?,F在,我來(lái)幫您把它們分解一下。
BiDi
在IEEE批準40&100Gb的三年后,2013年底,思科推出了40G BiDi,該技術(shù)由Avago Technologies開(kāi)發(fā),現在是富士康互聯(lián)技術(shù)公司(FOIT的一個(gè)業(yè)務(wù)部門(mén))的一部分。這項開(kāi)創(chuàng )性技術(shù)是為了使現有的兩芯多模光纖能夠在數據中心設施中使用WDM(波分復用)技術(shù)。為了實(shí)現40Gb傳輸,兩個(gè)20Gb信號在同一條多模光纖上,但波長(cháng)不同,在850nm和910nm處“雙向”發(fā)射和接收20G信號,因此得名BiDi。我們在2018年看到了100G BiDi的發(fā)布。
UNIV
在BiDi發(fā)布后不久,Arista和Juniper推出了他們的40Gb通用收發(fā)器(UNIV),使用另一種WDM技術(shù)在一對光纖上運行。這一次,它在傳統的單模1310nm區域單向發(fā)射了4 x 10Gb,中心波長(cháng)為1271、1291、1311和1331nm,但仍然可以通過(guò)一對多模光纖或單模光纖傳播(因此有了UNIV這個(gè)名字)。
SWDM4
我們的第三個(gè)WDM方案是SWDM4。使用與UNIV相似的4波長(cháng)方法,關(guān)鍵區別在于它們在更傳統的多模光纖的 850nm區域發(fā)射,中心波長(cháng)為850、880、910和940nm,可選擇40Gb和100Gb。
200Gb也有WDM選項,但關(guān)鍵是與并行光學(xué)不同,并行光學(xué)是一個(gè)被IEEE標準完全認可的標準。這些仍是專(zhuān)有技術(shù),或者作為MSA(Multi-Source Agreement)的一部分,不能彼此互聯(lián),也不能與任何標準許可的收發(fā)器相互兼容。BiDi必須連接到另一個(gè)BiDi,UNIV必須連接到UNIV,以此類(lèi)推。這有可能?chē)乐叵拗凭W(wǎng)絡(luò )管理者在尋求下一個(gè)速率遷移時(shí)可用的選項,通?!肮替i定”在某一個(gè)制造商,并限制我前面提到的那些關(guān)鍵基礎設施選擇。
有清晰的記錄表明,使用低成本組件的并行光學(xué)器件總是首先投放市場(chǎng),3-5年后才會(huì )有WDM同類(lèi)產(chǎn)品隨之上市。如果您決定采用WDM的雙光纖網(wǎng)絡(luò )策略,而您的企業(yè)和客戶(hù)恰好需要技術(shù)升級,如果WDM產(chǎn)品還沒(méi)上市,您還有什么選擇?
要么暫停直到其發(fā)布上市,但這會(huì )影響公司的收入和聲譽(yù);要么升級網(wǎng)絡(luò )以支持并行光纖部署。但是,如果您現在已經(jīng)有了并行光纖網(wǎng)絡(luò )(即使您仍在遵循WDM路徑),您可以選擇在同一個(gè)布線(xiàn)設備中使用這兩種技術(shù),而無(wú)需進(jìn)行任何計劃外升級。
調制技術(shù)
傳統的NRZ調制(不歸零)使用0和1兩個(gè)值。把它想象成一個(gè)燈泡是發(fā)射器,而你的眼睛是接收器。你只需要開(kāi)燈或關(guān)燈作為信號,但如果你的眼睛和我的一樣糟糕,那么隨著(zhù)速度的提高,識別或接收信號會(huì )變得困難重重。為了滿(mǎn)足100G的傳輸速率,PAM4(Pulse Amplitude Modulation)被開(kāi)發(fā)出來(lái),它使NRZ的速率加倍并簡(jiǎn)化, 使用4個(gè)離散值00、01、10和11將燈調亮、打開(kāi)到最亮、調暗和關(guān)燈。PAM4用于某些(但不是全部)100G選項。然而,這將成為400G的標準。值得注意的是,隨著(zhù)速度的提高,我們可能會(huì )看到其他調制技術(shù)的引入。
現在為了使這篇文章不像暢銷(xiāo)小說(shuō)那樣長(cháng),我只提到了以太網(wǎng)和不同的多模選項。請注意,單模并不意味著(zhù)更容易。在40G問(wèn)世之前,單模一直是2芯光纖,就像我們傳統的多模。和多模一樣,我們開(kāi)始看到了40G甚至更高速率的單模的并行光收發(fā)器選項的出現,這是因為用戶(hù)需要更長(cháng)的傳輸距離,但仍然想要利用端口突破能力——因此就采用了更大的速率端口并將其分為4個(gè)較小的速率端口,以獲得更低的總體成本。與傳統單模10km的距離相比,500m PSM4的距離更短,因此成本更低。
當前的行業(yè)趨勢是,一旦產(chǎn)量開(kāi)始穩定,部署高速并行光學(xué)并將其拆分出每個(gè)端口的成本與使用原生速度光學(xué)器件(例如,1個(gè) 100G分為4個(gè) 25G而不是4個(gè) 原生 25G)相比會(huì )變得更低,且速率越高,因此成本效益就越高。此外,端口分支實(shí)現了更高的密度,同時(shí)降低了電力和冷卻的能源成本。
400G——我們的今天
正如我前面提到的,我們對帶寬無(wú)限的欲望驅動(dòng)了這個(gè)行業(yè)實(shí)現了更快的速度、更短的延遲。人工智能(AI)和機器學(xué)習(ML)、無(wú)服務(wù)器計算、分布式閃存和更快的服務(wù)器CPU/GPU/FPGA的激增都是驅動(dòng)400G發(fā)展的因素。例如,Broadcom的Tomahawk III ASIC支持12.8Tb/s或128x100g光信號,并且還在對25.6Tb/s (256x100g)、51.2Tb/s (512 x 100G)和102.4Tb/s (256x400g)進(jìn)行開(kāi)發(fā)。
將越來(lái)越多的吞吐量壓縮到同一個(gè)內存中,提供了比以往更快地處理數據的機會(huì ),滿(mǎn)足了我們指尖對速度的需求。但這并非沒(méi)有挑戰,您將在下面的表格中看到,我們提供了幾種不同的選項來(lái)支持距離、通道和光纖類(lèi)型。
以下是IEEE標準發(fā)布或仍在開(kāi)發(fā)的所有400G光學(xué)PMD(Physical Media Dependent)列表:
400G光學(xué)
除此之外,2016年還形成了兩個(gè)MSA標準,考慮了400G收發(fā)器的物理尺寸和形狀,由8個(gè)通道連接。MSA為了研究連接形式而考慮了收發(fā)器的物理尺寸和形狀,以及收發(fā)器的封裝形式。它們是QSFP-DD(Quad Small Form-Factor Pluggable – Double Density)和OSFP(Octal Small Form-Factor Pluggable)??祵幨沁@兩個(gè)MSA標準成員。
QSFP-DD - http://www.qsfp-dd.com/
QSFP-DD使用與QSFP28相同的外形物理尺寸,因此在使用相同的板卡時(shí)可以完全兼容。在光纖接口方面,最新規范(2019年7月5.0版)列出了以下選項:
公頭MPO
雙工 LC
雙 CS
MDC*
SN*
*MDC和SN是新一代極小型連接器,于2019年初推出,將在另一篇文章中進(jìn)行介紹。這些都是由超大規模運營(yíng)商驅動(dòng)的,他們希望在收發(fā)器上直接把400G分支為4x100G的光路。
OSFP - https://osfpmsa.org/.
OSFP的外形設計考慮了更高的速度(QSFP-DD和OSFP都可以處理800G的散熱),因此其占用空間比QSFP-DD稍大一些。這主要是因為在收發(fā)器頂部有一組額外的散熱片,用來(lái)發(fā)散由于更高的功率要求而產(chǎn)生的更多的熱量(請注意,QSFP-DD已增加了散熱片的設計以來(lái)散發(fā)更多熱量)。溫度的升高對于QSFP-DD和OSFP來(lái)說(shuō)是一樣的,典型的要求是8-15W之間的多模模式。為了實(shí)現兼容QSFP28,您需要使用適配器。
2019年1月OSFP規范列出了:
公頭 MPO
雙工 LC
雙 CS
細心的人可能已經(jīng)注意到PMD與MSA中列出的選項不一致,完全正確。事實(shí)上,雖然MSA中列出了不同的光纖接口,目前只有針對CS、MDC或SN接口的收發(fā)器,對于多模 LC尚無(wú)確定的解決方案,只有500m、2km和10km的單模。
“那么,我們什么時(shí)候能看到400G收發(fā)器普遍上市呢?”我聽(tīng)到你們的需求了!我們在2019年初看到了Arista和Cisco的聲明,預計產(chǎn)品將在2020年交付。Arista已經(jīng)宣布了QSFP-DD和OSFP的選項,Cisco僅針對QSFP-DD。
結論
對于閱讀本文的許多人來(lái)說(shuō),飛向無(wú)限,更確切地說(shuō)是400G,似乎是一個(gè)相當遙遠的距離。然而,我們都逐漸意識到,在IT行業(yè),我們永遠不會(huì )停止追求極限,我們都必須接受這樣一個(gè)事實(shí):我們今天所熱愛(ài)的將很快成為昨天的記憶。
在過(guò)去的9年里,我們經(jīng)歷了比前30年更多的網(wǎng)絡(luò )速度提升(接下來(lái)還會(huì )有更多)。有了這么多選擇,用最靈活和可擴展的光纖基礎設施規劃正確的技術(shù)遷移路徑,應該是您的首要任務(wù)。如果您不這樣做,您可能會(huì )發(fā)現自己不得不繼續投資額外的光纖布線(xiàn),因為支持下一次技術(shù)更新的光學(xué)器件還沒(méi)有開(kāi)發(fā)出來(lái)。
您可不能打盹放松,引用《玩具總動(dòng)員》里的玩具們講的一句話(huà):“我們無(wú)處不在!”
作者:康寧光通信全球數據中心的市場(chǎng)開(kāi)發(fā)經(jīng)理 Anthony Robinson