AIGC引爆數據洪流，云服務(wù)商跑步進(jìn)入800G以太網(wǎng)時(shí)代

訊石光通訊網(wǎng) 發(fā)布時(shí)間:2023/5/23 10:08:04 編者:姬云青

摘要：AIGC產(chǎn)業(yè)的爆發(fā)進(jìn)一步帶動(dòng)了800G以太網(wǎng)的需求。通過(guò)引入全新的MAC和PCS，800G以太網(wǎng)找到了當前最經(jīng)濟理想的實(shí)現方案——8通道112G SerDes或PHY技術(shù)。不過(guò)，要把800G SR8方案系統框圖兌現到具體的800G芯片中，依然面臨著(zhù)性能、功耗、面積和信號完整性等多方面的挑戰，幫助大家克服這些挑戰，便是新思科技112G以太網(wǎng)PHY IP和以太網(wǎng)VIP的價(jià)值所在。

數日前，SimilarWeb更新了一份關(guān)于聊天機器人ChatGPT訪(fǎng)問(wèn)數的數據統計。數據顯示，2023年4月ChatGPT訪(fǎng)問(wèn)量再創(chuàng )新高，已經(jīng)超過(guò)了必應、DuckDuckGo等其他國際搜索引擎，也超越了紐約時(shí)報和CNN等知名網(wǎng)站;目前ChatGPT訪(fǎng)問(wèn)數已經(jīng)達到百度搜索引擎的60%，谷歌搜索引擎的2%。

圖1：ChatGPT訪(fǎng)問(wèn)數據統計(圖源：SimilarWeb)

當然，不光是ChatGPT，近一段時(shí)間以來(lái)，全球科技巨頭紛紛發(fā)布自己的大模型。北京時(shí)間5月11日，谷歌宣布推出最新大型語(yǔ)言模型PaLM 2，在部分任務(wù)上已經(jīng)超越GPT-4;在中國市場(chǎng)，百度、360、阿里、華為、京東、騰訊等也都紛紛推出了自己的AI大模型。

訪(fǎng)問(wèn)量陡增的ChatGPT，加上紛至沓來(lái)的AI大模型，AIGC(人工智能生成內容)產(chǎn)業(yè)不僅帶來(lái)檢索效率和工作效率的提升，同時(shí)由于大模型需要大量的數據和算力進(jìn)行訓練和運行，并在使用過(guò)程中產(chǎn)生大量新的數據，因此對底層基礎設備提出了更高的要求。

在數據傳輸方面，光通信行業(yè)市場(chǎng)調研機構Lightcounting曾在2021年時(shí)預測，800G光模塊將從2025年底開(kāi)始主導市場(chǎng)。如今，在GPT等大模型的帶動(dòng)下，這一節奏明顯提前。市場(chǎng)消息顯示，目前已經(jīng)有云服務(wù)廠(chǎng)商開(kāi)始集中測試和采購800G光模塊，相關(guān)需求將在2023年下半年開(kāi)始集中爆發(fā)。

800G 以太網(wǎng)需求提前爆發(fā)

為什么頭部云服務(wù)商如此重視800G 以太網(wǎng)用以數據傳輸呢?

最直接的回答就是：為了應對數據大爆炸。就以AI大模型訓練而言，公開(kāi)數據顯示，從GPT-1到GPT-3，模型的參數量從1.1億個(gè)增長(cháng)到了1750億個(gè)。有傳言稱(chēng)，GPT-4模型的參數達到5000億個(gè)，甚至可能超過(guò)萬(wàn)億規模。根據市場(chǎng)調查機構TrendForce的數據，如果以英偉達A100顯卡的處理能力計算，GPT-3.5大模型需要2萬(wàn)塊GPU來(lái)處理訓練數據。

因此，在算力集群的超算中心里，先進(jìn)芯片和先進(jìn)算力之間并不是劃等號的，算力芯片只是提供了算力，而要高效利用算力還需要依賴(lài)光模塊、存儲等芯片的支持。

如下圖所示，這是中國移動(dòng)在《算力網(wǎng)絡(luò )白皮書(shū)(2021年版)》中分享的一張算力網(wǎng)絡(luò )體系架構。在這個(gè)結構中，中國移動(dòng)將其分為算網(wǎng)底座、算網(wǎng)大腦、算網(wǎng)運營(yíng)三個(gè)部分，其中在算網(wǎng)底座這部分，全光底座是行業(yè)的共識。因此，先進(jìn)算力實(shí)際上是遵循“木桶效應”的，算力、存儲和網(wǎng)絡(luò )傳輸三大核心環(huán)節，一個(gè)出現短板，整個(gè)系統的性能就會(huì )出現巨大的下滑，這便是為什么云服務(wù)商積極部署800G 以太網(wǎng)光模塊的原因。

圖2：先進(jìn)算力網(wǎng)絡(luò )框圖(圖源：中國移動(dòng))

目前，已經(jīng)有多家方案商表示已經(jīng)完成800G光模塊送樣量產(chǎn)。供需大幅度提前讓LightCounting修改了自己在2022年的預測，該機構在今年3月份最新預測中表示，雖然今年整個(gè)以太網(wǎng)光模塊市場(chǎng)將出現10%的下滑，但是800G光模塊市場(chǎng)將在2023年維持高速增長(cháng)。

當然，不光是800G光模塊，在交換機芯片和交換機整機方面，產(chǎn)業(yè)也是快速跟進(jìn)。2022年8月，博通正式發(fā)布自己的Tomahawk 51.2 Tbps交換機芯片;在2022年OCP全球峰會(huì )上，思科發(fā)布了兩款新的800G交換機系列——Nexus 9232E和8111交換機，以及帶有100G和400G接口的800G光模塊。如下圖所示，過(guò)去12年里，交換機的交換能力已經(jīng)從640G發(fā)展到102.4T。

圖3：交換機容量擴張年表

800G 以太網(wǎng)的優(yōu)勢

當前，芯片廠(chǎng)商如博通等，設備廠(chǎng)商如思科等，云服務(wù)商如亞馬遜等，圍繞著(zhù)高性能計算、5G和深度學(xué)習等產(chǎn)業(yè)積極向800G 以太網(wǎng)過(guò)渡。

對于高性能計算和深度學(xué)習訓練等領(lǐng)域而言，800G 以太網(wǎng)具有兩大突出的賦能價(jià)值。其一是在同等算力規模下，800G 以太網(wǎng)能夠帶來(lái)倍增的計算效率。通過(guò)以太網(wǎng)技術(shù)聯(lián)盟發(fā)布的800GBASE-R規范可以看出，800G 以太網(wǎng)是400G的延伸和擴展，最直觀(guān)的改變是帶寬是此前400G以太網(wǎng)的兩倍。如下圖所示，端到端的以太網(wǎng)通信實(shí)際上可以抽象為這種連接，如果交換機全部端口從400G升級到800G，那么交換機傳輸容量將直接翻倍。

圖4：端到端800G 以太網(wǎng)實(shí)施用例

其二是能夠進(jìn)行更大規模的算力集群。我們都知道，算力網(wǎng)絡(luò )最底層的算力底座一般會(huì )分為算力基礎設施和網(wǎng)絡(luò )基礎設施，兩者融合使得目前的數據中心和算力中心呈現出一種類(lèi)似葉脊的架構。結合下圖來(lái)看，這是Facebook構建的樹(shù)形數據中心網(wǎng)絡(luò )架構，名為data center fabric網(wǎng)絡(luò )架構，里面的連接無(wú)處不在。

圖5：4層data center fabric網(wǎng)絡(luò )架構(圖源：Facebook)

從上圖的上方不難看出，data center fabric網(wǎng)絡(luò )架構是一個(gè)四層結構，也被成為“F4結構”。不過(guò)，Facebook在2019年已經(jīng)將其升級為“F16結構”，原因是數據暴漲和設備更新讓“F4結構”已經(jīng)難以適應。

參考下圖來(lái)看，“F16結構”明顯是更大規模的算力集群，連接數量和服務(wù)器數量都更多。預計這個(gè)結構很快也會(huì )更新，因為在2019年Facebook認為400G并不成熟，所以只支持了100G以太網(wǎng)，如今800G已經(jīng)步入商用，這個(gè)集群規模顯然太小了。

圖6：16層data center fabric網(wǎng)絡(luò )架構(圖源：Facebook)

800G 以太網(wǎng)的部署挑戰

在具體實(shí)現的過(guò)程中，800GBASE-R規范并非是簡(jiǎn)單地將兩個(gè)400G拼接在一起，而是引入了新的介質(zhì)訪(fǎng)問(wèn)控制(MAC)和物理編碼子層(PCS)，能夠以最小的成本實(shí)現800G。由于新的PCS包含對之前PCS的重用，因此保留了標準RS(544, 514)前向糾錯，并提供了很好的向后兼容特性。

下圖是800G Pluggable MSA工作組在《800G MSA白皮書(shū)》中給出的示意圖，這是一種能夠快速上市的800G實(shí)現方案，通過(guò)重新調整兩個(gè)400G的PMA，進(jìn)而得到一個(gè)800G的PMA，再定義一個(gè)低成本的800G的PMD，最終實(shí)現基于8通道100Gb/s技術(shù)的800G 以太網(wǎng)。

圖7：800G SR8方案系統框圖(圖源：MSA)

當然，為了繼續向1.6T以太網(wǎng)進(jìn)化，MSA工作組在白皮書(shū)中指出，后續800G會(huì )通過(guò)每通道200G PAM4技術(shù)進(jìn)行優(yōu)化，并且DSP芯片會(huì )采用更先進(jìn)的工藝制程，因此這是一種更加低功耗、低延遲的解決方案。不過(guò)，如MSA工作組所言，這種實(shí)現方式實(shí)際上是為了從800G向1.6T過(guò)渡，是一種未來(lái)式的實(shí)現方式。

圖8：800G FR4方案框圖(圖源：MSA)

雖然系統框圖都已經(jīng)很清晰，不過(guò)要完成800G交換芯片的設計還是會(huì )遇到很多挑戰。

首先，第一個(gè)顯著(zhù)的問(wèn)題是，800G并不是簡(jiǎn)單的兩個(gè)400G疊加，那么MAC、PCS和PMA被集成之后，如何保證整個(gè)系統能夠實(shí)現最佳的性能和延遲。

下圖展示的是一個(gè)800G芯片的設計框圖，對于這款芯片而言，信號完整性、電源完整性等方面的測試只是基礎，重點(diǎn)是如何系統性?xún)?yōu)化beachfront、SerDes、PCS和MAC這些塊分區。如果是在交換機芯片研發(fā)設計的過(guò)程中，又會(huì )分為單裸片方案、雙裸片方案和Chiplet三個(gè)不同的類(lèi)型，需要考慮的因素都不同。比如在Chiplet配置方式里，需要考慮如何更好地進(jìn)行模塊劃分，如何進(jìn)行參考時(shí)鐘布線(xiàn)等。

圖9：具有8通道100G Serdes的800G芯片示例圖

為了保證在各種實(shí)現方式中，整個(gè)芯片的信號一致性和低延遲，就需要一種高效的FEC，用以補償更快傳輸速度下必然伴隨的更高錯誤率。

第二個(gè)挑戰是芯片功耗和面積難題。目前800G芯片采用的是112G SerDes或PHY技術(shù)，進(jìn)而打造成一款并行處理能力強和時(shí)鐘速度快的硬件。雖然采用先進(jìn)制程，不過(guò)為了保證良率，芯片面積不能過(guò)小。然而，在交換機中，器件的集成度只會(huì )越來(lái)越高，因此合適的芯片尺寸是一個(gè)非常值得考究的問(wèn)題;另外，高速芯片必然伴隨功耗問(wèn)題，如果功耗過(guò)高就需要在交換機中加入額外的、昂貴的冷卻系統。

第三個(gè)挑戰也來(lái)自112G SerDes或PHY技術(shù)，那就是如何做到更好的跨信道傳輸。為了讓各個(gè)112G SerDes或PHY之間具有最小的串擾(xtalk)影響，在芯片實(shí)現的過(guò)程中往往會(huì )采用增加封裝層數，以滿(mǎn)足高速SerDes或PHY串擾規格，這必然會(huì )帶來(lái)更高的成本挑戰。同時(shí)，多層封裝也需要考慮南北(N/S)、東西(E/W)方向進(jìn)行封裝出線(xiàn)的問(wèn)題。

因此，如果要打造一款高性能的800G芯片，就需要擁有用于優(yōu)化beachfront、SerDes、PCS和MAC設計的專(zhuān)業(yè)知識，同時(shí)對時(shí)鐘布線(xiàn)、封裝出線(xiàn)和Chiplet等有深刻的認識。如此，才能夠打造出一顆完美的800G芯片。

新思科技 800G 以太網(wǎng)方案

看到了挑戰和要求，可能對一些想要從事800G 以太網(wǎng)芯片研究的人進(jìn)行了勸退。為了幫助大家應對這些挑戰，新思科技提供了業(yè)界唯一完整的200G/400G/800G 以太網(wǎng)IP解決方案。

作為全球以太網(wǎng)IP開(kāi)發(fā)的領(lǐng)航者，新思科技能夠為業(yè)界提供經(jīng)過(guò)硅驗證的800G 以太網(wǎng)IP方案。我們上面提到，800G是基于112G SerDes或PHY技術(shù)進(jìn)行實(shí)現。新思科技112G以太網(wǎng)PHY IP解決方案可實(shí)現真正的長(cháng)距離、中距離、極短距離和超短距離(LR、MR、VSR、XSR)接口，以及CEI-112G-Linear和CEI-112G-XSR+光接口，是支持實(shí)現800G光模塊和800G交換機的理想方案。

早在2021年1月，新思科技就已經(jīng)推出經(jīng)過(guò)硅驗證的采用5納米FinFET工藝的112G以太網(wǎng)PHY IP，提供超出IEEE 802.3ck和OIF標準電氣規范的卓越信號完整性和電氣性能。研發(fā)人員借助這款PHY IP能實(shí)現高集成度的800G 以太網(wǎng)芯片，擁有顯著(zhù)的性能、面積和功耗優(yōu)勢。這款I(lǐng)P主要用于長(cháng)距離和中距離接口，能夠在大于45dB的信道中以低于5pJ/bit實(shí)現出色的BER(誤碼率)。

另外，用于極短距離接口的新思科技112G以太網(wǎng)PHY可以在大于20dB的信道中以低于3pJ/bit的速度實(shí)現出色的BER;用于超短距離接口的新思科技112G以太網(wǎng)PHY可以在大于10dB的信道中以低于1.4pJ/bit實(shí)現出色的BER。

這些PHY IP全部都支持在芯片的四個(gè)邊緣進(jìn)行布局和堆疊，最大限度地提高每個(gè)芯片邊緣的帶寬。它們都支持脈沖幅度調制4級(PAM-4)、不歸零(NRZ)信號和獨立的每通道數據速率，并以極高的靈活性支持PCI Express®、DDR、HBM、Die-to-Die、CXL和CCIX等廣泛的連接協(xié)議。

為了使研發(fā)人員能夠加速基于以太網(wǎng)設計的驗證收斂，新思科技還推出了用于以太網(wǎng)的VC VIP，提供一套全面的協(xié)議、方法、驗證和生產(chǎn)力功能。

圖10：新思科技以太網(wǎng)VIP

通過(guò)這些IP和VIP，再結合新思科技在路由可行性研究、封裝基板指南、信號和電源完整性模型以及串擾分析等方面的全面經(jīng)驗，研發(fā)人員可實(shí)現高速可靠的800G芯片開(kāi)發(fā)。

當然，在此還需要額外提到，新思科技112G以太網(wǎng)PHY是該公司廣泛的IP產(chǎn)品組合中的一部分，新思IP產(chǎn)品組合包括邏輯庫、嵌入式存儲器、嵌入式測試、模擬IP、有線(xiàn)和無(wú)線(xiàn)接口IP、安全IP、嵌入式處理器和子系統，對高性能HPC應用進(jìn)行全方位的賦能。

結語(yǔ)

AIGC產(chǎn)業(yè)的爆發(fā)進(jìn)一步帶動(dòng)了800G 以太網(wǎng)的需求。通過(guò)引入全新的MAC和PCS，800G 以太網(wǎng)找到了當前最經(jīng)濟理想的實(shí)現方案——8通道112G SerDes或PHY技術(shù)。不過(guò)，要把800G SR8方案系統框圖兌現到具體的800G芯片中，依然面臨著(zhù)性能、功耗、面積和信號完整性等多方面的挑戰，幫助大家克服這些挑戰，便是新思科技112G以太網(wǎng)PHY IP和以太網(wǎng)VIP的價(jià)值所在。

內容來(lái)自：TechSugar
本文地址：http://joq5k4q.cn//Site/CN/News/2023/05/23/20230523022422240999.htm 轉載請保留文章出處
關(guān)鍵字: 800G 新思科技以太網(wǎng)
文章標題:AIGC引爆數據洪流，云服務(wù)商跑步進(jìn)入800G以太網(wǎng)時(shí)代

【加入收藏夾】【推薦給好友】

1、凡本網(wǎng)注明“來(lái)源：訊石光通訊網(wǎng)”及標有原創(chuàng )的所有作品，版權均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉載、摘編及鏡像，違者必究。對于經(jīng)過(guò)授權可以轉載我方內容的單位，也必須保持轉載文章、圖像、音視頻的完整性，并完整標注作者信息和本站來(lái)源。
2、免責聲明，凡本網(wǎng)注明“來(lái)源：XXX（非訊石光通訊網(wǎng)）”的作品，均為轉載自其它媒體，轉載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責。因可能存在第三方轉載無(wú)法確定原網(wǎng)地址，若作品內容、版權爭議和其它問(wèn)題，請聯(lián)系本網(wǎng)，將第一時(shí)間刪除。
聯(lián)系方式：訊石光通訊網(wǎng)新聞中心　電話(huà)：0755-82960080-168 Right

AIGC引爆數據洪流，云服務(wù)商跑步進(jìn)入800G以太網(wǎng)時(shí)代

相關(guān)新聞

AIGC引爆數據洪流，云服務(wù)商跑步進(jìn)入800G以太網(wǎng)時(shí)代