北京時(shí)間 3 月 19 日 (星期三) GTC AI 大會(huì )在美國加州圣何塞舉行,GTC 大會(huì )是探索 AI 真實(shí)用例及其優(yōu)勢的平臺,NVIDIA CEO 黃仁勛分享NVIDIA的加速計算平臺如何推動(dòng)人工智能、數字孿生、云技術(shù)和可持續計算的下一波浪潮。大會(huì )提到英偉達關(guān)于A(yíng)I工廠(chǎng)的未來(lái)路標,整體架構會(huì )從NVL72液冷升級到NVL576液冷,計算架構從Blackwell升級到Rubin,而在Scale-Up的NVLink互聯(lián)速率將從1800GB/s提升到未來(lái)的3600GB/s,同時(shí)Scale-Out的互聯(lián)方案將從Spectrum5的51T+CX8的800G升級到Spectrum6 102T的CPO液冷+CX9 1600G。
圖1 NVlDlA為千兆瓦級人工智能工廠(chǎng)鋪路
隨著(zhù)整體人工智能工廠(chǎng)能力和功耗的提升,網(wǎng)絡(luò )側互聯(lián)的光模塊功耗也成為重點(diǎn)關(guān)注對象,單個(gè)互聯(lián)光模塊最大功耗30瓦特,只是用作數據的轉發(fā)卻不參與任何計算。在GTC2025發(fā)布會(huì )上,英偉達推出了全新的NVIDIA Photonics硅光子技術(shù)。這項技術(shù)通過(guò)共封裝光學(xué)(CPO)取代傳統的可插拔光學(xué)收發(fā)器,使光纖直接連接到交換機,大幅減少數據中心的功耗。據英偉達測算,該技術(shù)可降低40MW的功耗,并提高AI計算集群的網(wǎng)絡(luò )傳輸效率,為未來(lái)超大規模AI數據中心奠定基礎。
圖2 NVlDlA發(fā)布CPO交換機
作為數字化解決方案領(lǐng)導廠(chǎng)商,紫光股份旗下新華三集團早在2023年便發(fā)布了業(yè)界首款800G硅光交換機S9827-64EO,通過(guò)光電合封CPO、液冷、智能無(wú)損等先進(jìn)技術(shù)的融合,旨在解決AIGC對網(wǎng)絡(luò )高性能、高可靠、低能耗訴求的矛盾,實(shí)現魚(yú)與熊掌兼得。
超高吞吐:
引領(lǐng)數據中心800G超寬時(shí)代
H3CS9827-64EO是全球首款基于51.2T高性能芯片設計的 800G CPO交換機,最大支持64端口800G端口,可擴展為128*400G/200G/100G端口,單POD可支持超過(guò)8000張400G網(wǎng)卡。
圖3 S9827硅光交換機前面板實(shí)物圖
如上圖,S9827-64EO上半部分采用32組MDC光纖接口,客戶(hù)只需要通過(guò)連接不同的光纖,便可實(shí)現64*800G或128*400G的對外連接能力。相對于傳統的MPO/LC連接器,MDC采用了獨有的端面研磨技術(shù),降低了端面連接損耗,在單條鏈路中累計可降低光鏈路損耗約1.6dB,在高速網(wǎng)絡(luò )中可以保障穩定的光信號傳輸能力。且經(jīng)過(guò)測試采用CPO技術(shù)轉發(fā)芯片直接出光相比普通插拔模塊時(shí)延更低,轉發(fā)時(shí)延同比傳統設備降低20%以上。
在S9827-64EO主機的下半部分,采用16個(gè)外置光源集成方案,通過(guò)外部獨立光源模塊提供純凈光信號,將光源耦合到光通路后再耦合至調制器。
液冷技術(shù):
低碳減排,提升使用體驗
在傳統印象中,如果采用了高性能數據中心交換機,伴隨而來(lái)的一定是高功耗對機房供電系統的挑戰,以及散熱風(fēng)扇全速運轉時(shí)喧囂的噪音,對用戶(hù)的使用支出和運維體驗都造成了負面影響。而在800G CPO展示產(chǎn)品上,新華三驗證并實(shí)現液冷技術(shù),解決了以上難題。
圖4液冷數據中心機房示意圖
端網(wǎng)融合零丟包:
助力智算網(wǎng)絡(luò )應用進(jìn)化
雖然高速以太網(wǎng)技術(shù)能夠提供充足的網(wǎng)絡(luò )通道資源,但同時(shí)也意味著(zhù)同樣時(shí)間的網(wǎng)絡(luò )擁塞,其帶來(lái)的丟包數量和影響也將數倍于上一代速率標準。因此,新華三在S9827-64EO上,集成了全面的智能無(wú)損網(wǎng)絡(luò )特性,包括打造端網(wǎng)融合的負載均衡,解決從端側到網(wǎng)側整體流量負載不均難題。
同時(shí)結合AI ECN技術(shù),實(shí)時(shí)監測不同隊列的傳輸時(shí)延、隊列長(cháng)度、緩存變化等,自動(dòng)調整傳輸門(mén)限,實(shí)現端到端無(wú)損網(wǎng)絡(luò )。并且支持端網(wǎng)融合的路徑導航負載均衡技術(shù)實(shí)現整網(wǎng)流量無(wú)擁塞,提升了AI訓練效率。 S9827硅光交換機支持ns級硬件自動(dòng)感知能力,能夠快速識別鏈路切換動(dòng)作極大降低了網(wǎng)絡(luò )故障對業(yè)務(wù)的影響程度,有力支撐智算網(wǎng)絡(luò )集群穩定運行。
圖4 S9827-64EO實(shí)物圖
如今S9827-64EO硅光交換機基于最新的新華三智算網(wǎng)絡(luò )架構進(jìn)一步為用戶(hù)提供高性能的智算網(wǎng)絡(luò )聯(lián)接(如圖4),以其硅光互聯(lián)技術(shù)為支撐,實(shí)現高吞吐量、低時(shí)延、低能耗等多項特點(diǎn),可與業(yè)界主流的400G GPU實(shí)現互聯(lián),單POD最大可支持超2000個(gè)800G端口或8000個(gè)400G端口規模。S9827-64EO將在人工智能等數字化領(lǐng)域繼續發(fā)揮更加重要的作用,助力各行業(yè)客戶(hù)暢享智算新時(shí)代。
2025年,新華三繼續推動(dòng)光互連技術(shù)的創(chuàng )新落地,即將發(fā)布新一代智算網(wǎng)絡(luò )交換機產(chǎn)品,敬請期待。