隨著(zhù)人工智能(AI)技術(shù)的迅猛發(fā)展,對數據處理和傳輸的需求日益增加,網(wǎng)絡(luò )基礎設施也必須隨之升級。Marvell Teralynx 10 作為一款51.2Tbps的交換機,正是為了滿(mǎn)足這些高要求而誕生的。本文將深入探討這款革命性的交換機內部結構和技術(shù)細節,揭示其在未來(lái)AI集群中的重要作用。
2021年,Marvell收購了Innovium,這家公司以其Teralynx 7交換機聞名,后者具備32個(gè)400GbE端口和12.8Tbps的吞吐量。Innovium是當時(shí)最成功的初創(chuàng )公司之一,成功打入了超大規模數據中心市場(chǎng)。
相比之下,英特爾在收購Barefoot Networks后未能達到預期效果,反而在2022年宣布退出以太網(wǎng)交換業(yè)務(wù)。博通在商用交換機芯片市場(chǎng)占據了重要地位,而Innovium/Marvell則在超大規模數據中心取得了顯著(zhù)進(jìn)展。
Part 1 Marvell Teralynx 10 的技術(shù)細節
外部結構
從交換機的正面來(lái)看,Teralynx 10采用了一個(gè)2U機箱,正面布滿(mǎn)了64個(gè)OSFP(Octal Small Form-factor Pluggable)端口,每個(gè)端口支持800Gbps的速率。每個(gè)接口都裝有OSFP光學(xué)器件,這些器件比傳統的QSFP+/QSFP28光學(xué)器件更大,并且配備了集成散熱器,從而提高了散熱效率。
在交換機的右側,可以看到管理和控制臺端口,而在背面則是風(fēng)扇和電源模塊。為了支持這些高功率的光學(xué)器件和交換機芯片,Teralynx 10的電源額定功率超過(guò)2kW。
內部結構
打開(kāi)交換機,我們首先看到的是大型散熱器,覆蓋了Teralynx 10的核心芯片。這款芯片采用了5nm工藝,功耗高達500W。散熱器的設計考慮到了芯片的高熱量輸出,確保在高負載下仍能保持穩定運行。
在散熱器下方是交換機的PCB板,這里布局了32個(gè)OSFP籠子,整個(gè)交換機內部共有64個(gè)OSFP籠子分布在兩個(gè)塊中。Teralynx 10的交換芯片位于OSFP籠子的后方,這個(gè)芯片是整個(gè)系統的核心,負責處理所有的數據傳輸任務(wù)。
交換機還配備了基于Marvell Octeon的管理控制器,并且主配電板上還安裝了一個(gè)M.2 SSD,用于存儲管理數據。為了便于診斷和維護,交換機內部還留有PCIe插槽和10Gbase-T管理端口。
Part 2 冷卻系統和產(chǎn)品迭代展望
Teralynx 10的冷卻系統設計相對簡(jiǎn)單,但高效。機箱后部安裝了四個(gè)風(fēng)扇模塊,這些風(fēng)扇能夠提供足夠的氣流,確保芯片和光學(xué)器件在高負載下也能保持低溫運行。
在Marvell的實(shí)驗室中,Teralynx 10被放置在機架中,并與Keysight Ixia AresONE 800GbE測試設備連接。這些設備能夠模擬800GbE的高負載網(wǎng)絡(luò )流量,驗證交換機在實(shí)際使用中的性能。
在測試中,Teralynx 10表現出色,能夠在多個(gè)端口上同時(shí)處理高帶寬數據流,線(xiàn)路速率達到99.3%。
隨著(zhù)AI技術(shù)的發(fā)展,數據中心對網(wǎng)絡(luò )交換機的性能要求將越來(lái)越高。Marvell Teralynx 10憑借其51.2Tbps的高吞吐量和64個(gè)800GbE端口,完美契合了未來(lái)AI集群的需求。其先進(jìn)的芯片工藝、強大的散熱系統和靈活的管理控制器,確保了在高負載下的穩定性和高效性。
小結
Marvell Teralynx 10不僅是一款技術(shù)先進(jìn)的交換機,更是未來(lái)數據中心和AI集群的核心組件。隨著(zhù)更多新技術(shù)的引入,這款交換機將在未來(lái)幾年內發(fā)揮越來(lái)越重要的作用。