ICC訊 隨著(zhù)人工智能應用的快速發(fā)展,AI智算網(wǎng)絡(luò )正在經(jīng)歷著(zhù)加速向超大規模集群演進(jìn)的過(guò)程。由于大規模并行計算的廣泛采用,為了確保AI智算網(wǎng)絡(luò )的運行效率與經(jīng)濟性,AI智算網(wǎng)絡(luò )對光互聯(lián)的可靠性和可用性均提出了新的挑戰。
大量的實(shí)驗及現網(wǎng)數據表明,光纖鏈路臟污是導致AI智算網(wǎng)絡(luò )的故障的一個(gè)重要因素,其引起的丟包會(huì )大幅降低AI智算中心集群的可用度;同時(shí),隨著(zhù)網(wǎng)絡(luò )聯(lián)接規模的指數級加大,涉及的光聯(lián)接節點(diǎn)數也呈指數級倍增,光聯(lián)接的虛接問(wèn)題已經(jīng)成為影響AI智算網(wǎng)絡(luò )開(kāi)局及日常運維效率的另一個(gè)重要因素。
“星云“400G/800G光模塊依托海思在光/電芯片、軟/硬協(xié)同等方面的技術(shù)整合優(yōu)勢,實(shí)現了領(lǐng)先的臟污定位檢測與診斷算法,支持主動(dòng)在線(xiàn)光路診斷監測預警和故障定界。該產(chǎn)品具備三大技術(shù)優(yōu)勢:
● 極簡(jiǎn)維護:無(wú)需外在儀表,無(wú)需現場(chǎng)上站檢測,可遠程監測,大幅減少網(wǎng)絡(luò )的開(kāi)局和日常維護投入,顯著(zhù)提升運維效率
● 極高可靠:通過(guò)持續在線(xiàn)連續跟蹤,提前預警鏈路風(fēng)險 (臟污、斷纖等),制定技術(shù)排障計劃,提升網(wǎng)絡(luò )可靠性的同時(shí)支撐大模型等AI應用的高效運行
● 極致成本:“星云”光模塊原生支持相關(guān)特性,無(wú)需外在硬件、傳統儀表等額外支出,打造極致成本的建網(wǎng)和運維方案
在CIOE 2024展上,海思展示了基于“星云“智能400G/800G光模塊的演示方案,在演示中系統中通過(guò)人為引入的光纖虛連接、接口臟污乃至光器件性能劣化均得到了明確的預警與界定,從而顯著(zhù)提升了網(wǎng)絡(luò )的維護效率,得到產(chǎn)業(yè)上下游的高度關(guān)注與認可。
AI及AI智算網(wǎng)絡(luò )正處于前所未有的加速發(fā)展階段,海思光電打造的“星云”系列光模塊將繼續適配AI智算網(wǎng)絡(luò )對光互聯(lián)的關(guān)鍵需求,賦能高可用、高可靠、智能化等業(yè)務(wù)場(chǎng)景,助力AI智算網(wǎng)絡(luò )的蓬勃發(fā)展。