ICC訊 6月19~20日,2024中國光網(wǎng)絡(luò )研討會(huì )在北京成功舉辦。在會(huì )議期間,海思光電先進(jìn)光電實(shí)驗室主任滿(mǎn)江偉博士發(fā)表題為“星云光模塊助力智算中心光互聯(lián)技術(shù)發(fā)展”的主題演講,分享智算中心網(wǎng)絡(luò )對光互聯(lián)的技術(shù)需求以及海思光電面向智算中心光互聯(lián)的星云系列光模塊產(chǎn)品。
近年來(lái),大模型的爆發(fā)性發(fā)展帶動(dòng)了AI智算中心向超大規模集群演進(jìn)。大規模計算集群中的NPU/GPU高性能互聯(lián)成為影響網(wǎng)絡(luò )性能的關(guān)鍵因素,并且正在經(jīng)歷著(zhù)快速迭代演進(jìn)。不斷加快的產(chǎn)品換代催生光互聯(lián)接口的代際升級,面向AI光互聯(lián)的光模塊正迎來(lái)爆發(fā)性增長(cháng)。
滿(mǎn)江偉博士在分享中指出:運營(yíng)商的數據中心分布廣泛,涵蓋從城市的核心數據中心到區域的邊緣接入數據中心,部署環(huán)境復雜且面臨鹽霧、硫化、水汽等復雜場(chǎng)景挑戰,因此對于光模塊的長(cháng)期性能和穩定性有較高的要求。IPEC國際光電委員會(huì )正在協(xié)同全產(chǎn)業(yè)鏈伙伴探索電信級光模塊可靠性保證。同時(shí),AI智算中心向大規模集群演進(jìn)的過(guò)程中,由于采用了大規模并行計算,AI計算相比通用計算具有更高的集約度和更大的能耗,因此在大帶寬、低時(shí)延、低功耗、高可靠、智能化等多個(gè)方面都對光互聯(lián)模塊提出了新的挑戰。
海思光電立足AI智算中心的光互聯(lián)需求,聯(lián)合計算、網(wǎng)絡(luò )等領(lǐng)域進(jìn)行協(xié)同創(chuàng )新,推出面向AI智算中心的星云系列光模塊,從五大維度適配AI智算需求,提升計算網(wǎng)絡(luò )效率:
-- 大帶寬維度:依托基于VCSEL的多模光芯片和基于TFLN、EML及硅光的單模光芯片,打造400G、800G短距光互聯(lián)產(chǎn)品,匹配AI智算中心的互聯(lián)需求。持續提升單Lane速率,推進(jìn)光模塊向更高速率演進(jìn)
-- 低時(shí)延維度:推進(jìn)系統側、模塊側的協(xié)同處理,采用低時(shí)延FEC等措施降低端到端時(shí)延。此外,針對業(yè)界討論熱點(diǎn)之一的LPO方案,持續關(guān)注其在標準化、互聯(lián)互通等方面的挑戰與進(jìn)展
-- 低功耗維度:在電/光/系統級等多個(gè)領(lǐng)域進(jìn)行協(xié)同優(yōu)化,充分挖掘技術(shù)潛力,構建系統級的功耗優(yōu)化方案來(lái)降低per-bit的功耗
-- 高可靠維度:AI智算網(wǎng)絡(luò )的鏈路故障來(lái)源于光纖鏈路、連接器、光電轉換單元、系統設備等多個(gè)部分。針對AI計算對高可靠光互聯(lián)的需求,從系統層面進(jìn)行統籌考慮,采用光/電聯(lián)合設計,提升光模塊長(cháng)期工作的穩定性和系統的可靠性
-- 智能化維度:引入AI技術(shù)提升光模塊和智算網(wǎng)絡(luò )的可運維性,通過(guò)對光模塊、光鏈路參數的數據檢測分析,對光模塊本體、光電鏈路健康度進(jìn)行診斷;同時(shí),與設備層面進(jìn)行聯(lián)動(dòng),主動(dòng)預防網(wǎng)絡(luò )故障
滿(mǎn)江偉博士最后指出,AI及AI智算網(wǎng)絡(luò )正處于前所未有的加速發(fā)展階段,這對光互聯(lián)既是機會(huì )也是挑戰。海思光電打造的星云系列光模塊將繼續適配AI智算網(wǎng)絡(luò )對光互聯(lián)的關(guān)鍵需求,賦能高可用、高可靠、智能化等業(yè)務(wù)場(chǎng)景,助力AI數據中心的蓬勃發(fā)展。