ICC訊 今年火爆的AI應用也帶火了數據中心市場(chǎng),AI服務(wù)器需求暴增。不僅是AI大模型的規模在不斷擴張至千億級參數,還有越來(lái)越多不同類(lèi)型的大模型訓練和推理,都需要更強大的算力集群。
在一個(gè)多服務(wù)器構成的算力系統中,互連速率其實(shí)很大程度上決定著(zhù)整個(gè)系統的性能上限,因此在片間互連方面,也開(kāi)始采用CPO光電合封技術(shù),將交換芯片和光電器件封裝在一起,使得光電器件與芯片之間的數據傳輸損耗減小、提高傳輸速度。
但另一方面,由于半導體晶體管密度的提升速度放緩,單個(gè)計算節點(diǎn)中,比如單張AI加速卡上的芯片采用Chiplet技術(shù)成為了趨勢,即多個(gè)小的“芯?!狈庋b在一起,通過(guò)互連組成一個(gè)整體的計算引擎。而為了提高chiplet設計的性能,芯片內部多個(gè)die之間的互連也非常關(guān)鍵。ONoC(Optical Network-on-Chip)片上光互連正是為了解決這個(gè)問(wèn)題。
片上光互連:晶圓級的光互連網(wǎng)絡(luò )
從結構上看,片上光互連其實(shí)是一種光子集成芯片技術(shù),將不同功能的有源器件和無(wú)源器件集成在同一塊光電基板上。光電基板上具有光子路由波導,這些波導被用于數據通信,和用于電路走線(xiàn)的多層金屬層。CMOS電芯片堆疊在硅光芯片上,在光電基板上形成二維陣列。
光從基板上的激光光源中發(fā)出,輸入到基板上的路由波導,通過(guò)波導到達光芯片上的調制器。這個(gè)時(shí)候電芯片上的信息數據,通過(guò)電芯片和光芯片之間的微凸塊加載到環(huán)形調制器中,將數字1和0轉換為光的強度差異。
調制后的光信號通過(guò)光電基板上的波導傳播,到達其他光芯片上的光電探測器中。這個(gè)時(shí)候光信號就被轉換成電信號,這些信息就被不同的電芯片所接收。
當然在實(shí)際應用中,每個(gè)CMOS芯片和光芯片之間,都有數以千計的微凸塊被用于數據傳輸。因為光信號傳播不需要銅導線(xiàn),損耗小,延遲低,這樣就實(shí)現了在光電基板上進(jìn)行高能效、高帶寬密度、低延遲的光互連。
從工作原理上看,其實(shí)可以大致分析出片上光互連的核心器件主要是激光器、調制器和接收器。要想提高片上光互連的傳輸容量,可以使用波分復用、偏振復用、模分復用等技術(shù)實(shí)現。
目前,針對單一物理維度光信號的復用、解復用設備已經(jīng)相對成熟。為了進(jìn)一步提高片上光互連系統的通道數量和傳輸容量,多種復用方式的綜合運用成為了重要的研究趨勢。例如,波長(cháng)-偏振-模式混合復用等技術(shù)能夠顯著(zhù)提升片上光互連系統的性能。此外,片上光互連架構的設計與選擇對性能的提升也具有不可忽視的作用。片上光互連架構不僅決定了片上網(wǎng)絡(luò )中不同節點(diǎn)的互連方式,同時(shí)也影響了路由器的端口數量和網(wǎng)絡(luò )鏈路數量,進(jìn)一步影響了網(wǎng)絡(luò )的時(shí)延、功耗和可靠性等性能指標。
因此,綜合運用多種復用方式并優(yōu)化片上光互連架構是片上光互連發(fā)展的重要趨勢。
距離落地應用還有多遠?
目前片上光互連技術(shù)主要處于實(shí)驗室階段,還未大規模量產(chǎn)。業(yè)界的主要玩家包括一些高校和研究機構,比如美國加州大學(xué)圣巴巴拉分校、加州伯克利大學(xué)、荷蘭的埃因霍溫科技大學(xué)和特溫特大學(xué)、美國集成光子制造研究所、中科院半導體所等。另外也有英特爾、曦智科技等廠(chǎng)商在推動(dòng)相關(guān)技術(shù)的產(chǎn)業(yè)化。
英特爾在今年的Hot CHIPS會(huì )議上,展示了一款代號為“Piuma”的8核528線(xiàn)程處理器,而這款處理器的最大特點(diǎn)在于,采用了硅光子互連,能夠提供1TB/s的光學(xué)帶寬,可以將多達131,072個(gè)芯片連接在一起,形成一個(gè)大型共享內存的圖形處理超級計算機。
在Piuma組成的超級計算機中,路由器就是網(wǎng)絡(luò ),所有設備都通過(guò) HyperX 拓撲進(jìn)行連接,每個(gè)機架內將有16個(gè)Piuma芯片。不過(guò)英特爾目前還未決定Piuma芯片是否會(huì )進(jìn)行商業(yè)化,他們表示,如果有客戶(hù)提供資金支持,公司將會(huì )很樂(lè )意生產(chǎn)這款產(chǎn)品。
曦智科技近幾年一直在片上光互連技術(shù)上努力推進(jìn)商業(yè)化,今年HiPChips會(huì )議上,曦智科技展示了其片上光互連技術(shù)上的最新進(jìn)展,該系統的通道數為512,單通道最長(cháng)廣播距離為50mm,廣播延時(shí)1ns,單通道頻率4GHz,片上總帶寬達到2Tbps。實(shí)測數據顯示,該計算系統完成多個(gè)計算核之間All-to-All的數據廣播,這將大幅提高每個(gè)計算核的算力利用率。
而基于該片上光互連技術(shù),曦智科技正在推動(dòng)第一款商用級光電混合計算加速卡的商業(yè)化落地,未來(lái)將搭載曦智科技自研軟件棧,在商用場(chǎng)景下發(fā)揮片上光互連低延遲、低功耗的優(yōu)勢。
小結:
在芯片受限于制程工藝、晶體管密度提高放緩的情況下,通過(guò)芯粒的設計將多個(gè)die封裝在同一基板上成為了突破單芯片性能的一條重要路線(xiàn)。而這條路線(xiàn)的關(guān)鍵在于片上互連技術(shù)的發(fā)展,片上光互連技術(shù)也為未來(lái)的chiplet設計路線(xiàn)提供了更多的可能。
作者: 梁浩斌