ICC訊 Credo Technology Group Holding Ltd(納斯達克股票代碼:CRDO)是一家致力于提供安全、高速連接解決方案的創(chuàng )新型企業(yè),隨著(zhù)數據基礎設施市場(chǎng)的快速發(fā)展,數據傳輸速率和帶寬需求也不斷攀升,Credo的產(chǎn)品以其卓越的表現,滿(mǎn)足了上述市場(chǎng)對高帶寬,高能效解決方案的需求。近日, Credo發(fā)布HiWire AEC新品 —— 線(xiàn)纜長(cháng)度為7米的800G ZeroFlap(ZF)系列。此系列高性能HiWire ZF AEC旨在為人工智能(AI)后端網(wǎng)絡(luò )提供高度可靠的互連解決方案。
Credo的800G HiWire ZF AEC產(chǎn)品設計基于Credo已成功在第一梯隊超大規模數據中心以百萬(wàn)級數量部署的HiWire AEC產(chǎn)品系列。Credo此次發(fā)布的 800G HiWire ZeroFlap AEC為AI后端網(wǎng)絡(luò )而設計。憑借更遠的傳輸距離及更優(yōu)異的信號完整性,HiWire ZF AEC支持AI集群所依賴(lài)的后端RDMA無(wú)損網(wǎng)絡(luò )傳輸,并提供零震蕩(Zero Link Flap)的穩定鏈路連接。得益于7米的線(xiàn)纜長(cháng)度以及最先進(jìn)的機柜液冷技術(shù),HiWire 800G AEC可以在主流的GPU集群中實(shí)現完整的主機到交換機的跨柜連接。
HiWire ZF AEC系列包括以下四款新品
Credo的AEC產(chǎn)品負責人Ameet Suri介紹道:“不同于傳統光模塊鏈路震蕩問(wèn)題頻現,Credo的HiWire ZeroFlap AEC可以提供零震蕩的穩定鏈路連接,顯著(zhù)提高了GPU集群的互聯(lián)可靠性。此外,與傳統光學(xué)器件相比,Credo的HiWire AEC每條鏈路可節省高達14瓦的功耗,并為每個(gè)GPU單元節省高達1000美元的成本?!?
來(lái)自X Corp.協(xié)助構建xAI的網(wǎng)絡(luò )工程師Massine Merzouk表示:“在構建世界上最大的擁有10萬(wàn)多個(gè)GPU超級計算機時(shí),集群的可靠性至關(guān)重要,Credo的HiWire AEC為我們構建如此龐大的系統提供了所需的穩定傳輸平臺?!?
650集團的創(chuàng )始分析師Alan Weckel表示:“光模塊的鏈路震蕩(Link Flap)問(wèn)題是大型GPU集群中逐漸顯現的技術(shù)挑戰 —— 每次鏈路震蕩事件可能導致高達30分鐘的訓練時(shí)間損失,成本高達20萬(wàn)美元。Credo HiWire AEC的硬件可靠性更高,但更重要的是,其已被證實(shí)數十億小時(shí)的現場(chǎng)運行并未發(fā)生鏈路震蕩(Link Flap)?!?
Credo將在于2024年10月15日至17日在美國圣何塞舉行的Open Compute Project (OCP 2024)峰會(huì )上展示上述HiWire ZF AEC新品。