ICCSZ訊 “更高帶寬,更高性能”,一直以來(lái)都是網(wǎng)絡(luò )領(lǐng)域的不懈追求。如今,隨著(zhù)云計算、大數據、移動(dòng)化等新一代IT技術(shù)的應用帶來(lái)了數據量的海量增長(cháng),以及用戶(hù)對體驗的關(guān)注,這一目標顯得更為緊迫和現實(shí)。比如,NVIDIA(英偉達)最新推出的深度學(xué)習一體機對網(wǎng)絡(luò )帶寬和性能的要求已經(jīng)達到了新的高度,標配就有4片100G的網(wǎng)卡。
其實(shí),網(wǎng)絡(luò )領(lǐng)域也一直在不斷創(chuàng )新,努力提升網(wǎng)絡(luò )產(chǎn)品的性能和帶寬,“卸載”(即將傳統由CPU處理的部分工作轉移到網(wǎng)絡(luò )設備進(jìn)行)就是其中的技術(shù)之一。Mellanox就是這一技術(shù)的主要倡導者和實(shí)踐者,正是基于這一創(chuàng )新技術(shù),Mellanox不斷推出新一代更高性能的網(wǎng)絡(luò )產(chǎn)品。日前Mellanox全球市場(chǎng)部副總裁 Gilad Shainer在接受記者采訪(fǎng)時(shí)表示,明年Mellanox將推出200Gb/s的InfiniBand和以太網(wǎng)交換機,這也是業(yè)界首次推出如此高速的網(wǎng)絡(luò )設備。此舉無(wú)疑會(huì )又一次推動(dòng)網(wǎng)絡(luò )傳輸能力的升級。
Mellanox全球市場(chǎng)部副總裁 Gilad Shainer
加速網(wǎng)絡(luò )互連
提到Mellanox,在HPC領(lǐng)域幾乎無(wú)人不知。Mellanox成名于HPC,從其2001年推出一代InfiniBand產(chǎn)品以來(lái),一直是InfiniBand市場(chǎng)的領(lǐng)導者。在最近一期的全球超級計算機500強(TOP500)榜單上,前500套HPC中有39%(194套系統)采用了Mellanox的InfiniBand產(chǎn)品。如果以其中真正用于超級計算的設備來(lái)計算,占比會(huì )更高,達到65%。
“在HPC市場(chǎng)InfiniBand占有絕對的優(yōu)勢。在排名最靠前的這些系統,比如千萬(wàn)億次的系統中,我們占據了近一半的市場(chǎng)份額,這充分了Mellanox在高性能計算系統里面的實(shí)力。”Gilad Shainer說(shuō)。
Gilad Shainer介紹說(shuō)有可能問(wèn)鼎2018年TOP500第一的美國“Coral珊瑚”系統也會(huì )采用Mellanox InfiniBand。
當然,InfiniBand并不是Mellanox發(fā)力的唯一領(lǐng)域。除了InfiniBand之外,在以太網(wǎng)領(lǐng)域,Mellanox同樣成績(jì)斐然,尤其是在高性能計算方面。比如,在全球HPC TOP500的榜單中,所有4萬(wàn)兆以太網(wǎng)系統采用的都是Mellanox的產(chǎn)品。同時(shí),全世界第一套100G以太網(wǎng)的系統用得也是Mellanox的網(wǎng)絡(luò )產(chǎn)品。
值得一提的是,上文中提到的4萬(wàn)兆以太網(wǎng)和100G以太網(wǎng)系統都出自中國,這一方面說(shuō)明Mellanox在HPC領(lǐng)域的技術(shù)實(shí)力,同時(shí)也表明中國在HPC領(lǐng)域的領(lǐng)先態(tài)勢。
Gilad Shainer說(shuō),HPC領(lǐng)域是Mellanox的傳統領(lǐng)域,除了HPC之外,Mellanox還將其技術(shù)優(yōu)勢擴展到其他領(lǐng)域,包括高速存儲、數據庫、人工智能等。其中,人工智能也被Mellanox鎖定為今后的重點(diǎn)領(lǐng)域。
“在這個(gè)領(lǐng)域里,需要對大量數據進(jìn)行分析和讀取,非常類(lèi)似于高性能計算。另外,Mellanox還能夠通過(guò)機器學(xué)習和人工智能等快速地延伸到物聯(lián)網(wǎng)、自動(dòng)駕駛、醫療、制造、零售等眾多行業(yè)。”他說(shuō)。
從“以CPU為中心”到“以數據為中心”
Mellanox在高速網(wǎng)絡(luò )方面的成績(jì)得益于其獨特的技術(shù)理念和基于這些理念下的諸多獨特優(yōu)勢,“以數據為中心的網(wǎng)絡(luò )”就是其中之一, 而“卸載”則是為了落實(shí)這一理念而采用的技術(shù)。
在Mellanox看來(lái),傳統數據中心的計算模式是以CPU為中心,即所有的數據都要移動(dòng)到CPU以后才能進(jìn)行計算。在小數據量的時(shí)候,這一模式運轉得很好,但當數據量不斷增加以后會(huì )出現問(wèn)題。比如,現在很多領(lǐng)域用到了分布式計算方式,其中CPU都要等待數據達到以后才計算,如果要移動(dòng)的數據太多就會(huì )使整個(gè)應用程序的性能出現瓶頸——因為CPU要等數據到齊才能完成計算,有時(shí)還會(huì )出現互相等待的情況。
Mellanox認為,未來(lái)的數據中心應該是以數據為中心的,也就是數據在哪里,計算就應該在哪里發(fā)生,從而避免CPU成為瓶頸。為了踐行這一理念,Mellanox設法讓網(wǎng)絡(luò )參與到計算過(guò)程中,也就是把一部分計算交由網(wǎng)絡(luò )設備來(lái)完成,網(wǎng)絡(luò )設備的角色不再只是數據的傳輸者,這就是Mellanox所說(shuō)的“卸載”。
“以數據為中心的新一代架構應該是:數據在哪兒,數據分析就在哪兒。如果數據在CPU,我們就在CPU分析;如果數據在傳輸當中,我們就應該有能力在數據的傳輸路徑中完成這個(gè)數據分析。為了高效地分析數據,我們就需要把計算能力向數據轉移,而不是把數據向計算去移動(dòng)。”Gilad Shainer表示。
據Gilad Shainer介紹,在“以數據為核心”的數據中心中,數據在網(wǎng)絡(luò )中移動(dòng)的同時(shí)就會(huì )完成一些操作,如數據的加減和數據的簡(jiǎn)單分析。這樣,當數據經(jīng)過(guò)網(wǎng)絡(luò )傳輸到達CPU時(shí),已經(jīng)是經(jīng)過(guò)清洗、處理的數據。這有很多好處:第一,它會(huì )提升系統的性能,因為數據不會(huì )等到了CPU以后再分析;第二,它會(huì )降低數據傳輸的時(shí)延,能把通訊延遲從現在的20-30多微秒下降到3-4微秒。
智能的網(wǎng)絡(luò )硬件
很顯然,以數據為中心的新一代數據中心中,因為網(wǎng)絡(luò )設備可以分擔部分CPU的壓力,同時(shí)也可以減輕網(wǎng)絡(luò )的傳輸壓力,是一個(gè)不錯的演進(jìn)方向,但這無(wú)疑對網(wǎng)絡(luò )設備提出了更好的要求,也就是網(wǎng)絡(luò )設備需要更加智能。用Mellanox的表述,就是需要具備“Offloading(卸載)”的網(wǎng)絡(luò )硬件才能完成數據中心的這一重要轉型。
“實(shí)際上,Mellanox一直致力于開(kāi)發(fā)智能網(wǎng)絡(luò ),讓網(wǎng)絡(luò )來(lái)協(xié)作處理數據。比如,我們發(fā)布的最新產(chǎn)品HDR InfiniBand 200Gb/s的網(wǎng)絡(luò )產(chǎn)品,包括全球第一款200Gb/s的交換機和全球第一個(gè)200Gb/s的網(wǎng)卡ConnectX-6,都是基于這一理念推出的新一代智能網(wǎng)絡(luò )產(chǎn)品。”Gilad Shainer說(shuō)。
據悉,HDR InfiniBand交換機中的Quantum芯片具有非常強大和智能的處理能力,可以支持網(wǎng)絡(luò )內的計算,Mellanox將這項技術(shù)稱(chēng)為SHArP 2.0。
“通過(guò)這個(gè)技術(shù)能夠在我們的交換機里面完成數據分析、數據查詢(xún),同時(shí),還能支持聚合式的通訊、包括新的一些Tag Matching,這些功能對整個(gè)應用程序性能提升非常關(guān)鍵,無(wú)論是傳統的高性能計算還是新興的深度學(xué)習、人工智能軟件都能適用。”Gilad Shainer表示。
Gilad Shainer強調,除了傳統的高性能計算和深度學(xué)習能用到卸載,網(wǎng)絡(luò )設備還能完成很多其他功能的卸載,包括存儲、安全以及一些網(wǎng)絡(luò )協(xié)議的卸載,從而提升整體系統的性能。
正是為了更好地實(shí)現部分CPU功能的卸載,實(shí)踐“以數據為中心”的網(wǎng)絡(luò ),Mellanox于2015以約8億美元的現金收購了以色列芯片公司EZchip半導體公司,并于2016年推出了一個(gè)名為BlueField的SoC芯片。
據介紹,BlueField集成了ARM的CPU和PCIe 4.0的內置交換,是一個(gè)具有交換、網(wǎng)絡(luò )和CPU的SoC系統。根據Mellanox的說(shuō)法,基于此SoC可以構建很多專(zhuān)用系統,比如存儲一體機、深度學(xué)習一體機、安全的一體機以及NFV的一體機。
“和傳統解決方案相比,這種方式可以達到更好的可擴展性,同時(shí)成本更低。這也是我們在網(wǎng)絡(luò )領(lǐng)域里面一個(gè)新的探索,包括如何集成網(wǎng)絡(luò )加計算的能力,如何更好地去處理數據。”Gilad Shainer表示。
“這就是Mellanox,一方面我們擁有一個(gè)被業(yè)界證明了的非常穩定、擁有最高性能的并持續不斷改進(jìn)的InfiniBand產(chǎn)品,同時(shí),我們也在不斷探索致力于提供更高性能、更高效、更高可擴展性、更智能的新一代的網(wǎng)絡(luò )產(chǎn)品。”Gilad Shainer總結說(shuō)。