omniture

第六期開放計(jì)算技術(shù)沙龍成功舉行 產(chǎn)學(xué)研用共話網(wǎng)絡(luò)技術(shù)研究與實(shí)踐

2022-07-01 16:02 5771

北京2022年7月1日 /美通社/ -- 隨著數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展和"東數(shù)西算"工程全面啟動(dòng),算力已成為新的生產(chǎn)力。計(jì)算場(chǎng)景的多元化、泛在化需要更高效的連接,云計(jì)算和一體化大數(shù)據(jù)中心的新型算力網(wǎng)絡(luò)體系將逐步構(gòu)建。網(wǎng)絡(luò)技術(shù)通過(guò)硬件重構(gòu)、開源開放,進(jìn)入了發(fā)展的快車道,高性能網(wǎng)絡(luò)為廣域互聯(lián)、高效通信、數(shù)據(jù)共享、協(xié)同計(jì)算提供了堅(jiān)實(shí)的支撐,有效推動(dòng)了云計(jì)算、邊緣計(jì)算等網(wǎng)絡(luò)應(yīng)用的發(fā)展,也助力了高性能和人工智能的蓬勃發(fā)展。

6月23日,由高效能服務(wù)器和存儲(chǔ)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室和開放計(jì)算中國(guó)社區(qū)聯(lián)合主辦的"網(wǎng)絡(luò)技術(shù)的研究與實(shí)踐"第六期開放計(jì)算技術(shù)沙龍?jiān)诰€上成功舉行,會(huì)議由高效能服務(wù)器和存儲(chǔ)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室首席研究員葉毓睿主持,匯集來(lái)自清華大學(xué)、華中科技大學(xué)、阿里云、電子云、浪潮網(wǎng)絡(luò)、NVIDIA、矩向科技等產(chǎn)學(xué)研用領(lǐng)域相關(guān)專家教授,圍繞高性能網(wǎng)絡(luò)互聯(lián)、智能網(wǎng)卡和DPU、開放網(wǎng)絡(luò)等話題,共同探討網(wǎng)絡(luò)技術(shù)的現(xiàn)狀與趨勢(shì)。

首先,主持人葉毓睿研究員在開場(chǎng)分享了高效能服務(wù)器和存儲(chǔ)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室最近的一些思考和觀點(diǎn)。他表示,如果說(shuō)軟件定義的方向是一切皆服務(wù),那么硬件重構(gòu)的方向則是一切皆計(jì)算機(jī)(XaaC,anything as a Computer或everything as a Computer)。在IT基礎(chǔ)設(shè)施領(lǐng)域內(nèi),不只是宏觀(超大規(guī)模,如數(shù)據(jù)中心級(jí)別)、中觀(機(jī)柜級(jí)別、服務(wù)器級(jí)別),還有微觀(組件級(jí)和設(shè)備級(jí)別),都有類似的趨勢(shì),例如網(wǎng)卡即計(jì)算機(jī):智能網(wǎng)卡SmartNIC/DPU。硬件重構(gòu)的方向是一切皆計(jì)算機(jī),這個(gè)趨勢(shì)不僅適用于IT基礎(chǔ)架構(gòu),還適用于智能制造領(lǐng)域,如葉片即計(jì)算機(jī),GE有個(gè)風(fēng)電部門,把傳感器安裝在每一個(gè)風(fēng)機(jī)葉片上,通過(guò)對(duì)轉(zhuǎn)速、風(fēng)力、溫度、環(huán)境等近百種數(shù)據(jù)的采集、分析,風(fēng)機(jī)能自己調(diào)整渦輪葉片轉(zhuǎn)速;此外還有吊艙即計(jì)算機(jī)、攝像頭即計(jì)算機(jī)、手套或眼鏡即計(jì)算機(jī)等等。

在主題演講環(huán)節(jié),清華大學(xué)教授、博士生導(dǎo)師向東分享了"高性能高階網(wǎng)絡(luò)互連架構(gòu)及通訊協(xié)議"。在高階網(wǎng)絡(luò)架構(gòu)中,他介紹到Dragonfly(蜻蜓網(wǎng)絡(luò))是一個(gè)二級(jí)全連接網(wǎng)絡(luò),現(xiàn)有的網(wǎng)絡(luò)設(shè)計(jì)成本主要取決于機(jī)柜間的全局光纖數(shù)目,減少光纖數(shù)目及交換機(jī)端口數(shù)目是降低設(shè)計(jì)成本的核心要素,蜻蜓網(wǎng)絡(luò)能夠?qū)?shù)據(jù)包傳輸路徑的全局光纖數(shù)目降低為1,其網(wǎng)絡(luò)設(shè)計(jì)成本遠(yuǎn)低于3-D Torus及胖樹等其他網(wǎng)絡(luò)架構(gòu),不僅適合于搭建超級(jí)計(jì)算機(jī),同時(shí)也適用于數(shù)據(jù)中心。Dragonfly可以容忍連線故障、節(jié)點(diǎn)故障等動(dòng)態(tài)故障,避免無(wú)目的的misrouting路由。相比國(guó)際上流行的互連技術(shù),Dragonfly轉(zhuǎn)發(fā)路由不需要虛擬通道(傳統(tǒng)的方法需要3~4個(gè)VCs,也即虛擬通道),可以實(shí)現(xiàn)無(wú)縫路由,能夠做成體系的硬件容錯(cuò)設(shè)計(jì)。向東教授同時(shí)介紹了dragonfly+,slingshot,及CLHR網(wǎng)絡(luò),其中dragonfly+網(wǎng)絡(luò)類似于胖樹,并在報(bào)告中給出了這些網(wǎng)絡(luò)類似便捷高效的互連及通訊解決方案。

華中科技大學(xué)教授、博士生導(dǎo)師劉方明就"國(guó)家重點(diǎn)研發(fā)計(jì)劃驅(qū)動(dòng)的數(shù)據(jù)中心網(wǎng)絡(luò)開源實(shí)踐" 進(jìn)行主題分享。他帶領(lǐng)團(tuán)隊(duì)與浪潮信息合作歷時(shí)四年,完成了科技部"云計(jì)算與大數(shù)據(jù)"專項(xiàng)中的研發(fā)計(jì)劃項(xiàng)目 -- 高效能云計(jì)算數(shù)據(jù)中心關(guān)鍵技術(shù)與裝備,其中研發(fā)了一系列有代表性的數(shù)據(jù)中心網(wǎng)絡(luò)開源系統(tǒng),涉及數(shù)據(jù)中心內(nèi)的資源調(diào)度,例如網(wǎng)絡(luò)功能虛擬化中間件PostMan,能夠快速緩解突發(fā)流量場(chǎng)景的小數(shù)據(jù)包請(qǐng)求洪峰負(fù)載,以及利用CPU-FPGA協(xié)同和軟硬結(jié)合的方法加速網(wǎng)絡(luò)數(shù)據(jù)處理的DHL框架,均入選了木蘭協(xié)議的全國(guó)首批自主開源項(xiàng)目;在跨域多數(shù)據(jù)中心間的資源調(diào)度方面,貢獻(xiàn)了OpenStack開源社區(qū)多數(shù)據(jù)中心級(jí)聯(lián)方案Tricircle的多個(gè)關(guān)鍵技術(shù),包含跨數(shù)據(jù)中心三層網(wǎng)絡(luò)拓?fù)湓O(shè)計(jì)、跨數(shù)據(jù)中心分布式負(fù)載均衡服務(wù)、跨數(shù)據(jù)中心資源調(diào)度管理等。相關(guān)成果通過(guò)研發(fā)計(jì)劃項(xiàng)目集成應(yīng)用于浪潮云海OS。

浪潮網(wǎng)絡(luò)總經(jīng)理孫波發(fā)表了"云邊端協(xié)同下的算網(wǎng)融合新趨勢(shì)"主題演講,他指出,云邊端協(xié)同的智慧聯(lián)接將成為算網(wǎng)融合新趨勢(shì)。數(shù)字化轉(zhuǎn)型的深入推進(jìn)對(duì)網(wǎng)絡(luò)基礎(chǔ)設(shè)施提出新要求和新挑戰(zhàn),需要一個(gè)彈性擴(kuò)展、高效連接、智慧運(yùn)維的全新網(wǎng)絡(luò)加以支撐。浪潮網(wǎng)絡(luò)智慧聯(lián)接架構(gòu),在云中心側(cè)以領(lǐng)先的開放網(wǎng)絡(luò)平臺(tái)為核心,打造高性能、低成本、彈性可擴(kuò)展的解決方案,使新業(yè)務(wù)上線時(shí)間縮短20%,提升排障效率30%,實(shí)現(xiàn)秒級(jí)網(wǎng)絡(luò)業(yè)務(wù)調(diào)整,滿足云業(yè)務(wù)彈性、敏捷擴(kuò)展的需求。邊緣側(cè)通過(guò)新一代邊緣網(wǎng)絡(luò)平臺(tái),融合傳統(tǒng)有線、無(wú)線網(wǎng)絡(luò),以及Zigbee、LoRa等終端網(wǎng)絡(luò),打造低延遲、實(shí)時(shí)可靠的邊緣網(wǎng)絡(luò),實(shí)現(xiàn)網(wǎng)絡(luò)的智能可視化調(diào)度,將網(wǎng)絡(luò)傳輸力提升27%、算力利用率提升30%,目前已在政府、教育、醫(yī)療、制造等諸多行業(yè)得到廣泛部署和應(yīng)用。

其中,針對(duì)云中心網(wǎng)絡(luò)解決方案,浪潮網(wǎng)絡(luò)架構(gòu)師、研發(fā)部系統(tǒng)處經(jīng)理吳迅亮分享了 "SONiC在開放網(wǎng)絡(luò)中的應(yīng)用與實(shí)踐"。他表示,開放網(wǎng)絡(luò)可以加速整個(gè)網(wǎng)絡(luò)的應(yīng)用創(chuàng)新,相比于傳統(tǒng)網(wǎng)絡(luò)交換機(jī),開放網(wǎng)絡(luò)交換機(jī)是軟硬件解耦、系統(tǒng)開放、應(yīng)用可定制、統(tǒng)一的軟件系統(tǒng)。關(guān)于開放網(wǎng)絡(luò)交換機(jī)是否會(huì)替代傳統(tǒng)網(wǎng)絡(luò)交換機(jī),他認(rèn)為"這是一個(gè)過(guò)程,二者會(huì)長(zhǎng)期共存"。SONiC是基于Debian Linux 基礎(chǔ)系統(tǒng)和SAI配合,屏蔽芯片差異的開源網(wǎng)絡(luò)軟件集合,可以提供豐富的L2/L3網(wǎng)絡(luò)特性,利用容器、數(shù)據(jù)庫(kù)等將網(wǎng)絡(luò)應(yīng)用之間的關(guān)聯(lián)解耦。同時(shí),SONiC又是一個(gè)開放的網(wǎng)絡(luò)生態(tài),從芯片廠商到最終用戶,都深度參與了SONiC的開發(fā)、測(cè)試和部署。SONiC的源碼是開放的,許多廠商都在SONiC上進(jìn)行特色功能的定制。Inspur NOS就是浪潮基于開源SONiC研發(fā)的網(wǎng)絡(luò)操作系統(tǒng),在易用性、安全性、功能性、穩(wěn)定性方面都得到了增強(qiáng)。

在數(shù)據(jù)中心和云市場(chǎng),對(duì)于業(yè)務(wù)來(lái)進(jìn)行性能隔離是困擾網(wǎng)絡(luò)界和計(jì)算界很久的問(wèn)題,現(xiàn)在我們已經(jīng)實(shí)現(xiàn)了租戶之間的安全隔離,租戶業(yè)務(wù)和業(yè)務(wù)之間的隔離,但是當(dāng)很多的租戶在同時(shí)運(yùn)行多個(gè)應(yīng)用時(shí),卻無(wú)法實(shí)現(xiàn)應(yīng)用之間的性能隔離。NVIDIA網(wǎng)絡(luò)高級(jí)總監(jiān)宋慶春進(jìn)行了"云原生超級(jí)計(jì)算架構(gòu)率先破解性能隔離難題"的主題分享,他表示在基于云原生超級(jí)計(jì)算架構(gòu)的計(jì)算平臺(tái),網(wǎng)絡(luò)、存儲(chǔ)均成為計(jì)算單元,實(shí)現(xiàn)了在一個(gè)數(shù)據(jù)中心里,數(shù)據(jù)在哪里,計(jì)算就在哪里,如此也就實(shí)現(xiàn)了在一個(gè)統(tǒng)一的架構(gòu)下面,無(wú)論是像AI訓(xùn)練這樣的大規(guī)模應(yīng)用,還是非常小的一些基于VM就可以實(shí)現(xiàn)的應(yīng)用,我們都可以使其性能達(dá)到最大化。云原生超級(jí)計(jì)算架構(gòu)實(shí)現(xiàn)了計(jì)算和通信平臺(tái)的統(tǒng)一,利用網(wǎng)絡(luò)計(jì)算技術(shù)解決了傳統(tǒng)通信方式帶來(lái)的網(wǎng)絡(luò)擁塞及大量CPU資源消耗的問(wèn)題,還解決了困擾業(yè)界數(shù)十年的多租戶應(yīng)用的性能隔離難題,多個(gè)交換機(jī)網(wǎng)絡(luò)計(jì)算單元并行計(jì)算,實(shí)現(xiàn)多任務(wù)高性能可擴(kuò)展。

關(guān)于智能網(wǎng)卡,電子云研發(fā)副總裁劉年超分享了"SmartNIC/DPU在云原生環(huán)境中應(yīng)用的實(shí)踐和思考"。他指出,SmartNIC、DPU、IPU抑或是新推出的CIPU,雖然在命名方式方面缺乏統(tǒng)一的標(biāo)準(zhǔn),但從以CPU為中心的體系架構(gòu)向以數(shù)據(jù)為中心的體系架構(gòu)轉(zhuǎn)變是大勢(shì)所趨。新一代 DPU/IPU 設(shè)備的共同特點(diǎn)是它們采用易于編程的多核CPU、先進(jìn)的網(wǎng)絡(luò)接口以及一組強(qiáng)大的網(wǎng)絡(luò)、存儲(chǔ)和安全加速器,可以進(jìn)行編程以執(zhí)行多個(gè)軟件定義的硬件加速功能。DPU能夠解決不同廠家網(wǎng)卡采用不同驅(qū)動(dòng)的痛點(diǎn),統(tǒng)一網(wǎng)卡和存儲(chǔ)驅(qū)動(dòng),共享存儲(chǔ)和網(wǎng)絡(luò)資源池,并可以真正實(shí)現(xiàn)裸金屬、虛擬機(jī)和容器統(tǒng)一的運(yùn)維和管理,并從規(guī)模效應(yīng)、運(yùn)營(yíng)模式、應(yīng)用場(chǎng)景、成本分析、性能要求、人才儲(chǔ)備六大方面探討了SmartNIC/DPU在公有云和私有云場(chǎng)景差異性,給SmartNIC/DPU Startup團(tuán)隊(duì)根據(jù)自身的情況找準(zhǔn)切入點(diǎn)提供一些思考的方向。

在最后有關(guān)SmartNIC/DPU的圓桌討論環(huán)節(jié),阿里云神龍計(jì)算平臺(tái)負(fù)責(zé)人蔣林泉、矩向科技創(chuàng)始人黃朝波、電子云研發(fā)副總裁劉年超、NVIDIA網(wǎng)絡(luò)高級(jí)總監(jiān)宋慶春等嘉賓,共同就SmartNIC和DPU的區(qū)別與聯(lián)系、DPU落地所面臨的挑戰(zhàn)與機(jī)遇等議題進(jìn)行了熱烈探討與交流,并和聽眾進(jìn)行了深入的互動(dòng)問(wèn)答。

黃朝波指出,從智能網(wǎng)卡到DPU,是一個(gè)持續(xù)演進(jìn)的過(guò)程。并且演進(jìn)還在繼續(xù),隨著Chiplet等技術(shù)的成熟,在邊緣和企業(yè)云等規(guī)模更大的、輕量一些的場(chǎng)景,CPU、GPU和DPU會(huì)融合成一顆芯片,我們把它稱為超異構(gòu)處理器HPU。

蔣林泉在介紹阿里云最新發(fā)布的CIPU時(shí)表示,從云業(yè)務(wù)出發(fā)還是從芯片供應(yīng)商出發(fā),對(duì)是否能在云領(lǐng)域規(guī)模落地區(qū)別較大,云操作系統(tǒng)和規(guī)模業(yè)務(wù)垂直迭代驅(qū)動(dòng)落地,才有可能在云這個(gè)領(lǐng)域發(fā)揮最大競(jìng)爭(zhēng)力。阿里云CIPU的創(chuàng)新,歷經(jīng)5年的迭代,事實(shí)上成為了云數(shù)據(jù)中心的中軸,也成為阿里云云計(jì)算服務(wù)在性能、穩(wěn)定性和效率上的核心引擎,這也是為何我們以Cloud Infrastructure Processing Unit命名它的關(guān)鍵原因。

劉年超指出,SmartNIC/DPU未來(lái)發(fā)展方向是存算網(wǎng)融合趨勢(shì),在IDC中計(jì)算端,網(wǎng)絡(luò)互聯(lián)端,存儲(chǔ)端都有很好的應(yīng)用場(chǎng)景。由于公有云可通過(guò)規(guī)模效應(yīng)來(lái)攤平高昂的人力及硬件成本,從云上層應(yīng)用到底層系統(tǒng)硬件芯片驅(qū)動(dòng)做到垂直打通的專一場(chǎng)景,以及服務(wù)型交付模式,可以成功將DPU在公有云場(chǎng)景商用落地,但這些高門檻的條件在專屬云場(chǎng)景難以具備,所以目前DPU 初創(chuàng)公司在公有云計(jì)算端虛擬化商用落地場(chǎng)景未必成立,但在數(shù)據(jù)中心存儲(chǔ)端和邊緣計(jì)算網(wǎng)絡(luò)互聯(lián)端也許是很好的切入點(diǎn)。

宋慶春表示,在算力時(shí)代,數(shù)據(jù)中心成為了計(jì)算單元,計(jì)算、通信和存儲(chǔ)作為計(jì)算單元性能的保障,在數(shù)據(jù)移動(dòng)的過(guò)程中完成計(jì)算,是實(shí)現(xiàn)業(yè)務(wù)性能最大化的關(guān)鍵。其中網(wǎng)絡(luò)計(jì)算作為計(jì)算和存儲(chǔ)的橋梁,將發(fā)揮更重要的作用。擺脫傳統(tǒng)的計(jì)算、通信和存儲(chǔ)的概念,在新的架構(gòu)下重新定位三者之間的操作,勢(shì)在必行。

消息來(lái)源:浪潮信息
China-PRNewsire-300-300.png
全球TMT
微信公眾號(hào)“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營(yíng)動(dòng)態(tài)、財(cái)報(bào)信息、企業(yè)并購(gòu)消息。掃描二維碼,立即訂閱!
collection