omniture

“產(chǎn)學研用”賽場,鄭州大學實驗室將采用云海“起跑”

2021-09-23 09:10 4255

北京2021年9月22日 /美通社/ -- 起跑!如今,這個詞在很多領域被賦予新內(nèi)涵。這次,我們將它的解釋權交給鄭州大學電氣工程學院某研究院大數(shù)據(jù)與人工智能實驗室。


實驗室的新課題 -- “1+1+1>3”

加強產(chǎn)學研的有效結(jié)合,提高科技成果的市場轉(zhuǎn)化率,一直是科技創(chuàng)新與市場化運作中最關鍵的一環(huán)。然而科技成果的轉(zhuǎn)化,一端連接著高校院所,另一端連接著企業(yè),要形成1+1+1>3的效果并非易事,如何讓科技成果轉(zhuǎn)化之路越走越暢通,是教育界與企業(yè)界都必須面對的核心問題。

正如實驗室老師所言:“一直以來,將教學、科研以及咨詢等工作做到更高質(zhì)量且更有價值,都是我們持續(xù)追求的,過程中有成績也有不少困惑,例如產(chǎn)學研用如何高效聯(lián)動、科技轉(zhuǎn)化怎樣加速落地,確實長期困擾我們?!?當下實驗室站在“產(chǎn)學研用”的起跑線上,許多難題亟待解決。

其一,成也開源,困也開源。為滿足在校師生以及科研人員在原有環(huán)境中的實踐和研發(fā)習慣,并匹配多行業(yè)應用開發(fā)體系,實驗室必須以開源技術為基礎構(gòu)建云平臺。那么,如何在實驗室硬件基礎設施之上,將KVM、OpenStack、Kubernetes、Hadoop等開源技術架構(gòu)統(tǒng)一集成起來,為師生提供完整的云基礎設施解決方案,無疑是整個實驗平臺建設的第一大難題。

其二,數(shù)智多元能力難聚合?!吧显朴脭?shù)賦智”是數(shù)字經(jīng)濟的新動能,更是科研創(chuàng)新的主要抓手。大數(shù)據(jù)與人工智能的不同技術體系對實驗平臺能力要求非常復雜,需要的算力資源既有通用架構(gòu)下CPU和GPU的并行計算能力,又有專用神經(jīng)網(wǎng)絡處理器(NPU)和張量處理器(TPU)等,如何把虛擬機、容器、裸機、大數(shù)據(jù)計算、AI計算等復雜能力聚合起來,按需取用,對實驗平臺的資源聚合、調(diào)度能力提出了極高要求。

其三,相對滯后的運維運營能力。作為國內(nèi)領先的計算機科學實驗室,技術和架構(gòu)的升級必然緊跟前沿科技的發(fā)展,可以預見,實驗室將面對更加復雜的運維和運營難題。因此提供跨平臺和技術統(tǒng)一運維保障的能力與接口,提高運維管理效率,避免多平臺、多技術線運維帶來的學習成本、使用成本和管理成本的提升,將是“起跑”之后改變“頻率”的關鍵。

因此,先實現(xiàn)開源基礎架構(gòu)的全面融合、云數(shù)智多元算力的高效聚合、運維與運營深度統(tǒng)合,然后把這三方面的目標“合而為一”,建設一套以云數(shù)智高度融合為目標的資源共享平臺勢在必行。

三位一體 -- 架構(gòu)、數(shù)智、運維

工欲善其事,必先利其器。為更好解決實驗室在科研創(chuàng)新與業(yè)務應用方面的諸多問題,研究院最終選擇了深諳融合之道的浪潮云海云數(shù)智融合智能解決方案。

先看內(nèi)核,浪潮云海解決方案采用了成功支撐超過30萬個服務器節(jié)點的云海OS,將開源、開放技術和敏捷的產(chǎn)品化過程有機結(jié)合,推動各個行業(yè)基礎設施的智能化升級,全面支撐從傳統(tǒng)核心應用到大數(shù)據(jù)、深度學習、邊緣計算等創(chuàng)新應用的各類場景,這也是改變實驗室“起步”技術的核心。而核聚變產(chǎn)生的能量是巨大的,這為基礎架構(gòu)、數(shù)智能力、運維運營“三位一體”目標的實現(xiàn),提供了澎湃動力。

  • 基礎架構(gòu)合一
    在傳統(tǒng)的高校實驗室場景中,虛擬化、容器,大數(shù)據(jù),人工智能等科研實驗常用的技術架構(gòu)都需要獨立建設,而云海云數(shù)智融合智能解決方案卻可以利用一體化平臺底座,為校內(nèi)師生提供了多元化資源,解決了過去基礎實踐平臺因架構(gòu)割裂帶來的獲取資源不便捷、實驗科研流程繁瑣、資源利用率低以及運維難度大等諸多問題。
  • 數(shù)智能力合一
    在云計算與大數(shù)據(jù)成熟的沃土上誕生的AI可謂是天選之子,但是AI 的技術需求和大數(shù)據(jù)處理模式有很大差異,尤其是在計算密集性層面,與傳統(tǒng)的大數(shù)據(jù)處理和分析應用有著本質(zhì)的不同。例如,深度學習模型在訓練時需要依賴GPU 或者 FPGA 等硬件資源的算力支撐,而大數(shù)據(jù)的存、取、用、管則是以 CPU 為主,這就使得整體計算資源在管理和分配上也存在一定不同。
    浪潮云海云數(shù)智融合智能解決方案將具備大數(shù)據(jù)處理和人工智能計算深度融合能力的浪潮InsightHD納入其中,在大數(shù)據(jù)平臺上提供CPU/GPU的一站式數(shù)據(jù)預處理到模型訓練推理能力,滿足人工智能處理所需要的多種深度學習框架,例如TensorFlow、PyTorch、Keras等,并提供大量的優(yōu)化的分布式算法。方案落地后,通過數(shù)據(jù)對比發(fā)現(xiàn),圖像推理方面的效率可提升87%、資源利用率提升95%以上、計算性能提高50%,開發(fā)效率提升40%。
  • 運維運營合一
    云數(shù)智融合平臺深度整合了云計算、大數(shù)據(jù)與AI資源池,整體資源利用率相比傳統(tǒng)煙囪模式提高70%,建設投資降低50%。方案落地后,最終呈現(xiàn)給實驗室用戶則是云數(shù)智一體化服務目錄,有效達成了資源的集中化管理,實現(xiàn)多維視角下的運維運營融合。
    運營視角,在可融合的軟硬件資源池基礎上,通過靈活的組織,將不同的資源池組成專業(yè)的服務器、存儲、網(wǎng)絡系統(tǒng),并實現(xiàn)資源的高效管理和調(diào)度以及數(shù)據(jù)在池化資源的靈動流轉(zhuǎn)。運維視角,憑借一站式健康檢查、資源預測分析、可視化日志分析等智能化運維功能來釋放運維壓力。用戶視角,可以通過統(tǒng)一化門戶界面,科研人員可按需申請各類資源,線上流程審批來解決資源發(fā)放和管控管控問題,徹底解決服務器申請、環(huán)境部署、工具安裝等很多前置操作,將重心放在最擅長的課題研究領域。

“起跑”極為重要,“步頻”決定成敗

隨著本次科研平臺的正式上線運行,鄭州大學電氣工程學院某研究院大數(shù)據(jù)與人工智能實驗室不斷加速從傳統(tǒng)教學實踐向基于大數(shù)據(jù)、人工智能的新型產(chǎn)學研用深度融合的教學實踐升級,并成為河南高校首個云數(shù)智一體化實驗室平臺,為其他高校的教科研升級樹立了典型樣板。

“該平臺面向本院相關專業(yè)師生,用來提供滿足應用需求的軟件開發(fā)新方法和新技術的訓練,打造特色人才培養(yǎng)基地和科研成果轉(zhuǎn)化基地以及高端智庫,全面促進產(chǎn)學研用的深度融合與協(xié)同創(chuàng)新?!痹侯I導表示。

寫在最后:對于鄭州大學實驗室,甚至是更多正在著力探索數(shù)智科研實踐的高校實驗室來說,浪潮云海無疑是更換起跑方式、提升步頻的最佳選擇。

消息來源:浪潮
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection