北京2021年10月21日 /美通社/ -- “推進教育新型基礎(chǔ)設(shè)施建設(shè)構(gòu)建高質(zhì)量教育支撐體系的指導(dǎo)意見”明確將高性能計算平臺(以下簡稱“HPC”)定位于“智慧科研設(shè)施”領(lǐng)域之中。HPC作為高等院校教科研的關(guān)鍵算力平臺,其在氣象預(yù)報、地質(zhì)勘探、生物科學以及宏觀經(jīng)濟預(yù)測等教學、科研的過程中已經(jīng)成為一個關(guān)鍵抓手。
HPC備受高等院校青睞,其最初的動因來自于科學研究領(lǐng)域中,人們對于“第三范式”,即計算科學的依賴。伴隨著大數(shù)據(jù)、人工智能等領(lǐng)域在教學科研中所扮演的角色越加重要,以及關(guān)于科研領(lǐng)域“第四范式”,即數(shù)據(jù)密集型科學議題的出現(xiàn),使得當下高等院校對服務(wù)于科研領(lǐng)域的核心算力平臺有了新的需求。
以傳統(tǒng)HPC為代表的高??蒲兴懔ζ脚_,正在朝著既能滿足HPC,又可以實現(xiàn)AI、大數(shù)據(jù)等計算服務(wù)的算力平臺 -- “智算中心”演進升級。浪潮前瞻性地提出了“智算中心”,其在高校構(gòu)建智慧科研設(shè)施的過程中,滿足了師生們在教學與科研的過程中對多元算力的要求。算力平臺對于底層網(wǎng)絡(luò)基礎(chǔ)設(shè)施,在架構(gòu)、性能、運維等方面提出的挑戰(zhàn)伴隨算力多元化而來。浪潮網(wǎng)絡(luò)依托浪潮集團在“智算中心”領(lǐng)域所擁有的整體實力,作為中國創(chuàng)新型網(wǎng)絡(luò)產(chǎn)品、技術(shù)、方案供應(yīng)商,針對智慧科研設(shè)施HPC算力平臺的新需求、新趨勢,推出了“高等院校HPC網(wǎng)絡(luò)解決方案”。
HPC+AI 科研算力平臺面臨的升級之“困”
高校在圍繞“智算中心”構(gòu)建智慧科研基礎(chǔ)設(shè)施的過程中,一方面要解決當下現(xiàn)有科研算力分散的“短板”,同時還面臨如何化解全新多元科研算力對于底層網(wǎng)絡(luò)平臺提出的挑戰(zhàn)。
長期以來,部分高校的HPC建設(shè)并未得到有效整合,造成算力資源利用效率不高、平臺運維管理繁重。與此同時,AI、大數(shù)據(jù)應(yīng)用的激增,加劇了科研“算力孤島”現(xiàn)象的增多。通過整合現(xiàn)有科研算力,不僅能夠充分釋放算力效能,同時在算力能耗、運維管理等方面也會帶來質(zhì)的改變。
網(wǎng)絡(luò)基礎(chǔ)架構(gòu)作為科研算力平臺的關(guān)鍵一環(huán),面對算力多元化、巨量化的發(fā)展趨勢,其在架構(gòu)、技術(shù)上需要做出全新的改變。在國家信息中心聯(lián)合浪潮所發(fā)布的《智能計算中心規(guī)劃建設(shè)指南》中,圍繞科研算力平臺建設(shè)指出 -- 針對HPC、大數(shù)據(jù)以及AI等應(yīng)用需求,現(xiàn)有的數(shù)據(jù)中心網(wǎng)絡(luò)在彈性、可擴展性以及功能靈活性等方面都存在不足,難以勝任當前科研算力這類大規(guī)模計算集群的需求。
科研算力向“智算”升級 網(wǎng)絡(luò)基座需先行
作為全球領(lǐng)先的HPC解決方案提供商 -- 浪潮為高校提供的科研算力平臺,具備從計算節(jié)點、異構(gòu)加速、并行存儲、高速網(wǎng)絡(luò)、集群管理的全棧解決方案。而浪潮網(wǎng)絡(luò)圍繞科研算力平臺的應(yīng)用特點和技術(shù)難點,在網(wǎng)絡(luò)架構(gòu)、技術(shù)及設(shè)備選用等維度,提供了完備的解決方案。
為了有效支撐異構(gòu)算力平臺,例如AI、大數(shù)據(jù)等應(yīng)用的需求,以及滿足數(shù)值計算的HPC應(yīng)用所需,浪潮網(wǎng)絡(luò)在整體架構(gòu)層面,采用Spine-Leaf網(wǎng)絡(luò)架構(gòu)設(shè)計,替代傳統(tǒng)的胖樹結(jié)構(gòu),構(gòu)建端到端無阻塞、無收斂的高速數(shù)據(jù)轉(zhuǎn)發(fā)網(wǎng)絡(luò)。在此基礎(chǔ)上,浪潮網(wǎng)絡(luò)通過提供支持 RoCE的網(wǎng)絡(luò)設(shè)備,在以太網(wǎng)上實現(xiàn)了RDMA 功能,為HPC這類數(shù)據(jù)密集型計算任務(wù)提供了超低的數(shù)據(jù)延遲高速交換和高效的網(wǎng)絡(luò)資源利用率,在絕大部分HPC場景中可有效替代傳統(tǒng)上昂貴的基于Infiniband的解決方案,同時浪潮網(wǎng)絡(luò)的HPC解決方案已在大量的985、211院校得到規(guī)模應(yīng)用。
在浪潮網(wǎng)絡(luò)HPC解決方案中,CN12900、CN9000、CN6000等高速低延遲數(shù)據(jù)中心交換機,在無損以太網(wǎng)、支持RoCE等方面的特點,為高校科研算力平臺構(gòu)建起一套具備高冗余、低延遲、無阻塞的網(wǎng)絡(luò)基礎(chǔ)平臺。整套解決方案不僅確保了科研算力平臺高速、安全、穩(wěn)定運行,同時其所具備的靈活、彈性的系統(tǒng)升級、擴容能力,也使得科研算力平臺的投入更加合理可控。