北京2022年12月20日 /美通社/ -- 伴隨牛頓力學體系的建立而誕生的近代科學,開辟了一個全新的時代改變了人類的生產(chǎn)生活和思維方式,對人類社會的發(fā)展進程產(chǎn)生了深遠的、革命性的影響。時至今日,科技創(chuàng)新也依然是影響和改變經(jīng)濟、社會的關鍵變量。不斷向科學技術廣度和深度進軍,探索當前世界科技發(fā)展的最前沿,推動事關人類生存與發(fā)展的科技進步是每個科研機構的目標,中國科學技術大學(以下簡稱中國科大)致力于科學前沿探索和高新技術創(chuàng)新,為了更好支撐生命科學、天文、材料、人工智能等各學科領域研究,校網(wǎng)絡信息中心負責的學校計算平臺,以計算和存儲為平臺融合新技術應用,推進重大科研創(chuàng)新平臺建設,提升創(chuàng)新體系效能,加速科技創(chuàng)新。
中國科大是中國科學院所屬的以前沿科學和高新技術為主、兼有醫(yī)學和特色文科的綜合性全國重點大學,于1958年在北京創(chuàng)建,重點培養(yǎng)新興、邊緣、交叉學科的尖端科技人才,其中包括一批國際知名的科學家,在單分子科學、高溫超導、納米科學、地球環(huán)境、生命與健康等前沿領域取得了世界水平領先的科研成果。
近幾年生命科學、材料科學、力學、人工智能、天文等學科的項目隨著新技術和新儀器的應用,取得了科研成果的同時,也對科研創(chuàng)新平臺在計算及存儲性能和容量上提出了新的挑戰(zhàn),現(xiàn)有的計算中心整體資源使用率接近極限,居高不下,生物工程、生態(tài)環(huán)境、新材料、天文觀測等科研項目,科研實驗的數(shù)據(jù)采集具有周期長、采集復雜、環(huán)境要求較高,甚至如氣候數(shù)據(jù)是不可復雜再生的,此外科研項目涉及的眾多研究員來自不同的高校等科研單位;因此為了穩(wěn)固地按照時間節(jié)點推進科研項目,采集分析實驗數(shù)據(jù),數(shù)據(jù)安全可靠必須得到保障,不容任何丟失。如生命科學領域的研究像冷凍電鏡設備,采用從樣品冷凍、低劑量電子斷層掃描到三維重構的技術,開展生命科學基礎研究,在其整個流程中,圖像處理、三維重構是非常核心的步驟,對計算和存儲的需求非常高,平均每分鐘就能產(chǎn)生5-6張Image Stack圖像數(shù)據(jù),按照24小時不間斷地工作計算,每天會產(chǎn)生超過數(shù)TB的數(shù)據(jù),每年可達數(shù)PB,并且采集的海量文件數(shù)據(jù)要就行高并發(fā)的模型重構,處理后的數(shù)據(jù)及時歸檔存儲,一方面釋放性能資源的占用,一方面更好的保存寶貴的原始科研數(shù)據(jù)以備后續(xù)計劃使用,全校多個領域的持續(xù)新增的科研項目的需求,對計算存儲平臺整體方案的性能、容量、安全穩(wěn)定都提出了新挑戰(zhàn)。
百萬級IOPS、百GB帶寬,為科研平臺注入新動力
聚焦前沿科學研究,致力尖端科技突破,注重學科交叉融合,努力實現(xiàn)創(chuàng)新和科技成果轉化的重大突破,為了保障不同學科課題項目的順利、高效開展,中國科大網(wǎng)絡信息中心深入分析科研項目對計算中心的需求,整體籌劃,以計算+存儲為核心的整體方案升級集群系統(tǒng),部署了25個浪潮GPU服務器節(jié)點、一套浪潮分布式并行文件存儲AS13000系列,為科研平臺提供了計算及數(shù)據(jù)基礎設施支撐。
為了滿足不同學科領域項目采集的數(shù)據(jù)在研究不同時期數(shù)據(jù)對存儲性能、容量的需求特點,數(shù)據(jù)層采用了基于浪潮分布式并行文件存儲AS13000系列構建的數(shù)據(jù)分層存儲方案,通過配置NVMe SSD高性能硬盤的全閃存節(jié)點構建了高速性能層,通過30個4U60盤位的高密節(jié)點搭建了11PB可用空間的容量層,集群中所有分布式節(jié)點參與并發(fā)讀寫,基于聚合的小文件優(yōu)化技術,減少了數(shù)據(jù)寫入硬盤次數(shù),提高小文件讀寫性能,實現(xiàn)了集群聚合讀帶寬160GB/s以上,寫帶寬100GB/s以上,同時隨機讀IOPS達205萬,保證科研項目順利進行。存儲集群采用同一目錄命名空間,可以自動根據(jù)數(shù)據(jù)訪問在高速存儲及普通容量層中遷移,確保發(fā)揮更大性能。此外浪潮分布式并行文件存儲AS13000可提供文件、對象、塊、大數(shù)據(jù)等多種存儲服務,通過靈活的存儲協(xié)議選擇以及多種存儲協(xié)議之間的互通性滿足多領域科研項目課題的負載多樣性。
數(shù)據(jù)存儲集群具有高冗余模式,當某節(jié)點出現(xiàn)故障時,可以自動切換到備用節(jié)點上,科研平臺數(shù)據(jù)不會丟失,保證了數(shù)據(jù)安全性,設備類故障頻率降低,保障項目課題的持續(xù)運行。此外,中國科大考慮到科研平臺未來研究方向的增多及規(guī)模的增大,浪潮分布式并行文件存儲AS13000可以根據(jù)后期業(yè)務的增長,在線擴展新的節(jié)點,系統(tǒng)的性能和容量會隨著節(jié)點數(shù)量的增加線性增長,保護了科研項目的持續(xù)性研究。
2003年正式建成的中國科大校級計算平臺是學校六大公共實驗中心之一,也是國內高校最早的平臺之一。目前投入設備采購費用已超1.2億元,1300臺在使用中的服務器,提供總雙精度浮點5409萬億次/秒的計算能力,利用率超過80%。其中在2022年支持發(fā)表SCI論文464篇(包括Nature系列、Science系列、PRL、JACS、Cell等頂級期刊論文38篇),為前沿領域的科技創(chuàng)新提供數(shù)據(jù)與計算平臺,有效支撐了用戶取得顯著項目成果。
科技創(chuàng)新作為引領發(fā)展的第一動力,深刻應用和影響著人類的工作、生產(chǎn)、生活各個方面,從而提升生命健康水平,推動經(jīng)濟繁榮、造福人類。最為具有較強知識創(chuàng)新和技術創(chuàng)新能力的教育與科研基地,中國科大致力推動中國科技文化的發(fā)展,通過對于新技術、新設備的應用,為了給每一位師生提供優(yōu)質的計算和數(shù)據(jù)資源,為加速前沿科技研究打下堅實的基礎,幫助全人類更好認識自然、理解自然、改造自然,推動人類社會和文明不斷向前邁進。