omniture

浪潮存儲助力復(fù)旦大學(xué)類腦研究院基因測序研究 加速多尺度腦庫建設(shè)

2022-07-27 15:08 5335

北京2022年7月27日 /美通社/ -- 大腦包含上百億神經(jīng)元,是人體身上最重要和最復(fù)雜的器官,復(fù)雜性遠遠超出了我們當前的認識能力。腦科學(xué)研究不僅是全球科技的前沿領(lǐng)域,也是理解人類本身的終極目標。為了加快了腦科學(xué)研究的步伐,"腦科學(xué)與類腦研究" 于2016年正式啟動,吸引了眾多頂尖科學(xué)家投身其中。以探索大腦秘密、攻克大腦疾病為導(dǎo)向的腦科學(xué)研究,以及以建立和發(fā)展人工智能技術(shù)為導(dǎo)向的類腦研究開啟了新的征程。作為國內(nèi)高校最早成立的腦科學(xué)與類腦前沿交叉研究機構(gòu)之一,復(fù)旦大學(xué)類腦人工智能科學(xué)與技術(shù)研究院(簡稱類腦研究院),面向腦與類腦重大科技前沿,依托學(xué)科優(yōu)勢,借助領(lǐng)先的計算、數(shù)據(jù)平臺,致力于在類腦人工智能算法、重大腦疾病智能診療等領(lǐng)域創(chuàng)新,引領(lǐng)腦科學(xué)、人工智能與產(chǎn)業(yè)應(yīng)用的融合,實現(xiàn)未來智能產(chǎn)業(yè)技術(shù)創(chuàng)新。


為了建成世界一流的腦與類腦前沿研究和科技創(chuàng)新機構(gòu),加速腦科學(xué)與類腦研究進程,復(fù)旦大學(xué)類腦研究院需要采用多維度、高精度的設(shè)備進行科研數(shù)據(jù)的采集、傳輸、使用。類腦研究設(shè)備涉及腦成像平臺、磁共振成像設(shè)備系統(tǒng)、多臺近紅外光、腦電、腦磁圖等實時腦功能監(jiān)測系統(tǒng),以及直流電刺激、經(jīng)顱磁刺激、超聲腦刺激等腦調(diào)控系統(tǒng)。認知神經(jīng)科學(xué)平臺擁有光學(xué)腦成像設(shè)備及認知行為解析設(shè)備,這些設(shè)備進行科學(xué)研究時產(chǎn)生了大量影像數(shù)據(jù)。在組建人腦大數(shù)據(jù)庫的科研項目中,復(fù)旦大學(xué)類腦研究院利用各種無創(chuàng)手段,以基因測序為主,對抑郁癥、精神分裂癥、健康人等不同類型的人群,并發(fā)采集其環(huán)境、行為、遺傳、腦影像、神經(jīng)等千萬級小文件數(shù)據(jù)信息,推動重大腦疾病如抑郁癥、精神分裂癥、自閉癥和物質(zhì)濫用的病根構(gòu)建并預(yù)測人腦的創(chuàng)造性、幸福感和毅力等各種宏觀指標,這對整個大平臺的數(shù)據(jù)基礎(chǔ)設(shè)施有著比較大的挑戰(zhàn)和要求。

首先是對數(shù)據(jù)容量的要求:研究院部署較早的傳統(tǒng)存儲擴展能力受限制,且配置6TB及以上大容量硬盤采用RAID 6、RAID 10,空間利用率小于50%,在容量利用方面存在巨大提升空間。

其次是要有穩(wěn)定的性能支撐:基因測序的生產(chǎn)過程是一個超高并發(fā)的文件轉(zhuǎn)換過程,整個生產(chǎn)過程有非常密集的文件讀取和寫入。一個完整的基因測序樣本會產(chǎn)生千萬量級的文件,通過測序儀、分析儀等儀器獲得包含原始基因序列堿基對的文件,大小大約幾十GB。整個生物樣本的導(dǎo)入過程對文件存儲的性能有著極高的要求,滿足不同科研任務(wù)對不同文件高帶寬的存儲需求,既要文件系統(tǒng)必須提供超大文件數(shù)量的支持,同時必須在有限的時間內(nèi)完成海量小文件的導(dǎo)入。

最后需要對設(shè)備和用戶的進行高效和精準管理:一是用戶層次多,類腦研究院擁有從本科生至博士生,以及各類研究員的使用者;在研究的過程中類腦研究院的教授、研究員及學(xué)生需要設(shè)置不同的級別,以防止重要數(shù)據(jù)的誤操作;二是多臺設(shè)備的使用,使得故障點隱患增加,管理及配置難以統(tǒng)一化,運維壓力較大。

浪潮存儲,助力類腦研究基礎(chǔ)平臺建設(shè)

針對全腦網(wǎng)絡(luò)可視化研究場景及相關(guān)需求,復(fù)旦大學(xué)類腦研究院采用了浪潮提供的專業(yè)化的存儲解決方案。


復(fù)旦大學(xué)類腦研究院采用浪潮分布式存儲AS13000,可按需提供文件、對象、塊、大數(shù)據(jù)等多種服務(wù),采用8+2糾刪碼策略提供了3PB容量空間,空間利用率達到80%;方案統(tǒng)一化管理,降低多套設(shè)備部署和維護的復(fù)雜度,允許集群內(nèi)同時故障2個節(jié)點,業(yè)務(wù)不中斷,數(shù)據(jù)不丟失,保障了業(yè)務(wù)連續(xù)性。

浪潮存儲通過對象聚合技術(shù),提升單次落盤的對象大小,降低落盤操作次數(shù),單節(jié)點恒定聚合帶寬達2GB/s以上,確?;驕y序的連續(xù)性。

針對高校多個學(xué)科與多個課題組共享、使用、管理數(shù)據(jù)會產(chǎn)生多份數(shù)據(jù),浪潮存儲為復(fù)旦大學(xué)定制了軟拷貝功能,在元數(shù)據(jù)索引上做變更,用戶視角是多份不同的文件,但底層則是共同的存儲空間,實現(xiàn)多份數(shù)據(jù)極速拷貝和使用,還大幅降低了存儲容量開銷和管理成本,讓數(shù)據(jù)共享、使用變得更加高效。浪潮存儲平臺還通過部署增強ACL,支持讀、寫、執(zhí)行、可視、刪除,滿足對不同用戶的精細權(quán)限控制:保證研究員、學(xué)生和管理者等不同用戶對數(shù)據(jù)的訪問和存儲有不同的權(quán)限,有效防止誤操作。

復(fù)旦大學(xué)類腦研究院下設(shè)的生物醫(yī)學(xué)大數(shù)據(jù)中心---張江國際腦庫(ZIB),不斷加強高性能計算與存儲能力建設(shè),目前擁有6個隊列、15000例被試、30 PB存儲、1005 份問卷,形成了國內(nèi)領(lǐng)先的生物大數(shù)據(jù)、云計算平臺。預(yù)計到2023年,張江國際腦庫將圍繞精神分裂癥、抑郁癥、自閉癥、腦卒中、神經(jīng)退行性疾病以及正常人群的六個隊列建設(shè),完成環(huán)境、行為、遺傳、腦影像、神經(jīng)5-O尺度等全維度數(shù)據(jù)采集,建成全球最大規(guī)模的全維度腦數(shù)據(jù)庫和算法中心,服務(wù)腦科學(xué)基礎(chǔ)研究、腦疾病臨床診療與類腦智能新興產(chǎn)業(yè)的發(fā)展。

同時該機構(gòu)還將與全球主流生物數(shù)據(jù)庫建立合作共享機制,推動構(gòu)建全球頂級規(guī)模的全維度腦數(shù)據(jù)庫和算法中心。無論是腦科學(xué)還是類腦研究,對提升未來中國科技整體智慧水平、提高經(jīng)濟發(fā)展質(zhì)量、促進人類的生產(chǎn)生活方式的轉(zhuǎn)變均意義重大。

消息來源:浪潮信息
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection