omniture

"算儲兼?zhèn)?quot; 亞馬遜云科技可滿足醫(yī)療與生命科學行業(yè)的存儲需求

亞馬遜云科技
2023-08-18 13:09 3661

北京2023年8月18日 /美通社/ -- 早在16世紀,近代人體解剖學創(chuàng)始人安德烈·維薩里在其著作《人體結構》中首次描述了人體的骨骼、肌肉、血管和神經(jīng)的自然形態(tài)和分布。這一偉大成果使維薩里成為與哥白尼并列的兩大科學革命代表人物,也讓醫(yī)學和人體生物學從此擺脫中世紀神權桎梏,步入科學軌道。

以此為起點,醫(yī)學研究一路向著更微觀的世界挺近,在歷經(jīng)發(fā)明顯微鏡,發(fā)現(xiàn)細菌,發(fā)現(xiàn)抗生素等數(shù)個里程碑之后,來到了以基因圖譜和分子式為研究對象,將人工智能(AI)和機器學習(ML)作為研究工具的精準醫(yī)學時代。

相比于維薩里要靠盜尸來獲得研究"數(shù)據(jù)"的窘境,如今已游走于分子維度的精準醫(yī)學卻要應對數(shù)據(jù)爆炸帶來的難題。身處分秒不停的數(shù)據(jù)洪流之中,醫(yī)療與生命科學行業(yè)對IT基礎設施的核心需求之一就是以較低成本獲得龐大且可彈性擴縮的存儲空間。這種需求也開啟了醫(yī)療與生命科學行業(yè)數(shù)據(jù)的上云之旅。

亞馬遜云科技基于醫(yī)療與生命科學行業(yè)客戶的需求不斷創(chuàng)新,不但讓他們獲得云上高性價比的彈性存儲空間,并針對存儲服務不斷創(chuàng)新以支持他們大規(guī)模的數(shù)據(jù)計算,達成"存"與"用"的性能協(xié)同。

如何滿足醫(yī)療與生命科學行業(yè)海量數(shù)據(jù)的存儲需求,并降低存儲成本?

數(shù)據(jù)量的爆炸性增長在醫(yī)療與生命科學領域尤為顯著。例如在藥物發(fā)現(xiàn)領域,科學家已發(fā)現(xiàn)的自然界里有可能成為藥物分子的個數(shù)有1060之多,相比之下,整個太陽系原子個數(shù)也只是1050左右。即便是數(shù)據(jù)指數(shù)效應相對較弱的醫(yī)院和診所,在國內(nèi)也面對一年數(shù)十億人次診療所沉積的數(shù)字化檔案及醫(yī)學影像。

如何存儲海量數(shù)據(jù)并不斷降低存儲成本是醫(yī)療和生命科學領域亟需解決的一大挑戰(zhàn)。而無論從可靠性還是經(jīng)濟性,亞馬遜云科技的存儲服務都為醫(yī)療和生命科學機構存放海量數(shù)據(jù)提供了可靠的選擇。

其中,對象存儲服務Amazon Simple Storage Service (Amazon S3)設計具有99.999999999%(11個9)的持久性,具有安全、可擴展和按需付費等特性,可輕松完成PB至EB級數(shù)據(jù)的存儲。為了更經(jīng)濟、高效地存儲客戶的數(shù)據(jù),亞馬遜云科技持續(xù)對 Amazon S3進行創(chuàng)新。例如,Amazon S3的存儲層級多達8級,讓客戶可根據(jù)工作負載對數(shù)據(jù)訪問、恢復能力和成本等方面的需求來進行選擇;Amazon S3智能分層( Intelligent-Tiering )在不影響性能的前提下,能夠在數(shù)據(jù)訪問模式發(fā)生變化時自動節(jié)省存儲成本。自2018年推出 Amazon S3 Intelligent-Tiering 以來,客戶使用該功能已經(jīng)節(jié)省了 10 億美元。

醫(yī)療與生命科學行業(yè)大規(guī)模、高并發(fā)的數(shù)據(jù)計算需要高性能的存儲服務

海量數(shù)據(jù)為基因診斷、基因治療、靶向藥物研發(fā)等奠定了精準醫(yī)學發(fā)展的基礎,而大規(guī)模的數(shù)據(jù)計算則推進精準醫(yī)學的發(fā)展。例如單次數(shù)據(jù)分析所涉及的樣本數(shù)量可能超過數(shù)萬或數(shù)十萬,可能需調(diào)用底層成百上千甚至上萬個計算實例,這對存儲數(shù)據(jù)的存儲服務提出更高的數(shù)據(jù)吞吐性能要求。

為了確保存儲服務性能足以支持大規(guī)模、高并發(fā)計算集群的要求,亞馬遜云科技提供了一項完全托管式的文件存儲服務Amazon FSx for Lustre,為高性能計算工作負載提供經(jīng)濟高效、高性能且可擴展的支持。Amazon FSx for Lustre可將文件系統(tǒng)連接至多個Amazon S3存儲桶,無縫訪問Amazon S3中的數(shù)據(jù),優(yōu)化計算資源的吞吐量。同時Amazon FSx for Lustre與亞馬遜云科技的計算服務高度集成,可提供亞毫秒級延遲、高達每秒數(shù)百GB吞吐量和數(shù)百萬的IOPS,能夠同時給上千臺運行PB級數(shù)據(jù)復雜分析工作負載的計算實例提供支持,并且將分析結果的數(shù)據(jù)同步回寫至Amazon S3中。 

對于醫(yī)療與生命科學行業(yè)所涉及的大規(guī)模計算工作負載,Amazon FSx for Lustre相當于在對象存儲與計算集群之間加入了高性能緩存層,為存儲、計算兩端實現(xiàn)高效率的雙向數(shù)據(jù)同步;并且用戶無需在設置和管理Lustre文件系統(tǒng)上花費精力,就能夠獲得充足的算力支持和更短的計算周期,并節(jié)省人力與計算成本。

位于上海的腫瘤精準醫(yī)學企業(yè)桐樹基因,采用二代高通量測序技術進行腫瘤基因檢測,單個樣本可以產(chǎn)生108至109的短序列片段,每個序列片段又約是150個基因堿基長度,單個樣本的文件大小可達10GB到30GB。隨著業(yè)務發(fā)展和樣本量增長,桐樹基因選擇遷移至亞馬遜云科技以解決對存儲、I/O和算力的要求。此后,桐樹科技一方面獲得Amazon S3的高性價比存儲服務,另一方面也借助Amazon FSx for Lustre 為基因測序流程提供高性能共享文件存儲,使單個樣本分析時間縮短30-40分鐘,批量樣本分析整體用時較過去節(jié)省達三分之二。

亞馬遜云科技豐富的存儲服務,滿足醫(yī)療與生命科學行業(yè)的多樣化需求

在醫(yī)療與生命科學行業(yè),相對于初創(chuàng)企業(yè)從業(yè)務之初即原生上云,也有不少機構需要將本地數(shù)據(jù)存儲向云上遷移。對此,亞馬遜云科技不斷豐富"專門構建"的Amazon FSx文件存儲系列服務,幫助用戶在遷移時無需重構應用,就能繼續(xù)使用熟悉的文件管理系統(tǒng)。

除了Amazon FSx for Lustre,Amazon FSx文件存儲系列服務還包括Amazon FSx for Windows File Server,基于開源OpenZFS文件系統(tǒng)構建的Amazon FSx for OpenZFS,以及Amazon FSx for NetApp ONTAP。例如,對于使用NetApp ONTAP文件存儲在線下構建了自己的數(shù)據(jù)管理和應用的醫(yī)療與生命科學行業(yè)用戶。這些企業(yè)在數(shù)據(jù)存儲遷移上云時,可使用Amazon FSx for NetApp ONTAP,無需修改其應用和數(shù)據(jù)管理方式,即可將部署在本地數(shù)據(jù)中心的網(wǎng)絡文件存儲(NAS)設備上的應用遷移至亞馬遜云科技,繼續(xù)使用自己熟悉的方式在云端部署、管理應用和數(shù)據(jù),同時獲得FSx for NetApp ONTAP與亞馬遜云科技其它云服務之間的無縫集成。 

亞馬遜云科技安全的數(shù)據(jù)保護功能,助力醫(yī)療與生命科學行業(yè)快速創(chuàng)新

此外,亞馬遜云科技的所有存儲服務都具有多重安全功能,并已通過權威的國際和本地技術測評與認證,遵守嚴格的國際和本地合規(guī)原則。同時,亞馬遜云科技還提供豐富的數(shù)據(jù)保護功能,實現(xiàn)關鍵數(shù)據(jù)的備份、容災、一站式管理和快速恢復,包括對不同應用和數(shù)據(jù)源的一站式數(shù)據(jù)備份,跨區(qū)域遠程復制服務,以及多種數(shù)據(jù)快速恢復功能。亞馬遜云科技安全及豐富的數(shù)據(jù)保護功能,讓醫(yī)療與生命科學客戶可以更輕松滿足行業(yè)本身更高的安全與合規(guī)要求,將精力聚焦于業(yè)務創(chuàng)新上。

借助亞馬遜云科技提供的存儲服務,醫(yī)療與生命科學行業(yè)客戶無論是海量數(shù)據(jù)存儲,還是進行基因研究、藥物分子篩選等大規(guī)模的數(shù)據(jù)計算,都能獲得更優(yōu)成本、卓越性能,以及滿足細分場景需求的多樣化解決方案,快速驅動業(yè)務的創(chuàng)新發(fā)展。

消息來源:亞馬遜云科技
China-PRNewsire-300-300.png
醫(yī)藥健聞
微信公眾號“醫(yī)藥健聞”發(fā)布全球制藥、醫(yī)療、大健康企業(yè)最新的經(jīng)營動態(tài)。掃描二維碼,立即訂閱!
collection