深圳2020年6月18日 /美通社/ -- 近日,深圳承啟生物科技有限公司(以下簡(jiǎn)稱(chēng)“承啟生物”)利用自主研發(fā)的云平臺(tái)Chi-Cloud及高精度算法FANSe3,實(shí)現(xiàn)了單機(jī)5分鐘分析完成一個(gè)全基因組數(shù)據(jù)集。這使得基因檢測(cè)結(jié)果向“立等可取”、“又快又準(zhǔn)”邁進(jìn)了一大步,大力推進(jìn)了精準(zhǔn)醫(yī)學(xué)的普及落地。
5分鐘,不僅僅是速度
單機(jī)5分鐘解碼全基因組究竟意味著什么?
在臨床上,醫(yī)生往往是和死神賽跑,時(shí)間就是生命。從“天”到“分鐘”的速度飛躍,或許就是“生死之別”。對(duì)患者來(lái)說(shuō),尤其是重癥患者,都會(huì)希望能夠指導(dǎo)治療方案的基因檢測(cè)分析結(jié)果,能出得越快越好。而除了出結(jié)果的速度,基因檢測(cè)高昂的價(jià)格也是阻礙精準(zhǔn)醫(yī)學(xué)應(yīng)用的關(guān)鍵因素之一,在測(cè)序?qū)嶒?yàn)成本不斷降低的情況下,分析成本逐漸成為了精準(zhǔn)醫(yī)學(xué)檢驗(yàn)流程中的主要成本板塊。
龐大數(shù)據(jù)分析,壁壘重重
當(dāng)測(cè)序儀運(yùn)行速度越來(lái)越快,測(cè)定全基因組只需要1天的時(shí)候,人們發(fā)現(xiàn)分析成為了新的瓶頸。從原始數(shù)據(jù)到分析出基因突變,用服務(wù)器通常要幾十個(gè)小時(shí)才能計(jì)算完成。即便使用大規(guī)模的超算集群、輔以FPGA等專(zhuān)用硬件加速的方案,多數(shù)也需數(shù)小時(shí),并且要付出成本高昂、不易擴(kuò)展和改進(jìn)的代價(jià)。當(dāng)然,亞馬遜、阿里云等云服務(wù)廠商也曾經(jīng)試驗(yàn)過(guò)同時(shí)采用超多高性能節(jié)點(diǎn)進(jìn)行極限挑戰(zhàn),將單任務(wù)處理時(shí)間壓縮到了15-30分鐘,但在目前的云服務(wù)定價(jià)體系下,這樣處理能力的系統(tǒng)連續(xù)運(yùn)行一年所需要的費(fèi)用可達(dá)數(shù)百萬(wàn)元甚至更高 -- 這也正是諸多超級(jí)計(jì)算機(jī)雖世界排名前列,但無(wú)法對(duì)單個(gè)普通民眾提供高性?xún)r(jià)比服務(wù)的原因。同時(shí),數(shù)據(jù)傳輸費(fèi)用也是傳統(tǒng)云服務(wù)商的一大筆開(kāi)銷(xiāo)。
自主創(chuàng)新,突破“不可能挑戰(zhàn)”
由于算法原理的限制,目前常用的國(guó)外算法若要保持一定精度,則在速度上已難有質(zhì)的突破。因此,為了能在保證精準(zhǔn)的前提下達(dá)到速度突破,承啟生物團(tuán)隊(duì)拋開(kāi)傳統(tǒng)算法的框架,自主研發(fā)了底層算法FANSe系列算法,這是目前國(guó)內(nèi)唯一規(guī)?;逃玫娜灾髦R(shí)產(chǎn)權(quán)的高性能測(cè)序比對(duì)算法,其準(zhǔn)確度在各種實(shí)測(cè)中大幅度領(lǐng)先國(guó)外算法。2017年,承啟生物基于FANSe3開(kāi)發(fā)的新一代私有云平臺(tái)Chi-Cloud,就實(shí)現(xiàn)了全轉(zhuǎn)錄組測(cè)序數(shù)據(jù)的秒級(jí)分析,并發(fā)表在英國(guó)著名的權(quán)威學(xué)術(shù)期刊《核酸研究》上。2018年,承啟生物更是創(chuàng)下了“1分鐘解碼2萬(wàn)個(gè)基因信息(全外顯子組)”的世界紀(jì)錄。
近年來(lái),隨著醫(yī)學(xué)和遺傳學(xué)的進(jìn)展,越來(lái)越多的疾病被發(fā)現(xiàn)與外顯子區(qū)段以外的部分高度相關(guān),因而全基因組測(cè)序分析的需求日益增長(zhǎng)。經(jīng)過(guò)承啟生物技術(shù)團(tuán)隊(duì)不懈的改良優(yōu)化,對(duì)數(shù)據(jù)量擴(kuò)大了50倍不止的人全基因組測(cè)序數(shù)據(jù),現(xiàn)在也實(shí)現(xiàn)了單機(jī)5分鐘左右得到完整分析結(jié)果的“立等可取”的分析速度。
更值得一提的是,達(dá)到這個(gè)速度,承啟生物并沒(méi)有動(dòng)用大型服務(wù)器,只是使用了一臺(tái)高端的家用電腦。所有運(yùn)算只使用CPU,無(wú)需任何GPU、FPGA等專(zhuān)用硬件加速。這意味著基因組測(cè)序基礎(chǔ)分析的成本已達(dá)到了幾乎忽略不計(jì)的程度。在對(duì)數(shù)據(jù)保密性有高要求的一些特殊領(lǐng)域(如軍事、公共安全、特定的醫(yī)療場(chǎng)景等),可直接采用這種單機(jī)分析的方式,而無(wú)需采購(gòu)和維護(hù)大型計(jì)算集群,無(wú)需連接到互聯(lián)網(wǎng)。自主研發(fā)、不依賴(lài)專(zhuān)用硬件的特性使得各種功能增加與改進(jìn)十分方便,可擴(kuò)展性強(qiáng),且不會(huì)受制于特定硬件平臺(tái),從根本上避免了芯片禁運(yùn)導(dǎo)致的風(fēng)險(xiǎn)。同時(shí),該云平臺(tái)兼容目前國(guó)內(nèi)外所有主流測(cè)序儀,并針對(duì)國(guó)產(chǎn)測(cè)序儀進(jìn)行了特別適配和優(yōu)化,有力地保障了精準(zhǔn)醫(yī)學(xué)的國(guó)家安全。
立等可取,精準(zhǔn)醫(yī)學(xué)近在眼前
超高速、低成本的分析及更精確的結(jié)果解讀,基因檢測(cè)即將迎來(lái)立等可取的廣泛應(yīng)用場(chǎng)景,也將對(duì)整個(gè)行業(yè)的發(fā)展提供有力支撐。對(duì)研究人員而言,可更高效地分析基因組數(shù)據(jù),大力推動(dòng)精準(zhǔn)醫(yī)學(xué)、藥物研發(fā)和疾病治療等領(lǐng)域加速發(fā)展。對(duì)百姓而言,以前緩慢昂貴的精準(zhǔn)醫(yī)學(xué)檢測(cè)將變得更快速、實(shí)惠,診斷和治療將更有效、便宜;尤其是情況危急的病患,快速準(zhǔn)確的基因組分析能在第一時(shí)間幫助醫(yī)生快速診斷和制定最佳治療方案,將拯救更多生命。