深圳2022年12月30日 /美通社/ -- 近日,暨南大學(xué)、華南理工大學(xué)團(tuán)隊(duì)發(fā)表論文Towards an accurate and robust analysis pipeline for somatic mutation calling,比較了突變檢測(cè)算法在癌癥領(lǐng)域常見(jiàn)的低頻突變標(biāo)準(zhǔn)測(cè)試數(shù)據(jù)集上的性能,發(fā)現(xiàn)國(guó)產(chǎn)FANSe算法的檢測(cè)效果遠(yuǎn)勝于國(guó)際上常用的算法,速度還要快上幾十倍。這將為癌癥診療等應(yīng)用提供重要的標(biāo)準(zhǔn)化依據(jù)。
癌癥的診斷、分型、治療中,突變檢測(cè)是重要手段。特定的突變對(duì)應(yīng)著相應(yīng)的治療方案,尤其是近年來(lái)火爆的靶向治療和免疫治療,均高度依賴突變檢測(cè)的結(jié)果。因此突變檢測(cè)的靈敏度和準(zhǔn)確性在癌癥的診療中十分關(guān)鍵。用二代測(cè)序手段進(jìn)行全基因組級(jí)別的突變檢測(cè)一直被視為癌癥診療的“通用武器”,但市場(chǎng)上的現(xiàn)實(shí)狀況卻是亂象不止。不少人都有過(guò)體會(huì),將同一份樣品送到兩家公司去進(jìn)行檢測(cè),得到的兩份突變檢測(cè)報(bào)告卻大相徑庭。事實(shí)上,這是一個(gè)國(guó)際性的難題。2017年,JAMA Oncology雜志發(fā)表研究,將40個(gè)患者的ctDNA樣品送至兩家國(guó)際知名的測(cè)序公司,大部分患者得到的兩份突變檢測(cè)報(bào)告中的突變完全不同。醫(yī)生很難從這樣兩份充滿著矛盾和沖突的報(bào)告中制定正確的治療方案,看似“先進(jìn)”的二代測(cè)序技術(shù)卻往往帶來(lái)悲劇。在實(shí)驗(yàn)和儀器早已高度標(biāo)準(zhǔn)化的情況下,主要的問(wèn)題在于算法的準(zhǔn)確性。使用標(biāo)準(zhǔn)樣品進(jìn)行的室間質(zhì)評(píng)一直是監(jiān)管部門(mén)使用的質(zhì)控方法,但對(duì)基因組級(jí)別的檢測(cè),標(biāo)準(zhǔn)樣品難以制備:人工方法做幾個(gè)突變出來(lái)還可以,但整個(gè)基因組的突變狀況要想給出可靠的標(biāo)準(zhǔn)答案非常難以做到。也因此,長(zhǎng)期以來(lái)整個(gè)市場(chǎng)無(wú)法得到有效監(jiān)管。
2020年,華南理工大學(xué)杜紅麗教授團(tuán)隊(duì)使用多個(gè)真實(shí)世界的測(cè)序數(shù)據(jù)集,制作了一系列基因組級(jí)別的低頻突變標(biāo)準(zhǔn)測(cè)試數(shù)據(jù)集,這是世界上第一個(gè)接近真實(shí)癌癥測(cè)序應(yīng)用場(chǎng)景、并有明確“標(biāo)準(zhǔn)答案”的突變檢測(cè)評(píng)測(cè)數(shù)據(jù)集,可以客觀真實(shí)地反映突變檢測(cè)流程的能力。此次研究中,研究者們利用這一系列標(biāo)準(zhǔn)測(cè)試數(shù)據(jù)集評(píng)測(cè)了5種突變檢測(cè)流程,包括唯一的純國(guó)產(chǎn)自主開(kāi)發(fā)的FANSe流程和國(guó)際上的4種主流突變檢測(cè)算法。測(cè)試結(jié)果顯示,所有算法能檢出的突變基本99%以上都是正確的,即“假陽(yáng)性”較少,但靈敏度則有巨大的差異。在所有場(chǎng)景下(突變頻率1-40%,測(cè)序深度100-800x),F(xiàn)ANSe的靈敏度都顯著超越其他所有算法,即FANSe能檢出更多的突變,同時(shí)保持很高的準(zhǔn)確度。即便是1%突變率下,F(xiàn)ANSe也可以正確檢出87%的突變,而此時(shí)Mutect2和Strelka2僅能檢出20%左右的突變。突變率5%時(shí),F(xiàn)ANSe即可幾乎完美地檢出所有的突變。速度方面更是一騎絕塵,無(wú)論是序列比對(duì)(mapping)過(guò)程還是突變檢測(cè)過(guò)程,均比其他流程快上數(shù)量級(jí)。
FANSe算法由承啟首席科學(xué)家張弓教授開(kāi)發(fā),最初是專門(mén)用于大規(guī)模測(cè)序的序列比對(duì),其準(zhǔn)確度有數(shù)學(xué)證明,并已基本達(dá)到理論上限。隨后逐漸擴(kuò)展其應(yīng)用領(lǐng)域,目前已直接整合了快速的突變檢測(cè)和表達(dá)量檢測(cè)等常用分析,部署于承啟生物的云平臺(tái)上。2020年,承啟生物云平臺(tái)創(chuàng)造了單機(jī)5分鐘分析完成一個(gè)人全基因組測(cè)序數(shù)據(jù)集的世界紀(jì)錄并保持至今,用戶不再需要自己購(gòu)買昂貴的服務(wù)器,只需要上傳數(shù)據(jù)即可享受免費(fèi)、快速準(zhǔn)確的基因測(cè)序分析服務(wù)。2022年,以FANSe為基礎(chǔ)的大規(guī)模測(cè)序云分析系統(tǒng)在AWS上部署成功,全世界的用戶都可以在數(shù)據(jù)不出境的前提下使用FANSe快速準(zhǔn)確的分析。FANSe極高的效率也使得其成為唯一一種在純國(guó)產(chǎn)CPU上能達(dá)到應(yīng)用上可接受的速度的分析流程,使得基因測(cè)序的全流程完全脫離國(guó)外技術(shù),徹底避免“卡脖子”,保障中國(guó)精準(zhǔn)醫(yī)學(xué)的安全。
此次FANSe被確認(rèn)可以準(zhǔn)確全面地檢測(cè)癌癥突變,將為癌癥診療等應(yīng)用提供重要的標(biāo)準(zhǔn)化依據(jù),也為行業(yè)樹(shù)立了一個(gè)新的標(biāo)桿。