天津2023年3月28日 /美通社/ -- 2023年3月28日,中國科學(xué)院天津工業(yè)生物技術(shù)研究所(以下簡稱天津工業(yè)生物所)與亞馬遜云科技聯(lián)合在天津舉辦"生物計(jì)算設(shè)計(jì)"溝通會,就BT+IT結(jié)合助力合成生物學(xué)發(fā)展的現(xiàn)狀和未來進(jìn)行溝通交流。
天津工業(yè)生物所是中國合成生物學(xué)領(lǐng)域的核心力量,由中國科學(xué)院和天津市人民政府共建,牽頭組織承擔(dān)了多項(xiàng)合成生物學(xué)、綠色生物制造等重點(diǎn)研發(fā)計(jì)劃任務(wù)。2019年,天津工業(yè)生物所成立了生物設(shè)計(jì)中心平臺實(shí)驗(yàn)室,并圍繞生物計(jì)算設(shè)計(jì),開始與亞馬遜云科技共同探索生物技術(shù)和信息技術(shù)相結(jié)合(BT+IT)技術(shù)體系,以進(jìn)一步推動合成生物學(xué)發(fā)展,以期能夠?yàn)樵诮】怠⒛茉?、農(nóng)業(yè)和環(huán)境等領(lǐng)域的重大突破提供技術(shù)支撐。至今已推出了全球首個(gè)基于圖數(shù)據(jù)庫的大腸桿菌調(diào)控代謝關(guān)系知識圖譜ERMer和全流程高通量編輯序列設(shè)計(jì)云平臺AutoESD等20多項(xiàng)生物計(jì)算設(shè)計(jì)工具和軟件應(yīng)用。云原生的開發(fā)方式較傳統(tǒng)方式大幅縮短開發(fā)時(shí)間,總體運(yùn)行成本大幅降低,使得團(tuán)隊(duì)可以專注于業(yè)務(wù)代碼和創(chuàng)新。
圖數(shù)據(jù)庫助力構(gòu)建專業(yè)大腸桿菌調(diào)控代謝知識圖譜,提升科研效率
細(xì)胞中的代謝調(diào)控非常復(fù)雜,一個(gè)特定的細(xì)胞功能往往由一系列不同類型的代謝途徑調(diào)控相互作用決定。通常不同類型的調(diào)控?cái)?shù)據(jù)散落在各個(gè)不同的數(shù)據(jù)庫,生物學(xué)家很難通過僅關(guān)注與所研究的代謝物/蛋白質(zhì)密切相關(guān)的一兩類相互作用來識別這種復(fù)雜調(diào)控級聯(lián)關(guān)系。因此,將這些不同類型的調(diào)控相互作用匯集在一起,并提供方便的交互方式,將極大的方便生物學(xué)家挖掘和理解生物體內(nèi)的復(fù)雜調(diào)控關(guān)系。天津工業(yè)生物所生物設(shè)計(jì)中心團(tuán)隊(duì)聯(lián)合亞馬遜云科技團(tuán)隊(duì)在計(jì)算生物學(xué)國際期刊Nucleic Acids Research上發(fā)表文章,發(fā)布了全球首個(gè)基于圖數(shù)據(jù)庫Amazon Neptune的大腸桿菌調(diào)控代謝關(guān)系知識圖譜ERMer,首次提供了全局的代謝調(diào)控圖譜,并通過可視化框架實(shí)現(xiàn)了豐富的搜索功能,如多步查詢、最短路徑查詢等。ERMer采用專門為高度關(guān)聯(lián)的復(fù)雜數(shù)據(jù)集的高效存儲和查詢設(shè)計(jì)圖數(shù)據(jù)庫架構(gòu),這打破了傳統(tǒng)的低效數(shù)據(jù)檢索方式,有效增強(qiáng)用戶和圖譜的人機(jī)交互,大大降低了使用門檻。
為充分發(fā)揮知識圖譜的價(jià)值,生物設(shè)計(jì)中心團(tuán)隊(duì)還進(jìn)一步采用基于圖神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行推理,成功實(shí)現(xiàn)了轉(zhuǎn)錄因子預(yù)測和轉(zhuǎn)錄因子靶點(diǎn)預(yù)測等功能,這將有助于挖掘潛在的關(guān)鍵調(diào)控因子和調(diào)控靶點(diǎn),構(gòu)建新的調(diào)控代謝網(wǎng)絡(luò),能夠?yàn)檠芯咳藛T提供新的思路和方向。
云原生Serverless應(yīng)用架構(gòu)加速生物計(jì)算設(shè)計(jì)工具研發(fā)
模塊化、標(biāo)準(zhǔn)化,是所有工程學(xué)科的基礎(chǔ),也是合成生物學(xué)區(qū)別于傳統(tǒng)發(fā)酵行業(yè)的革命。工程學(xué)的可控性,意味著其將能夠與各種軟硬件進(jìn)行結(jié)合,從而走向自動化與高通量,擺脫過往勞動密集型的研究模式,獲得更高的技術(shù)迭代能力。而對于這個(gè)過程,除了針對元件工具以外,將合成生物學(xué)的相關(guān)實(shí)驗(yàn)流程進(jìn)行模塊化、標(biāo)準(zhǔn)化,也是自動化研究當(dāng)中不可或缺的一環(huán)。面向微生物遺傳操作,天津工業(yè)生物所生物設(shè)計(jì)中心團(tuán)隊(duì)開發(fā)得到了第一個(gè)能夠在所有操作類型、任何基因組位點(diǎn)和跨物種上進(jìn)行精確、自動化和高通量編輯序列設(shè)計(jì)的云平臺AutoESD。AutoESD 的開發(fā)采用了基于云端的無服務(wù)器架構(gòu),確保了高可靠性、穩(wěn)健性和可擴(kuò)展性,能夠在幾分鐘內(nèi)并行處理包含上千個(gè)編輯序列設(shè)計(jì)目標(biāo)的數(shù)百個(gè)設(shè)計(jì)任務(wù)。開發(fā)人員利用Amazon Step Functions實(shí)現(xiàn)可視化的工作流管理,實(shí)現(xiàn)了編輯序列設(shè)計(jì)工作流的串聯(lián),從而實(shí)現(xiàn)應(yīng)用的快速構(gòu)建和更新,同時(shí)快速查詢處理異常任務(wù);利用Amazon Lambda無服務(wù)計(jì)算將不同的引物設(shè)計(jì)、同源臂設(shè)計(jì)等編輯序列設(shè)計(jì)模塊封裝打包,滿足了具體功能的模塊化開發(fā)要求,并方便地對功能模塊進(jìn)行管理和共享;利用Amazon DynamoDB提供毫秒級的動態(tài)資源響應(yīng)性能,并自動擴(kuò)展所需資源以應(yīng)對增加的業(yè)務(wù)需求。這些Serverless服務(wù)幫助天津工業(yè)生物所團(tuán)隊(duì)進(jìn)一步簡化運(yùn)維,使得開發(fā)人員可以專注于業(yè)務(wù)代碼和創(chuàng)新,與傳統(tǒng)開發(fā)方式相比,開發(fā)時(shí)間縮短了75%,總體擁有成本降低高達(dá)50%。
未來,天津工業(yè)生物所團(tuán)隊(duì)希望基于亞馬遜云科技先進(jìn)的服務(wù)技術(shù)和能力,開展更多"BT+IT"的研發(fā)工作,進(jìn)一步助力研究所在合成生物領(lǐng)域的科研探索。此外,也期望通過亞馬遜云科技的全球科研領(lǐng)域輻射能力,提升天津工業(yè)生物所生物計(jì)算設(shè)計(jì)方面的國際影響力,為世界各國的合成生物學(xué)科研工作者提供優(yōu)質(zhì)服務(wù)。
天津工業(yè)生物所生物設(shè)計(jì)中心主任馬紅武表示:"中國科學(xué)院天津工業(yè)生物技術(shù)研究所肩負(fù)著國家工業(yè)生物技術(shù)發(fā)展的重任,并正在加速利用云計(jì)算推動相關(guān)技術(shù)的研發(fā)和成果落地。亞馬遜云科技提供的圖數(shù)據(jù)庫和Serverless服務(wù),突破傳統(tǒng)的開發(fā)模式、提升研發(fā)效率、不斷優(yōu)化云上成本,生物技術(shù)和信息技術(shù)相結(jié)合的技術(shù)體系將進(jìn)一步推動合成生物領(lǐng)域的發(fā)展和創(chuàng)新。"
亞馬遜云科技中國區(qū)商用與公共市場事業(yè)部總經(jīng)理李曉芒表示:"亞馬遜云科技為全球數(shù)千家生命科學(xué)領(lǐng)域客戶提供云服務(wù)和行業(yè)解決方案,助力從實(shí)驗(yàn)室到真實(shí)世界,全面加速生命科學(xué)數(shù)字化創(chuàng)新。我們很高興能夠與天津工業(yè)生物所一道,通過云技術(shù)和深厚的行業(yè)實(shí)踐推動合成生物學(xué)領(lǐng)域的技術(shù)進(jìn)步,開拓生物制造產(chǎn)業(yè)的數(shù)字化創(chuàng)新路徑。"