北京2018年6月14日電 /美通社/ -- 在近日舉行的英特爾人工智能開發(fā)者大會(huì)上,英特爾公司全球副總裁兼人工智能產(chǎn)品事業(yè)部總經(jīng)理Naveen Rao提到,英特爾正在與諾華合作,利用深度神經(jīng)網(wǎng)絡(luò)來(lái)加速高內(nèi)涵篩選 -- 這是早期藥品研發(fā)的關(guān)鍵因素。雙方的合作把訓(xùn)練圖片分析模型的時(shí)間從11個(gè)小時(shí)縮短到了31分鐘 -- 改善了20多倍1。
細(xì)胞表型的高內(nèi)涵篩選是支持早期藥品研發(fā)的關(guān)鍵工具,“高內(nèi)涵”一詞是指利用傳統(tǒng)圖像處理技術(shù)從圖像中提取的豐富數(shù)據(jù)集,這些數(shù)據(jù)集由數(shù)千個(gè)預(yù)定義特性(如大小、形狀、肌理等)構(gòu)成。通過(guò)高內(nèi)涵篩選可以分析顯微鏡圖像,進(jìn)而研究數(shù)千種基因或化學(xué)治療方法對(duì)不同細(xì)胞的培養(yǎng)效果。
深度學(xué)習(xí)有望做到的是從數(shù)據(jù)中“自動(dòng)”學(xué)習(xí)如何通過(guò)相關(guān)圖像特征將一種治療方法與另一種治療方法區(qū)分開。英特爾與諾華的生物學(xué)家和數(shù)據(jù)科學(xué)家希望通過(guò)利用深度神經(jīng)網(wǎng)絡(luò)加速技術(shù),提高高內(nèi)涵圖像篩選的速度。在雙方的合作中,團(tuán)隊(duì)并非通過(guò)獨(dú)立的步驟鑒別出圖像中的各個(gè)細(xì)胞,而是聚焦于完整的顯微鏡圖像,但完整的顯微鏡圖像遠(yuǎn)遠(yuǎn)大于深度學(xué)習(xí)數(shù)據(jù)集里的圖像,例如英特爾與諾華合作評(píng)估中使用的圖片就比典型的動(dòng)物、物體和場(chǎng)景數(shù)據(jù)集ImageNet*中的圖像大26倍以上。
深度卷積神經(jīng)網(wǎng)絡(luò)模型在分析顯微鏡圖像時(shí)可同時(shí)分析一張圖像中的幾百萬(wàn)個(gè)像素或者一個(gè)模型中的幾百萬(wàn)個(gè)參數(shù),甚至還能同時(shí)分析數(shù)千個(gè)訓(xùn)練圖像,這些構(gòu)成了很高的計(jì)算工作量,即使采用先進(jìn)的計(jì)算性能也無(wú)法有足夠時(shí)間對(duì)DNN模型展開深入研究。為了解決這一挑戰(zhàn),英特爾聯(lián)手諾華利用深度神經(jīng)網(wǎng)絡(luò)加速技術(shù)處理多個(gè)圖像,大大縮減了時(shí)間并提高工作效率,同時(shí)讓模型從圖像特性中獲得更加豐富的洞察。具體講就是通過(guò)使用Broad Bioimage Benchmark Collection* 021 (BBBC-021) 數(shù)據(jù)集,英特爾與諾華合作團(tuán)隊(duì)將總處理時(shí)間縮短至31分鐘,準(zhǔn)確率超過(guò)99%;利用深度學(xué)習(xí)訓(xùn)練中的數(shù)據(jù)并行性原則,并充分依靠服務(wù)器平臺(tái)上的大存儲(chǔ)支持,通過(guò)了32個(gè)TensorFlow* workers,實(shí)現(xiàn)了每秒處理120個(gè)3.9兆像素圖像的成果。
與諾華的合作,是英特爾通過(guò)企業(yè)級(jí)的解決方案為人工智能的應(yīng)用與企業(yè)部署提供最廣泛的計(jì)算力合作案例之一。在未來(lái),雖然監(jiān)督學(xué)習(xí)對(duì)于加快圖像分類、縮短獲得洞察的時(shí)間至關(guān)重要,但卻仍需要依賴大量專家標(biāo)記的數(shù)據(jù)集來(lái)訓(xùn)練模型,建立此類數(shù)據(jù)集所需的時(shí)間和工作量往往超出現(xiàn)實(shí)條件。無(wú)監(jiān)督學(xué)習(xí)或許可以應(yīng)用于無(wú)標(biāo)記的顯微鏡圖像,有望在細(xì)胞生物學(xué)領(lǐng)域發(fā)現(xiàn)新洞察,有助于人類藥物研發(fā)的進(jìn)一步發(fā)展。
1 20倍是通過(guò)從單節(jié)點(diǎn)系統(tǒng)擴(kuò)展到8插槽集群實(shí)現(xiàn)的21.7倍速度提升。
8插槽集群節(jié)點(diǎn)配置:CPU:英特爾®至強(qiáng)® 6148處理器(2.4GHz);核心數(shù):40;插槽數(shù):2;超線程:?jiǎn)⒂茫粌?nèi)存/節(jié)點(diǎn):192GB,2666MHz;網(wǎng)卡:英特爾® Omni-Path Host Fabric Interface (英特爾® OP HFI);TensorFlow:v1.7.0;Horovod:0.12.1;OpenMPI:3.0.0;集群:ToR Switch:英特爾® Omni-Path Switch
單節(jié)點(diǎn)配置:CPU:英特爾®至強(qiáng)®融核處理器7290F;192GB DDR4 RAM;1x 1.6TB 英特爾® SSD DC S3610系列SC2BX016T4;1x 480GB 英特爾® SSD DC S3520系列SC2BB480G7;英特爾® MKL 2017/DAAL/Intel Caffe