上海2017年4月1日電 /美通社/ -- 近期,由七牛云組織的的架構(gòu)師小組交流會(huì)在線上舉行,Polarr 聯(lián)合創(chuàng)始人宮恩浩、搜狗大數(shù)據(jù)總監(jiān)高君、七牛云 AI 實(shí)驗(yàn)室負(fù)責(zé)人彭垚參加了活動(dòng),討論中三位分享人對(duì)深度學(xué)習(xí)框架選型、深度學(xué)習(xí)的未來(lái)趨勢(shì)展開了交流和探索。
分享開始,Polarr 聯(lián)合創(chuàng)始人宮恩浩介紹了Polarr(國(guó)內(nèi)叫潑辣修圖),Polarr在美國(guó)是做圖片大數(shù)據(jù)的,有云端,也有手機(jī)端,PC 端,Polarr通過(guò) App 收集數(shù)據(jù),建立優(yōu)化的算法,我們?cè)谠贫颂峁﹫D片整理、圖片選擇、圖片信息的識(shí)別,把識(shí)別的模型通過(guò)壓縮手段,把整個(gè)深度學(xué)習(xí)放在手機(jī)的 App,實(shí)現(xiàn)圖片裁定、識(shí)別、選擇、渲染,在這當(dāng)中會(huì)應(yīng)用到很多深度學(xué)習(xí)的功能開發(fā)。隨后介紹了自己在網(wǎng)絡(luò)壓縮方面的做法:首先,要找到一個(gè)最適合的架構(gòu),這部分得根據(jù)具體的應(yīng)用、性能要求來(lái)定。其次,是網(wǎng)絡(luò)壓縮,在不改變模型效果前提下盡量減少模型參數(shù)。最后,是模型編碼,Polarr 有在做想把圖像識(shí)別的 Network 放在手機(jī)上,那么首先基于模型壓縮。具體實(shí)現(xiàn)的方法是:每步迭代的時(shí)候,一部分把小的部分變成零,然后不斷迭代優(yōu)化,最終模型還有一些優(yōu)化,會(huì)小很多。然后同時(shí)還可以在手機(jī)上 Network 優(yōu)化編碼,我實(shí)驗(yàn)的時(shí)候權(quán)重也可以從原來(lái)的 32 位 float,變成 16 位,就是少了一半,或者是變成 8 位的話做了 encoding 就會(huì)小很多,基于這些(優(yōu)化模型結(jié)構(gòu),閾值讓模型稀疏,編碼來(lái)減少存儲(chǔ))就可以不斷進(jìn)行壓縮。
搜狗大數(shù)據(jù)總監(jiān)高君給大家分享了在廣告領(lǐng)域深度學(xué)習(xí)的應(yīng)用案例。他表示,搜狗從用戶端的產(chǎn)品來(lái)講,有兩個(gè)產(chǎn)品與深度學(xué)習(xí)有較強(qiáng)關(guān)系,一個(gè)是語(yǔ)音識(shí)別,應(yīng)用在輸入法,用于語(yǔ)音輸入轉(zhuǎn)文本,另一個(gè)是圖像搜索。搜狗推薦是以推薦結(jié)構(gòu)化數(shù)據(jù)和推薦非結(jié)構(gòu)化數(shù)據(jù)兩種都有的模式,對(duì)于搜索廣告來(lái)講,它是有一個(gè)明確的查詢?cè)~,你可以理解為是一個(gè)結(jié)構(gòu)化。假設(shè)把文本理解為結(jié)構(gòu)化,那么對(duì)于展示類的廣告就很復(fù)雜了,為了提高線上的 CTR,需要明確用戶的興趣,那么處理用戶興趣的過(guò)程中,它的數(shù)據(jù)差異非常大,肯定會(huì)用到搜索,但是也會(huì)用到它站內(nèi)的一些瀏覽的行為,比方說(shuō)我們拿到客戶站內(nèi)所有的數(shù)據(jù),它整個(gè)數(shù)據(jù)的來(lái)源很復(fù)雜。所以對(duì)于展示類廣告來(lái)講,可以認(rèn)為所有的處理的數(shù)據(jù)基本都是異構(gòu)的,可以理解為是個(gè)非結(jié)構(gòu)化的問(wèn)題。
最后,七牛云 AI 實(shí)驗(yàn)室負(fù)責(zé)人彭垚分享了七牛AI 方面的戰(zhàn)略,他表示,七牛是一個(gè)以云存儲(chǔ)起家的公司,在七牛云平臺(tái)上面有廣泛的圖像、視頻、音頻的數(shù)據(jù),富媒體客戶非常多,所以七牛云AI 實(shí)驗(yàn)室的主要職責(zé)是對(duì)大量的富媒體數(shù)據(jù)去做分析,并做一些內(nèi)容審核,識(shí)別等相關(guān)領(lǐng)域的應(yīng)用,以服務(wù)我們平臺(tái)上面的客戶。包括像視頻分析之類的,包括一些視頻通用檢測(cè)的一些功能,我們會(huì)致力于解決我們平臺(tái)上客戶的實(shí)際問(wèn)題來(lái)投入這方面的研究,主要是視頻分析領(lǐng)域,因?yàn)槲覀兇鎯?chǔ)上面視頻非常多,視頻的細(xì)粒度檢測(cè)也是其中的一個(gè)重點(diǎn)方向。
深度學(xué)習(xí)是人工智能發(fā)展的一個(gè)里程碑,雖然深度學(xué)習(xí)已經(jīng)在語(yǔ)音識(shí)別、圖像識(shí)別、預(yù)測(cè)分析、機(jī)器翻譯等領(lǐng)域小試身手,從三位專家分享的技術(shù)方向來(lái)看還深度學(xué)習(xí)的技術(shù)處在初級(jí)階段。誰(shuí)也不能保障深度學(xué)習(xí)在未來(lái)是否能夠成為人工智能最基礎(chǔ)的方法,或許會(huì)有新的更好的技術(shù)替代深度學(xué)習(xí),但是可以肯定的是,人工智能的夢(mèng)想不再遙遠(yuǎn),機(jī)器將在不久的將來(lái)像人類一樣思考。