北京2016年8月26日電 /美通社/ -- 由中國人工智能學會發(fā)起主辦、中國科學院自動化研究所與CSDN共同承辦的2016中國人工智能大會今天在北京召開。云知聲CEO黃偉在CCAI大會上了發(fā)表了《物聯(lián)網(wǎng)時代的人機交互》主題演講,向與會嘉賓分享在未來人機交互以及物聯(lián)網(wǎng)人工智能技術發(fā)展,同時也分享了云知聲如何在商業(yè)化落地等問題。
以下為云知聲CEO黃偉的演講文字實錄:
人機交互的發(fā)展
從目前來看,行業(yè)比較成熟的交互方式有:語音交互、手勢識別、圖像識別、體感交互等。但是這些交互方式都有一定的局限性,它可能在某些的特定領域會發(fā)揮著特定的作用。語音識別是一樣的,現(xiàn)階段我們依然沒有很好的解決好一些噪音或回聲等問題,其實今天我們在感知方面依然有很多路需要走。
在IoT人機交互不再只是鼠標鍵盤,在物聯(lián)網(wǎng)領域里面我們可以看到智能家居和機器人占非常大的比重,語音交互將成為一個重要的方式,從我們后臺分析的數(shù)據(jù)來看,即使手機上,用戶量超過2~3億的App在語音的使用量上也只有1%~2%,而在智能電視上,語音功能的日激活量幾乎是100%,可以看出,物聯(lián)網(wǎng)時代語音將成為最主要的交互方式。同時語音可以在搜入、查詢、搜索、智能家居、車載、醫(yī)療、教育等很多領域有著廣泛的運用。
因此,在未來物聯(lián)網(wǎng)時代,隨著智能語音技術的進一步發(fā)展和成熟,語音也將取代移動設備,成為未來主要的交互方式。
物聯(lián)網(wǎng)下人工智能技術
物聯(lián)網(wǎng)下的人工智能技術有哪些呢,在語音方面,第一步語音識別,首先要聽到用戶說了什么,那聽到之后呢還要聽懂,那我需要語音理解,需要知道你說的話里面包含什么意思,那當然可能說還需要跟場景相結(jié)合,比如語用計算,我知道說你這句話不僅僅是文字的表面意思,還要知道更深層次的含義。
所以,一個真正的能夠在人和設備之間,類似人和人的對話,他應該是一種計算的人機交互框架,不光有字面的含義還有物理語境,比如時間、地點、場所,不同的時間、地點、場所說的同樣的文字代表含義是不一樣的。
要結(jié)合上下文以及人類的這些基本嘗試,包括還有物理世界等,通過這樣我們可以構(gòu)建出一個語境為中心的交互形態(tài),這樣才能實現(xiàn)真正的像人和人的自然對話,這就是我們在物聯(lián)網(wǎng)下人工智能技術發(fā)展要解決的問題。
云知聲如何商業(yè)化落地
人工智能是一個很長的賽道,商業(yè)化落地也是一個很重要的問題。我們在2014年的時候提出“云端芯”服務,希望打造一種軟硬件一體化的云解決方案。過AI芯、AIUI、AI Service三大解決方案支撐起云知聲核心技術的落地和實現(xiàn),目前已經(jīng)在車載、醫(yī)療、教育和家居等領域有廣泛應用,形成了完整的“云端芯”生態(tài)閉環(huán)。
通過這樣的一種戰(zhàn)略方式,云知聲目前取得了不錯的成績,比如:在車載領域占據(jù)60% 以上的市場份額,占有率第一,出貨量也超過了150 萬臺;在醫(yī)療領域,在國內(nèi)已經(jīng)正式簽約并上線的醫(yī)院有多家,其中協(xié)和醫(yī)院已經(jīng)正式對外宣布,同云知聲合力打造的語音錄入系統(tǒng)正式在全院上線;在教育方面,云知聲也成功簽約了包括全通教育等幾家行業(yè)巨頭公司;在智能家居領域,云知聲是國內(nèi)六大家電廠商中的語音服務供應商,并且成為了行業(yè)內(nèi)白色家電領域唯一落地出貨的芯片供應商,并在今年已經(jīng)陸陸續(xù)續(xù)實現(xiàn)了落地。從這四個主要領域來切入,就是云知聲目前商業(yè)化落地的具體形式。