北京2016年8月26日電 /美通社/ -- 由中國人工智能學(xué)會(huì)發(fā)起主辦、中國科學(xué)院自動(dòng)化研究所與CSDN共同承辦的2016中國人工智能大會(huì)今天在北京召開。云知聲CEO黃偉在CCAI大會(huì)上了發(fā)表了《物聯(lián)網(wǎng)時(shí)代的人機(jī)交互》主題演講,向與會(huì)嘉賓分享在未來人機(jī)交互以及物聯(lián)網(wǎng)人工智能技術(shù)發(fā)展,同時(shí)也分享了云知聲如何在商業(yè)化落地等問題。
以下為云知聲CEO黃偉的演講文字實(shí)錄:
人機(jī)交互的發(fā)展
從目前來看,行業(yè)比較成熟的交互方式有:語音交互、手勢(shì)識(shí)別、圖像識(shí)別、體感交互等。但是這些交互方式都有一定的局限性,它可能在某些的特定領(lǐng)域會(huì)發(fā)揮著特定的作用。語音識(shí)別是一樣的,現(xiàn)階段我們依然沒有很好的解決好一些噪音或回聲等問題,其實(shí)今天我們?cè)诟兄矫嬉廊挥泻芏嗦沸枰摺?/p>
在IoT人機(jī)交互不再只是鼠標(biāo)鍵盤,在物聯(lián)網(wǎng)領(lǐng)域里面我們可以看到智能家居和機(jī)器人占非常大的比重,語音交互將成為一個(gè)重要的方式,從我們后臺(tái)分析的數(shù)據(jù)來看,即使手機(jī)上,用戶量超過2~3億的App在語音的使用量上也只有1%~2%,而在智能電視上,語音功能的日激活量幾乎是100%,可以看出,物聯(lián)網(wǎng)時(shí)代語音將成為最主要的交互方式。同時(shí)語音可以在搜入、查詢、搜索、智能家居、車載、醫(yī)療、教育等很多領(lǐng)域有著廣泛的運(yùn)用。
因此,在未來物聯(lián)網(wǎng)時(shí)代,隨著智能語音技術(shù)的進(jìn)一步發(fā)展和成熟,語音也將取代移動(dòng)設(shè)備,成為未來主要的交互方式。
物聯(lián)網(wǎng)下人工智能技術(shù)
物聯(lián)網(wǎng)下的人工智能技術(shù)有哪些呢,在語音方面,第一步語音識(shí)別,首先要聽到用戶說了什么,那聽到之后呢還要聽懂,那我需要語音理解,需要知道你說的話里面包含什么意思,那當(dāng)然可能說還需要跟場(chǎng)景相結(jié)合,比如語用計(jì)算,我知道說你這句話不僅僅是文字的表面意思,還要知道更深層次的含義。
所以,一個(gè)真正的能夠在人和設(shè)備之間,類似人和人的對(duì)話,他應(yīng)該是一種計(jì)算的人機(jī)交互框架,不光有字面的含義還有物理語境,比如時(shí)間、地點(diǎn)、場(chǎng)所,不同的時(shí)間、地點(diǎn)、場(chǎng)所說的同樣的文字代表含義是不一樣的。
要結(jié)合上下文以及人類的這些基本嘗試,包括還有物理世界等,通過這樣我們可以構(gòu)建出一個(gè)語境為中心的交互形態(tài),這樣才能實(shí)現(xiàn)真正的像人和人的自然對(duì)話,這就是我們?cè)谖锫?lián)網(wǎng)下人工智能技術(shù)發(fā)展要解決的問題。
云知聲如何商業(yè)化落地
人工智能是一個(gè)很長(zhǎng)的賽道,商業(yè)化落地也是一個(gè)很重要的問題。我們?cè)?014年的時(shí)候提出“云端芯”服務(wù),希望打造一種軟硬件一體化的云解決方案。過AI芯、AIUI、AI Service三大解決方案支撐起云知聲核心技術(shù)的落地和實(shí)現(xiàn),目前已經(jīng)在車載、醫(yī)療、教育和家居等領(lǐng)域有廣泛應(yīng)用,形成了完整的“云端芯”生態(tài)閉環(huán)。
通過這樣的一種戰(zhàn)略方式,云知聲目前取得了不錯(cuò)的成績(jī),比如:在車載領(lǐng)域占據(jù)60% 以上的市場(chǎng)份額,占有率第一,出貨量也超過了150 萬臺(tái);在醫(yī)療領(lǐng)域,在國內(nèi)已經(jīng)正式簽約并上線的醫(yī)院有多家,其中協(xié)和醫(yī)院已經(jīng)正式對(duì)外宣布,同云知聲合力打造的語音錄入系統(tǒng)正式在全院上線;在教育方面,云知聲也成功簽約了包括全通教育等幾家行業(yè)巨頭公司;在智能家居領(lǐng)域,云知聲是國內(nèi)六大家電廠商中的語音服務(wù)供應(yīng)商,并且成為了行業(yè)內(nèi)白色家電領(lǐng)域唯一落地出貨的芯片供應(yīng)商,并在今年已經(jīng)陸陸續(xù)續(xù)實(shí)現(xiàn)了落地。從這四個(gè)主要領(lǐng)域來切入,就是云知聲目前商業(yè)化落地的具體形式。