11月1日,捷通華聲宣布推出新版靈云英文語音合成(TTS)技術。具有國際水準、擁有獨立自主知識產(chǎn)權的靈云英文TTS技術的推出,標志著捷通華聲在發(fā)展多國語言TTS技術上取得了重大突破。捷通華聲此次推出最新靈云英文TTS,也是繼宣布推出最新靈云離線式語音識別(ASR)技術、靈云智能客戶服務系統(tǒng)全新升級之后又一重大突破。
語音合成即TTS(Text to Speech)技術,又稱文語轉(zhuǎn)換技術,能將任意文本信息實時轉(zhuǎn)化為標準流暢的語音朗讀,簡單講就是讓"機器開口講話"。TTS技術涉及聲學、語言學、數(shù)字信號處理、計算機科學等多個學科技術,是語言信息處理領域的一項前沿技術。通過TTS技術,計算機可以在任何時候?qū)⑷我馕谋?ldquo;輕松”轉(zhuǎn)換成具有高自然度的語音,從而真正實現(xiàn)讓機器"像人一樣開口說話"。我國自上世紀80年代,開始研究中文TTS技術,因為起步晚,國內(nèi)語音研究領域大多專注在中文語音研究與商品化進程。
創(chuàng)建于2000年的北京捷通華聲語音技術有限公司,是國內(nèi)最早從事中文TTS研究與應用的企業(yè),捷通華聲中文語音合成(TTS)技術在國內(nèi)已處于絕對領先地位,市場占有率超過50%。全新升級后的英文TTS,能夠自動識別并表現(xiàn)出合成文本中包含的各類句式,合成效果更富表現(xiàn)力;優(yōu)化了分詞對特殊符號、韻律短語等內(nèi)容的分析,確保合成的高準確度;改善了短語停頓、數(shù)字識別效果,使朗讀更加準確、節(jié)奏感更強,發(fā)音準確、清晰、飽滿,完全達到國際水平。
長期以來,國際智能語音技術市場基本為美國Nuance公司壟斷,給應用智能語音的國際廠商,尤其是一些跨國企業(yè)形成一定的壓力,多家跨國企業(yè)在與捷通華聲的多次交流中表示,希望捷通華聲等中國語音技術公司也能夠走向國際市場。因此,此次捷通華聲靈云英文語音合成(TTS)技術達到國際水準,預示捷通華聲已開始實施進軍國際智能語音技術市場的戰(zhàn)略部署。
十幾年來,捷通華聲始終堅持自主研究語音合成(TTS)、語音識別(ASR)等智能人機交互(HCI)技術,并不斷在語音合成(TTS)、語音識別(ASR)等智能語音技術領域取得突破,為保證我國中文智能語音技術始終處于世界領先地位做出了主要貢獻。經(jīng)過長期與國內(nèi)金融、電信、交通、能源及CTI等各領域企業(yè)保持良好的合作伙伴關系,并憑借為合作企業(yè)提供周到細致的技術服務,捷通華聲靈云智能語音技術的語音服務從縱貫中國的高鐵到各大飛機場;從各個醫(yī)院語音叫號到各地長途汽車站;從建行、農(nóng)行等各大銀行聲訊服務到各領域呼叫中心服務;從北京奧運會到上海世博會,從2000年到今天,捷通華聲無時無刻、無處不在地為中國億萬大眾提供最先進的智能語音服務。隨著移動互聯(lián)網(wǎng)的高速發(fā)展,靈云智能語音技術助力并通過百度導航、導航犬、搜狗地圖、嘀嘀打車、快的打車等數(shù)百款移動應用服務大眾,為超過2億社會大眾提供輕松、便捷的語音服務。
2011年,捷通華聲創(chuàng)造性推出了全球第一個最大、最全的智能人機交互(HCI)技術開放平臺 — 靈云(www.hcicloud.com)。靈云是一種可以用語音、手寫、拍照、手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機、計算機等數(shù)字設備的網(wǎng)絡云服務,發(fā)展目標是讓人機交互像人與人溝通一樣的簡單自然。靈云以“云 + 端”方式,為中國整個信息產(chǎn)業(yè)領域提供語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學字符識別(OCR)和自然語言理解(NLU)等多項核心技術能力。在語音合成(TTS)技術領域,靈云開放平臺已能夠提供中文普通話、粵語(廣東話)、維吾爾語、英語、德語、法語、日語、韓語等在內(nèi)十幾種語言的語音合成技術。國內(nèi)外企業(yè)與個人,均可以通過靈云開發(fā)者社區(qū)(www.hcicloud.com)直接體驗并獲取代表最高水平的各種HCI技術能力支持。
此次靈云英文TTS的全新升級,不僅標志我國英文語音成(TTS)技術的整體水平實現(xiàn)與國際同步,也將幫助國內(nèi)各種智能移動終端、呼叫中心等應用智能語音技術的企業(yè)拓展海外市場,也必將推動捷通華聲靈云開放平臺,在立足服務中國,走向國際的道路上邁出更加堅實的一步。捷通華聲靈云,源自中國,服務全球!
更多詳情請登陸,靈云智能人機交互能力開放平臺:www.hcicloud.com