上海2018年7月27日電 /美通社/ -- 近日,由 Gartner 和七牛云聯(lián)合發(fā)布了一份《Five Key Essentials for the New Generation of Intelligent Video Cloud》白皮書報(bào)告,報(bào)告中針對(duì)各行業(yè)在視頻應(yīng)用領(lǐng)域升級(jí)過(guò)程中面臨的技術(shù)痛點(diǎn)及挑戰(zhàn),提出了構(gòu)建新一代視頻云的5個(gè)關(guān)鍵要素和相關(guān)參考標(biāo)準(zhǔn),并描述了智能視頻云如何以更便捷的服務(wù)和更低的成本幫助客戶加速升級(jí)。本文則對(duì) Gartner 和七牛云的白皮書報(bào)告進(jìn)行了詳細(xì)編譯。
以下為譯文:
一、導(dǎo)語(yǔ)
過(guò)去十年里,中國(guó)移動(dòng)互聯(lián)網(wǎng)的高速發(fā)展,帶動(dòng)了各個(gè)產(chǎn)業(yè)IT基礎(chǔ)架構(gòu)的擴(kuò)展和升級(jí):
本文介紹各行業(yè)在視頻應(yīng)用領(lǐng)域的升級(jí)過(guò)程中,主要面臨的技術(shù)痛點(diǎn)和挑戰(zhàn),并提出了構(gòu)建新一代視頻云的5個(gè)關(guān)鍵要素和相關(guān)參考標(biāo)準(zhǔn),描述了智能視頻云如何以更便捷的服務(wù)和更低的成本幫助客戶加速升級(jí)。未來(lái)視頻的應(yīng)用的場(chǎng)景和領(lǐng)域可能會(huì)成為企業(yè)產(chǎn)品或營(yíng)銷服務(wù)中核心的環(huán)節(jié),而且它本身的規(guī)模變化也非常符合互聯(lián)網(wǎng)中的馬太效應(yīng),因此企業(yè)都需要提前為自己未來(lái)海量的富媒體素材做好充分準(zhǔn)備,避免數(shù)據(jù)失控。
二、各行業(yè)在視頻時(shí)代的新興場(chǎng)景
1、安防監(jiān)控
根據(jù) Markets&Markets 的調(diào)查結(jié)果,2017年至2022年期間,全球監(jiān)控視頻市場(chǎng)年復(fù)合增長(zhǎng)率將達(dá)15.4%,2022年將增至約756億美元的規(guī)模。視頻監(jiān)控廣泛應(yīng)用于各類場(chǎng)合,包括:
最近兩年來(lái),以幼兒園、學(xué)校代表的公共區(qū)域場(chǎng)所監(jiān)控提出了更高的要求:
而道路交通和城市安全的監(jiān)控,除了傳統(tǒng)的車輛違章監(jiān)控和識(shí)別,行人的違章也逐步納入到了監(jiān)控的體系中,如:
由此可以看到,視頻監(jiān)控領(lǐng)域正在面臨著產(chǎn)業(yè)升級(jí),如何做到公網(wǎng)穩(wěn)定地訪問(wèn),產(chǎn)生的海量的圖像和視頻數(shù)據(jù)如何更好地存儲(chǔ)、分析和檢索,是一項(xiàng)巨大的挑戰(zhàn)。
2、在線教育
近年來(lái),在線教育發(fā)展異?;馃?,利用互聯(lián)網(wǎng)音視頻技術(shù),解決了優(yōu)質(zhì)教育資源傳遞的時(shí)空限制,主要體現(xiàn)形式如下:
如何解決學(xué)生觀看直播的卡頓問(wèn)題,如何進(jìn)一步降低視頻互動(dòng)的延時(shí),提高老師和學(xué)生的體驗(yàn),顯得至關(guān)重要。另外,隨著人工智能的發(fā)展,視頻技術(shù)如何更好地借助 AI 技術(shù),也成為在線教育領(lǐng)域大家更為關(guān)注的方向,如:
3、廣電新媒體
隨著互聯(lián)網(wǎng)直播興起,各類廣電平臺(tái)想要做出一檔可看且互動(dòng)性強(qiáng)的直播節(jié)目,除了要精心編排節(jié)目?jī)?nèi)容,還要特別重視音視頻及互動(dòng)方式的呈現(xiàn)。顯然,在新媒體時(shí)代下,傳統(tǒng)的廣電方案具有一定的局限性:
面對(duì)這些局限,廣電行業(yè)迫切需要全新的視頻系統(tǒng),為消費(fèi)者提供高畫質(zhì)、強(qiáng)互動(dòng)的視頻娛樂體驗(yàn)和可量化的精確數(shù)據(jù)管理:
如何實(shí)現(xiàn)導(dǎo)播內(nèi)容的實(shí)時(shí)切換,如何保證廣電內(nèi)容實(shí)時(shí)傳輸,如何讓廣電傳媒的廣告價(jià)值較大化,如何制作低成本、高質(zhì)量的節(jié)目,這對(duì)廣電新媒體來(lái)說(shuō)均是急需解決的難題。
4、智慧法庭
2016年7月1日起,較高人民法院所有公開開庭案件均有網(wǎng)上直播,所有直播視頻均有視頻存檔,公眾可在線觀看。截至2018年3月,全國(guó)范圍內(nèi)的庭審直播共累計(jì)66萬(wàn)余場(chǎng),累計(jì)訪問(wèn)近50億人次。智慧法庭充分運(yùn)用互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、人工智能等先進(jìn)信息技術(shù),支持全業(yè)務(wù)網(wǎng)上辦理、全流程依法公開、全方位智能服務(wù):
基于視頻及文書,結(jié)合人工智能計(jì)算機(jī)視覺技術(shù),讀取、分析電子化卷宗,抓取重要因素,并分類標(biāo)注。例如把犯罪動(dòng)機(jī)、犯罪時(shí)間、犯罪工具等 -- 以不同顏色打上標(biāo)簽,并予以比對(duì)分析。
建設(shè)智慧法庭,如何保障開庭審訊直播視頻的實(shí)時(shí)傳輸,如何存儲(chǔ)海量直播視頻用于點(diǎn)播回放,如何基于廣泛的視頻內(nèi)容進(jìn)行智能分析,對(duì)視頻基礎(chǔ)設(shè)施的可靠性提出了更高的要求和挑戰(zhàn)。
5、遠(yuǎn)程醫(yī)療
當(dāng)前醫(yī)療資源還存在著地區(qū)分布不均問(wèn)題,醫(yī)療專家可以通過(guò)在線直播、實(shí)時(shí)音視頻進(jìn)行跨區(qū)域互動(dòng)會(huì)診:
遠(yuǎn)程醫(yī)療這一概念被提出后,已經(jīng)被廣泛應(yīng)用。但是,如何提高視頻傳輸性能,如何確保家庭、基層醫(yī)療機(jī)構(gòu)和戶外應(yīng)急的遠(yuǎn)程醫(yī)療快速接入,是當(dāng)前的遠(yuǎn)程醫(yī)療業(yè)務(wù)系統(tǒng)面臨的主要挑戰(zhàn)。
從以上列舉的幾個(gè)行業(yè)新興場(chǎng)景可以看出,在產(chǎn)業(yè)升級(jí)的過(guò)程中,他們都面臨著巨大的技術(shù)和資源挑戰(zhàn)。大部分企業(yè)無(wú)法在短時(shí)間內(nèi)構(gòu)建有效的相關(guān)視頻服務(wù)能力,因此如何選擇和利用公有云的相關(guān)視頻服務(wù),快速滿足業(yè)務(wù)的升級(jí)需求,顯得至關(guān)重要。
三、智能視頻云的關(guān)鍵要素
為了滿足各行業(yè)在視頻時(shí)代新的需求和挑戰(zhàn),智能視頻云至少需要擁有以下5個(gè)關(guān)鍵要素:
1、穩(wěn)定的網(wǎng)絡(luò)傳輸與分發(fā):直播延遲不高于1s,互動(dòng)延遲不高于150ms
2、可擴(kuò)展的海量存儲(chǔ)服務(wù):可以實(shí)現(xiàn)業(yè)務(wù)層無(wú)感知PB級(jí)擴(kuò)容
3、云端媒體的編輯處理:可以在數(shù)秒內(nèi)創(chuàng)建獨(dú)立計(jì)算實(shí)例,執(zhí)行自定義媒體編輯操作
4、視頻內(nèi)容的智能分析:視頻內(nèi)容識(shí)別率高于95%
5、完備的權(quán)限控制:徹底杜絕非法拷貝,秒級(jí)封禁盜鏈流量
要素1:穩(wěn)定的網(wǎng)絡(luò)傳輸與分發(fā):提供流暢的觀看體驗(yàn)與低延遲的互動(dòng)
要素2:可擴(kuò)展的海量存儲(chǔ)服務(wù):高可靠易擴(kuò)展的數(shù)據(jù)安全保障
要素3:端媒體的編輯處理:快捷多用途云端視頻編輯
要素4:視頻內(nèi)容的智能分析:結(jié)合人工智能發(fā)揮視頻數(shù)據(jù)的較大價(jià)值
要素5:完備的權(quán)限控制:杜絕非法拷貝與盜鏈
根據(jù)以上5個(gè)關(guān)鍵要素,七牛云認(rèn)為一套完整的智能視頻云需要由以下模塊組成:
四、智能視頻云的成本優(yōu)勢(shì):
智能視頻云不僅在技術(shù)能夠完全滿足各行業(yè)在視頻時(shí)代的新需求,相比自主研發(fā),還能為企業(yè)大幅節(jié)省研發(fā)成本和運(yùn)營(yíng)成本。
面對(duì)高昂的成本,視頻云服務(wù)在提供了豐富產(chǎn)品的同時(shí),還具有簡(jiǎn)單易用、可彈性擴(kuò)展、維護(hù)成本低的特點(diǎn)。智能視頻云服務(wù)通過(guò)提供通用且易于根據(jù)具體業(yè)務(wù)定制的技術(shù)系統(tǒng),大大降低了行業(yè)應(yīng)用的開發(fā)周期與成本開銷,同時(shí)視頻云的多個(gè)模塊均可私有或混合部署,在保障企業(yè)數(shù)據(jù)安全的同時(shí),獲得和公有云一樣的穩(wěn)定性、可靠性和靈活性。
五:AI在智能視頻云的增值應(yīng)用
在智能視頻云的技術(shù)和成本優(yōu)勢(shì)背后,人工智能,尤其是計(jì)算機(jī)視覺技術(shù)的深度應(yīng)用發(fā)揮了巨大的作用。在七牛云整個(gè)智能視頻云系統(tǒng)中,計(jì)算機(jī)視覺技術(shù)在諸多環(huán)節(jié)取代了人工操作,極大地提高了視頻內(nèi)容處理的效率。通過(guò)完全不同于傳統(tǒng)數(shù)據(jù)分析的角度,實(shí)現(xiàn)了先前難以想象的數(shù)據(jù)分析應(yīng)用。
1、視頻內(nèi)容識(shí)別:自動(dòng)識(shí)別視頻畫面信息,從標(biāo)簽庫(kù)中匹配對(duì)應(yīng)標(biāo)簽
作為計(jì)算機(jī)視覺基礎(chǔ)模型層中重要的幾項(xiàng)技術(shù),人臉識(shí)別、物體識(shí)別、場(chǎng)景識(shí)別等技術(shù)在安防、廣電、教育等領(lǐng)域的眾多場(chǎng)景中有廣泛的應(yīng)用場(chǎng)景。
例如在安防行業(yè),擁有人臉識(shí)別、動(dòng)作追蹤等功能的高清攝像頭,能根據(jù)監(jiān)控范圍內(nèi)人物的動(dòng)作并判斷其行為,對(duì)具有可疑行為的人觸發(fā)自動(dòng)報(bào)警。當(dāng)智能攝像頭與公安部門的在逃嫌犯資料庫(kù)匹配之后,能在機(jī)場(chǎng)、火車站等人流密集場(chǎng)所配合警方識(shí)別可疑人員,大幅提升破案、抓捕效率。
2、視頻內(nèi)容結(jié)構(gòu)化:可以像搜索文本文件一樣搜索視頻文件中的信息
計(jì)算機(jī)視覺視頻結(jié)構(gòu)化相比人工標(biāo)注具有識(shí)別范圍廣、準(zhǔn)確性好、學(xué)習(xí)模型不斷迭代、GPU機(jī)器效率高、成本低等一系列明顯優(yōu)勢(shì)。經(jīng)標(biāo)注后的視頻能夠在遠(yuǎn)程醫(yī)療、在線教育、廣電等行業(yè)發(fā)揮巨大作用。
例如,遠(yuǎn)程醫(yī)療行業(yè)擁有的存量和新增影像資料遠(yuǎn)遠(yuǎn)超出人工標(biāo)注的能力范圍,想要發(fā)揮醫(yī)療視頻資料的較大價(jià)值,需要根據(jù)不同類別將視頻和圖片進(jìn)行分類。通過(guò)人工智能高效完成視頻精確分類后,就能像搜索文本文件一樣搜索視頻文件中的關(guān)鍵信息,進(jìn)行更有效的利用,真正將醫(yī)療大數(shù)據(jù)變?yōu)獒t(yī)療知識(shí)圖譜。
3、視頻內(nèi)容審核:從視頻中識(shí)別敏感信息,提升審核效率
如今,圖片和視頻取代文字成為主流的傳播方式,針對(duì)圖片和視頻的內(nèi)容審核正變得越來(lái)越重要。然而人工審核不僅會(huì)造成高企的人力成本,其效率和準(zhǔn)確性也很難滿足當(dāng)下巨大的視頻數(shù)據(jù)量帶來(lái)的審核需求。
例如在廣電行業(yè),視頻內(nèi)容鑒黃、鑒暴恐、政治人物識(shí)別等工作過(guò)去均由人工完成。隨著計(jì)算機(jī)視覺技術(shù)的日漸成熟,利用機(jī)器代替人工進(jìn)行絕大部份的內(nèi)容審核工作,成為了視頻時(shí)代的提高審核效率的不二之選。憑借計(jì)算機(jī)視覺技術(shù)帶來(lái)的審核效率革命,鑒黃、鑒暴恐、政治人物識(shí)別將不再是廣電行業(yè)的難題。
4、視頻內(nèi)容推薦:可根據(jù)用戶消費(fèi)視頻習(xí)慣,實(shí)現(xiàn)精細(xì)化運(yùn)營(yíng)
除了能夠高效完成視頻結(jié)構(gòu)化和內(nèi)容審核工作,計(jì)算機(jī)視覺技術(shù)還能在業(yè)務(wù)層面成為內(nèi)容運(yùn)營(yíng)的創(chuàng)新引擎,實(shí)現(xiàn)更多個(gè)性化產(chǎn)品需求。
同樣在廣電行業(yè),例如在完成視頻內(nèi)容結(jié)構(gòu)化之后,運(yùn)營(yíng)者可以根據(jù)用戶收看行為記錄進(jìn)行智能內(nèi)容推薦,甚至在視頻的特定時(shí)間段和畫面的特定位置實(shí)現(xiàn)廣告定向投放,較大化提升廣告轉(zhuǎn)化效果。智能視頻內(nèi)容推薦能夠幫助內(nèi)容運(yùn)營(yíng)人員以較高效率實(shí)現(xiàn)高水平的用戶精細(xì)化運(yùn)營(yíng)。
六、借助靈活的智能視頻云從容面對(duì)未來(lái)產(chǎn)業(yè)升級(jí)的未知挑戰(zhàn)
未來(lái),很少有企業(yè)能脫離互聯(lián)網(wǎng)而獨(dú)立存在,因此企業(yè)數(shù)據(jù)的總量會(huì)不斷增加,對(duì)應(yīng)產(chǎn)生的數(shù)據(jù)價(jià)值甚至負(fù)擔(dān)也會(huì)同步提升。每個(gè)企業(yè)都需要擁有對(duì)于文件和富媒體素材(包含海量圖片,視頻,音頻)的使用和存儲(chǔ)的彈性能力,但只有極少數(shù)企業(yè)才需要擁有自建視頻云的能力和資源,大部分企業(yè)只需要借助一套穩(wěn)定并可持續(xù)升級(jí)的視頻云平臺(tái),迎接未來(lái)產(chǎn)業(yè)中不斷變化和升級(jí)的未知挑戰(zhàn)。
報(bào)告出處:
Gartner白皮書英文版鏈接:https://www.gartner.com/technology/media-products/newsletters/qiniu/1-4UWO347/index.html
Gartner白皮書中文版鏈接:https://www.qiniu.com/products/qavs