杭州2017年2月14日電 /美通社/ -- 在2月12日“2017 Kubernetes Meetup 中國”開幕典禮暨“2.12上海站”活動中,才云發(fā)布了全球首個 TensorFlow as a Service (TaaS) v1.0.0 深度學習平臺。
谷歌深度學習框架 TensorFlow 自2015年11月開源以來受到了學術(shù)界和工業(yè)界的廣泛關(guān)注。然而要將 TensorFlow 真正地應(yīng)用于生產(chǎn)環(huán)境中仍然存在很大的挑戰(zhàn)。為了進一步降低 TensorFlow 的使用門檻,才云(caicloud.io)早在 2016 年4月即發(fā)布國內(nèi)首個基于容器集群的分布式深度學習 TensorFlow 系統(tǒng) Clever,于2月12日正式發(fā)布產(chǎn)品 TensorFlow as a Service (TaaS) v1.0.0 商用版。
TaaS v.1.0.0 包括支持 CPU 和 GPU 的分布式 TensorFlow 模型訓練平臺和 TensorFlow 模型托管平臺。通過將 TensorFlow 與谷歌開源的容器云平臺管理工具 Kubernetes 結(jié)合, Caicloud 提供的 TaaS 服務(wù)解決了 TensorFlow 在使用中學習成本高、管理難、監(jiān)控難、上線難等問題,旨在幫助企業(yè)更快、更容易地體驗和應(yīng)用最新深度學習技術(shù)。 Caicloud 作為國內(nèi)首家提供商用分布式 TensorFlow 解決方案的云平臺,將引領(lǐng)大數(shù)據(jù)市場發(fā)展的新潮流。
谷歌深度學習框架 TensorFlow
TensorFlow 在谷歌內(nèi)外都已經(jīng)得到了廣泛的應(yīng)用。
在谷歌內(nèi),語音搜索、廣告、電商、圖片、街景圖、翻譯、 YouTube 等眾多產(chǎn)品之中都有基于 TensorFlow 的系統(tǒng)。AlphaGo 的開發(fā)團隊 DeepMind 也正式宣布其開發(fā)的系統(tǒng)將全部基于 TensorFlow 。
在谷歌外,優(yōu)步(Uber)、Snapchat、Twitter、京東、小米等國內(nèi)外科技公司也加入了使用 TensorFlow 的行列。在短短的一年時間內(nèi), TensorFlow 在開源社區(qū) Github 上的活躍度已遠超 Caffe 、MXNet 、Torch 、Theano 等其他開源深度學習工具。
TensorFlow 生產(chǎn)化的難點
雖然 TensorFlow 在眾多大型 IT 公司已得到了廣泛的使用,但在廣大的中小型 IT 企業(yè)以及傳統(tǒng)企業(yè)中,要將其應(yīng)用于生產(chǎn)環(huán)境卻仍然存在挑戰(zhàn)。
在單機環(huán)境下,即使使用目前先進的 GPU 都無法滿足訓練大型深度學習模型的計算量要求。
而在集群環(huán)境下, TensorFlow 存在高門檻、難配置、難管理等問題。分布式 TensorFlow 也不支持多用戶管理,在多用戶同時使用時存在資源和權(quán)限分配等問題。
Caicloud 解決方案
為了讓更多企業(yè)能夠享受到 TensorFlow 帶來的人工智能技術(shù)革新,Caicloud 提供了產(chǎn)品 TensorFlow as a Service (TaaS) v1.0.0 來搭建企業(yè)版的 TensorFlow 平臺。
TaaS 可以幫助企業(yè)更好的管理分布式 TensorFlow 的模型訓練過程,并一鍵上線訓練好的 TensorFlow 模型。下表對比了原生態(tài)分布式TensorFlow和Caicloud TaaS 平臺的差異:
目前,Caicloud 已經(jīng)將 TaaS 實際應(yīng)用于很多大數(shù)據(jù)項目中,并對外提供企業(yè)級大數(shù)據(jù)解決方案服務(wù)。
雖然 TaaS 可以極大程度降低企業(yè)使用 TensorFlow 的門檻,但為了進一步幫助企業(yè)節(jié)約研發(fā)投入,直接享用深度學習技術(shù),Caicloud 提供了大數(shù)據(jù)解決方案服務(wù)。Caicloud 通過在深度學習算法和平臺上的技術(shù)積累,已為安防、電商、金融、物流等多個行業(yè)提供大數(shù)據(jù)服務(wù)。
Caicloud 基于不同應(yīng)用場景,針對性地進行數(shù)據(jù)分析和模型訓練,把大數(shù)據(jù)融入到各個行業(yè)的深層次業(yè)務(wù)中。通過 TaaS 平臺,Caicloud 大數(shù)據(jù)解決方案可以更有效地利用海量數(shù)據(jù),從而更多地挖掘數(shù)據(jù)中的價值。在一些實際問題中,通過 TaaS 平臺訓練得到的模型可以成功地將正確率提升 80%。
TaaS分布式模型訓練平臺先睹為快
提交訓練任務(wù)界面:
任務(wù)監(jiān)控界面:
啟動 TensorFlow Serving:
通過界面調(diào)試API:
才云計劃將在 2017 年 3 月底發(fā)行 TaaS 的下一個演進版本 v.2.0.0。除了 TaaS 私有云產(chǎn)品進一步加強外,未來還將有邀請制公有云內(nèi)測版本,歡迎密切關(guān)注。如有業(yè)務(wù)需求,歡迎垂詢:info@caicloud.io