北京2016年7月26日電 /美通社/ --
為了進一步完善大數據平臺,企業(yè)級基礎云服務商青云QingCloud(qingcloud.com)日前宣布新增分布式實時計算系統(tǒng)Storm和基于Hadoop的數據倉庫工具Hive,這是繼月初推出Elasticsearch全文搜索引擎服務后QingCloud推出的又一重要功能。隨著數據在企業(yè)商業(yè)決策和產品功能中起到的作用越來越重要,大數據技術正在越來越多的企業(yè)中發(fā)揮出更大價值。QingCloud正在不斷完善大數據平臺,幫助用戶降低技術門檻。目前,兩個新功能已經分別在QingCloud控制臺的大數據平臺和映像市場上線。
Storm是一個開源的分布式實時計算系統(tǒng),通常被比作“實時的Hadoop”。Storm為實時計算提供了一些簡單優(yōu)美的原語,支持多種編程語言,并內建流式窗口API及分布式緩存API,極大簡化了流式數據處理過程。Storm不僅高可靠、易擴展,而且處理速度極快,每個計算節(jié)點每秒能處理上百萬條元組信息(Tuple),因此常被用于實時分析、在線機器學習、連續(xù)計算、分布式RPC、ETL等。QingCloud提供的Storm 集群采用Master/Slave 架構,提供了在線伸縮、監(jiān)控告警等功能,幫助用戶更好地管理集群。
通常包括Storm在內的大數據平臺的運維都是非常繁瑣的,但在QingCloud上,用戶可以在2到3分鐘創(chuàng)建一個Storm集群。集群支持橫向與縱向在線伸縮,還提供了監(jiān)控告警等功能,使得管理集群異常方便。集群運行于100%二層隔離的私有網絡內,結合QingCloud提供的高性能硬盤,在保障高性能的同時兼顧用戶的數據安全。
Hive是基于Hadoop的一個主流的針對海量數據做離線分析的數據倉庫,可以將結構化的數據文件映射為數據庫表,并提供簡潔的類SQL(稱為HQL)查詢功能,將HQL語句轉換為MapReduce任務后運行。 其優(yōu)點是學習成本低,可通過HQL語句快速實現(xiàn)簡單的MapReduce統(tǒng)計,大部分場景不必開發(fā)專門的MapReduce應用,十分適合基于數據倉庫的統(tǒng)計分析。另外,也可通過MapReduce開發(fā)擴展新功能函數。
QingCloud提供的Hive映像包含了Hive Client和Hive Server的所有功能。用戶在Hive Client端發(fā)起HQL任務,通過Hive Server實現(xiàn)HQL到MapReduce任務的轉換,然后調用Hadoop集群執(zhí)行。在QingCloud上,用戶可以在2到3分鐘內創(chuàng)建一個Hive服務,并完成與其他大數據集群連接的配置。Hive服務支持縱向在線伸縮, 提供了監(jiān)控告警等功能,使得服務管理非常方便。
青云QingCloud CTO甘泉(Reno Gan)表示:“Storm、Hive服務的推出標志著QingCloud大數據基礎平臺的進一步完善,結合已經推出的Spark、Hadoop、ZooKeeper、消息隊列(Kafka)、Elasticsearch等服務,QingCloud的大數據平臺服務已經能夠滿足用戶的各種需求。很快我們還將會上線HBase存儲集群服務,提升整個大數據生命周期使用效率的各類平臺管理服務——包括但不限于日志服務、計算引擎靈活切換、對象存儲集成、服務編排等,以及基于主流機器學習平臺的智能分析服務。此外,全新的容器技術將會大幅度提升大數據平臺的整體性能?!?/p>