北京2022年5月17日 /美通社/ -- 隨著云計算、大數據等新興應用廣泛普及,業(yè)務數據呈現爆炸式增長,海量數據的高效訪問、經濟存儲和智能管理變得越來越重要。
從數據生命周期來看,在數據剛生成并使用時,屬于在線數據,在線數據訪問的頻率最高,數據的價值也最高,對數據訪問的性能、數據的訪問的連續(xù)性、數據邏輯錯誤后的恢復性有很高的要求,但隨著時間的推移,在線熱數據會逐步變成溫數據,甚至冷數據和冰數據;據統(tǒng)計,超過30天的數據的使用率不到10%,但這些數據仍然很重要,如何處理和合理存儲這部分數據,對IT系統(tǒng)的運維部門來講,是一個需要解決的重要問題。
浪潮存儲基于對數據需求特點的研究,發(fā)現不同時期的數據存在不同的需求,對于存儲性能、成本的需求差異較大,基于這些特點提出了熱、溫、冷、冰四級分層數據生命周期管理策略,根據數據的訪問頻率不同,提供相應的方案和產品,通過數據分級集中管理,實現存儲性能、容量和成本之間的平衡,提升系統(tǒng)的整體存儲性能的同時,減少設備投入成本。
熱數據高可用,保障業(yè)務永續(xù)
MES( 制造執(zhí)行系統(tǒng))、HIS(醫(yī)院信息系統(tǒng))、ERP(企業(yè)資源計劃)等結構化數據為主的關鍵業(yè)務,對存儲性能、對業(yè)務連續(xù)性有非常高的要求,浪潮提供基于集中式存儲平臺的免網關存儲雙活方案,在雙活模式下,兩個數據中心具備等同的業(yè)務處理能力并通過高速鏈路實時同步數據,采用浪潮獨有的WAN網絡加速技術,通過先進的算法實現數據流壓縮、固定塊切割和多數據流并發(fā),將遠程傳輸的性能提升高達10倍、延時降低為原來的十分之一,僅占用少量的網絡帶寬就可以完成海量數據的遠程復制,大幅降低企業(yè)對容災網絡帶寬的依賴,節(jié)約成本。若其中一個數據中心出現故障,業(yè)務會立即自動切換到另一數據中心,保持業(yè)務連續(xù)運行,并且方案不需要單獨網關,在降低了延遲的同時,也減少了網關帶來的額外故障風險。
在此基礎上,浪潮存儲可以升級至容災更全面的兩地三中心方案,即生產數據中心、同城災備中心、異地災備中心。其中異地災備中心提供數據備份,當同城中心因自然災害等原因而發(fā)生故障時,異地災備中心可以用備份數據進行業(yè)務的恢復。兩地三中心的設計架構,可在同城雙中心遇自然災害或人為破壞時,使用異地災備中心及時恢復并提供有效的信息服務,從而保證業(yè)務和數據的連續(xù)性。
在容災方案中,浪潮集中式存儲平臺能夠提供滿足企業(yè)關鍵的業(yè)務需求的可靠性和性能。在可靠性方面,浪潮存儲從器部件到存儲操作系統(tǒng)再到算法進行了全面的加強。在性能方面,通過不斷打磨以iTurbo為核心的加速引擎,優(yōu)化資源調度算法,充分利用更多的CPU核心和線程承載更多的數據存儲進程。通過搭載iTurbo智能引擎,浪潮集中式存儲在SPC-1性能測試中創(chuàng)造了2300 萬IOPS的世界紀錄。
浪潮成熟的雙活、兩地三中心技術方案已經在金融、醫(yī)療等關鍵行業(yè)有大量的成功實踐,無論是在實際發(fā)生的災難還是災備演練,RPO和RTO均接近于零,有效保障了用戶關鍵業(yè)務的連續(xù)性。
溫數據備份,確保數據安全
容災方案通過數據多地存放,物理上保障了在線熱數據業(yè)務連續(xù),但遇到邏輯問題仍可能面臨風險。比如當前端業(yè)務新建一個文檔,修改一條數據,刪除一個圖片時,存儲會把最新的狀態(tài)保存下來,數據的歷史狀態(tài)一直會被最新的狀態(tài)覆蓋。無論是惡意入侵、誤操作,還是正常操作,存儲并不識別上層軟件的意圖。如果是異常操作,則需要專業(yè)的備份系統(tǒng)將數據恢復到操作之前的狀態(tài)。
浪潮備份解決方案部署備份一體機DP2000G6,單一設備可提供傳統(tǒng)備份方案中備份軟件、備份服務器、備份存儲三者的功能,滿足企業(yè)D2D及D2D2T備份需求,簡化了用備份系統(tǒng)的建設和維護。浪潮備份方案通過合成多種備份技術,利用上一個全備份以及其后的增量備份生成一個新的備份,兼顧全備和增備的優(yōu)勢,有效應對需要備份大量文件的應用場景;并通過重刪和壓縮技術,提高了備份速率,降低了企業(yè)擴容成本。
溫數據備份方案可以有效抵御因人為誤操作、被勒索病毒攻擊、以及自然災害等不可抗拒力而導致的業(yè)務中斷和數據丟失所帶來的風險,幫助用戶實現業(yè)務永遠在線,數據永不丟失。
冷數據歸檔,低成本存儲有保障
隨著互聯網、人工智能、大數據等新技術的快速應用,數據采集精確度不斷提升,來源不斷增多,傳輸效率也在快速提升,數據規(guī)模爆發(fā)式增長,其中80%以上多為圖片、視頻等非結構化數據。這些非結構數據在使用一段時間后,會積淀為使用頻率不高的冷數據,但是冷數據并非失去價值,大數據、人工智能等新興業(yè)務對海量冷數據進行檢索和挖掘的需求依然存在而且日益迫切。面對體量巨大但訪問性能要求不高的冷數據,傳統(tǒng)存儲無法滿足海量冷數據的低成本存儲需求。
基于數據存儲成本、容量、性能等方面的權衡考量,浪潮存儲采用分布式存儲對海量冷數據進行管理,滿足大數據等新興業(yè)務對部分冷數據進行近線或在線訪問的偶發(fā)存取性能要求。
浪潮分布式存儲AS13000系列可同時提供文件、塊、對象、大數據四種存儲服務,實現一套存儲支撐一個數據中心業(yè)務,極大地提高數據共享的效率,同時所有設備統(tǒng)一管理,減少設備維護和管理成本,降低TCO。此外,隨著業(yè)務增長,浪潮分布式存儲不僅可以通過擴展節(jié)點增加容量及性能資源,還能在所需的存儲類型發(fā)生了巨大變化情況下,可以將原有塊存儲的資源進行釋放,配置為文件存儲空間,從而避免重復投資,幫助企業(yè)敏捷地應對海量數據業(yè)務復雜的存儲需求。同時為了保障數據的安全,浪潮分布式存儲還基于回收站功能有效防止數據誤刪;并采用數據冗余策略,支持業(yè)界最高的8份副本、4TB/H快速重構進一步提升系統(tǒng)可靠性。
冰數據離線,經濟節(jié)能長期保存
除了企業(yè)自身業(yè)務的特點對數據有著長期保存需求之外,在特定的行業(yè),對數據還有明確的監(jiān)管要求,如醫(yī)療行業(yè)住院病歷數據需要保存30年以上;測繪地理信息業(yè)務檔案保管期限最長為永久;教育行業(yè)的學生信息,成績,檔案要求永久保存。針對于此類數據訪問頻率非常低,但需要保障安全的數據,浪潮存儲采用了模塊化的磁帶庫,在保障數據安全的情況下,提供持久經濟的解決方案。
首先,從經濟節(jié)能的角度,磁帶采用納米級磁性顆粒,存儲密度更高,并且一個磁帶驅動器可以對應大量的磁帶,當擴容時,只需考慮存儲介質的成本,同等容量下磁帶存儲的成本僅為磁盤的1/6;磁帶離線存儲記錄下數據后,被存放在自動磁帶庫的卡槽中,不用定期通電維護,節(jié)省大量能耗。
其次,在安全可靠層面,磁帶配有內置和動態(tài)加密,以及介質自身的性質帶來額外的安全性,如離線狀態(tài)隔絕了黑客和網絡攻擊,無法訪問或修改數據;根據相關測試表明磁帶出錯率相當于硬盤萬分之一,能保障數據保存期限長達30-50年。
浪潮冰數據離線解決方案支持最新的LTO9磁帶,單系統(tǒng)最高可提供400多PB數據空間,滿足金融、醫(yī)療、檔案、石油勘探等行業(yè)的海量重要數據離線長期存儲需求。
數據作為企業(yè)重要的數字資產,隨著企業(yè)數字化轉型不斷加速,數據安全要求越來越高,數據價值挖掘越來越深,數據全生命周期的管理模式已成為企業(yè)在智慧時代下全新的需求。為此,浪潮提出"存儲即平臺"戰(zhàn)略,以面向關鍵應用的集中式存儲平臺、面向智慧應用的分布式存儲平臺、保障數據安全的備份存儲平臺、長周期保存數據的歸檔存儲平臺四大平臺,針對數據不同周期的性能、容量、成本等需求特點,提供數據全生命周期存儲解決方案,助力企業(yè)提速數字化轉型。