北京2021年5月10日 /美通社/ -- 近日,IPF2021在蘇州隆重舉辦,會上浪潮存儲產品線總經理李輝與華中科技大學武漢國家光電研究中心教授、博士生導師謝長生圍繞“從圖靈機視角看存儲產業(yè)發(fā)展”進行了圓桌對話,對話由百易傳媒(DOIT)總編宋家雨主持。
“十四五”時期,數字經濟推動智算中心加速普及和升級,對計算、存儲能力的需求將出現巨大的飛躍。與中國數字經濟遙相呼應,浪潮存儲業(yè)務正迎來爆發(fā)式增長,根據IDC最新報告,浪潮存儲2020年銷售額和銷量分別為26億元和2.4萬臺,增速為70%和96%,浪潮存儲全年市場銷量躍居中國前二、增速第一。那么從理論和實踐兩個維度來看,圖靈理論對數據存儲產業(yè)發(fā)展有怎樣啟示,一路奔跑的存儲廠商如何在十四五期間再創(chuàng)新高?本次圓桌訪談,浪潮存儲聯袂學術大咖,就上述問題展開深入討論。
以下為學術專家與浪潮存儲嘉賓圓桌對話摘錄:
從圖靈理論 看存算協同
主持人:圖靈理論是1936年由數學家圖靈提出來的,我們今天整個存儲、計算的基礎仍然是圖靈機這樣一個模型,以計算作為處理的核心,以數據存儲作為存儲的核心,要求計算和存儲要協同發(fā)展。但是發(fā)展到今天,最新的技術進展到什么地步了呢?
謝長生:現在商用的計算系統都在圖靈機的框架下,這是它的原理之根。從圖靈機模型可以直觀看出計算機實際就是計算、存儲、傳輸三個部分,存儲可以形象地認為它就是那根無限長的帶子,其中隱含的信息就是存儲容量越大越好,數據存儲和傳輸速度要跟得上處理的速度。因此,圖靈從理論上告訴我們,存儲第一要大,第二要快。只要我們能夠有無限的算力、無限的數據,我們就能計算整個世界。
計算跟存儲要協同發(fā)展,算力在一直前進,數據存儲也要在容量和性能上能夠跟計算匹配,并駕齊驅。特別是現在AI、云計算都要非常大的算力,應用跑得快了以后我們存儲就得要跟上,過去存儲速度跟不上,所以我們采取了各種各樣的新技術、新器件、新結構,就是為了讓存儲跟得上應用的數據處理速度。
主持人:計算和存儲的協同,目前是不是已經達到一種比較令人滿意的狀態(tài)?
李輝:在當前人工智能計算應用下,我們的存儲是夠用的,但是隨著新的人工智能模型演進,硅級計算接近碳級計算、類腦接近人腦的話,無論是計算還是存儲都有很大的空間等著我們去探索和提升。像在新型人工智能模型 GPT-3這里面,模型參數已經達到100多個億,但我們要達到類腦計算的效果,模型參數要到幾百萬億,數據存儲的容量、性能還要有比較大的提高。
謝長生:應用在推動我們技術的發(fā)展。因為應用的要求是越來越高,剛把它滿足,又有新的挑戰(zhàn)出來了,所以技術的進步總是有市場驅動力在驅動。
李輝:從存儲技術發(fā)展來看,過去存儲系統內部的瓶頸在介質上,現在介質已經把瓶頸突破了;目前的瓶頸是在傳輸和網絡上。無論是節(jié)點內高速的處理,還是節(jié)點間海量的數據同步,我們都需要做更多的工作,像PCIe、100G以太網技術的進步正在突破傳輸的瓶頸。
場景共同體 匯聚“產學研用”各方力量
主持人:本次IPF2021大會上,浪潮存儲提出了“場景共同體”的倡議。我們如何理解這個概念呢?
謝長生:教科書里有一個思路,叫“加快經常性事件”,經常性的事件就是場景特定的、相關的。不同的場景,經常發(fā)生的事情是不一樣的,把資源放到這個特定場景去優(yōu)化以后,加速效果是最好的。浪潮存儲提出來的以場景為特色的應用,和我們教科書上的在哲學思想上是一樣的,就是加快經常性事件。
計算機體系結構領域獲得圖靈獎的一位教授,帕特森,是RISC的發(fā)明人,又是磁盤陣列的發(fā)明人,他現在提出一個新的概念叫“域特定的架構”,Domain-Specific Architecture,就是說用資源加強特定領域,就能得到最好的效果,這和場景化的哲學思想是一樣的,但浪潮提出來的場景化的概念,更加接近于老百姓的理解。
李輝:是的,場景共同體這個概念,我們主要是考慮海量非結構化數據、超大規(guī)模應用場景的新需求。過去我們接觸的非結構化數據常見場景是高性能計算,現在演進到智慧計算,智慧交通、醫(yī)學影像、金融大數據、互聯網短視頻等應用場景里都有非常多的非結構化數據。這些新應用場景對數據的流動、處理,有各自獨特的需求,所以我們提出了一個概念 -- 場景共同體,就是在通用產品上通過產品定制、技術創(chuàng)新,來更好的滿足新應用場景對數據存儲的要求。
主持人:場景共同體的構建,需要“產學研用”各方力量的匯聚,這種匯聚會產生什么價值呢?
謝長生:產學研結合實際上很早就在提,早期的產學研合作層次比較低,但是經過二十年發(fā)展以后,我們的企業(yè)變強大了,學術界的研究水平也提高了,可以在國際前沿上做出我們自己創(chuàng)新的東西來,這樣產學研合作就能達到一個更高的水平。我們跟浪潮存儲幾年前還合作過一項經費達兩個億的重大專項,就產生了自主創(chuàng)新的成果。
李輝:我們跟華中科技大學在2009年合作了一個課題,叫超大規(guī)模海量存儲。在課題當中,我們在海量存儲體系結構上有了一些突破,探索在分布式的體系結構下我們怎么去解決容量、性能、可靠性的問題,這些成果為我們傳統集中式存儲和在新興分布式存儲的產品創(chuàng)新、產品工程化、市場化的商業(yè)運作奠定了很好的技術基礎。
謝長生:現在我們的企業(yè)已經在國際上有很強的競爭力了,有些領域已經進入無人區(qū),再往前怎么走,就要靠自己探路。這個時候企業(yè)和大學的結合是非常有好處的,因為學??赡芫褪遣粩嗳ヌ剿髑把?,看一些新方向,企業(yè)有大量的應用需求,會提出很多真問題來。這樣我們結合,比過去是更高層次的合作,就可以產生一些新的,甚至可以超越國外的產品。我相信我們國家產學研結合可以走向一個更高的階段,而且可以做出一些世界領先的東西。
李輝:謝老師提的那些,我非常有感觸。我們現在國內在學術界、高校、研究所有很多東西走在了前面,在基礎技術研究、新技術方向、算法、協議方面有很多突破,包括像謝老師在光存儲、在體系結構上的突破。面對科研先行的探索,企業(yè)是來做接力棒的,我們要把科研領域的創(chuàng)新和突破拿到我們的產品上,在工程上去嘗試、應用,把技術落地到產品上,最終能夠到達我們的用戶,到達產業(yè)界。
謝長生:形成一個產學研真正的循環(huán)。
主持人:據了解浪潮存儲和華中科技大學之間就異構存儲方面目前正在合作,能不能給我們披露一些情況?
謝長生:現在新介質越來越多,但沒有一種介質它是又大又快又便宜的,有的是非常快但非常貴,有的是很便宜但又很慢。所以我們講異構融合,那就是說存儲里要用不同的介質來構成一個系統,總體呈現出來的是速度高、容量大、比較便宜的這樣一個虛擬的存儲系統。我們在這方面做了很多研究,我想浪潮存儲很多產品都是用的這種思想。
李輝:是,我們跟華中科技大學的合作成果在我們第二代全閃存儲上就開始了,我們第二代全閃存儲稱之為HF系列,我們去年發(fā)布,今年已經量產。HF系列繼承了我們的合作成果,實現了3D XPoint跟3D TLC、MLC介質的融合,為存儲系統帶來非常高的性能。
基于場景共同體 實現產品創(chuàng)新
主持人:全閃存、分布式存儲,在場景共同體里會有哪些變化?
李輝:場景共同體我們也在一個探索過程當中,場景共同體的產品定制會對產品帶來什么樣的變化,是革命性的、顛覆性的變化,還是說只是一些延續(xù)性的、局部的變化。從目前我們對場景的認識來看,它應該還是一個局部的,不是一個顛覆性的變化。比如車還是車,但是這個車根據應用場景可以設計為公交車或是私家車,會有這樣的變化。
整體上來講我們認為產品的架構和基本技術、基本能力是不變的,只是針對場景去做優(yōu)化,就像遠距離傳輸場景里的無損壓縮和傳輸的需求,在高性能的計算碰到的快速拷貝需求等等,這些變化會對特定場景的用戶,帶來巨大的促進。
我們預計近期不會有太多的變化,但我們不確定這個場景的延伸,至少我們目前看到兩個極端的延伸,一個極端的延伸是往邊緣和終端上走,所以在邊緣計算領域可能會出來一些架構重構、形態(tài)重構的存儲。另外一個場景就是進內存計算,或者說這種高速的運行計算往內存存儲這個方向,可能會有一些架構和形態(tài)的變化,可能會衍生出新的產品。
主持人:對于場景化的追求也是所有廠商都希望實現的這樣一個目標。要實現這樣一個目標,它有沒有一些基本條件或門檻呢?
李輝:在場景共同體里面最基本的東西是搞清楚大家針對場景的認識、判斷或者商業(yè)期望。
首先大家愿意在這個場景上去投入,我們要想把這個場景通過技術的手段更好的滿足,實際上是一定要有投入的。比如說像我們今天提到的智慧交管、醫(yī)療影像、金融的內容管理,這實際上都是從用戶這一端來看業(yè)務發(fā)展過程當中在未來一段時間面臨比較大的、迫切的需求。
同時在場景共同體里我們會有專業(yè)化的分工,比如我們是做產品的,謝老師是做技術的,我們還有做應用的合作伙伴、做其他基礎設施產品的合作伙伴,比如做操作系統、數據庫、中間件、PaaS平臺的,甚至做服務器和網絡的一些合作伙伴。
場景共同體有一個簡單的想法,就是將專業(yè)化分工不同的伙伴聚在一起,類似圓桌或聯盟,大家不是點對點,而是多點對多點,通過多方交流合作方式大家共同去解決用戶碰到的問題。
主持人:場景共同體有點像從通用存儲往專用存儲去發(fā)展和變化,通用和專用之間需要有一個平衡,在技術上怎么樣支撐呢?
謝長生:通用性和專用性的問題還是看場景,看經常性的事件是什么。現在很多場景上,像CPU就是通用性很強的產品,但要拿這個通用的產品去解決有特定的問題,它的效率就比專用產品差很多。
假如經常性事件主要就是快速傅里葉變換,如果95%的時間都是要做這項應用,我們用一個其他技術能比CPU快得多。又如像量子計算,針對某一個場景能夠比現在IT方案快幾萬倍,那就是特定。所以就是這個道理,選擇通用產品還是專用產品,取決于業(yè)務場景。
李輝:場景之間來看需求的時候一定是個性化的,但是這個場景里面一定是包含著巨大的群體,包含著很多用戶,在場景內部又是共性的,所以這就是場景間是個性、場景內是共性,這就是所謂個性化的批量生產,這就是工業(yè)革命4.0的核心思想。比如一個領帶單品能賣100萬件,如果考慮我們周邊人的話不會想到它會賣出100萬件。但是你把它放到網上的幾億消費者當中,你就會找出100萬個直接用戶來。所以場景覆蓋的群體越大、找到的共性越大,實際上效率就越高。
主持人:感謝兩位,相信未來數據存儲的場景針對性會越來越強,就像本次圓桌對話的主題“新存志遠數聚向新”,我們也期待著場景共同體能夠給整個存儲產業(yè)帶來一些新的變化,能夠為數據存儲、為整個行業(yè)用戶提供全新的支撐,釋放數據價值加速企業(yè)數字化轉型。