北京2017年4月14日電 /美通社/ -- 2017年3月,英特爾發(fā)布的面向臺式機的英特爾® 傲騰? 內存模塊(16GB和32GB),將從4月24日起上市。在半導體技術驅動下,計算機性能沿著摩爾定路突飛猛進,然而,仍舊逃離不開“存儲”的瓶頸制約,拖累整個系統(tǒng)性能提升緩慢。使用閃存(NAND)加速的想法一直都在,Wintel都有嘗試,今天,傲騰(Optane)將有機會改變這一切。
雖然已經有了數十年的歷史,但是馮·諾依曼1946年提出的計算機體系架構,仍是現在乃至可見的未來,計算機所遵循的基本架構體系:存儲和計算。CPU是大家所熟悉的計算核心,但是并非馮·諾依曼體系中的計算核心,按照大學計算機原理課老師所說,CPU非常笨,它只會做“1+1”這一件事,而且只會從A、B寄存器取數、結果放到C寄存器,馮·諾依曼體系中的計算是指ALU(數邏運算單元)而存儲是寄存器。當然,這是最狹義的馮·諾依曼體系理解,不過也從側面說出了計算和存儲相依相存的特殊關系。
速度快當然是王道,但是非常遺憾,半導體技術發(fā)展到今天,仍然不能解決容量和性能的根本矛盾,考慮到成本和實現因素,最終的產品都是性能向成本的妥協(xié)。歷史上看,誰能將兩者的平衡點向性能或容量任一端推動,定將帶來世界的巨大改變。SRAM到DRAM、閃存盤對軟盤/光盤、SSD對HDD,以及剛剛面世的Optane。
快慢設備的銜接
“多點潤滑、少點摩擦”,這是海灣戰(zhàn)爭期間的著名潤滑油廣告。而對于計算機來說,高速和低俗設備之間,對獲取數據方面的摩擦一直沒有停止過,解決這種數據沖突的方式也在革新。
以速度較快的ALU為例,與之進行數據交換的寄存器有著相同速度的寄存器,除去在相鄰周期里循環(huán)存取的時間周期不算,兩者實際上是同頻同步工作的。寄存器有著動輒數GHz的運行速度,只能集成在離ALU最近的地方,但代價是成本高昂、容量以字節(jié)為單位精打細算,這就是為什么如AVX 2.0中的256位指令/數據寄存器,英特爾更壕一些,直接放入256位長,而AMD摳門些,旗艦的Ryzen 7 1800X只有128位寄存器,256位數據需要兩個周期讀入和寫出,性能折損極大。當然,處理器廠商們早已注意到這個問題,n年前就大肆引入Cache結構作為從寄存器到內存的梯級緩沖,用數量和逐漸提高的速度解決計算單元從內存獲取數據的性能落差。L1、L2、L3 Cache容量通常為數十KB、數百KB和數MB,對應容量提升一個級別,速度也降低一個級別,以匹配慢速的GB級別內存。為了保證速度,Cache通常會采用SRAM(靜態(tài)內存)制作,而內存雖然用了DRAM速度低了不少,但當年正是DRAM的出現,讓配有64KB內存的PC有機會誕生,要知道同容量的SRAM當時價格超過2500美元,而第一臺PC的不過1999美元。
類似的情況也出現在“存儲”設備上,雖然以硬盤(HDD)為代表的存儲設備已經是外設“矬子里面的將軍”,但是它和PC系統(tǒng)之間的性能落差仍然很大,其性能包括了帶寬和響應延遲等兩個維度的速度。于是另一種緩存,Buffer出現了。別看中文都是“緩存”,但是在計算機詞匯中,Cache和Buffer是兩個不同世界的速度,相比多采用SRAM的Cache,Buffer多使用廉價的DRAM以緩解I/O接口兩側的速度不匹配,最常見的情形是Buffer容量作為HDD的重要參數標識產品檔次。無論是哪種緩沖,都能在響應時間和帶寬上同時匹配兩端性能,兩端都認為對方遷就了自己的性能水準,而沒有察覺到緩沖的加入,此現象就叫透明。
容量與性能的分歧
經過多級緩沖,DRAM的速度已經遠遠落后于CPU,但即便如此,它仍遠遠高于主流的存儲設備。更具體點說,單通道DDR4-2400內存帶寬已近20GB/s、延遲為30ns左右,而容量已突破10TB的HDD,對應的性能水準只略微增長到150MB/s~200MB/s帶寬,延遲則停留在3~4ms(接口)+7~8ms(平均尋道)的10年前水平,明顯不能滿足當下電腦系統(tǒng)的需求。于是這才有了近幾年較有效的升級已經從增加內存變?yōu)榱烁鼡QHDD為SSD。SSD綜合性能較HDD已經有了質的飛躍,主流產品接口帶寬突破1GB/s水平、延遲下降到μs量級,但與之伴隨的就是10倍的價格差異。
無論是容量還是性能,對使用體驗的影響都是顯而易見的。在預算有限的前提下,考慮到時間可以換取性能而容量不行,更多數消費者都傾向于容量更大而非性能更高,這也就是為何仍有超過85%的臺式電腦選擇HDD作為唯一存儲設備的原因。但凡預算寬裕一些,或者性能的需求稍占上風,雙硬盤就成為更為理想的搭配。現實是很殘酷的,艱難的預算增加,并不能帶來如一的性能體驗,頻繁使用的數據固然可以手動放置到SSD中,但是相對較小的容量被占滿后,越是大量的數據,越會深刻體會到“慢”的熬人,小容量SSD對此無能為力。
能夠彌合電腦與HDD性能落差、解決SSD與HDD容量落差的Optane來了。
橫空出世
SSD的出現,可謂是近年來存儲領域較大的技術革新。以高速旋轉的磁碟片為基礎的HDD,數十年來維持在溫徹斯特架構下幾乎沒有變化,無論是體積縮小還是容量增加,都不能很好地解決速度問題,哪怕是即將到來的熱輔助磁存儲技術,也只是幫助容量大幅提升而對性能的提升仍是隔靴搔癢,機械原理限制了HDD性能質的升級。SSD核心的改變正在于以半導體取代機械,ms進入μs、MB/s提升到GB/s。按下葫蘆起來瓢,SSD讓成本和耐久性問題浮出水面,NAND的存儲介質可謂“萬惡之源”。
NAND是閃存(Flash)中最主要的類別,具有讀寫耐久性隨制程提升下降、性能隨制程提升下降等固有特性,特別是為了在有限的晶圓(成本)上獲得更大容量,制程和單元結構升級一直沒有停止過,如今NAND已經進入10nm時代、TLC漸成主流,反觀其耐久性艱難維持在2000次左右,延遲和介質性能改進緩慢。
2015年,英特爾正式發(fā)布了名為3D XPoint的全新非易失性存儲技術,這就是橫空出世的Optane傲騰;與英特爾合作生產相關產品的美光,則將其命名為QuantX。3D XPoint或者說Optane與NAND/NOR等Flash完全不同,而更接近于內存,延遲、耐擦寫性、介質速度等幾個關鍵指標也優(yōu)于NAND幾個數量級,未來發(fā)展?jié)摿薮?,英特爾的目標是用其擴大僅有5%左右的SSD市場份額。
Optane的非易失性和性能優(yōu)勢,使其可在計算機系統(tǒng)中扮演多種甚至是任何存儲角色:內存、存儲和緩存,分別對應Optane DIMM、Optane SSD和Optane Memory,從而改變整個計算機存儲發(fā)展進程。目前后兩類產品已經上市。
為了獲得極速的存儲,一種名為RAMDisk的產品已經問世多年。它采用單位容量昂貴的DRAM為存儲介質,使系統(tǒng)用訪問硬盤的方式訪問它,性能當然是內存水平的,而容量也是內存水平的數GB。顯然,這樣的容量水平對PC都不夠用,何況這樣的“硬盤”還要面臨掉電數據丟失(易失性)的問題,使用時先要從硬盤讀取數據、關機前人工將數據寫回硬盤,可用性不佳。今天,Optane SSD已經具有了RAMDisk的性能卻有著數TB的超大容量和非易失性,后者已經沒有繼續(xù)存在的意義。
Optane Memory則是比NAND更為理想的緩存材料,更高的耐久性和ns級的響應速度,比當年英特爾涉足緩存領域的TurboMemory所使用的SLC NAND表現優(yōu)1~3個數量級,更別提如今漫天的TLC產品了。性能改善之余,32GB的超大容量早已突破系統(tǒng)緩沖的需求,甚至作為超高性能的SSD也不為過(想想Optane SSD的表現),它更大的作用是為Windows以外的更多應用和數據進行緩沖和優(yōu)化,實用性遠超當年512MB的TurboMemory產品。只要用上英特爾200系列的芯片組和7代酷睿處理器,Optane Memory的延遲水平直逼DRAM。想象一下有否體驗過內存的延遲水平或速度不足,沒有吧?未來“硬盤”也不會再有今天煩人的等待,與內存同速。