北京2021年7月1日 /美通社/ -- 美國東部時間6月30日,國際權威AI基準測試MLPerf?公布2021年最新榜單,在固定任務(Closed)賽道的全部8項模型訓練任務中,浪潮獲得4項性能第一,斬獲半數冠軍。
MLPerf?由圖靈獎得主大衛(wèi)·帕特森(David?Patterson)聯合谷歌、斯坦福、哈佛大學等知名學術機構發(fā)起成立,是影響力最廣的國際AI性能基準評測。此次性能評測基于最新MLPerf? Training V1.0基準,涵蓋了圖像分類(ResNet)、醫(yī)學影像分割(U-Net3D)、目標物體檢測(SSD)、目標物體檢測(Mask R-CNN)、語音識別(RNN-T)、自然語言理解(BERT)、智能推薦(DLRM)以及強化機器學習(Minigo)8類AI應用場景,每類場景都包含固定任務(Closed)和開放優(yōu)化(Open)兩類性能競賽。
除浪潮外,Google、NVIDIA、Intel、DELL等12家廠商也參與了此次MLPerf?訓練基準測試,競爭十分激烈。最終,浪潮在固定任務(Closed)賽道的全部8項任務中,獲得圖像分類ResNet、自然語言理解BERT、目標檢測SSD和智能推薦DLRM4項訓練任務性能冠軍,其中,浪潮NF5688M6獲得ResNet、DLRM和SSD的單機訓練性能第一,NF5488A5獲得BERT的單機訓練性能桂冠。
憑借卓異的軟硬件系統優(yōu)化能力,浪潮將MLPerf?訓練基準的單機效率進一步提升至新的高度。相比2020年MLPerf? Training v0.7榜單,浪潮刷新了圖像分類、自然語言理解、目標檢測(SSD)和智能推薦4項任務的單機訓練性能紀錄,將模型訓練耗時分別縮短了17.95%、56.85%、18.61%和42.64%,凸顯出優(yōu)質AI服務器在AI模型訓練效率上的巨大價值。
浪潮在MLPerf?基準評測中的出色表現,得益于在AI計算系統創(chuàng)新上卓越的系統設計能力和全棧優(yōu)化能力。在硬件層面,針對AI訓練中常見的密集IO傳輸瓶頸,浪潮PCIe Retimer Free設計實現了CPU-GPU間通道免中繼高速互聯,大幅降低通信延遲,極大提升了AI訓練效率;同時,針對高負載多GPU協同任務調度,對NUMA節(jié)點與GPU之間的數據傳輸進行全面優(yōu)化和深度調校,確保訓練任務中的數據IO無阻塞;此外,在散熱層面,針對目前業(yè)界功率最高的500W 80GB A100 GPU,浪潮率先開發(fā)的先進片上液冷系統,確保GPU在全功率甚至超頻負載下依然穩(wěn)定工作,將AI計算系統的性能發(fā)揮到極致。
在不斷斬獲MLPerf?冠軍的同時,浪潮也把競賽過程中探索出的高效優(yōu)化方法回饋至MLPerf社區(qū),推動AI技術的共同進步。在MLPerf? Training v0.7中,浪潮開創(chuàng)性提出效率更高的ResNet收斂性優(yōu)化方案:在ImageNet數據集上,僅使用85%的迭代步數就達到了75.9%的目標精度,該優(yōu)化方案將訓練性能提升了15%。目前,該方案已被社區(qū)成員采納,并廣泛應用到MLPerf? Training V1.0測試中,這也是此次ResNet任務成績得以大幅提升的重要原因。
自2020年至今,浪潮參與了MLPerf? training v0.7, Inference v0.7, Inference v1.0, training v1.0四次競賽。已經累計斬獲41項冠軍。
浪潮是全球領先的AI計算廠商,AI服務器市場份額全球第一,在中國的市場份額已連續(xù)四年保持在50%以上。浪潮致力于AI計算平臺、資源平臺和算法平臺的研發(fā)創(chuàng)新,并通過元腦生態(tài)與AI領先企業(yè)共同推進AI產業(yè)化和產業(yè)AI化進程。