浪潮獲15項(xiàng)MLPerf 推理V1.1 AI基準(zhǔn)評(píng)測(cè)冠軍

浪潮

2021-09-23 18:54 4548

北京2021年9月23日 /美通社/ -- 9月23日，全球權(quán)威AI基準(zhǔn)評(píng)測(cè)MLPerf?公布最新榜單Inference(推理) V1.1，在最受關(guān)注的固定任務(wù)(Closed)測(cè)試中，浪潮獲得15項(xiàng)冠軍，占據(jù)冠軍榜單半壁江山，蟬聯(lián)四屆MLPerf? AI基準(zhǔn)測(cè)試冠軍榜首。

MLPerf?是影響力極為廣泛的國(guó)際AI性能基準(zhǔn)評(píng)測(cè)，由圖靈獎(jiǎng)得主大衛(wèi)?帕特森（David Patterson）聯(lián)合頂尖學(xué)術(shù)機(jī)構(gòu)發(fā)起成立。2020年，非盈利性機(jī)器學(xué)習(xí)開(kāi)放組織MLCommons基于MLPerf?基準(zhǔn)測(cè)試成立，其成員包括谷歌、Facebook、英偉達(dá)、英特爾、浪潮、哈佛大學(xué)、斯坦福大學(xué)、加州大學(xué)伯克利分校等50余家全球AI領(lǐng)軍企業(yè)及頂尖學(xué)術(shù)機(jī)構(gòu)，致力于推進(jìn)機(jī)器學(xué)習(xí)和人工智能標(biāo)準(zhǔn)及衡量指標(biāo)。目前，MLCommons每年組織2次MLPerf? AI訓(xùn)練性能測(cè)試和2次MLPerf? AI推理性能測(cè)試，為用戶(hù)衡量設(shè)備性能提供權(quán)威有效的數(shù)據(jù)指導(dǎo)。

MLPerf?推理V1.1 AI基準(zhǔn)測(cè)試固定任務(wù)(Closed)包括數(shù)據(jù)中心(共16個(gè)項(xiàng)目)和邊緣(共14個(gè)項(xiàng)目)兩大場(chǎng)景。在數(shù)據(jù)中心場(chǎng)景下設(shè)置6個(gè)模型，分別是圖像識(shí)別（ResNet50）、醫(yī)學(xué)影像分割（3D-UNet）、目標(biāo)物體檢測(cè)（SSD-ResNet34）、語(yǔ)音識(shí)別（RNN-T）、自然語(yǔ)言理解（BERT）以及智能推薦（DLRM），其中Bert、DLRM和3D-Unet設(shè)有高精度（99.9%）模式。除3D-UNet模型任務(wù)只考察Offline離線(xiàn)推理場(chǎng)景性能外，其他模型任務(wù)按照Server在線(xiàn)推理和Offline離線(xiàn)推理兩種應(yīng)用場(chǎng)景分別進(jìn)行性能測(cè)試。邊緣場(chǎng)景AI模型在數(shù)據(jù)中心場(chǎng)景的6個(gè)模型基礎(chǔ)上刪減了智能推薦（DLRM）模型，并增加目標(biāo)物體檢測(cè)（SSD-MobileNet）模型，所有模型均有Offline離線(xiàn)推理場(chǎng)景和SingleStream單流推理兩個(gè)場(chǎng)景。

固定任務(wù)(Closed)要求參賽各方使用相同模型和優(yōu)化器，這對(duì)于實(shí)際用戶(hù)評(píng)測(cè)AI計(jì)算系統(tǒng)性能具備很強(qiáng)的參考意義，也一直是MLPerf?中角逐最激烈及主流廠(chǎng)商最關(guān)注的領(lǐng)域。此次共有英偉達(dá)、英特爾、浪潮、高通、阿里巴巴、戴爾、HPE等19家廠(chǎng)商參與到固定任務(wù)(Closed)測(cè)試競(jìng)賽中，其中數(shù)據(jù)中心場(chǎng)景收到了754項(xiàng)成績(jī)提交，邊緣場(chǎng)景收到了448項(xiàng)成績(jī)提交，共1199項(xiàng)成績(jī)提交。

浪潮全棧AI能力助推性能持續(xù)突破

浪潮取得此次MLPerf?競(jìng)賽佳績(jī)的三款A(yù)I服務(wù)器，分別是NF5488A5、NF5688M6及NE5260M5。NF5488A5是全球首批上市的A100服務(wù)器，在4U空間支持8顆第三代NVlink互聯(lián)的A100 GPU和2顆AMD Milan CPU，同時(shí)支持液冷和風(fēng)冷散熱技術(shù)。NF5688M6是面向大規(guī)模數(shù)據(jù)中心優(yōu)化設(shè)計(jì)的具備極致擴(kuò)展能力的AI服務(wù)器，支持8顆A100 GPU和兩顆Intel Icelake CPU，支持多達(dá)13張PCIe Gen4的IO擴(kuò)展卡。NE5260M5通過(guò)極致優(yōu)化的信號(hào)和電源等系統(tǒng)設(shè)計(jì)，兼容高性能CPU和多種AI加速卡，通過(guò)減震降噪優(yōu)化和嚴(yán)苛的可靠性測(cè)試，機(jī)箱深度430mm較普通服務(wù)器縮短近二分之一，滿(mǎn)足空間受限的邊緣計(jì)算場(chǎng)景部署需求。

浪潮在本次MLPerf?競(jìng)賽獲得15項(xiàng)全球第一，涵蓋醫(yī)學(xué)影像識(shí)別、自然語(yǔ)義理解、圖像識(shí)別、語(yǔ)音識(shí)別、智能推薦、目標(biāo)物體檢測(cè)（SSD-ResNet34）以及目標(biāo)物體檢測(cè)（SSD-MobileNet）全部7項(xiàng)AI模型任務(wù)，從云到邊全面領(lǐng)先。浪潮持續(xù)提升數(shù)據(jù)中心場(chǎng)景下MLPerf?各項(xiàng)任務(wù)性能成績(jī)，即便在相同服務(wù)器配置下各項(xiàng)任務(wù)成績(jī)依然得到較大改善，如圖像識(shí)別(ResNet50)和語(yǔ)音識(shí)別(RNN-T)的模型性能分別較半年前的V1.0競(jìng)賽成績(jī)提升了4.75%和3.83%。

浪潮AI服務(wù)器在MLPerf?基準(zhǔn)評(píng)測(cè)中的出色表現(xiàn)，得益于浪潮在AI計(jì)算系統(tǒng)卓越的系統(tǒng)設(shè)計(jì)能力和全棧優(yōu)化能力。在硬件層面，通過(guò)對(duì)CPU、GPU硬件性能的精細(xì)校準(zhǔn)和全面優(yōu)化，使CPU性能、GPU性能、CPU與GPU之間的數(shù)據(jù)通路均處于對(duì)AI推理最優(yōu)狀態(tài)；在軟件層面，結(jié)合GPU硬件拓?fù)鋵?duì)多GPU的輪詢(xún)調(diào)度優(yōu)化使單卡至多卡性能達(dá)到了近似線(xiàn)性擴(kuò)展；在深度學(xué)習(xí)算法層面，結(jié)合GPU Tensor Core 單元的計(jì)算特征，通過(guò)自研通道壓縮算法成功實(shí)現(xiàn)了模型的極致性能優(yōu)化。

浪潮NF5488A5是本次MLPerf?競(jìng)賽中唯一實(shí)現(xiàn)以液冷方式支持8顆500W A100 GPU的AI服務(wù)器，液冷散熱為AI計(jì)算性能提升注入了強(qiáng)勁動(dòng)力。而在本次MLPerf?競(jìng)賽所有配置8顆A100 SXM4芯片的主流高端AI服務(wù)器中，浪潮獲得了數(shù)據(jù)中心場(chǎng)景固定任務(wù)下全部16項(xiàng)任務(wù)的最佳成績(jī)。

浪潮是全球領(lǐng)先的AI計(jì)算領(lǐng)導(dǎo)廠(chǎng)商，AI服務(wù)器市場(chǎng)份額全球第一，連續(xù)四年以超50%的市場(chǎng)份額居中國(guó)AI服務(wù)器市場(chǎng)第一。浪潮致力于AI計(jì)算平臺(tái)、資源平臺(tái)和算法平臺(tái)的研發(fā)創(chuàng)新，并通過(guò)元腦生態(tài)與AI領(lǐng)先企業(yè)共同推進(jìn)AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化進(jìn)程。

消息來(lái)源：浪潮