北京2021年9月23日 /美通社/ -- 9月23日,全球權(quán)威AI基準(zhǔn)評(píng)測(cè)MLPerf?公布最新榜單Inference(推理) V1.1,在最受關(guān)注的固定任務(wù)(Closed)測(cè)試中,浪潮獲得15項(xiàng)冠軍,占據(jù)冠軍榜單半壁江山,蟬聯(lián)四屆MLPerf? AI基準(zhǔn)測(cè)試冠軍榜首。
MLPerf?是影響力極為廣泛的國(guó)際AI性能基準(zhǔn)評(píng)測(cè),由圖靈獎(jiǎng)得主大衛(wèi)?帕特森(David Patterson)聯(lián)合頂尖學(xué)術(shù)機(jī)構(gòu)發(fā)起成立。2020年,非盈利性機(jī)器學(xué)習(xí)開(kāi)放組織MLCommons基于MLPerf?基準(zhǔn)測(cè)試成立,其成員包括谷歌、Facebook、英偉達(dá)、英特爾、浪潮、哈佛大學(xué)、斯坦福大學(xué)、加州大學(xué)伯克利分校等50余家全球AI領(lǐng)軍企業(yè)及頂尖學(xué)術(shù)機(jī)構(gòu),致力于推進(jìn)機(jī)器學(xué)習(xí)和人工智能標(biāo)準(zhǔn)及衡量指標(biāo)。目前,MLCommons每年組織2次MLPerf? AI訓(xùn)練性能測(cè)試和2次MLPerf? AI推理性能測(cè)試,為用戶(hù)衡量設(shè)備性能提供權(quán)威有效的數(shù)據(jù)指導(dǎo)。
MLPerf?推理V1.1 AI基準(zhǔn)測(cè)試固定任務(wù)(Closed)包括數(shù)據(jù)中心(共16個(gè)項(xiàng)目)和邊緣(共14個(gè)項(xiàng)目)兩大場(chǎng)景。在數(shù)據(jù)中心場(chǎng)景下設(shè)置6個(gè)模型,分別是圖像識(shí)別(ResNet50)、醫(yī)學(xué)影像分割(3D-UNet)、目標(biāo)物體檢測(cè)(SSD-ResNet34)、語(yǔ)音識(shí)別(RNN-T)、自然語(yǔ)言理解(BERT)以及智能推薦(DLRM),其中Bert、DLRM和3D-Unet設(shè)有高精度(99.9%)模式。除3D-UNet模型任務(wù)只考察Offline離線(xiàn)推理場(chǎng)景性能外,其他模型任務(wù)按照Server在線(xiàn)推理和Offline離線(xiàn)推理兩種應(yīng)用場(chǎng)景分別進(jìn)行性能測(cè)試。邊緣場(chǎng)景AI模型在數(shù)據(jù)中心場(chǎng)景的6個(gè)模型基礎(chǔ)上刪減了智能推薦(DLRM)模型,并增加目標(biāo)物體檢測(cè)(SSD-MobileNet)模型,所有模型均有Offline離線(xiàn)推理場(chǎng)景和SingleStream單流推理兩個(gè)場(chǎng)景。
固定任務(wù)(Closed)要求參賽各方使用相同模型和優(yōu)化器,這對(duì)于實(shí)際用戶(hù)評(píng)測(cè)AI計(jì)算系統(tǒng)性能具備很強(qiáng)的參考意義,也一直是MLPerf?中角逐最激烈及主流廠(chǎng)商最關(guān)注的領(lǐng)域。此次共有英偉達(dá)、英特爾、浪潮、高通、阿里巴巴、戴爾、HPE等19家廠(chǎng)商參與到固定任務(wù)(Closed)測(cè)試競(jìng)賽中,其中數(shù)據(jù)中心場(chǎng)景收到了754項(xiàng)成績(jī)提交,邊緣場(chǎng)景收到了448項(xiàng)成績(jī)提交,共1199項(xiàng)成績(jī)提交。
浪潮全棧AI能力助推性能持續(xù)突破
浪潮取得此次MLPerf?競(jìng)賽佳績(jī)的三款A(yù)I服務(wù)器,分別是NF5488A5、NF5688M6及NE5260M5。NF5488A5是全球首批上市的A100服務(wù)器,在4U空間支持8顆第三代NVlink互聯(lián)的A100 GPU和2顆AMD Milan CPU,同時(shí)支持液冷和風(fēng)冷散熱技術(shù)。NF5688M6是面向大規(guī)模數(shù)據(jù)中心優(yōu)化設(shè)計(jì)的具備極致擴(kuò)展能力的AI服務(wù)器,支持8顆A100 GPU和兩顆Intel Icelake CPU,支持多達(dá)13張PCIe Gen4的IO擴(kuò)展卡。NE5260M5通過(guò)極致優(yōu)化的信號(hào)和電源等系統(tǒng)設(shè)計(jì),兼容高性能CPU和多種AI加速卡,通過(guò)減震降噪優(yōu)化和嚴(yán)苛的可靠性測(cè)試,機(jī)箱深度430mm較普通服務(wù)器縮短近二分之一,滿(mǎn)足空間受限的邊緣計(jì)算場(chǎng)景部署需求。
浪潮在本次MLPerf?競(jìng)賽獲得15項(xiàng)全球第一,涵蓋醫(yī)學(xué)影像識(shí)別、自然語(yǔ)義理解、圖像識(shí)別、語(yǔ)音識(shí)別、智能推薦、目標(biāo)物體檢測(cè)(SSD-ResNet34)以及目標(biāo)物體檢測(cè)(SSD-MobileNet)全部7項(xiàng)AI模型任務(wù),從云到邊全面領(lǐng)先。浪潮持續(xù)提升數(shù)據(jù)中心場(chǎng)景下MLPerf?各項(xiàng)任務(wù)性能成績(jī),即便在相同服務(wù)器配置下各項(xiàng)任務(wù)成績(jī)依然得到較大改善,如圖像識(shí)別(ResNet50)和語(yǔ)音識(shí)別(RNN-T)的模型性能分別較半年前的V1.0競(jìng)賽成績(jī)提升了4.75%和3.83%。
浪潮AI服務(wù)器在MLPerf?基準(zhǔn)評(píng)測(cè)中的出色表現(xiàn),得益于浪潮在AI計(jì)算系統(tǒng)卓越的系統(tǒng)設(shè)計(jì)能力和全棧優(yōu)化能力。在硬件層面,通過(guò)對(duì)CPU、GPU硬件性能的精細(xì)校準(zhǔn)和全面優(yōu)化,使CPU性能、GPU性能、CPU與GPU之間的數(shù)據(jù)通路均處于對(duì)AI推理最優(yōu)狀態(tài);在軟件層面,結(jié)合GPU硬件拓?fù)鋵?duì)多GPU的輪詢(xún)調(diào)度優(yōu)化使單卡至多卡性能達(dá)到了近似線(xiàn)性擴(kuò)展;在深度學(xué)習(xí)算法層面,結(jié)合GPU Tensor Core 單元的計(jì)算特征,通過(guò)自研通道壓縮算法成功實(shí)現(xiàn)了模型的極致性能優(yōu)化。
浪潮NF5488A5是本次MLPerf?競(jìng)賽中唯一實(shí)現(xiàn)以液冷方式支持8顆500W A100 GPU的AI服務(wù)器,液冷散熱為AI計(jì)算性能提升注入了強(qiáng)勁動(dòng)力。而在本次MLPerf?競(jìng)賽所有配置8顆A100 SXM4芯片的主流高端AI服務(wù)器中,浪潮獲得了數(shù)據(jù)中心場(chǎng)景固定任務(wù)下全部16項(xiàng)任務(wù)的最佳成績(jī)。
浪潮是全球領(lǐng)先的AI計(jì)算領(lǐng)導(dǎo)廠(chǎng)商,AI服務(wù)器市場(chǎng)份額全球第一,連續(xù)四年以超50%的市場(chǎng)份額居中國(guó)AI服務(wù)器市場(chǎng)第一。浪潮致力于AI計(jì)算平臺(tái)、資源平臺(tái)和算法平臺(tái)的研發(fā)創(chuàng)新,并通過(guò)元腦生態(tài)與AI領(lǐng)先企業(yè)共同推進(jìn)AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化進(jìn)程。