北京2016年6月24日電 /美通社/ -- 英特爾®發(fā)布了其全新一代至強(qiáng)融核?處理器。隨著數(shù)據(jù)量繼續(xù)激增且日益復(fù)雜,業(yè)界需要新的硬件、軟件和架構(gòu)來推動(dòng)更深刻的洞察的獲取,進(jìn)而加速新的發(fā)現(xiàn)和促進(jìn)業(yè)務(wù)創(chuàng)新,以及推動(dòng)機(jī)器學(xué)習(xí)和人工智能領(lǐng)域數(shù)據(jù)分析的下一輪演進(jìn)。
全新一代英特爾®至強(qiáng)融核?處理器正是獲取更深刻洞察的關(guān)鍵。作為英特爾® 可擴(kuò)展系統(tǒng)框架(英特爾®SSF)的基本要素,英特爾®至強(qiáng)融核?產(chǎn)品家族旨在為易于部署的高性能集群整體解決方案帶來關(guān)鍵的計(jì)算引擎。
借助英特爾® 至強(qiáng)融核? 處理器家族1更快速地解決較大挑戰(zhàn)
英特爾至強(qiáng)融核處理器是英特爾首款專門針對高度并行工作負(fù)載而設(shè)計(jì)的可獨(dú)立自啟動(dòng)的主處理器,且首次實(shí)現(xiàn)了內(nèi)存與高速互聯(lián)技術(shù)的集成。作為可獨(dú)立自啟動(dòng)的 x86 CPU,英特爾至強(qiáng)融核處理器可實(shí)現(xiàn)高效擴(kuò)展,而不會(huì)像 GPU 加速器等受到 PCIe 總線的限制。通過消除對 PCIe 總線的依賴性,英特爾至強(qiáng)融核處理器與加速器產(chǎn)品相比,可提供更高的可擴(kuò)展性,能應(yīng)對更廣泛的工作負(fù)載和配置。
集成 16GB 高帶寬內(nèi)存,可為內(nèi)存訪問密集型的工作負(fù)載2提供高達(dá) 500 GB/秒的可持續(xù)高內(nèi)存帶寬,此外,雙端口英特爾® Omni-Path 架構(gòu)(英特爾® OPA)還進(jìn)一步降低了解決方案成本、能耗和空間占用率。英特爾至強(qiáng)融核處理器是基于開放標(biāo)準(zhǔn)構(gòu)建的通用 CPU,可有效保障用戶未來的軟件投資。
在廣泛的應(yīng)用和環(huán)境中,從機(jī)器學(xué)習(xí)到高性能計(jì)算(HPC),英特爾至強(qiáng)融核產(chǎn)品家族助企業(yè)更快速地解決最具挑戰(zhàn)性的計(jì)算問題,同時(shí)提供更高的效率和可擴(kuò)展性3。該產(chǎn)品家族還能幫助企業(yè)借助高性能建模以及仿真、可視化和數(shù)據(jù)分析取得新突破。
英特爾至強(qiáng)融核處理器的特性和優(yōu)勢還包括:
現(xiàn)在公開發(fā)布的配有英特爾至強(qiáng)融核處理器家族的系統(tǒng),有望在今年9月推出更多選擇。迄今為止,英特爾已發(fā)運(yùn)了數(shù)萬臺(tái)設(shè)備,英特爾預(yù)計(jì)今年能總共售出100,000臺(tái)以上。該產(chǎn)品家族的廣泛生態(tài)系統(tǒng)支持包括 50 多家原始設(shè)備制造商(OEM)、ISV 和中間件合作伙伴。更多信息敬請登錄:www.intel.com/xeonphi/partners。
英特爾® 至強(qiáng)融核? 處理器讓機(jī)器學(xué)習(xí)更深入
機(jī)器學(xué)習(xí)需要強(qiáng)大的計(jì)算能力來運(yùn)行復(fù)雜的數(shù)學(xué)算法并處理海量數(shù)據(jù)。面對這些挑戰(zhàn),英特爾通過發(fā)布全新一代英特爾®至強(qiáng)融核?處理器家族拓展了機(jī)器學(xué)習(xí)的技術(shù)范疇。該英特爾®至強(qiáng)融核?處理器 可為機(jī)器學(xué)習(xí)訓(xùn)練模型(training)提供強(qiáng)勁性能,且借助可獨(dú)立啟動(dòng)主處理器的靈活性,它可運(yùn)行多種分析工作負(fù)載。基于英特爾®可擴(kuò)展系統(tǒng)框架的集群采用了英特爾至強(qiáng)融核處理器和集成英特爾® Omni-Path 高速互聯(lián),可幫助數(shù)據(jù)科學(xué)家大幅降低復(fù)雜的神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間。在32 節(jié)點(diǎn)的基礎(chǔ)設(shè)施中,英特爾至強(qiáng)融核家族的擴(kuò)展性比 GPU 好1.38倍;在128節(jié)點(diǎn)的基礎(chǔ)設(shè)施中,英特爾至強(qiáng)融核家族將構(gòu)建訓(xùn)練模型的速度加快了50倍。
英特爾至強(qiáng)融核家族是對英特爾®至強(qiáng)?處理器 E5 家族的有力補(bǔ)充,后者則是機(jī)器學(xué)習(xí)領(lǐng)域4部署最廣泛的基礎(chǔ)設(shè)施。英特爾至強(qiáng)處理器 E5 v4 產(chǎn)品家族極其適用于機(jī)器學(xué)習(xí)評分模型(scoring),且可為廣泛數(shù)據(jù)中心工作負(fù)載提供強(qiáng)大性能和重要價(jià)值。同時(shí),該英特爾至強(qiáng)處理器家族還可為開發(fā)人員提供一致的用于訓(xùn)練和評分的編程模型,以及可用于高性能計(jì)算、數(shù)據(jù)分析和機(jī)器學(xué)習(xí)工作負(fù)載的通用架構(gòu)。
全新英特爾® 可擴(kuò)展系統(tǒng)框架參考架構(gòu)
英特爾® SSF 覆蓋從小型集群到全球較大的超級計(jì)算機(jī)的工作負(fù)載,可為計(jì)算密集型應(yīng)用、數(shù)據(jù)密集型應(yīng)用、機(jī)器學(xué)習(xí)和可視化提供可擴(kuò)展性和平衡性能。英特爾已發(fā)布了其首款英特爾® SSF 參考架構(gòu),它為經(jīng)過優(yōu)化的 HPC 系統(tǒng)提供推薦的基準(zhǔn)硬件和軟件配置。英特爾 SSF 參考架構(gòu)由兩種參考設(shè)計(jì)提供支持,這兩種設(shè)計(jì)記錄了 HPC 系統(tǒng)的特殊要求,包括硬件和軟件元素以及安裝和配置說明。該全新的參考架構(gòu)和設(shè)計(jì)可幫助系統(tǒng)構(gòu)建人員簡化設(shè)計(jì)和驗(yàn)證流程,還可為最終用戶提供購買指南以便更加全面地獲取英特爾® SSF 的價(jià)值,保護(hù)廣泛的軟件應(yīng)用可移植性。該全新參考架構(gòu)和設(shè)計(jì)的更多信息,敬請登錄:www.intel.com/SSF.
借助英特爾® HPC Orchestrator 簡化軟件部署
英特爾® HPC Orchestrator 是一種全新的支持產(chǎn)品家族,可通過減少需要的集成、測試和驗(yàn)證工作來簡化高性能系統(tǒng)軟件堆棧的實(shí)施和后續(xù)的持續(xù)維護(hù)。英特爾 HPC Orchestrator 產(chǎn)品預(yù)定于2016年第四季度上市,基于 OpenHPC 社區(qū)軟件,并可提供專業(yè)服務(wù)和技術(shù)支持。作為首款產(chǎn)品,英特爾® HPC Orchestrator - Advanced 是一種模塊化軟件堆棧,可提供定制特性、出色性能、可擴(kuò)展性以及易用性。有關(guān)英特爾® HPC Orchestrator 特性和優(yōu)勢的更多信息請?jiān)L問:www.intel.com/hpcorchestrator。
行業(yè)快速采用英特爾 Omni-Path 架構(gòu)
英特爾 Omni-Path 架構(gòu)(英特爾® OPA)是一款全新的端到端高速互聯(lián)解決方案,可針對入門級和大規(guī)模高性能集群經(jīng)濟(jì)高效地提升高性能計(jì)算應(yīng)用的性能。英特爾® OPA 的市場采用率正迅速激增,目前市場上已有超過 80,000 個(gè)節(jié)點(diǎn),且眾多系統(tǒng)制造商正大規(guī)模發(fā)運(yùn)基于英特爾 OPA 的交換機(jī)和服務(wù)器平臺(tái),包括:戴爾*、富士通*、日立*、惠普*、浪潮*、聯(lián)想*、NEC*、Oracle*、Quanta*、SGI*、美超微*、Colfax* 等。
英特爾 OPA 部署的主要成功案例,包括:
更多材料和多媒體信息請?jiān)L問:http://www.intel.com/newsroom/isc。
*其他的名稱和品牌可能是其他所有者的資產(chǎn)。
1 英特爾® 至強(qiáng)融核? 處理器可提供超過 3 Teraflop(每秒萬億次浮點(diǎn)運(yùn)算)的雙精度性能,遠(yuǎn)快于英特爾® 至強(qiáng)融核? 處理器 x100 家族的 1 Teraflop 以上雙精度性能。
2資料來源:英特爾使用 STREAM Triad 性能指標(biāo)評測測量了英特爾® 至強(qiáng)融核? 處理器 7250 的性能(以 GB/秒計(jì)),截至 2016 年 3 月。
3 相比單節(jié)點(diǎn),128 節(jié)點(diǎn)實(shí)現(xiàn)了 50 倍的訓(xùn)練速度提升,基于 AlexNet* 拓?fù)涔ぷ髫?fù)載(批量大小 = 1024),在運(yùn)行單節(jié)點(diǎn)英特爾至強(qiáng)融核處理器 7250(16 GB MCDRAM,1.4 GHz,68 核)的英特爾® 服務(wù)器系統(tǒng) LADMP2312KXXX41 中使用大型圖像數(shù)據(jù)庫,96GB DDR4-2400 MHz,四集群模式,MCDRAM 平面內(nèi)存模式,Red Hat Enterprise Linux* 6.7 (Santiago),1.0 TB SATA 硬盤 WD1003FZEX-00MK2A0 系統(tǒng)磁盤,運(yùn)行英特爾® Optimized DNN Framework。有關(guān)如何獲取二進(jìn)制的更多信息,請聯(lián)系您的英特爾代表。節(jié)點(diǎn)數(shù)量為 32 時(shí)擴(kuò)展效率提升多達(dá) 38%,基于 GoogLeNet 深度學(xué)習(xí)圖像分類訓(xùn)練拓?fù)洌褂么笮蛨D像數(shù)據(jù)庫,將使用上述配置、英特爾® Optimized DNN Framework(87% 的能效)的單節(jié)點(diǎn)英特爾至強(qiáng)融核處理器 7250(16 GB MCDRAM,1.4 GHz,68 核)與各自運(yùn)行 32 節(jié)點(diǎn)的 NVIDIA Tesla* K20 GPU(62% 的能效)的未知主機(jī)進(jìn)行了比較。http://arxiv.org/pdf/1511.00175v2.pdf)
4 英特爾估計(jì)基于英特爾至強(qiáng) E5 處理器內(nèi)部銷售數(shù)據(jù)和客戶反饋
在性能檢測過程中涉及的軟件及其性能只有在英特爾微處理器的架構(gòu)下方能得到優(yōu)化。諸如 SYSmark 和 MobileMark 等測試均系基于特定計(jì)算機(jī)系統(tǒng)、硬件、軟件、操作系統(tǒng)及功能,上述任何要素的變動(dòng)都有可能導(dǎo)致測試結(jié)果的變化。請參考其它信息及性能測試(包括結(jié)合其它產(chǎn)品使用時(shí)的運(yùn)行性能)以對目標(biāo)產(chǎn)品進(jìn)行全面評估。更多信息敬請登錄 http://www.intel.com/performance。
英特爾處理器標(biāo)號不是性能的指標(biāo)。處理器標(biāo)號僅用于區(qū)分同屬一個(gè)家族的處理器的特性,而不能夠用于區(qū)分不同家族的處理器。如欲了解更多信息,請?jiān)L問 http://www.intel.com/performance 。
英特爾技術(shù)的特性和優(yōu)勢取決于系統(tǒng)配置,并需要兼容的硬件、軟件或需要激活服務(wù)。實(shí)際性能會(huì)因您使用的具體系統(tǒng)配置的不同而有所差異。沒有一項(xiàng)計(jì)算機(jī)系統(tǒng)可以提供所有運(yùn)行環(huán)境下的絕對安全。描述的成本降低方案旨在作為舉例,說明指定的英特爾架構(gòu)產(chǎn)品在特定環(huán)境和配置下,可能如何影響未來的成本和提供成本節(jié)省。環(huán)境將有所不同。英特爾不保證任何成本或成本降低。
所有日期和產(chǎn)品僅用于規(guī)劃目的,可隨時(shí)更改,恕不另行通知。
各性能指標(biāo)評測的相對性能計(jì)算規(guī)則為:將第一個(gè)被測試平臺(tái)的實(shí)際性能指標(biāo)評測結(jié)果賦值為 1.0,作為計(jì)算基礎(chǔ),之后將其它性能指標(biāo)評測結(jié)果與其進(jìn)行比較。其余被測平臺(tái)的相對性能的計(jì)算規(guī)則為:用基準(zhǔn)平臺(tái)的實(shí)際性能指標(biāo)評測結(jié)果去除其它各平臺(tái)的具體性能指標(biāo)評測結(jié)果,并賦予它們一個(gè)與所報(bào)告的性能改進(jìn)相關(guān)的相對性能值。
本文件不構(gòu)成對任何知識(shí)產(chǎn)權(quán)的授權(quán),包括明示的、暗示的,也無論是基于禁止反言的原則或其他。
英特爾明確拒絕所有明確或隱含的擔(dān)保,包括但不限于對于適銷性、特定用途適用性和不侵犯任何權(quán)利的隱含擔(dān)保,以及任何對于履約習(xí)慣、交易習(xí)慣或貿(mào)易慣例的擔(dān)保。
英特爾公司 © 2016 年版權(quán)所有。