omniture

智算中心快速投產(chǎn)高效運營?42kW風(fēng)冷算力倉來助力

2024-09-25 12:14 1317

北京2024年9月25日  /美通社/ -- 步入AI時代,AI大模型對基礎(chǔ)設(shè)施的重構(gòu)超乎想象,一方面要滿足大模型訓(xùn)練和推理對澎湃算力的要求,另一方面則需化解能源消耗造成的運營壓力??焖俨渴?、超大規(guī)模、超強算力、超低能耗成為下一代智算中心的演進方向。浪潮信息42kW智算風(fēng)冷算力倉實現(xiàn)了高密度與低能耗并進,高算效與高能效齊飛,并使算力部署速度跑贏業(yè)務(wù)上線時間,助力智算中心快速投產(chǎn)高效運營。

AI 時代浪潮下,智算中心建設(shè)面臨三重挑戰(zhàn)

隨著AIGC蓬勃發(fā)展,對計算資源的需求呈現(xiàn)出指數(shù)級增長。傳統(tǒng)數(shù)據(jù)中心基礎(chǔ)設(shè)施的建設(shè)速度難以跟上AI算力需求增長的速度。同時,傳統(tǒng)機房由于單柜功率低、網(wǎng)絡(luò)及場地環(huán)境差,改造復(fù)雜,同樣難以滿足智算中心快速建設(shè)和算力服務(wù)快速上線的需求。

另一方面,算力需求猛增導(dǎo)致服務(wù)器單機功耗以及單機柜功率密度不斷攀升,傳統(tǒng)數(shù)據(jù)中心單機柜功率多為3~7kW,而每臺AI服務(wù)器的功耗現(xiàn)在已超過10kW,這意味著1臺AI服務(wù)器需要占用兩個機柜的電力和散熱資源,機柜資源、機房空間嚴(yán)重浪費,智算中心需要實現(xiàn)更高算力密度的部署,并解決隨之而來的如何在有限空間內(nèi)實現(xiàn)高效散熱和供電的難題。

同時,AI算力發(fā)展也使得智算中心的能耗問題更加突出。國家相關(guān)政策對數(shù)據(jù)中心PUE進行了嚴(yán)格限制要求,提出2025年底,新建/改擴建大型及超大型數(shù)據(jù)中心PUE不超過1.25,算力樞紐節(jié)點PUE不超過1.2。當(dāng)場地限制不具備液冷部署條件時,如何實現(xiàn)高密風(fēng)冷智算中心的高效散熱、節(jié)能降碳是亟需解決的難題。

創(chuàng)新42kW智算風(fēng)冷算力倉,快速建成"高密低耗"智算中心

為解決AI時代智算中心建設(shè)面臨的高密度部署、高功率散熱挑戰(zhàn),實現(xiàn)高密度與低能耗齊頭并進,能投天府云和浪潮信息創(chuàng)新開發(fā)42kW智算風(fēng)冷算力倉解決方案,以AI算力為核心,兼容國內(nèi)外主流的CPU和異構(gòu)加速芯片,集計算/存儲/網(wǎng)絡(luò)于一體,高效融合機柜、配電、UPS、空調(diào)、監(jiān)控、消防等系統(tǒng),極大提升智算中心建設(shè)交付速度,是為AI服務(wù)器量身定制的支持高算力密度部署的新一代智算基礎(chǔ)設(shè)施。

  • 快速交付帶來"省時",智算中心建設(shè)周期縮短70%。采用高度集成系統(tǒng)設(shè)備,模塊化設(shè)計、積木式建設(shè)、去工程化安裝等方法,例如出廠集成冷熱通道,無需施工搭建傳統(tǒng)風(fēng)冷通道件,計算/存儲/網(wǎng)絡(luò)按需擴容等,實現(xiàn)AI服務(wù)器+數(shù)據(jù)中心基礎(chǔ)設(shè)施一體化交付。
  • 高密部署促成"省地",大幅提升智算中心算力密度。單機柜功率密度從3~7kW提升至42kW,意味著比傳統(tǒng)數(shù)據(jù)中心減少40%模塊部署量和60%建設(shè)用地。而高密部署必然要實現(xiàn)高密散熱,當(dāng)單柜功率密度提升至8~10倍后,如何解決風(fēng)冷散熱問題,智算風(fēng)冷算力倉一方面采用封閉冷熱通道,避免傳統(tǒng)大空間彌漫式送風(fēng)導(dǎo)致的風(fēng)量處理不集中及冷量散失問題,實現(xiàn)冷量100%利用;另一方面,獨創(chuàng)空調(diào)雙群控策略,嵌套兩組輪巡調(diào)控算法,避免因單臺空調(diào)設(shè)備故障或輪巡休眠出現(xiàn)的局部熱點超溫問題,提升系統(tǒng)可靠性的同時將制冷系統(tǒng)能效比提升逾10%。
  • 高效節(jié)能造就"省電",給智算中心卸下重負(fù)。供配電系統(tǒng)創(chuàng)新采用全功率簡鏈路供電+高效UPS一體設(shè)計,實現(xiàn)兆瓦級一體解決方案,供電效率大幅提升,有效降低電能損耗30%以上,風(fēng)冷散熱PUE能降至1.25以下。
  • 安全智能引致"省心",為智算中心運營吃下定心丸。采用浪潮信息InManage+動環(huán)融合創(chuàng)新平臺,解決兩套獨立軟件平臺數(shù)據(jù)不互通的問題,實現(xiàn)了智算中心統(tǒng)一納管,并進行高密單排微模塊2D/3D可視化、核心制冷部件遠程調(diào)控等5大功能創(chuàng)新,實現(xiàn)智算中心智能管理、精準(zhǔn)運維,安全可靠性提升30%;采用AIStation智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺,還能有效提升大模型算力平臺的使用效率,助力客戶加速AI大模型開發(fā)與部署。

42kW風(fēng)冷智算算力倉一經(jīng)推出便廣受客戶青睞,短短1個季度內(nèi)就實現(xiàn)了規(guī)?;瘧?yīng)用,以天府智算西南算力中心為樣板,打造為AI而生的新一代智算中心。在天府智算西南算力中心,國內(nèi)首款42kW智算風(fēng)冷算力倉投運,"高密度、低能耗"雙管齊下,智算中心實現(xiàn)算效、能效雙提升,作為成渝樞紐的重要組成部分,為人工智能產(chǎn)業(yè)發(fā)展提供優(yōu)質(zhì)算力支撐。

消息來源:浪潮信息
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection