北京2024年9月28日 /美通社/ -- 9月27日,我國算力產(chǎn)業(yè)領(lǐng)域的頂級(jí)盛會(huì)——中國算力大會(huì)在鄭州召開,會(huì)上浪潮信息聯(lián)合信通院發(fā)布了《人工智能算力高質(zhì)量發(fā)展評(píng)估體系報(bào)告》(以下簡(jiǎn)稱報(bào)告)。報(bào)告首次完整地構(gòu)建了人工智能時(shí)代高質(zhì)量算力的理論體系,并探索性提出業(yè)界首個(gè) "五位一體"的高質(zhì)量算力評(píng)估體系。
在當(dāng)前由大模型和AIGC驅(qū)動(dòng)的AI時(shí)代,算力需求暴增,同時(shí)還面臨供給不足、供需匹配難、能耗激增等挑戰(zhàn),亟需算力產(chǎn)業(yè)由"量"向"質(zhì)"加速高質(zhì)量發(fā)展。為了推動(dòng)算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展,去年10月工業(yè)和信息化部等六部門聯(lián)合印發(fā)了《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》。報(bào)告的發(fā)布,為該政策的進(jìn)一步落實(shí)提供實(shí)踐路徑,加速高質(zhì)量算力從概念到落地。
"三高三可"促進(jìn)算力"提質(zhì)增效"
報(bào)告對(duì)人工智能時(shí)代的"高質(zhì)量算力"予以明確定義:高質(zhì)量算力是基于最新人工智能理論,采用先進(jìn)人工智能的計(jì)算架構(gòu),與算法、數(shù)據(jù)深度結(jié)合的高水平計(jì)算能力。高質(zhì)量算力具備高算效、高智效、高碳效、可持續(xù)、可獲得、可評(píng)估"三高三可"六大特征。
高算效是指在提高算力理論算效的同時(shí)考慮更高的實(shí)測(cè)性能和資源利用率。理論算效主要體現(xiàn)的是部件和系統(tǒng)能力,2023年年底,全國在用算力中心平均理論算效為11.8GFLOPS/W,僅達(dá)到GB/T 43331-2023《互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)技術(shù)和分級(jí)要求》中通用算力算效第三等級(jí),表明算效水平仍有很大提升空間。實(shí)測(cè)性能體現(xiàn)的是應(yīng)用場(chǎng)景下的實(shí)測(cè)性能,如單位時(shí)間內(nèi)處理的Token數(shù)量、運(yùn)行時(shí)延、模型訓(xùn)練時(shí)間、數(shù)據(jù)處理質(zhì)量等指標(biāo)。當(dāng)前算力集群實(shí)測(cè)性能和理論性能差距過大問題明顯,部分算力實(shí)際性能不足理論性能的10%。資源利用率則關(guān)注的是算力資源利用水平。據(jù)公開數(shù)據(jù)顯示,傳統(tǒng)模式下的智算中心GPU利用率平均數(shù)值低于30%。高算效就是要破解上述算效水平不高、算力資源利用率較低等問題。
高智效體現(xiàn)的是算力面向人工智能業(yè)務(wù)的高效處理能力。在以大模型為代表的人工智能技術(shù)上,更高的模算效率是體現(xiàn)高智效的主要指標(biāo)。模算效率正比于模型精度與模型的計(jì)算效率。模型本身精度越高、在對(duì)應(yīng)軟件上對(duì)硬件性能利用率越高、推理及訓(xùn)練所需算力越小,模算效率越高,整體反映被測(cè)模型在人工智能業(yè)務(wù)應(yīng)用中的綜合處理效率。當(dāng)前大模型發(fā)展百花齊放,大模型的智能涌現(xiàn)能力大幅提升,但是現(xiàn)有大模型模算效率普遍不高,在算力供需矛盾凸顯的當(dāng)下,提升模算效率,以更低算力實(shí)現(xiàn)更高智能是智效水平提升的核心目標(biāo)。
高碳效指的是算力在最低碳排放前提下實(shí)現(xiàn)最大化算力輸出。高碳效不僅關(guān)注算力單純的能源消耗、算力輸出水平,更要注重算力的全生命周期碳足跡管理,通過綠色采購、綠色設(shè)計(jì)、清潔生產(chǎn)、綠色包裝、回收處理等環(huán)節(jié)降低算力系統(tǒng)的碳排放。算力中心是公認(rèn)的高耗能基礎(chǔ)設(shè)施,據(jù)中國信通院數(shù)據(jù)顯示,截至2023年我國算力中心耗電量,達(dá)到1500億千瓦時(shí),預(yù)計(jì)到2030年將超過4000億千瓦時(shí),二氧化碳排放或?qū)⒊?億噸。面對(duì)人工智能對(duì)算力的旺盛需求,算力產(chǎn)業(yè)在高速發(fā)展的同時(shí)亟需提高碳效,實(shí)現(xiàn)"雙碳目標(biāo)"。
此外,高質(zhì)量算力還具備可持續(xù)、可獲得和可評(píng)估三大特征。可獲得是指算力普適普惠,能夠適用各種應(yīng)用場(chǎng)景,同時(shí)算力使用成本較低??沙掷m(xù)是指算力具備技術(shù)兼容、供應(yīng)鏈完備、生態(tài)開放的特性,能夠保證算力持續(xù)供給和升級(jí)迭代??稍u(píng)估是指可通過完整、有效的評(píng)估體系反映算力系統(tǒng)實(shí)際應(yīng)用情況。
聚焦高質(zhì)量算力"三高三可"特征,報(bào)告提出了以系統(tǒng)設(shè)計(jì)提升算效、協(xié)同驅(qū)動(dòng)提升智效、全生命周期管理提升碳效、基建先行推動(dòng)算力普適普惠、繁榮生態(tài)推動(dòng)算力可持續(xù)發(fā)展、多元評(píng)估加速算力規(guī)范化發(fā)展的高質(zhì)量算力發(fā)展路徑,有效推動(dòng)算力發(fā)展"提質(zhì)增效",讓高質(zhì)量算力助力經(jīng)濟(jì)社會(huì)實(shí)現(xiàn)數(shù)智化轉(zhuǎn)型和高質(zhì)量發(fā)展。
"五位一體"評(píng)估體系引導(dǎo)算力高質(zhì)量發(fā)展
只有通過精準(zhǔn)的性能評(píng)估與測(cè)試,發(fā)現(xiàn)算力系統(tǒng)的瓶頸,才能促進(jìn)算力技術(shù)創(chuàng)新和改善產(chǎn)品設(shè)計(jì),不斷提升算力質(zhì)量發(fā)展水平。然而,現(xiàn)有算力評(píng)估體系評(píng)估場(chǎng)景簡(jiǎn)單,無法全面、深入地反映算力應(yīng)用的實(shí)際效果,如何準(zhǔn)確評(píng)估算力的質(zhì)量是當(dāng)前算力建設(shè)者和使用者共同面臨的問題。為此,報(bào)告結(jié)合人工智能時(shí)代算力發(fā)展面臨的機(jī)遇與挑戰(zhàn),推出面向人工智能時(shí)代的"五位一體"高質(zhì)量算力評(píng)估體系。
"五位一體"高質(zhì)量算力評(píng)估體系遵循系統(tǒng)性、全面性等原則,針對(duì)算力系統(tǒng)從算效水平、智效水平、碳效水平、可獲得水平、可持續(xù)水平5個(gè)維度搭建高質(zhì)量算力評(píng)估體系,指標(biāo)涉及理論算效、實(shí)測(cè)性能、模算效率等12個(gè)指標(biāo),進(jìn)行多維、多元評(píng)估。
這套"五位一體"的高質(zhì)量算力評(píng)估體系涵蓋了算效、智效、碳效、可獲得、可持續(xù)等算力系統(tǒng)建設(shè)運(yùn)營關(guān)鍵因素,能夠多維度客觀評(píng)估我國算力質(zhì)量情況,彌補(bǔ)了現(xiàn)有算力評(píng)估體系評(píng)估場(chǎng)景簡(jiǎn)單、評(píng)估維度單一、無法全面反映算力應(yīng)用的實(shí)際效能與發(fā)展?jié)摿Φ炔蛔恪?/p>
作為業(yè)界推出的首個(gè)高質(zhì)量算力評(píng)估體系,對(duì)促進(jìn)我國算力產(chǎn)業(yè)規(guī)范化、高質(zhì)量發(fā)展具有重要意義,不但可以幫助企業(yè)用戶識(shí)別和優(yōu)化資源配置,提高算力資源使用效率,并激勵(lì)企業(yè)進(jìn)行技術(shù)研發(fā)和創(chuàng)新,進(jìn)而推動(dòng)整個(gè)行業(yè)的技術(shù)進(jìn)步,而且能夠在算力項(xiàng)目的規(guī)劃期、建設(shè)期、運(yùn)營期等不同階段,引導(dǎo)算力實(shí)現(xiàn)全生命周期可持續(xù)發(fā)展。