omniture

NEWS專欄 | 未來(lái)3年,智能算力將順著這條路徑發(fā)展

2023-11-06 15:26


NEWS專欄引讀 :
生成式AI將為全世界新創(chuàng)造“一個(gè)英國(guó)的GDP”,而國(guó)內(nèi)大語(yǔ)言模型爭(zhēng)先恐后地推出,也說(shuō)明中國(guó)將在這場(chǎng)生成式AI變革中占據(jù)自己應(yīng)有的位置。因此,推動(dòng)生成式AI發(fā)展的算力基礎(chǔ)設(shè)施,也就必須保持在高水平之上。而建設(shè)生成式AI算力支撐的難點(diǎn),在于要在許多基本技術(shù)原理被重新改寫(xiě)的情況下提前進(jìn)行,在這方面,作為生成式AI應(yīng)用的先行者,北美數(shù)據(jù)中心市場(chǎng)已經(jīng)出現(xiàn)了數(shù)據(jù)中心容量供需失衡的情況。
《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》為智能算力未來(lái)3年的發(fā)展確定了綱要,但如何確定生成式AI算力支撐的提前量,還需要各位CIO根據(jù)自己企業(yè)與行業(yè)的發(fā)展現(xiàn)狀,做出精準(zhǔn)的判斷。從北美市場(chǎng)的情況來(lái)看,人工智能將進(jìn)一步加速數(shù)據(jù)中心的需求,所以針對(duì)這個(gè)問(wèn)題的解決措施,需要從現(xiàn)在開(kāi)始立即推出。
工業(yè)和信息化部、中央網(wǎng)信辦、教育部、國(guó)家衛(wèi)生健康委、中國(guó)人民銀行、國(guó)務(wù)院國(guó)資委等六部門近日聯(lián)合印發(fā)了《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》(下稱:行動(dòng)計(jì)劃),業(yè)界認(rèn)為這份行動(dòng)度劃指明了未來(lái)3年算力基礎(chǔ)設(shè)施的發(fā)展方向。雖然行動(dòng)計(jì)劃面向智能計(jì)算、邊緣計(jì)算、超級(jí)計(jì)算等多種算力需求,但其中特別提到2025年智能算力占比要達(dá)到35%。針對(duì)當(dāng)前智能算力支撐所面臨的問(wèn)題,行動(dòng)計(jì)劃可謂是提前給出了應(yīng)對(duì)之策。


生成式AI的潛力

ChatGPT問(wèn)世以來(lái),生成式人工智能的經(jīng)濟(jì)潛力越來(lái)越被關(guān)注。麥肯錫在《生成式人工智能的經(jīng)濟(jì)潛力:下一波生產(chǎn)力浪潮》報(bào)告中指出,如果將分析的63種生成式AI應(yīng)用于各行各業(yè),將為全球經(jīng)濟(jì)每年帶來(lái)2.6萬(wàn)億至4.4萬(wàn)億美元的增長(zhǎng)。與英國(guó)2021年的GDP總額3.1萬(wàn)億美元對(duì)比,生成式AI可能每年為全球經(jīng)濟(jì)貢獻(xiàn)“一個(gè)英國(guó)的GDP”,由此可見(jiàn)生成式AI所具備的巨大潛力。
從生成式AI具體應(yīng)用情況來(lái)看,調(diào)查顯示,使用生成式AI助手,企業(yè)不僅可以多完成12.2%的任務(wù),還能將速度提升25.1%,同時(shí)工作結(jié)果的質(zhì)量也因此而提升40%。再?gòu)募夹g(shù)發(fā)展角度來(lái)看,下一代大型語(yǔ)言模型將比目前的GPT-4(OpenAI)、Palm 2(Google)、Llama(Meta)和Claude 2(Anthropic)更復(fù)雜、更通用。因此,一場(chǎng)圍繞著生態(tài)為核心的大語(yǔ)言模型之間的競(jìng)爭(zhēng)已經(jīng)展開(kāi)。
從生態(tài)的角度來(lái)看,決定著生成式AI能否發(fā)揮出巨大潛力的,是生態(tài)的強(qiáng)弱,而決定生態(tài)能否最終勝出的因素是應(yīng)用。本次行動(dòng)計(jì)劃有四個(gè)主要目標(biāo),其中之一就是針對(duì)這個(gè)問(wèn)題的應(yīng)用賦能。力圖打造一批算力新業(yè)務(wù)、新模式、新業(yè)態(tài),在工業(yè)、金融等領(lǐng)域算力滲透率顯著提升,醫(yī)療、交通等領(lǐng)域應(yīng)用實(shí)現(xiàn)規(guī)?;瘡?fù)制推廣,能源、教育等領(lǐng)域應(yīng)用范圍進(jìn)一步擴(kuò)大。每個(gè)重點(diǎn)領(lǐng)域打造30個(gè)以上應(yīng)用標(biāo)桿。概括起來(lái),就是通過(guò)一體化算力服務(wù)體系的構(gòu)建,實(shí)現(xiàn)“算力+工業(yè)”、“算力+教育”、“算力+金融”、“算力+交通”、“算力+醫(yī)療”、“算力+能源”的多行業(yè)算力補(bǔ)強(qiáng)。這將對(duì)生成式AI在這些行業(yè)的應(yīng)用起到極大的助力作用。


三個(gè)難題的解決之策

當(dāng)生成式AI在算法層面取得大舉突破之時(shí),生成式AI的研發(fā)和應(yīng)用卻可能遭遇算力瓶頸。算力是集信息計(jì)算力、網(wǎng)絡(luò)運(yùn)載力、數(shù)據(jù)存儲(chǔ)力于一體的新型生產(chǎn)力,生成式AI所需的算力支撐,在計(jì)算力、運(yùn)載力、存儲(chǔ)力都和傳統(tǒng)應(yīng)用有所不同,因而在這三個(gè)層面都面臨著難題。
在計(jì)算力層面,傳統(tǒng)應(yīng)用的算力支撐更多地依靠CPU,而AI所需的智能算力在CPU之外,還需要大量GPU以及如ASICs和FPGAs等專用硬件參與。此外,用于人工智能的機(jī)架必須重新設(shè)計(jì),以適應(yīng)額外的重量和熱量。因此,智能計(jì)算的數(shù)據(jù)中心建設(shè)因此而呈現(xiàn)出高密化趨勢(shì),并需要通過(guò)異構(gòu)計(jì)算來(lái)突破算力瓶頸。
在網(wǎng)絡(luò)層面,大模型AI場(chǎng)景下海量的參數(shù)分布于多個(gè)服務(wù)器的多個(gè)GPU之上,由于需要用到成千上萬(wàn)個(gè)GPU來(lái)訓(xùn)練數(shù)十TB級(jí)甚至更大的數(shù)據(jù)集,大量的GPU之間的通信容易出現(xiàn)由于網(wǎng)絡(luò)HASH負(fù)載分擔(dān)不均而導(dǎo)致的網(wǎng)絡(luò)吞吐下降,從而引發(fā)AI訓(xùn)練性能整體下降等問(wèn)題。
在存儲(chǔ)層面,由于大語(yǔ)言模型的訓(xùn)練參數(shù)越來(lái)越多,因此智能算力可能面臨著幾十T數(shù)據(jù)的存儲(chǔ)和應(yīng)用,還必須實(shí)現(xiàn)高速存儲(chǔ)訪問(wèn),以滿足人工智能工作訓(xùn)練和推理所需。
針對(duì)這些問(wèn)題,行動(dòng)計(jì)劃給出了未來(lái)3年算力基礎(chǔ)設(shè)施發(fā)展的具體目標(biāo)。其中,在計(jì)算力方面,算力規(guī)模超過(guò)300EFLOPS,智能算力占比達(dá)到35%。在運(yùn)載力(網(wǎng)絡(luò))方面,國(guó)家樞紐節(jié)點(diǎn)數(shù)據(jù)中心集群間基本實(shí)現(xiàn)不高于理論時(shí)延1.5倍的直連網(wǎng)絡(luò)傳輸,重點(diǎn)應(yīng)用場(chǎng)所光傳送網(wǎng)(OTN)覆蓋率達(dá)到80%,骨干網(wǎng)、城域網(wǎng)全面支持IPv6,SRv6等新技術(shù)使用占比達(dá)到40%。在存儲(chǔ)力方面,存儲(chǔ)總量超過(guò)1800EB,先進(jìn)存儲(chǔ)容量占比達(dá)到30%以上。

更為重要的,行動(dòng)計(jì)劃從全局的高度出發(fā),對(duì)于算力均衡發(fā)展進(jìn)行了統(tǒng)籌。不僅優(yōu)化算力設(shè)施建設(shè)布局、推動(dòng)算力結(jié)構(gòu)多元配置、推動(dòng)算力標(biāo)準(zhǔn)體系建設(shè),還通過(guò)優(yōu)化算力高效運(yùn)載質(zhì)量、強(qiáng)化算力接入網(wǎng)絡(luò)能力、提升樞紐網(wǎng)絡(luò)傳輸效率、探索算力協(xié)同調(diào)度機(jī)制,提升了算力高效運(yùn)載能力。這為生成式AI應(yīng)用的爆發(fā)奠定了基礎(chǔ)。

算力的可持續(xù)之道


數(shù)據(jù)中心在2022年使用的電力已達(dá)到200T瓦時(shí),這一電量已經(jīng)占到全球電力使用量的2%。預(yù)計(jì)到2030年,全球數(shù)據(jù)中心耗費(fèi)的電量將占到全球總電量的5%,達(dá)到576T瓦時(shí),這個(gè)數(shù)字將會(huì)超過(guò)韓國(guó)、加拿大或德國(guó)的單個(gè)國(guó)家用電量。生成式AI的崛起使得能耗問(wèn)題變得更加嚴(yán)峻。
由于AI所需的智能計(jì)算需要GPU驅(qū)動(dòng)的機(jī)架,與同等CPU容量相比,它會(huì)消耗更多電量、散發(fā)更多熱量并占用更多空間。這就意味著人工智能計(jì)算能力通常需要更多的電源連接或替代冷卻系統(tǒng)。為此,為了保障智能算力的可持續(xù)發(fā)展,包括高壓直流、預(yù)制化、液冷、自然冷卻等新一代綠色技術(shù)已經(jīng)逐漸走向數(shù)據(jù)中心。
行動(dòng)計(jì)劃同樣關(guān)注到了這個(gè)問(wèn)題,在基本原則中就強(qiáng)調(diào)了綠色低碳,在促進(jìn)綠色低碳算力發(fā)展方面,通過(guò)提升資源利用和算力碳效水平、引導(dǎo)市場(chǎng)應(yīng)用綠色低碳算力、賦能行業(yè)綠色低碳轉(zhuǎn)型,力求全面提升算力設(shè)施能源利用效率和算力碳效(CEPS)水平。推動(dòng)了算力在重點(diǎn)行業(yè)發(fā)揮應(yīng)用賦能作用,促進(jìn)了企業(yè)經(jīng)營(yíng)活動(dòng)數(shù)智化發(fā)展,通過(guò)構(gòu)建“算力+”綠色低碳生態(tài)體系,助力各行業(yè)綠色低碳發(fā)展,這為智能算力的可持續(xù)發(fā)展提供了必要的保障條件。
未來(lái)3年內(nèi),通過(guò)加強(qiáng)統(tǒng)籌聯(lián)動(dòng)、加大金融支持、深化交流協(xié)作、強(qiáng)化平臺(tái)支撐,《行動(dòng)計(jì)劃》的落地實(shí)施最終將為智能算力的發(fā)展提供保障,也將為生成式AI的發(fā)展和應(yīng)用奠定堅(jiān)實(shí)的基礎(chǔ)。

消息來(lái)源:CIO時(shí)代網(wǎng)