北京2022年6月24日 /美通社/ -- 近幾年,“AI大模型”儼然是AI界的“當(dāng)紅明星”,從國外的谷歌、微軟、英偉達(dá),到國內(nèi)的浪潮信息、阿里、百度,都在不遺余力的布局AI大模型,而AI大模型的參數(shù)量更是屢創(chuàng)新高。
AI大模型究竟有什么魔力能吸引如此關(guān)注?AI大模型的產(chǎn)業(yè)應(yīng)用價值有多大?產(chǎn)業(yè)化道路是布滿荊棘還是一路坦途?
近期,浪潮信息AI軟件研發(fā)總監(jiān)吳韶華博士和復(fù)旦大學(xué)管理學(xué)院張誠教授受財聯(lián)社邀請做客鯨平臺直播間,與財聯(lián)社科創(chuàng)板日報記者黃心怡就AI大模型與人工智能產(chǎn)業(yè)發(fā)展的關(guān)系展開了一場高端對話。
一訓(xùn)多能的算法基礎(chǔ)設(shè)施
AI大模型的出現(xiàn),讓很多產(chǎn)業(yè)人士認(rèn)為這項技術(shù)會改變信息產(chǎn)業(yè)格局,即基于數(shù)據(jù)的互聯(lián)網(wǎng)時代、基于算力的云計算時代之后,將進入基于大模型的AI時代。在未來,人工智能像供水供電一樣流向終端,流向用戶、流向企業(yè),誰能先做到這點,誰就會在AI產(chǎn)業(yè)布局中獲得先發(fā)優(yōu)勢。
什么是AI大模型?吳韶華博士從技術(shù)角度給出解釋,AI大模型是“人工智能預(yù)訓(xùn)練大模型”的簡稱,包含了“預(yù)訓(xùn)練”和“大模型”兩層含義,二者結(jié)合產(chǎn)生了一種新的人工智能模式,即模型在大規(guī)模數(shù)據(jù)集上完成了預(yù)訓(xùn)練后無需微調(diào),或僅需要少量數(shù)據(jù)的微調(diào),就能直接支撐各類應(yīng)用。例如浪潮信息于去年9月推出的2457億參數(shù)的大模型“源 1.0”,一個模型就能提供聊天、對話、知識問答、寫作等各類應(yīng)用。
張誠教授從應(yīng)用角度指出,大模型與訓(xùn)練數(shù)據(jù)、預(yù)訓(xùn)練等構(gòu)成了AI的基礎(chǔ)架構(gòu),這種基礎(chǔ)架構(gòu)即浪潮信息提出的“算法基礎(chǔ)設(shè)施”,在此基礎(chǔ)上,可以支持算法更高效地融入當(dāng)前企業(yè)各類業(yè)務(wù)所使用的工具軟件,形成算法應(yīng)用價值的商業(yè)變現(xiàn)。
大模型加速AI產(chǎn)業(yè)化進程
當(dāng)前人工智能落地面臨長尾場景應(yīng)用的“碎片化”和應(yīng)用開發(fā)的“高門檻”等挑戰(zhàn),而AI大模型是解決AI產(chǎn)業(yè)化應(yīng)用痛點的一劑良方。
吳韶華博士提出,AI大模型將對AI模型的構(gòu)建及應(yīng)用產(chǎn)生極大影響,它會將傳統(tǒng)煙囪式的、碎片化的AI應(yīng)用開發(fā)轉(zhuǎn)向集中式開發(fā)。一方面AI大模型具備很好的泛化能力,一個模型可以支撐各類不同應(yīng)用,有效緩解碎片化開發(fā)反復(fù)建模的困境;另一方面,圍繞AI大模型構(gòu)建的算法基礎(chǔ)設(shè)施,比如浪潮“源1.0”大模型開放的API、開源的應(yīng)用代碼等,使開發(fā)者無需關(guān)心底層技術(shù),設(shè)置無需配置編程環(huán)境,就可以直接將應(yīng)用構(gòu)建于AI大模型的能力之上,在降低開發(fā)門檻的同時,讓開發(fā)人員能夠?qū)⒏嗟木劢购诵臉I(yè)務(wù)邏輯。
張誠教授則認(rèn)為,AI大模型代表了人工智能技術(shù)向產(chǎn)品化、產(chǎn)業(yè)化落地的趨勢,這個趨勢的持續(xù)發(fā)展會深刻改變產(chǎn)業(yè)格局。同時,人們對AI的認(rèn)知、行業(yè)對其能力的評估都將越來越體系化。
AI大模型的“先天優(yōu)勢”為其加速AI產(chǎn)業(yè)化發(fā)展奠定了基礎(chǔ)。在數(shù)字經(jīng)濟的未來,AI大模型以及包含大模型在內(nèi)的人工智能模型,憑借優(yōu)秀的數(shù)據(jù)價值挖掘能力,較高的應(yīng)用智能化水平,將會成為數(shù)字經(jīng)濟的智能化核心,甚至?xí)蔀閿?shù)字經(jīng)濟中的智能大腦。
當(dāng)然,AI大模型的發(fā)展也并非一蹴而就的。吳韶華博士指出,AI大模型的構(gòu)建,首先需要大規(guī)模、高質(zhì)量數(shù)據(jù)集的支撐,數(shù)據(jù)集的質(zhì)量很大程度上決定了模型的質(zhì)量。在大規(guī)模高質(zhì)量數(shù)據(jù)集上,目前不但缺少相關(guān)配套軟件,也缺少數(shù)據(jù)集質(zhì)量評測標(biāo)準(zhǔn);其次還有模型算法以及訓(xùn)練算力等方面的挑戰(zhàn)。張誠教授則認(rèn)為,當(dāng)前AI大模型和企業(yè)提升勞動效率需求的結(jié)合是最大的挑戰(zhàn),也就是如何讓AI大模型在生產(chǎn)中真正發(fā)揮生產(chǎn)力作用。
挑戰(zhàn)只是暫時的,AI大模型代表了人工智能技術(shù)發(fā)展的方向。吳韶華博士和張誠教授堅信,AI大模型會在技術(shù)上產(chǎn)生更多的突破,也會對應(yīng)用的規(guī)模化落地產(chǎn)生更好的促進作用。
采訪實錄
黃心怡:請談?wù)剬?/b>AI大模型的理解。
吳韶華:AI大模型的出現(xiàn)帶來一種新的現(xiàn)象,它將AI應(yīng)用的開發(fā)從碎片化、煙囪式的開發(fā),轉(zhuǎn)變成集中式開發(fā),這種開發(fā)范式的變化,有望緩解當(dāng)前人工智能落地難的問題,更好的賦能人工智能應(yīng)用創(chuàng)新。
張誠:我們可以把人工智能到商業(yè)應(yīng)用看成上下游的關(guān)系,上游對機器學(xué)習(xí)模型進行很好的預(yù)訓(xùn)練,做成更扎實的“半成品”,幫助下游落時更好地把注意力放到商業(yè)問題的優(yōu)化上,這樣算法的商業(yè)應(yīng)用就會更快、更有效。比如,AI大模型因為其自身具有的兼容性能適應(yīng)更多場景,同時大模型做到了相對標(biāo)準(zhǔn)化,下游可以降低對算法的使用成本,以及和商業(yè)問題的適配成本。當(dāng)然,企業(yè)對這種改變的適應(yīng)也是影響大模型產(chǎn)生效果的重要影響因素。
吳韶華:浪潮信息將大模型看作算法基礎(chǔ)設(shè)施,這種基礎(chǔ)模型在算法層面的能力,還要聯(lián)合服務(wù)軟件才能在應(yīng)用中發(fā)揮出來。因此,在應(yīng)用支撐上模型和服務(wù)軟件共同形成一種類似于算法基礎(chǔ)設(shè)施的作用。
黃心怡: 您認(rèn)為AI大模型的應(yīng)用價值有多大?對于推進人工智能規(guī)?;涞啬芊衿鸬阶饔??
吳韶華:首先是應(yīng)用的碎片化,尤其是長尾場景應(yīng)用的碎片化,是人工智能落地的難題。碎片化意味著不同場景需要有針對性的建模,每個小場景都要從數(shù)據(jù)到模型、應(yīng)用整個流程走一遍。此外,隨著數(shù)據(jù)的更新,模型也要更新。設(shè)想下,對于一個維護上百個模型的企業(yè),要同時更新上百個模型及應(yīng)用,投入是巨大的。因為大模型具備比較廣泛的普適應(yīng)用支撐能力,將傳統(tǒng)AI應(yīng)用的煙囪式、碎片化開發(fā)轉(zhuǎn)變成集中式開發(fā),很好的緩解了碎片化場景反復(fù)建模的現(xiàn)象。
其次,大模型也可以使研發(fā)人員聚焦在應(yīng)用開發(fā)的核心要素上。在算法基礎(chǔ)設(shè)施層面,包括浪潮信息構(gòu)建的源 1.0都是開源開放的,開發(fā)者不需要關(guān)心底層搭建的技術(shù),就能直接調(diào)用源1.0的大模型能力。這種能力把AI應(yīng)用的開發(fā)往上推了一大步,讓開發(fā)者聚焦應(yīng)用最核心的業(yè)務(wù)邏輯,把跟模型相關(guān)的內(nèi)容放在模型層面或算法基礎(chǔ)設(shè)施的層面。比如,基于源1.0搭建的“劇本殺”游戲,可以直接復(fù)用源1.0的開源代碼,開發(fā)過程基本不需要寫代碼和調(diào)試代碼,就完成了整個應(yīng)用的構(gòu)建,此時,開發(fā)者能把更多精力放在劇情內(nèi)容等創(chuàng)意的創(chuàng)作上。
總結(jié)一下,大模型一方面會將AI應(yīng)用的開發(fā)從煙囪式轉(zhuǎn)變到集中式開發(fā),另一方面大模型降低了AI應(yīng)用的開發(fā)難度,讓開發(fā)者能夠更聚焦在核心業(yè)務(wù)邏輯上,這是大模型給AI的應(yīng)用落地帶來的兩大益處。
張誠:大模型和AI產(chǎn)業(yè)的發(fā)展是一個必然趨勢,對這種趨勢的未來判斷其實通過回顧信息技術(shù)的商業(yè)應(yīng)用歷史來對照。上世紀(jì)90年代早期管理信息系統(tǒng)(MIS)剛開始在商業(yè)得到應(yīng)用的時候,企業(yè)往往需要18個月到36個月才能完成信息系統(tǒng)的建設(shè)和流程的配合。但是到了最近二十年,相關(guān)產(chǎn)品越來越標(biāo)準(zhǔn),3個月到12個月就能完成中等規(guī)模信息系統(tǒng)的設(shè)計和上線應(yīng)用。從新技術(shù)發(fā)展來說,早期很重的項目定制化咨詢方式,到現(xiàn)在越來越多的系統(tǒng)以產(chǎn)品化、標(biāo)準(zhǔn)化的方式復(fù)制實施。
同時,現(xiàn)在越來越多的云服務(wù)被采納,算法基礎(chǔ)設(shè)施使得算法逐漸產(chǎn)品化、技術(shù)集中化,最終完成“標(biāo)準(zhǔn)產(chǎn)品”應(yīng)用+二次開發(fā)的成熟模式。算法被標(biāo)準(zhǔn)化,應(yīng)用或設(shè)置也可以標(biāo)準(zhǔn)化,那么人工智能應(yīng)用的開發(fā)就不用從零開始做,時間也會大大縮短。同時,大模型的產(chǎn)品化、基礎(chǔ)化過程,讓企業(yè)智能化的成本越來越低,進一步促進人工智能產(chǎn)業(yè)的應(yīng)用發(fā)展。
黃心怡:浪潮信息在實際應(yīng)用過程中有沒有成本降低的案例
吳韶華:劇本殺就是一個典型的案例,在大模型出現(xiàn)之前,如果要做這樣一個游戲,需要很強大的模型,這個模型既要有對話能力,也要有邏輯推理能力,這對于模型的開發(fā)、數(shù)據(jù)的選擇門檻很高。
我們在源1.0開放過程中也遇到了很多類似情況,比如一個模型即可以支撐用戶的隨機閑聊,公文寫作,還可以支持一些特定場景的各類任務(wù),這些在沒有大模型和算法基礎(chǔ)設(shè)施支撐之前,用戶需要有自己的算法人員,從頭開始收集數(shù)據(jù)、標(biāo)注數(shù)據(jù),然后做模型等,經(jīng)過一系列研發(fā)流程,最后才能走到最核心的業(yè)務(wù)邏輯上。
現(xiàn)在有了大模型,這些問題都可以得到很好的解決或者緩解,開發(fā)者不再關(guān)注底層算法基礎(chǔ)設(shè)施的構(gòu)建,只要通過API就能獲得相應(yīng)能力。所以大模型不管是從規(guī)?;?yīng),還是針對單用戶的應(yīng)用場景,都在成本方面有比較好的促進作用。
黃心怡:AI大模型的落地還存在哪些技術(shù)和應(yīng)用瓶頸?
張誠:技術(shù)的應(yīng)用在商業(yè)上要回答好兩個最基本的問題:投入產(chǎn)出比(ROI)和價值創(chuàng)造。
第一個問題涉及商業(yè)運營的基本利益原則:技術(shù)帶來的生產(chǎn)效率提升超過技術(shù)投入,企業(yè)才愿意去使用它。隨著技術(shù)成本不斷降低,達(dá)到收益-成本的均衡點后,自然會有越來越多的企業(yè)愿意接受,現(xiàn)在只是企業(yè)在等待均衡點到達(dá)的合適時間點。關(guān)鍵是第二個問題,涉及企業(yè)競爭優(yōu)勢和可持續(xù)發(fā)展的戰(zhàn)略問題,即企業(yè)究竟需要什么樣的AI可以產(chǎn)生超越競爭者的競爭優(yōu)勢。這個問題不完全是由技術(shù)決定的,而是由企業(yè)需求決定的。特別是實體企業(yè),比如像制造業(yè)、傳統(tǒng)服務(wù)業(yè),人在哪個地方做不好,哪個地方的生產(chǎn)效率或者轉(zhuǎn)換效率就會很低,如果用技術(shù)能夠解決、改變,技術(shù)與生產(chǎn)的結(jié)合就會非常重要。
假設(shè)把技術(shù)看成一種推動力,哪些業(yè)務(wù)場景是AI真正能夠緊密結(jié)合在企業(yè)流程里,能夠解決企業(yè)實際的生產(chǎn)需求或者某個決策需求,同時經(jīng)濟和社會收益都是值得去做的,那么AI大模型就能順利落地。所以,從應(yīng)用的角度來看,大模型可能會遇到的瓶頸就是怎樣和實體企業(yè)的勞動效率提升和形成競爭優(yōu)勢這兩個需求結(jié)合起來。
吳韶華:大模型在技術(shù)上仍面臨著較大挑戰(zhàn)。首先大模型的構(gòu)建過程中面臨大規(guī)模、高質(zhì)量的數(shù)據(jù)集開發(fā)。數(shù)據(jù)集的質(zhì)量決定了模型的質(zhì)量,大規(guī)模的、高質(zhì)量數(shù)據(jù)集的構(gòu)建,是一個比較普遍的挑戰(zhàn)。不管是語言、文字等單模態(tài)數(shù)據(jù),還是多模態(tài)數(shù)據(jù),都面臨類似問題。
第一是在軟件及方法方面,業(yè)界缺少開源軟件,也缺少數(shù)據(jù)集構(gòu)建和數(shù)據(jù)集質(zhì)量評測的相關(guān)標(biāo)準(zhǔn)。我們在構(gòu)建數(shù)據(jù)集的時候,基本上從零起步,從軟件、算法的角度構(gòu)建了一個關(guān)于數(shù)據(jù)集的端到端開發(fā)平臺。多模態(tài)數(shù)據(jù)集更是如此,多模態(tài)數(shù)據(jù)可能會包含文字、圖象、語音、視頻等,它不僅需要原始數(shù)據(jù),還需要對原始數(shù)據(jù)進行對齊,這更進一步增強了數(shù)據(jù)集構(gòu)建的難度。大模型需要海量數(shù)據(jù)來做支撐,海量數(shù)據(jù)的收集本身就是一件比較有挑戰(zhàn)的事情。
構(gòu)建數(shù)據(jù)集后,需要一個大規(guī)模集群來做訓(xùn)練。以源1.0為例,在2128顆業(yè)界最先進的GPU集群上開展訓(xùn)練。大規(guī)模集群算力的獲取就是一個比較大的挑戰(zhàn)。此外,怎么用好這個集群,加速訓(xùn)練過程,進而降低算力成本開銷,也同樣充滿挑戰(zhàn)。
所以,從技術(shù)層面來講,大模型既有數(shù)據(jù)獲取,構(gòu)建的挑戰(zhàn),也有模型算法、訓(xùn)練算力性能優(yōu)化的挑戰(zhàn)。
黃心怡:人工智能在數(shù)字經(jīng)濟當(dāng)中發(fā)揮的價值?它的挑戰(zhàn)以及機遇有哪些?
吳韶華:大模型以及其他人工智能模型,將會是數(shù)字經(jīng)濟的核心支撐。一方面它可以很好的挖掘數(shù)據(jù)價值,另外一方面,在應(yīng)用的智能化上也會發(fā)揮關(guān)鍵作用,大模型有可能會成為數(shù)字經(jīng)濟的智能大腦。
大模型帶來了很多新的機會,隨著技術(shù)的成熟,還會涌現(xiàn)更多機會。比如建模,AI大模型帶來的集中式建模能力將有效緩解碎片化應(yīng)用開發(fā)的痛點。同時,大模型本身也能否孵化出新型應(yīng)用,比如大模型具有很強的對話、交流能力,可以很好的賦能元宇宙的虛擬人場景。大模型對多模態(tài)信息的強大處理能力,也會孵化出來更豐富的多模態(tài)應(yīng)用。
張誠:在過去的十年,更多的是人工智能和大模型的宣傳,嘗試,探索階段。接下來的十年會,對人工智能的應(yīng)用會更好、也會更成熟,企業(yè)更懂得人工智能、大模型技術(shù)是什么、什么時候應(yīng)用,同時還會很專業(yè)的評定收入產(chǎn)出比,評定人工智能對企業(yè)造成的成本增減,亦即獲得收益之間的平衡。當(dāng)AI大模型的應(yīng)用越來越成熟,我們就可以期待接下來每一年都比以前會更好。
黃心怡:總結(jié)一下您對AI大模型的一些思考
吳韶華:大模型將在技術(shù)上產(chǎn)生更多的突破,也會對應(yīng)用的規(guī)?;涞禺a(chǎn)生更好的促進作用。
張誠:大模型代表了人工智能技術(shù)發(fā)展向產(chǎn)品化、產(chǎn)業(yè)化落地的趨勢,這個趨勢繼續(xù)下去,會更深刻改變產(chǎn)業(yè)的格局。