北京2020年11月25日 /美通社/ -- 2020年11月13日,以“Connect·Collaborate·Accelerate”為主題,由浪潮和OCP基金會(huì)聯(lián)合舉辦的第二屆OCP China Day 暨OCP Tech Week全球技術(shù)峰會(huì)中國(guó)專場(chǎng)在北京望京凱悅酒店隆重開幕。百度攜整機(jī)柜、OAI等多種解決方案亮相大會(huì),與微軟、浪潮、Facebook、阿里、騰訊等OCP社區(qū)領(lǐng)袖企業(yè)和數(shù)百位參會(huì)嘉賓一道,共同探討開放計(jì)算在人工智能、邊緣計(jì)算等新興技術(shù)領(lǐng)域及未來數(shù)據(jù)中心基礎(chǔ)設(shè)施層面的發(fā)展與應(yīng)用。
OCP(Open Compute Project)是由Facebook聯(lián)合英特爾、Rackspace等公司于2011年發(fā)起成立的非營(yíng)利組織,作為全球影響力最大的開放計(jì)算社區(qū), OCP旨在解決未來數(shù)據(jù)中心技術(shù)的標(biāo)準(zhǔn)化、產(chǎn)業(yè)化問題。目前在機(jī)架式和整機(jī)柜式高密度服務(wù)器、下一代數(shù)據(jù)中心管理架構(gòu)等領(lǐng)域的開源項(xiàng)目已經(jīng)實(shí)現(xiàn)了數(shù)百萬的部署規(guī)模,人工智能、開源交換機(jī)操作系統(tǒng)等新領(lǐng)域的標(biāo)準(zhǔn)正在開放測(cè)試,是業(yè)內(nèi)最有影響的開放技術(shù)項(xiàng)目。
整機(jī)柜,超大規(guī)模數(shù)據(jù)中心規(guī)?;瘧?yīng)用
作為OCP 中國(guó)社區(qū)的重要成員,百度服務(wù)器資深系統(tǒng)工程師趙杰向與會(huì)者介紹了百度天蝎3.0整機(jī)柜以及中國(guó)開源整機(jī)柜技術(shù)與應(yīng)用。
天蝎計(jì)劃最早由百度在2011年推出并商用,經(jīng)過近十年的積累沉淀和兩次大版本的迭代升級(jí),目前百度天蝎整機(jī)柜部署規(guī)模超2萬柜,生態(tài)產(chǎn)值超200億元。
天蝎3.0采用了全新的架構(gòu)設(shè)計(jì),在散熱、供電、結(jié)構(gòu)三個(gè)方面進(jìn)行了技術(shù)革新。散熱方面,同時(shí)布局多種散熱技術(shù),風(fēng)冷可支持最大350W的CPU,同時(shí)風(fēng)扇能耗降低了35%。供電方面,支持最高48V供電,單機(jī)柜最高功率密度可達(dá)36kW。結(jié)構(gòu)上,兼容21inch/19inch設(shè)計(jì),以及風(fēng)冷液冷兩種散熱方式,模塊化的快插設(shè)計(jì),使成本降低了30%。
而這樣的技術(shù)創(chuàng)新則離不開百度與浪潮的深度合作,在此基礎(chǔ)上,不僅實(shí)現(xiàn)了整機(jī)柜的L11級(jí)高效交付,也刷新了多項(xiàng)紀(jì)錄,2019年,百度與浪潮8小時(shí)完成1萬臺(tái)服務(wù)器部署,交付效率較機(jī)架式服務(wù)器提升20倍,為支撐2019年春晚紅包項(xiàng)目發(fā)揮了關(guān)鍵作用。
OAI推動(dòng)AI、5G開放創(chuàng)新
2019年,OCP社區(qū)成員百度、Facebook、微軟、浪潮等共同發(fā)起OAI(Open Accelerator Infrastructure)項(xiàng)目,計(jì)劃建立一套支持不同AI芯片的技術(shù)標(biāo)準(zhǔn),涵蓋結(jié)構(gòu)設(shè)計(jì)、溫度、管理、供電、硬件安全性、可用性等諸多方面。OCP大會(huì)現(xiàn)場(chǎng),百度、浪潮、燧原科技等企業(yè)基于OAM標(biāo)準(zhǔn)的產(chǎn)品紛紛亮相。
百度系統(tǒng)架構(gòu)師黎世勇表示,OAI標(biāo)準(zhǔn)不僅將極大提高不同AI硬件加速模塊和系統(tǒng)的互操作性,更將加速新AI硬件加速模塊的大規(guī)模落地應(yīng)用,全球AI硬件生態(tài)系統(tǒng)都會(huì)從中受益。同時(shí),為了更好地為上層各種各樣的AI負(fù)載提供高效靈活的硬件算力,百度不僅積極參與構(gòu)建了AI芯片昆侖、AI服務(wù)器X-MAN系列產(chǎn)品、AI通信加速組件Halo以及AI訓(xùn)練平臺(tái)Kongming,并可搭配高效的分布式存儲(chǔ)系統(tǒng)。
他還表示,百度X-MAN系列產(chǎn)品多項(xiàng)技術(shù)行業(yè)領(lǐng)先,如X-MAN1.0首次實(shí)現(xiàn)AI計(jì)算硬件解耦架構(gòu)、X-MAN2.0首次將冷板式液冷散熱技術(shù)應(yīng)用到AI計(jì)算產(chǎn)品里、X-MAN3.0首次倡導(dǎo)模塊化標(biāo)準(zhǔn)化設(shè)計(jì),X-MAN4.0是首款實(shí)現(xiàn)支持OAI標(biāo)準(zhǔn)及液冷散熱的AI計(jì)算產(chǎn)品。
最后,百度云邊緣計(jì)算計(jì)算部總經(jīng)理陳剛,帶來了他對(duì)開放計(jì)算的看法。他表示,邊緣計(jì)算依然處于初期階段,而在此基礎(chǔ)上產(chǎn)生的業(yè)務(wù)需求又非常的多樣化,導(dǎo)致了對(duì)基礎(chǔ)設(shè)施的需求也十分的多樣化,并由此帶來了一些技術(shù)方面的挑戰(zhàn)。對(duì)此,他認(rèn)為應(yīng)該設(shè)立一個(gè)統(tǒng)一的標(biāo)準(zhǔn),來規(guī)范整個(gè)基礎(chǔ)設(shè)施,尤其是從物理形態(tài)上。這樣對(duì)開放計(jì)算的標(biāo)準(zhǔn)化能起到一定的作用。
接下來他提到了關(guān)于對(duì)邊緣計(jì)算的管控問題和平臺(tái)調(diào)度問題,他認(rèn)為邊緣計(jì)算設(shè)備尚在發(fā)展初期,需要開放計(jì)算來給出指導(dǎo),標(biāo)準(zhǔn)化相應(yīng)的硬件規(guī)格,從而推進(jìn)商業(yè)化進(jìn)程并提高部署效率。
正是因?yàn)榘俣冗@樣的優(yōu)秀合作伙伴在軟硬件技術(shù)上的革新與支持,才使得開放計(jì)算的生態(tài)不斷豐富和完善,這樣才能加快推動(dòng)整個(gè)行業(yè)的發(fā)展和向傳統(tǒng)行業(yè)落地。這也讓更多合作伙伴和客戶看到了開放計(jì)算的優(yōu)秀成果和未來潛在的發(fā)展,為吸引更多廠商加入這一生態(tài)做出了貢獻(xiàn)。
2020年初,一場(chǎng)突如其來的新冠肺炎疫情席卷全球,時(shí)至今日仍在影響著世界各國(guó)的經(jīng)濟(jì)發(fā)展和日常工作生活,迫使各行各業(yè)加速數(shù)字化轉(zhuǎn)型的步伐。利用AI、5G、邊緣計(jì)算等前沿技術(shù)為新型基礎(chǔ)設(shè)施賦能,構(gòu)建更靈活,更開放、更智能的開放數(shù)據(jù)中心,獲得彈性、可擴(kuò)展和成本效益等優(yōu)勢(shì),是OCP長(zhǎng)期以來的目標(biāo),也是本次大會(huì)“連接、協(xié)作、加速”主題的意義所在。
未來,百度將攜手OCP和以浪潮為代表的社區(qū)合作伙伴一起,為開放計(jì)算產(chǎn)品帶來更多創(chuàng)新,為客戶創(chuàng)造更大價(jià)值。也希望能有更多像百度這樣的優(yōu)質(zhì)合作伙伴,加入開放計(jì)算,加速開放計(jì)算生態(tài)的建設(shè)和完善。