北京2020年10月29日 /美通社/ -- ASC世界大學(xué)生超算競賽是一場怎樣的比賽?對于擁有4年參賽經(jīng)歷的廖秋承來說,ASC不僅是比賽,更是改變?nèi)松钠鯔C。非計算機專業(yè)出身的他因為ASC接觸超算,熱愛超算,從隊員成長為指導(dǎo)老師,更選擇將超算作為自己的終生事業(yè)。在今年初的ASC20啟動會上,廖老師作為指導(dǎo)老師代表發(fā)言,講述了他對ASC超算競賽的感悟和體會。
以下是廖秋承老師的演講實錄。
各位專家,各位老師,各位媒體朋友大家好。
我是上海交通大學(xué)代表隊的指導(dǎo)老師廖秋承。上海交通大學(xué)從2013年開始參加ASC,至今為止參加了七屆比賽,共獲得一個冠軍,一個亞軍,一個e Prize和4個應(yīng)用創(chuàng)新獎。2020年是我個人第5年參加比賽,從一名隊員到一名指導(dǎo)老師,中間走過的路程激動人心又坎坷曲折。交通大學(xué)2013年建成國內(nèi)高校第一臺超級計算機π1.0,今年建成了π2.0,這個過程中無數(shù)科研成果從這兩臺超級計算機上誕生。包括中國第一個全國性的兒童早期白血病數(shù)據(jù)庫、目前世界上最大規(guī)模的4.3萬億個粒子N體問題模擬、比串行版本加速1.8萬倍的BTE算法等,很多重要的成果都有ASC競賽隊員的參與。
種下計算的種子
ASC不僅是讓大學(xué)生參加超算比賽、深刻了解超算的平臺,更為高校提供了人才培養(yǎng)機制,讓高校從中獲取高性能計算專業(yè)人才。我時常跟學(xué)生打比方,如果說戈登·貝爾獎和Top500是超算屆的達喀爾拉力賽和F1比賽,ASC就是超算界的卡丁車競賽。一個車手想成長為F1賽車手,他從非常小的時候就要接受卡丁車專業(yè)訓(xùn)練,連續(xù)十幾年的時間里一直接受各種各樣的賽車訓(xùn)練知識、引擎的知識,學(xué)習(xí)如何掌控重力、牽引力,輪胎管理和底盤管理等等。超算競賽就像卡丁車競賽,教會學(xué)生如何管理一個復(fù)雜系統(tǒng),從芯片微架構(gòu)體系結(jié)構(gòu),到芯片間的互聯(lián),節(jié)點的互聯(lián),到操作系統(tǒng),調(diào)優(yōu)到建模。從來沒有一個比賽像ASC比賽這樣,把所有方面全部結(jié)合在一起,這也給學(xué)生帶來非常大的挑戰(zhàn)。
根據(jù)我個人統(tǒng)計,每年可能有超過40名本科生在我們實驗室學(xué)習(xí),但最后只有5個人的名字出現(xiàn)在ASC的獎狀上,這中間的淘汰機制非常殘酷,只有在這樣殘酷的條件下才有可能得到最優(yōu)秀的學(xué)生。超算競賽是一粒種子,給大學(xué)生種下了計算的種子,就像原始人拿到的第一個工具一樣,原始人拿到第一個手動工具之后開始開天辟地,而我們拿到算力以后開始改變世界,讓我們的生活變得更加美好。
讓學(xué)生發(fā)揮最大創(chuàng)造力
ASC不僅是播撒種子的平臺還是創(chuàng)新的平臺,上海交通大學(xué)代表隊在這幾年比賽中干過瘋狂的事情。2016年為DNN模型創(chuàng)建了18層的令牌環(huán),達到了決賽中苛刻的精度和速度要求。2017年我們第一次在PCIE SSD上使用了并行文件系統(tǒng)BeeGFS。2018年我們打磨了散熱器,更換了高性能的硅脂,改變服務(wù)器的散熱策略,使得我們在南昌大學(xué)酷熱的場地還能保持服務(wù)器的正常運行。2019年我們第一次在每一臺服務(wù)器節(jié)點上用了兩塊Omni-Path 100G的網(wǎng)卡,從而實現(xiàn)了全場最快的CESM模擬,當然因為一些原因我們的CESM并沒有拿到獎。
所以大家可以看到,ASC不僅是一個播撒種子的平臺,還是一個讓學(xué)生發(fā)揮他們最大創(chuàng)造力的平臺,你有非常多在正式生產(chǎn)集群上無法用的技能技巧和奇思妙想。雖然在ASC的賽場上,這些技巧并不會扭轉(zhuǎn)乾坤,甚至根據(jù)我的經(jīng)驗,它們大部分都失敗了,但是最后這些技巧越來越成熟后,卻有可能真正用在生產(chǎn)環(huán)境和高校的科研中。2019年π2.0幫助上海交通大學(xué)一位老師進行了北冰洋洋面和洋面下的氣候模擬,用的正是CESM的模型,他經(jīng)過我們的競賽隊員幫助,在π2.0集群上非常高效地完成之前無法運行起來的模擬。
今年我們第一次以超算工程師和學(xué)科主要科學(xué)家合作的模式,從零開始研發(fā)一個內(nèi)燃機摩擦學(xué)模擬程序,在研發(fā)成功后,這將是國際上摩擦學(xué)領(lǐng)域第一個二維滑動平面進行多尺度摩擦特性研究的程序。大家可以看到,ASC比賽不僅僅是讓學(xué)生玩得爽的比賽,還讓算力應(yīng)用到日??蒲兄校尭咝:透黝I(lǐng)域?qū)W科的科學(xué)家都從中受益。
建立超算交流平臺
更重要的,ASC為我們建立一個交流的平臺,我記得去年我去SC,賽事主席Rebecca Hartman-Baker給我們說的第一句話是,你們這16個隊伍里有15個隊伍會輸。仔細想想確實是這樣,只有一個隊伍會贏,我們?yōu)槭裁催€要參加這個比賽?我說一個真實的故事,有一個大學(xué)是ASC的參賽代表隊,埃爾朗根紐倫堡大學(xué),這個大學(xué)大家可能沒有聽說過,但是負責(zé)這個大學(xué)代表隊的實驗室兩位教授Gerhard Wellein和Gerog Hager,是高性能計算和芯片體系結(jié)構(gòu)性能模型ECM的創(chuàng)始人,也是非常著名的高性能計算著作《Introduction to High Performance Computing for Scientists and Engineers》的作者,正是通過這個比賽,我們和他們有了很多的學(xué)術(shù)交流。
今年我們會看到ETH,非常著名的老牌大學(xué)來到中國,HPC領(lǐng)域著名的Torsten Hoefler教授就在他們的團隊里,他在去年SC拿到了戈登貝爾獎,也拿到了Best Paper,如果他們今年能來到中國,希望我們很多代表隊有機會和這樣一位大師能夠面對面的交流。
綜合以上,我想說ASC不僅僅給我們帶來無數(shù)的榮譽,無數(shù)的歷練,無數(shù)的精彩,還給我們整個高性能計算的生態(tài)圈注入了新鮮的血液。今年的題目里有一個題“QuEST”,使我想起了13年的同學(xué),他是通過HPC比賽了解到HPC的相關(guān)知識,目前在從事量子計算的研究。有無數(shù)的學(xué)生從ASC里發(fā)現(xiàn)了計算的潛力,在各個行業(yè),有的去了金融公司,有的去了互聯(lián)網(wǎng)公司。這是一棵大樹,希望我能和浪潮、亞洲超算協(xié)會和其他為這項比賽辛勤付出的人一起,把這棵大樹慢慢培養(yǎng)長大,最后長成參天大樹,讓全人類都享受到計算帶來的強大力量。
謝謝大家。