8月15日,在蘇州舉行的2020全球人工智能產(chǎn)品應(yīng)用博覽會(AIExpo2020)上,浪潮最新推出的人工智能服務(wù)器NF5488A5受到關(guān)注。這款A(yù)I服務(wù)器在此前最新公布的MLPerf全球權(quán)威AI測試榜單中,僅用時33.37分鐘,就在包含128萬張圖片的ImageNet數(shù)據(jù)集上完成Resnet50模型的訓(xùn)練,相當(dāng)于每秒訓(xùn)練23000多張圖片,單機計算性能排名第一。
MLPerf是業(yè)內(nèi)首套衡量機器學(xué)習(xí)軟硬件性能的通用基準(zhǔn),由圖靈獎得主David Patterson聯(lián)合谷歌和幾所著名高校于2018年發(fā)起,得到亞馬遜、Facebook、谷歌、哈佛大學(xué)、英特爾、英偉達(dá)、阿里巴巴、浪潮等支持和參與。在最新發(fā)布的MLPerf 0.7 訓(xùn)練測試榜單中,浪潮NF5488A5人工智能服務(wù)器除了在Resenet50取得單機計算性能榜首外,還在人工智能自然語言理解Transformer、神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)GNMT、深度學(xué)習(xí)推薦模型DLRM、目標(biāo)監(jiān)測算法SSD等MLPerf的模型訓(xùn)練評估中均取得不俗成績。
參與打榜的這款產(chǎn)品NF5488A5是浪潮自研推出的新一代AI服務(wù)器,單機訓(xùn)練性能可達(dá)5 PetaOPS,相比上一代服務(wù)器計算性能提升234%。兩年前Facebook的科學(xué)家用32臺GPU服務(wù)器、256塊GPU花了1個小時完成了ImageNet上的Resnet50訓(xùn)練,而現(xiàn)在僅需一臺NF5488A5,即可在33分鐘完成同樣的訓(xùn)練,單臺設(shè)備訓(xùn)練效率提升近60倍。同時,浪潮優(yōu)化了NF5488A5的拓?fù)浣Y(jié)構(gòu),采用NUMA綁定策略,可實現(xiàn)CPU與最近GPU的指定通信,大幅提升CPU與GPU之間的數(shù)據(jù)傳輸效率,實現(xiàn)更低的數(shù)據(jù)傳輸延遲和更高的帶寬,滿足各種AI負(fù)載高效數(shù)據(jù)通信需求。
NF5488A5可廣泛應(yīng)用于圖像視頻、語音識別、金融分析、智能客服等典型AI應(yīng)用場景,幫助AI用戶高效完成AI基礎(chǔ)設(shè)施和開發(fā)環(huán)境的構(gòu)建,縮短開發(fā)周期,顯著提升AI開發(fā)和應(yīng)用效率,在享受更高計算性能的同時降低部署、運行成本。