【ITBEAR科技資訊】9月23日消息,華為在今日的全聯(lián)接大會(huì)2023期間發(fā)布了一項(xiàng)重大突破,正式推出了Atlas 900 SuperCluster,這是一款全新架構(gòu)的昇騰AI計(jì)算集群,專門設(shè)計(jì)用于支持超大規(guī)模模型訓(xùn)練,參數(shù)容量高達(dá)萬(wàn)億級(jí)別。
華為企業(yè)BG總裁兼ICT基礎(chǔ)設(shè)施業(yè)務(wù)管理委員會(huì)主任汪濤在發(fā)布會(huì)上介紹了這一創(chuàng)新產(chǎn)品,他表示,Atlas 900 SuperCluster采用了最新一代的華為星河AI智算交換機(jī)CloudEngine XH16800,該交換機(jī)具備高密度的800GE端口能力,使得只需要兩層交換網(wǎng)絡(luò)即可構(gòu)建一個(gè)擁有2250個(gè)節(jié)點(diǎn)的超大規(guī)模集群,相當(dāng)于18000張計(jì)算卡的規(guī)模。

更為引人注目的是,這款集群采用了全新的超節(jié)點(diǎn)架構(gòu),極大提升了大模型訓(xùn)練的性能。汪濤強(qiáng)調(diào),大算力已經(jīng)成為推動(dòng)人工智能發(fā)展的核心引擎。為了滿足日益增長(zhǎng)的計(jì)算需求,華為進(jìn)行了系統(tǒng)架構(gòu)創(chuàng)新,將算力、運(yùn)力、存力融為一體,成功突破了大算力瓶頸。



據(jù)ITBEAR科技資訊了解,為了進(jìn)一步加速大模型創(chuàng)新,華為還發(fā)布了CANN7.0,這是一個(gè)更加開放、易于使用的平臺(tái)。它不僅與業(yè)界主流的AI框架、加速庫(kù)和大模型兼容,還深度開放底層能力,使得AI框架和加速庫(kù)可以更加靈活地調(diào)用和管理計(jì)算資源,為開發(fā)者提供了更多的自定義高性能算子的可能性。


華為在計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、能源等領(lǐng)域的綜合優(yōu)勢(shì),使得這一新集群在器件級(jí)、節(jié)點(diǎn)級(jí)、集群級(jí)和業(yè)務(wù)級(jí)全面提升了系統(tǒng)的可靠性,將大模型訓(xùn)練的穩(wěn)定性從天級(jí)提升到了月級(jí)水平。這個(gè)突破性的產(chǎn)品將為人工智能領(lǐng)域的發(fā)展提供更強(qiáng)大的支持,推動(dòng)大模型時(shí)代的到來(lái)。






