国产18在线,久久亚洲国产成人影院,国产午夜精品一区二区三区小说

亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告：魔扣目錄網(wǎng)為廣大站長(zhǎng)提供免費(fèi)收錄網(wǎng)站服務(wù)，提交前請(qǐng)做好本站友鏈：【網(wǎng)站目錄：http://www.430618.com 】，免友鏈快審服務(wù)（50元/站），

網(wǎng)站：52011
待審：79
小程序：12
文章：1184964
會(huì)員：801

首頁(yè) > 新聞資訊 > 手機(jī)數(shù)碼 >正文

蘋果M3 Ultra實(shí)測(cè)：運(yùn)行DeepSeek R1，性能竟超8張A100顯卡？

發(fā)布時(shí)間：2025-03-12 18:19:22 作者：網(wǎng)友整理

近期，B站知名UP主“雖然但是張黑黑”發(fā)布了一段引人注目的視頻，該視頻揭示了蘋果最新滿血版M3 Ultra芯片在運(yùn)行超大規(guī)模AI模型時(shí)的驚人表現(xiàn)。測(cè)試中，這款芯片在驅(qū)動(dòng)DeepSeek R1模型——一個(gè)擁有6710億參數(shù)的龐然大物時(shí)，展現(xiàn)出了超越8張NVIDIA A100顯卡的性能，而其成本卻遠(yuǎn)低于傳統(tǒng)解決方案。

通常，運(yùn)行如此大規(guī)模的AI模型需要借助配備6至8張A100顯卡的專業(yè)服務(wù)器，這樣的配置總價(jià)往往超過百萬(wàn)元人民幣，對(duì)于大多數(shù)用戶而言，這無(wú)疑是一道難以逾越的門檻。然而，滿血版M3 Ultra卻僅憑一臺(tái)Mac Studio就實(shí)現(xiàn)了相近的性能，其性價(jià)比之高令人矚目。

測(cè)試數(shù)據(jù)顯示，在運(yùn)行DeepSeek R1模型時(shí)，8張A100顯卡的性能為每秒處理16.41個(gè)Tokens，而滿血版M3 Ultra在GGUF格式下達(dá)到了每秒15.78個(gè)Tokens。但令人驚喜的是，當(dāng)切換到能充分發(fā)揮統(tǒng)一內(nèi)存優(yōu)勢(shì)的MLX格式后，M3 Ultra的速度飆升至每秒19.17個(gè)Tokens，成功超越了8張A100顯卡的表現(xiàn)。在運(yùn)行DeepSeek V3的6710億參數(shù)模型時(shí)，M3 Ultra的速度更是達(dá)到了每秒19.66個(gè)Tokens。

然而，值得注意的是，M3 Ultra的性能優(yōu)勢(shì)并非在所有場(chǎng)景下都能顯現(xiàn)。在進(jìn)行單一模型推理時(shí)，主要依賴于內(nèi)存帶寬和容量，此時(shí)A100顯卡的潛力可能無(wú)法得到完全發(fā)揮。而在多用戶推理和大模型訓(xùn)練等更復(fù)雜的應(yīng)用場(chǎng)景中，M3 Ultra則無(wú)法與A100相媲美。

盡管如此，M3 Ultra在大語(yǔ)言模型推理速度測(cè)試中的表現(xiàn)依然令人印象深刻。無(wú)論是Llama 3.1的70B版本、Gemma2的27B版本還是Qwen 2.5的14B版本，M3 Ultra的速度都明顯優(yōu)于其他M系列芯片。與M2 Ultra相比，M3 Ultra在這些模型上的速度分別提升了13%、34%和18%。

此次測(cè)試的滿血版M3 Ultra配備了高達(dá)512GB的統(tǒng)一內(nèi)存，其總價(jià)為74249元人民幣。對(duì)于大多數(shù)用戶而言，如果不需要運(yùn)行如此大規(guī)模的模型，可以適當(dāng)降低統(tǒng)一內(nèi)存的容量以節(jié)省成本。這一靈活的配置選項(xiàng)無(wú)疑為更多用戶提供了體驗(yàn)高性能AI計(jì)算的可能性。

分享到：

標(biāo)簽：實(shí)測(cè) 顯卡性能運(yùn)行蘋果