隨著每一次工業(yè)革命的浪潮,人類社會(huì)經(jīng)歷了前所未有的躍遷式發(fā)展。如今,以人工智能(AI)為核心的新一輪技術(shù)變革正洶涌而來(lái),企業(yè)如何在這樣的背景下獲取必要的技術(shù)支撐,為通用人工智能時(shí)代的到來(lái)做好充足準(zhǔn)備,成為了業(yè)界關(guān)注的焦點(diǎn)。
近日,在2024火山引擎FORCE原動(dòng)力大會(huì)·冬技術(shù)主論壇上,一系列創(chuàng)新產(chǎn)品及升級(jí)方案被隆重推出,旨在幫助企業(yè)解決落地大模型所面臨的實(shí)際難題。字節(jié)跳動(dòng)基礎(chǔ)架構(gòu)負(fù)責(zé)人趙鵬偉在會(huì)上發(fā)表了重要講話。
“為了迎接通用人工智能時(shí)代的到來(lái),企業(yè)必須在性價(jià)比、創(chuàng)新能力和安全保障等方面做好充分準(zhǔn)備。”趙鵬偉指出,“火山引擎通過(guò)提供AI云原生式的全鏈路產(chǎn)品服務(wù)能力,包括豆包大模型、大模型服務(wù)、AI基礎(chǔ)設(shè)施、數(shù)據(jù)和安全方向的新成果,致力于與眾多企業(yè)和開發(fā)者共同推進(jìn)未來(lái)的AI創(chuàng)新變革。”
火山引擎提出了AI云原生的新概念,認(rèn)為未來(lái)的計(jì)算范式應(yīng)以GPU為核心,重新優(yōu)化計(jì)算、存儲(chǔ)與網(wǎng)絡(luò)架構(gòu)。AI云原生將允許GPU直接訪問(wèn)存儲(chǔ)和數(shù)據(jù)庫(kù),顯著降低IO延遲,并提供更高規(guī)模的高速互聯(lián)和端到端的安全保護(hù)。為此,火山引擎將打造以AI負(fù)載為中心的基礎(chǔ)架構(gòu)新范式,推出新一代計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)和安全產(chǎn)品。
在計(jì)算層面,火山引擎推出了新一代GPU實(shí)例,通過(guò)vRDMA網(wǎng)絡(luò)支持大規(guī)模并行計(jì)算和P/D分離推理架構(gòu),顯著提升訓(xùn)練和推理效率,降低成本。在存儲(chǔ)方面,新發(fā)布的EIC彈性極速緩存能夠?qū)崿F(xiàn)GPU直連,使大模型推理時(shí)延降低至原來(lái)的五十分之一,成本降低20%。在安全層面,火山引擎推出了PCC私密云服務(wù),構(gòu)建大模型的可信應(yīng)用體系,實(shí)現(xiàn)用戶數(shù)據(jù)在云上推理的端到端加密,且性能優(yōu)越,推理時(shí)延與明文模式相比差異在5%以內(nèi)。

火山方舟作為一站式大模型服務(wù)平臺(tái),通過(guò)Cache、離線推理模式等產(chǎn)品與升級(jí),以及全新發(fā)布的Prompt優(yōu)解,加速了大模型能力的落地。Prompt優(yōu)解通過(guò)“自動(dòng)+互動(dòng)”的方式協(xié)助用戶編寫提示詞,用機(jī)器實(shí)現(xiàn)類似人類的反思、類比、錯(cuò)誤總結(jié)能力,全自動(dòng)優(yōu)化prompt,助力企業(yè)低成本高效率獲得高質(zhì)量prompt。目前,Prompt優(yōu)解已通過(guò)火山方舟開放全量公測(cè)。
火山引擎始終將成本和價(jià)格作為重要考量因素,發(fā)布了離線批量推理方案和上下文緩存,進(jìn)一步踐行“人人用得起,才是好模型”的理念,幫助用戶實(shí)現(xiàn)更為精細(xì)化和低成本的運(yùn)營(yíng)。

全新發(fā)布的扣子1.5和HiAgent1.5,助力企業(yè)打造AI原生應(yīng)用。從通用大模型到企業(yè)AI應(yīng)用落地,需要跨越三道鴻溝,而扣子1.5和HiAgent1.5的推出,將幫助企業(yè)更好地實(shí)現(xiàn)這一轉(zhuǎn)變。豆包大模型最新發(fā)布的視覺理解模型、文生圖模型2.1和音樂(lè)模型,都可以通過(guò)扣子以插件的方式體驗(yàn),有助于更多多模態(tài)AI應(yīng)用的誕生。
為了幫助企業(yè)用好數(shù)據(jù),驅(qū)動(dòng)業(yè)務(wù)價(jià)值的提升,火山引擎發(fā)布了數(shù)據(jù)飛輪2.0,通過(guò)AI創(chuàng)新重新定義企業(yè)數(shù)據(jù)智能。數(shù)據(jù)飛輪2.0全面注入大模型,帶來(lái)前所未有的決策洞察,通過(guò)一體化數(shù)智研發(fā)與一站式數(shù)據(jù)智能運(yùn)營(yíng),簡(jiǎn)化工作流程。在多元異構(gòu)計(jì)算引擎的加速下,快速處理結(jié)構(gòu)與非結(jié)構(gòu)數(shù)據(jù)資產(chǎn),激發(fā)企業(yè)更多潛在數(shù)據(jù)資產(chǎn),實(shí)現(xiàn)更大的動(dòng)力。

火山引擎云安全圍繞“讓智能更安全、讓安全更智能”的理念,為AI基礎(chǔ)設(shè)施提供透明可信的安全保障,并通過(guò)安全智能體,將字節(jié)跳動(dòng)沉淀的安全經(jīng)驗(yàn)服務(wù)于每個(gè)企業(yè)。大模型應(yīng)用進(jìn)入快速發(fā)展階段,企業(yè)對(duì)模型能力、價(jià)格以及落地難度都提出了更高要求。火山引擎本次發(fā)布的多款全新產(chǎn)品與升級(jí),進(jìn)一步降低了模型訓(xùn)練、推理應(yīng)用的難度,以更高性價(jià)比和更強(qiáng)安全保障,為企業(yè)落地AI能力奠定了堅(jiān)實(shí)基礎(chǔ)。






