近期,杭州深度求索人工智能基礎技術研究有限公司,作為deepseek的關聯企業,在人工智能領域取得了新的技術突破。據天眼查信息顯示,該公司成功申請并公布了一項名為“一種大語言模型的部署方法及系統”的專利。
該專利的核心創新點在于,它提出了一種創新的部署策略,將大語言模型的預填充階段和解碼階段進行分離,并分別部署在具備高性能計算能力和大內存的機器上。這一策略旨在優化資源分配,實現負載的均衡。
具體而言,通過將預填充階段部署在高性能計算設備上,可以充分利用其強大的計算能力,快速完成模型的初始化工作。而解碼階段則部署在大內存機器上,以確保在處理大量數據時能夠保持高效和穩定。這種部署方式不僅實現了硬件資源的最大化利用,還顯著減少了閑置算力,進一步降低了系統的整體延遲。
該專利還帶來了吞吐量的提升,使得系統能夠在單位時間內處理更多的請求。這對于提升用戶體驗和滿足日益增長的數據處理需求具有重要意義。同時,該方案還增強了系統的擴展性和容錯性,為未來的技術升級和故障應對提供了堅實的基礎。

從公布的專利摘要中,我們可以更直觀地了解到這一創新技術的具體實現和所帶來的積極效果。這一專利的公布,標志著杭州深度求索人工智能基礎技術研究有限公司在大語言模型部署領域取得了重要的技術進展。

隨著人工智能技術的不斷發展和應用領域的不斷拓展,對于大語言模型的部署效率和性能要求也越來越高。杭州深度求索人工智能基礎技術研究有限公司的這一專利成果,無疑為行業提供了新的思路和技術支持,有望推動人工智能技術的進一步發展和應用。






