隨著當前人工智能技術普遍應用于日常生活和傳統產業,對于底層芯片計算能力的需求一直 在飛速增長,其增速已經大幅超過了摩爾定律的速度。例如在 2021 年,由Google提出的Switch Transformer網絡及Facebook提出的DLRM12T網絡,分別是 2017 年Google提出的Transformer網絡模型大小的7, 600 倍和57, 000 倍。人工智能運算常常具有大運算量、高并發度、訪存頻繁的特點,且不同子領域(如視覺、語音與自然語言處理)所涉及的運算模式具有高度多樣性,對于芯片的微架構、指令集、制造工藝甚至配套系統軟件都提出了巨大的挑戰。
寒武紀的主營業務是各類云服務器、邊緣計算設備、終端設備中人工智能核心芯片的研發、設計和銷售,主要產品為云端智能芯片及加速卡、訓練整機、邊緣智能芯片及加速卡、終端智能處理器IP以及上述產品的配套軟件開發平臺。
寒武紀所研發的通用型智能芯片產品,具備靈活的指令集和精巧的處理器架構,技術壁壘高但應用面廣,可覆蓋人工智能領域高度多樣化的應用場景(如 視覺、語音、自然語言理解、傳統機器學習、生成式人工智能等)。與CPU、GPU等芯片相比,通用型智能芯片能夠更好地匹配和支持人工智能算法中的關鍵運算操作,在性能和功耗上存在顯著優勢。根據市場調研公司 Tractica 的研究報告,人工智能芯片的市場規模將由 2018 年的 51 億美元增長到 2025 年的 726 億美元,年均復合增長率將達到 46.14%。隨著人工智能市場需求潛力逐 步釋放,通用型人工智能芯片未來將成為該市場的主流產品。
集成電路設計行業屬于技術密集型行業,而智能芯片作為集成電路領域新興的方向,在集成 電路和人工智能方面有著雙重技術門檻。通用型智能芯片及其基礎系統軟件的研發需要全面掌握核心芯片與系統軟件的大量關鍵技術,技術難度高、涉及方向廣,是一個極端復雜的系統工程。
寒武紀憑借領先的核心技術,較早實現了多項技術的產品化。自 2016 年 3 月成立以來,寒武紀先后推出了用于終端場景的寒武紀1A、寒武紀1H、寒武紀1M系列智能處理器;基于思元100、思元270、思元 290 芯片和思元 370 的云端智能加速卡系列產品;基于思元 220 芯片的邊緣智能加速卡。其中,寒武紀智能處理器IP產品已集成于超過 1 億臺智能手機及其他智能終端設備中,思元系列產品也已應用于浪潮、聯想等多家服務器廠商的產品中。此外,思元 270 芯片、思元 290 芯片還分別獲得第六屆世界互聯網大會、世界人工智能大會頒布的獎項。思元 220 自發布以來,累計銷量突破百萬片。
同時,寒武紀通過技術創新和設計優化,持續提升產品的性能、能效和易用性,推動產品競爭力不斷提升。此外,寒武紀通過對硬件產品及軟件生態的不斷技術創新和設計優化,實現了產品的多次迭代更新,使得公司產品的成熟度達到了新高度。
2022 年寒武紀的基礎系統軟件平臺相比前期版本也進行了優化和迭代。一方面,推理軟件平臺持續完善了推理加速引擎 MagicMind 及其周邊生態,在功能上已全面支持視頻理解、圖像分類、相似度檢測、語義分割、文本檢測、OCR、語音及自然語言處理、搜索、推薦等領域的云邊端推理業務,并完善了公有云、私有云部署的功能組件及管理模塊;在性能上,MagicMind 在多個領域的典型模型上,均取得不弱于同檔位友商產品的表現;在兼容性上,MagicMind 達到了穩定狀態,版本發布保持了對前序版本的 API、ABI 兼容。另一方面,訓練軟件平臺的研發和改進工作亦持續進行,在功能上支撐了寒武紀新的硬件平臺以及 FP19 數據精度,支撐了新的 PyTorch 版本,算子覆蓋度達到 80%,TensorFlow 的算子數量及交付網絡模型均有所增加,支持了包括 GPT 類語言模型在內的多種主流模型的分布式訓練。
值得注意的是,各類人工智能應用廠商如能在云、邊、端三個領域進行協同開發和部署,將大幅節省開發成本并提升研發效率。從硬件及開發工具角度而言,低效的軟硬件生態最終會被逐步淘汰,人工智能軟件生態在云端、邊緣端和終端將走向一體化,同時具備云、邊、端芯片產品和生態開發能力的智能芯片企業會獲得更顯著的協同優勢。
而寒武紀研發的云邊端一體化開發環境,為智能芯片/處理器產品提供統一、完整、有效的應用開發、功能調試和性能調優的軟件工具鏈。在該軟件平臺的支持下,程序員可實現跨云邊端平臺的應用開發,大幅提升人工智能應用在不同硬件平臺的開發效率和部署速度,同時也使云邊端異構硬件資源的統一管理、調度和協同計算成為可能。
(推廣)