半導體產業中,存儲器的重要性不言而喻,特別是DRAM(動態隨機存取存儲器)和NAND(閃存)兩大類別,它們不僅支撐起行業的半壁江山,還不斷催生新的增長點。近年來,隨著生成式人工智能(AI)的崛起,特別是ChatGPT等技術的廣泛應用,存儲器市場迎來了新的發展機遇,新型存儲技術如HBM、QLC SSD等備受矚目。
AI時代,計算能力固然重要,但存儲的作用同樣不可忽視。隨著生成式AI的火爆,非結構化數據如圖像、視頻、音頻等呈現爆炸式增長,這對存儲提出了前所未有的挑戰。據IDC預測,到2028年,全球數據產量將達到394ZB,其中AIGC領域的數據增長尤為顯著,AI圖像和視頻生成數據量將激增167倍。
面對這一挑戰,存儲逐漸成為AI發展的瓶頸。存內計算作為一種創新的解決方案,近年來備受關注,但商業化進程卻步履維艱。近日,三星電子與SK海力士宣布合作,共同推進LPDDR6-PIM內存產品的標準化。這一合作旨在加速專門用于AI的低功耗存儲器標準化進程,有望為存內計算的商業化注入新的動力。
在AI領域,算法、數據和算力是三大核心要素,而算力(芯片)則是決定AI能否最終落地的關鍵。隨著ChatGPT、GPT-4等大模型研究的深入,模型結構日益復雜,數據量與計算量大幅增長。然而,摩爾定律的逐漸失效使得芯片制造工藝演進放緩,算法發展與硬件發展之間的矛盾日益突出。如何高效利用復雜算法處理海量數據,成為當前AI領域的重要挑戰。
傳統的馮·諾依曼架構中,計算與內存分離,導致功耗墻、性能墻、內存墻等問題凸顯。為了突破這些瓶頸,國內外學術界和產業界從架構、工藝、集成等多個維度展開研究,探索后摩爾時代的新一代芯片技術。其中,存算一體芯片通過器件、架構、電路、工藝的協同創新,實現存儲與計算的融合一體化,被視為突破馮·諾依曼架構瓶頸的重要途徑。
存算一體芯片具有三種主流技術路徑:近存計算(PNM)、存內處理(PIM)、存內計算(CIM)。近存計算通過減少數據移動和提高緩存效率,適用于需要大規模并行處理和優化內存帶寬的應用;存內處理則注重數據密集型應用和能效優化,適合快速數據處理和降低能耗;存內計算則專注于特定領域的高并行性計算和定制硬件優化,適用于高度專業化和定制化解決方案。
在存算一體的概念上,業界已經進行了多年的探索。從斯坦福研究所首次提出“logic-in-memory”方案,到后續研究人員在芯片電路結構、計算架構與系統應用等方面的研究,存算一體的理念逐漸深入人心。然而,受限于電路設計復雜度與工藝難度,早期的研究大多停留在近存計算的層面,存算分離的問題依然存在。近年來,隨著大數據驅動應用的發展,數據量激增,研究者們開始考慮賦予內存一定的計算能力,從而實現存儲和計算融合一體化的“存內計算”架構。
在巨頭們的布局中,存內計算技術逐漸走向成熟。三星、海力士、TSMC等國際巨頭以及阿里巴巴達摩院等國內企業紛紛投入研發,推出了基于不同技術路徑的存內計算芯片。例如,三星展示了基于HBM2-PIM技術的存內計算芯片,提供了高達1.2 TFLOPS的嵌入式計算能力;阿里巴巴達摩院則成功研發了全球首款基于DRAM的3D鍵合堆疊存算一體AI芯片,在特定AI場景中性能提升10倍以上,能效比提升高達300倍。
然而,盡管各家企業都在積極布局存內計算技術,但商業化進程卻受到標準化問題的制約。由于各家企業根據各自的標準開發產品,導致概念和規范存在差異,行業難以采用通用標準。為了推動存內計算的商業化進程,三星電子和SK海力士正在合作推動LPDDR6-PIM內存的標準化。他們與聯合電子設備工程委員會(JEDEC)進行標準化工作,討論確定每項標準的具體規格。
標準化的推進將帶來多重好處。首先,它可以提升兼容性和互操作性,使得不同廠商生產的PIM設備可以在同一系統中無縫協作,減少因兼容性問題導致的系統故障或性能下降。其次,標準化有助于降低成本,減少研發成本和時間,促進規模經濟,降低生產成本,從而使得PIM技術更加普及和實惠。標準化還將加速技術的廣泛應用和普及,推動存內計算技術的快速發展。
除了三星和SK海力士的合作外,其他企業也在積極探索存內計算技術。例如,TSMC展示了在SRAM、ReRAM、PCM、STT-MRAM等多種器件上實現存內計算的探索成果;美國處理器公司Mythic推出了采用模擬存內計算方案的M1076處理器;國內知存科技則推出了首款量產存內計算SOC芯片WTM2101,已商用至智能可穿戴設備中。這些產品的推出標志著存內計算產業化初見成果,越來越多的存內計算產品開始落地。
隨著標準化進程的加速和技術的不斷成熟,存內計算芯片有望在未來大放異彩。這一技術的突破將不僅推動半導體產業的發展,還將為AI時代的計算需求提供強有力的支持。






