浙商證券指出,多家科技巨頭“盯上”各類端側AI應用,已競相布局,AI PC已接近產業落地的轉折點,到2027年60%的PC將具備人工智能功能。AI手機有望成為個人智能助理,為手機行業帶來創新。
當AI逐步滲透到生活的方方面面,AI正持續向端側靠近,從手機都電腦再到汽車等產業都將迎來轉折。
浙商證券在研報中指出,生成式AI發展之初,由于計算規模巨大,運算處理基本都匯集在云端進行,如今為了提升用戶的體驗,AI能力需要落地到數十億終端設備,成本必將大幅提升,因此,AI處理重心正不斷向邊緣轉移,混合AI成大勢所趨,多家科技巨頭“盯上”各類端側AI應用,已競相布局。
浙商證券稱,AI不止于云,端側是模型應用不容忽視的重要場景,從概念來看,云側AI是指,在數據云端匯集訓練,模型通用性強。從終端采集和感知到的聲音、視頻等數據都通過網絡傳輸到云中心側進行后續處理。
而端側AI則是終端設備上進行的輕型模型運用。更多AI計算和推理工作負載在手機、筆記本電腦、XR 頭顯、汽車和其他邊緣終端上運行。隨著用戶對生成式AI應用需求日益增長,端側AI的隱私和安全、低延時、可靠性、低成本等技術優勢凸顯。
那么,當前端側AI已發展到哪一步了,未來又會有哪些進展?
AI PC:產業落地轉折點漸行漸近
浙商證券指出,由于PC已經有成熟的消費市場,AI PC已接近產業落地的轉折點。支持人工智能的PC市場有望在2025年和2026年大幅擴張。根據Canalys預測,到2027年60%的PC將具備人工智能功能。
浙商證券認為,AI PC為各領域提供創新解決方案:
1)高速AI處理:AI PC能快速處理圖像識別、語音識別、自然語言處理等AI任務,提高生產力和娛樂體驗;
2)增加AI應用:ISV有望提供NPU應用程序,將AI功能整合到現有應用程序中;
3)新用例開發:AI PC推動新的業務用例和服務,包括醫療診斷、自動駕駛等多領域;
4)提升用戶體驗:通過語音、手勢互動、AI個性化支持和高級安全功能改善用戶體驗。
從AI PC進展來看,“英特爾on技術創新大會2023”官宣將在今年12月14日正式發布面向下一代的AI PC的英特爾酷睿Ultra處理器Meteor Lake,以加速“AI PC”時代的到來。
此外,英特爾提出“AI PC加速計劃”,宣布將為軟件合作伙伴提供工程軟件和資源,以在2025年前實現為超過1億臺PC實現人工智能特性:
首次引入了針對人工智能加速的NPU:NPU能與所有計算引擎的內置AI功能結合實現更高能效的AI計算,通過NPU降低CPU和GPU的AI工作負載,帶來高能低耗的表現。
通過GPU、NPU、CPU不同層級的AI算力網絡,Meteor Lake能很好的將AI從云端引入到客戶端PC和企業邊緣PC。
“AI PC加速計劃”,旨在為軟件合作伙伴提供工程軟件和資源。酷睿Ultra處理器“Meteor Lake”將于12月14日正式發售。
10月24日,聯想舉行了主題為“AI for All”的“2023聯想Tech World創新科技大會”,重點展示了聯想在端側大模型方面的能力,以及聯想的首款AI PC產品:
個性化優勢凸顯:相比云端公用大模型,聯想PC級大模型Lenovo AI Now在面對“去斯德哥爾摩的音樂節的行程規劃”問題時表現出更加個性化,能夠將家庭地址、酒店偏好等考慮進去。
AI PC預計2024年9月后上市,未來還將進入車端。楊元慶會后表示,搭載端側大模型的PC要明年9月以后才上市,按照規律前期將占有10%的市場份額,日后會成為主流。此外,聯想表示未來端側大模型還將進入車端。
推出針對企業用戶的混合人工智能計劃,旨在保護數據安全。通用訓練后大模型可通過企業的特定數據進行額外的訓練和微調;在端側再加入企業知識矢量數據庫中的特定知識,最后鏈接舊有ERP系統、CRM系統、MES系統等供應商數據庫,得到混合AI系統。
AI 手機:產業爆發前夜
浙商證券認為,AI手機有望成為個人智能助理,為手機行業帶來創新,對比蘋果2011年推出的手機助手Siri:Siri采用一問一答的形式,而AI手機具有人格化、記憶、感知和管理能力,觸發主動服務,具體來看:
1)智能化和便利的服務體驗:手機作為使用頻率最高,使用時間最長的電子產品,也是鏈接智能汽車、PC、耳機以及其他智能終端的中樞,植入AI大模型后能成為真正的個人智能助理。
例如語音助手能提供更自然的交互與更精準的意圖識別服務,圖像識別和處理功能可以為手機帶來更出色的拍照和圖像處理能力,文本生成能力可用于快速撰寫購物評價、生成發言稿等場景。
2)數據更加安全精確:AI手機需要的數據保存在端側更安全,較云有隱私優勢,手機用戶自己生成的數據對于智能助理的訓練更加精確。
3)從單個AI應用到統一AI生態:融入手機系統中的大模型,可以打破各App之間的壁壘,比如郵件、備忘錄、日歷的互相調用,在某一工
作節點發送特定郵件。
AI手機進展:
1.高通成功將AI布局在Android/ target=_blank class=infotextkey>安卓手機,2023年2月23日,高通技術公司成功在搭載了驍龍芯片的安卓手機上運行了Stable Diffusion,作為一款現象級應用,Stable Diffusion可以基于大模型從文本生成圖片,神奇的背后是復雜的模型和巨大的運算量,其模型參數超過10億個。
2.谷歌發布全新Pixel 8系列手機,搭載谷歌自研Tensor G3處理器和Titan M2安全芯片,在手機上首次應用AI智能大模型。谷歌還發布了新版安卓系統Android 14,以及生成式AI加持的谷歌助手Assistant with Bard。
3.華為/小米/OPPO/VIVO
華為發布HarmonyOS 4 :通過盤古大模型的底層能力加持,華為將為用戶帶來智慧終端交互、高階生產力效率、個性化服務的全新AI體驗變革。
小米澎湃OS:自研端側大模型MiLM,輕量化語言模型(13億參數),手機端側大模型部分場景效果媲美云端,進一步實現“人/車/家全生態”智能化。
OPPO Andes GPT模型:Andes GPT作為OPPO自主訓練的生成式專屬大模型,以端云協同為基礎架構設計思路,推出從10億至千億多種不同參數規模的模型規格。10月11日,聯發科宣布攜手 OPPO 、 ColorOS , 合作共建輕量化大模型端側部署方案,共同推動大模型能力在端側逐步落地。
VIVOOriginOS 4:聯發科與VIVO在AI領域展開深度合作,率先實現了10億和70億參數AI大語言模型、10億參數AI視覺大模型在手機端側的地。
端側AI需要強大芯片硬件支持
考慮到硬件配套、隱私安全、用戶體驗等,“云側+端側”的協同設計思路成為手機行業共識。
模型訓練需要巨大的算力,一定都會在云端進行,與云端大模型不同,手機無法支撐通用大模型百萬億甚至千億級別的參數,在此類消費級終端需要做適配處理,提升用戶體驗:
1.明確云側和端側的特點和功能,各取所長,協同工作。云側→大模型訓練;端側→推理。
2.需要對手機SoC芯片做一定的升級,增加大模型所需的GPU、NPU、APU等單元。
3.精簡參數,降低內存占用,以適配手機硬件。減小參數量、量化技術調整、有爭對的精調模型等,使模型能夠在端側流暢應用。e.g.高通使用AI模型增效工具包(AIMET)將模型從FP32縮小到INT8。
本文觀點主要來自于浙商證券研報:《2024 ·AI“下凡”——端側AI深度跟蹤報告》分析師蔣高振,華爾街見聞略有刪節






