華金證券:端側AI蓄勢待發,有望開啓半導體新週期
21世紀經濟報道記者王媛媛、孫燕 上海報道
從高通在驍龍芯片上推理stable diffusion模型,到華爲推出基於手機算力的“智能搜圖”功能,AI正持續向端側靠近。
“端側是AI模型應用不容忽視的重要場景。”6月20日,華金證券傳媒首席分析師倪爽在華金證券AI產業2024全景論壇表示,越來越多的AI計算和推理工作負載在手機、筆記本電腦、XR頭顯、汽車和其他邊緣終端上運行。
作爲在終端設備上進行的輕型模型運用,端側AI具有隱私和安全、低延時、可靠性、低成本等技術優勢,但也面臨着參數量小、功能相對有限等挑戰。
“端側AI趨勢已定。”華金證券電子聯席首席分析師王海維在論壇上表示,AI手機需要完成算力、帶寬、內存等硬件升級以確保AI模型順暢運行,一方面有望驅動新一輪換機週期,另一方面也有望帶來半導體新週期。
端側AI蓄勢待發
今年以來,AI的一大焦點是落地手機端。從大模型、到操作系統、再到應用生態,各大廠商在AI層的競爭愈演愈烈,在大模型的基礎上選擇的路徑也有所不同。
目前,三星、Vivo、華爲等手機廠商已在端側佈局AI;蘋果亦在WWDC2024宣佈推出端側Apple Intelligence,攜手OpenAI接入GPT-4o,以多模態能力賦能複雜任務處理。
在此背後,輕量化模型的發展使得原本只能在雲端運行的大型AI模型,如今可以在手機、PC等終端設備上高效運行,且保持了與雲端相近的性能和精確度。
事實上,端側AI不僅限於智能手機和PC,還逐漸滲透到AR眼鏡、智能家居等領域。其火熱,來源於終端的強需求。
倪爽指出,端側應用的主要功能包括兩類:一是內容生成,即藉助瀏覽器AIGC插件總結文字、視頻等內容,提升閱讀效率等,並以標籤形式提煉,助力工作提效;二是信息生成,即圍繞工作場景,用戶可藉助AI生成所需的文本、圖片等內容信息,也可生成辦公文檔等,提高效率。
在他看來,手機廠商先後入局端側AI,有望雙輪驅動長效賦能端側“生產力”,加速AI應用落地。“2024年以後,更多AI產品逐步變現、AI能力下放至邊緣側與端側之後的影響將更爲明顯。”
硬件待升級
從端側看,消費者希望端側大模型的響應速度可以達到幾乎“實時” 效果。
一般而言,大模型擁有的參數越多、精度越高,實現的功能越強大。而在大模型裁剪技術以及終端算力制約下,端側部署大模型參數量小,功能相對有限。
因而當前,芯片算力、內存容量、內存帶寬構成了影響端側AI性能的三大挑戰。
王海維認爲,爲確保AI模型順暢運行,AI手機需要進行高算力、高帶寬、內存等硬件升級。而這一過程,有望驅動新一輪換機週期。“AI Intelligence換機週期更類似於4G到5G的換機週期。”
與此同時,端側AI的滲透有望帶來半導體新週期。王海維指出,當前半導體供應鏈整體庫存逐漸恢復至常態,第三季度開始的傳統旺季有望帶來新一輪備貨週期。
華金證券總裁助理、研究所所長、電子首席分析師孫遠峰進一步表示,AI技術和應用創新,最終實現有時間關聯度的“三維”處理能力。着眼硬科技產業鏈,產品層級將拉動底層先進技術的快速產品化;而更深層次的產業鏈升級,則是設計、製造、封測和設備材料等全產業鏈協同升級的過程。