蘋果智能海外上線 國產廠商押注AI 欲與之一戰
《科創板日報》10月29日訊(記者 黃心怡)今日,蘋果智能(Apple Intelligence)終於在海外上線。蘋果計劃在12月份推出新一批AI功能,包括將ChatGPT服務集成到Siri中,以及推出更強大的圖像生成工具。不過,Apple Intelligence何時能夠在中國市場使用還尚未確定。
近日來,國內安卓陣營廠商也接連發布了端側AI和操作系統方面的一系列升級,各種AI智能體、AI OS的概念鋪天蓋地襲來。
可以說,蘋果智能尚未落地中國市場的窗口期,正促使國產手機廠商進一步以AI賣點來加碼旗艦機型的競爭。各家手機廠商都明確要做系統級AI,要做AI OS、做好AI智能體。
IDC中國研究經理郭天翔對《科創板日報》表示,安卓陣營和蘋果在AI方面的思路類似,都是注重端側模型、智能體的概念。“在AI方面國內並沒有落後多少。”
▌智能體能否幹掉APP?
作爲 iPhone 的語音助手, Siri 可以通過語音指令進行簡單操作。但由於過去的回答主要基於搜索引擎,智能程度非常有限,並沒有能取代手機的APP交互模式。隨着大模型的發展,以Siri爲代表的手機助手有望變得更有智商,從語音助手升級爲AI智能體。比如想要預定酒店行程,不需要再打開APP,而是直接與AI智能體對話來完成。
談及智能體是否會取代APP,榮耀CEO趙明認爲,大概率是往這個方向發展,但是相當長的時間內,APP和智能體肯定是一個長期共存的方式。“這涉及到一個使用習慣的問題,還有各種意想不到的體驗障礙的問題,所以一定是相當長的時間內並存,或者長期可能並存。”
作爲智能體交互模式的第一步,AI識屏已開始在國內安卓手機上落地。最新發布的OPPO Find X8上線了一鍵問屏功能,能智能解析屏幕信息,並根據內容與用戶互動,提供相應的解答和操作。
“舉個例子,平時拍攝的景點照片,直接一鍵讓AI識別並回答這是哪、背後有什麼故事。看上去很簡單,但背後涉及到全國3A級以上16000個景點,差不多百萬級的數據來做專項訓練。“OPPO AI中心產品總監張峻表示。
榮耀則發佈搭載智能體的AI操作系統MagicOS 9.0。趙明介紹,現在智能體可以模擬人來點擊屏幕、閱讀理解屏幕,進行慢思考、找到關鍵的信息,然後進行相應的操作。目前可分爲“自動駕駛”的智能體以及與應用交互的智能體兩大類。
“自動駕駛的智能體,無需第三方的介入,首先對用戶意圖進行分析理解。比如說幫我點杯喝的,智能體能理解意圖背後的這些信息和邏輯,對意圖場景進行分解之後,變成可執行的指令,最終實現了點咖啡的操作。另一種則需要應用方進行協同。比如,榮耀跟中國移動的靈犀大模型。在查詢手機話費的餘額、充50塊錢話費的過程當中,調用了靈犀的型進行接管。上述兩種智能體未來一定是並存的,會有需要生態介入的部分,也有一些操作可以自動進行。”
對於未來AI交互在手機上的發展,多名業內人士認爲,符合直覺、最直接的方式,會最終佔據主流。
郭天翔表示,識屏交互屬於AI手機一種新的交互方式,更便於用戶的使用,降低學習成本。從目前看,未來AI交互還是會以最直接最簡單的方式爲主,從人的本能出發。
OPPO首席產品官劉作虎也認爲,符合直覺是最基本的AI理念。
“我每週都會開AI專項會,一直灌輸一個概念:不管是什麼,首先是符合直覺。我們看到很多可能炫技的東西,看似很簡單,其實背後的技術要求很高。就像一鍵問屏,怎麼識別用戶的意圖、識別屏幕,裡面涉及很多的分流技術。但技術最終都要回到用戶做產品。比如使用導航時,打開就有地址,直接一按就到目的地,AI時代就是直覺更加高效,這是最基本的AI理念。”
▌端側模型:難點在體驗和性能的平衡
大模型要裝入手機,在前景無限的同時,挑戰並存。手機上有限的算力決定了端側模型不能過大,但小參數的模型在能力上又受到侷限。
郭天翔表示,現在端側模型已經不再過於強調模型參數的大小,而是追求使用體驗、佔用內存以及功耗之間的平衡。
劉作虎坦言,端側模型對性能要求很高,不管是性能還是內存的要求都非常高。所以如何持續優化架構、高能效發揮芯片潛能,仍是很漫長的路。
“目前還有很多事情可以做。比如對平臺的散熱,可能大家會覺得很簡單,其實很難。還有怎麼做好底層內存的調用等等。說實話,AI在手機行業還是剛剛開始,接下來大家會看到非常多的AI變化。”
張峻透露, OPPO即將推出新的端側架構AI LoRA,來降低內存等資源的佔用。
“端側AI最大的瓶頸是手機計算資源的使用。比如同時在手機上實現三個功能的端側化,正常而言要佔用三個相應的資源。假使把模型比做火車頭,上了三個模型就意味着需要三個火車頭再加車廂。而LoRA架構採用了基模型+應用模型的模式。只需要一個基模型,即只有一個火車頭。後面的應用模型,相當於三個車廂,像左輪手槍一樣,可以輪換。當需要什麼模型,就上什麼車廂,這樣的內存峰值佔用,可以節約75%。”
▌AI手機後時代:智能體將取代更多人工操作
對於大模型的發展,業內普遍保持短期審慎、長期樂觀的態度。在端側的落地亦如是。
劉作虎分析,AI時代的變化非常快。“過去對手機操作系統,我們是按半年、一年來做規劃。而AI時代,一定不是這樣。誰能知道一年後,AI是什麼樣子。AI產品甚至不是每三個月規劃,應該每個月去規劃。模型變化太快,技術超出想象速度。坦白講,我自己都有很大的緊迫性。”
劉作虎強調,在AI時代做產品就是要快跑。“你一定要去跑,跑得要快,不然要落後,要緊跟技術的變化。
近日,中國信息通信研究院發佈了全球首份《終端智能化分級研究報告》,將終端智能化水平分爲五個等級L1-L5,智能化等級越高,終端自主參與度越高,人的參與度越低。L1級和L2級具備一定智能化,可以完成單類型任務。L3級和L4級逐步從感知識別複雜意圖到識別潛在意圖。L5級具備全面智能化,能夠自主規劃完成全類型任務。
趙明表示,當前終端智能化水平處於L3的水平,要通往下一個L4、L5的階段,所需的時間會更長一點,需要更多的積累。
“今天我們可以實現用戶理解類別達到950項。未來,一定能夠涵蓋手機諸多的運行,把現有在傳統手機上需要更多人干預的地方,逐步都消除掉。現在,一句話撥打手機電話沒問題,微信視頻也可以了,點咖啡也能做到。再往下一步,要實現更多、更模糊的指令,以及更復雜的關係之間的理解。”