智譜AI COO張帆:AI整個發展歷史,就是AI普惠的過程
智譜AI COO張帆:大模型時代,如何構建產品力(來源:本站科技頻道)
12月22日,第十屆以“智能涌現·發現未來”爲主題的本站未來大會,在杭州開幕。大會包括思想之夜、未來局、未來公開課、主論壇、AGI論壇、汽車科技論壇、靈感無界等,廣邀頂級學者、產業專家和行業精英,作答未來科技、人文藝術、時代個人的精彩變化。
在未來大會AGI論壇,智譜AI公司COO張帆分享了《大模型時代,如何構建產品力》主題演講。張帆表示,2023年GhatGPT的橫空出世,讓人們扭轉了以往AI概念先行的現狀。在深刻感受到大模型強悍能力後,行業對於大模型落地實踐更加期待。
不過,張帆表示,企業要想把握住大模型賦能的機會,首先要正確看清自己,在數據、業務等環節是否做好鏈接的準備,並且責任到人,高度重視。其次,企業要對自己內部數據有甄別,爲大模型提供高質量數據。
談到大模型時代企業該如何構建自己的競爭力,張帆表示,企業應該選擇一個穩定、長期持續更新的基座模型,有足夠豐富的產品能夠滿足自身業務。其次,大模型要和企業彼此適合,並且實現真正的正向循環,併產生新時代的數據資產。
以下爲爲智譜AI COO張帆演講節錄:
很高興今天有機會能夠跟大家一起來分享我們在大模型上落地的經驗和探索。我覺得站在現在這個時間點,大家討論大模型,更多的還是“模型爲王”,總是在看參數和指標,但是我相信到2024年,會變成“價值爲王”,大模型的價值體現在哪裡?大模型該如何落地?這是有志於從事大模型行業的人都必須回答的問題。
我們希望和大家分享一點如何將模型落地和應用的思考,從我們如何幫助大家把模型的能力落地到我們的業務當中提供一些我們自己的建議。
我們先來看爲什麼今天大模型有價值,或者說爲什麼要落地它?ChatGPT發佈兩個月內全球用戶破億,這是人類現象級的增長,是人類所有歷史上前所未有的速度,而且增速非常快,這次風潮跟以往不一樣,以往看到新技術出現一定是概念先行,無論是Web3還是元宇宙,我們都是先有一個非常好的願景,我們設想它在未來會逐步落地。
大模型這一次和以往完全不同,我相信絕大多數人瞭解到這個技術的時候並不先是概念,而是先看到了ChatGPT這款產品給我們帶來了震撼,發現了它的價值,才發現背後有一個東西叫大模型,所以它天然就具備落地的屬性。
這反映出了一個根本屬性上的不同。我們可以看到,AI的整個發展歷史就是AI普惠的過程。AI已經有近百年的歷史了,從上個世紀四十年代就有AI,太遠不講,從移動時代來講,一方面,我們發現在那個時候生產AI和消費AI的成本非常高,但另一方面,其實我們在那個時候已經在應用AI了,無論是搜索引擎、計算攝影還是推薦算法,我們都已經用到了AI的能力。
但在當時所有的任務幾乎都是要定製化的。如果要做任何任務,我需要找到並定義好對應的任務,收集到對應的數據,選擇算法去訓練模型再應用。這就導致了AI的成本高企,當時我們看到基本上只有互聯網大廠有能力使用AI。
這一波人工智能浪潮的1.0版本,也就是2013年、2014年的時候,我們注意到神經網絡的算法開始逐漸走向成熟,一個明顯的特點是不需要那麼多的算法了,另外神經網絡在訓練模型時的門檻也變低了,我們只需要供給數據就可以得到這個模型,這個場景下帶來了第一次AI的普惠,我們看到市場上出現了大量基於AI服務的公司,並且把AI從互聯網大廠帶入到產業和行業中了, AI的行業落地應用開始出現。
這一次的大模型,我覺得相對於以往有一個更大的進步,那就是我們可以用一個模型解決所有問題,統一數據、統一算法、統一模型、統一任務。我不需要找幾百萬個例子訓練模型來進行特定任務了,我用prompt直接提要求,很多任務模型就直接可以搞定了。它帶來的結果是,大模型的能力實現了質的飛躍。這種能力提升的另一個好處是把AI的成本下降了兩個數量級,現在只用1%的成本就可以使用AI了,所以AI也成爲了最重要的生產要素之一,我們所有必需的生產要素都融合我們的生產環節裡,從而給我們帶來新的產品體驗和新的生產模式。今天大模型在生產效率、質量上都能給我們帶來幫助。
另外值得一提的是,我們也可以看到AI的進步速度之快,超出了許多人的預期。短短一年間,以ChatGPT代表的大模型給我們帶來的進步非常巨大。每一次迭代都會把原來被認爲只有人能完成的事情又解決了一部分,整個AI海平面在不斷上升,一個一個淹沒原本是人類佔領的高地,不得不讓我們和企業變成兩棲動物,既能適應山上的生活方式,也開始適應水中的生活方式。
那麼我們該如何理解大模型帶來本質變化?
首先是交互能力。大模型帶來底層交互能力的變化,從而推動產品體驗和商業模式變化。命令行的時代的輸入工具是鍵盤,桌面時代是鼠標,移動時代是多點觸控,在AI時代則是自然語言和多模態。我們可以看到,我們輸入工具承載的信息量越來越大,學習成本越來越低,效率越來越高,也越來越符合本能。
這種趨勢對我們開發AI工具與產品、實現大模型商業化落地應用的過程有很大的啓發,促使我們深入思考如何去更好應用誕生於這個時代的新技術、新產品。
比如說DOS時代鍵盤的學習成本很高,你只能用最簡單的功能;而到了桌面時代出現了人利用信息的新方式,比如BBS、電腦遊戲等一系列場景;而到了移動場景它又開始改變了,由於LBS能力、手機交互新的觸控能力,許多新的應用誕生了。基於這個邏輯,我們相信一定會有屬於AI時代的“抖音時刻”或者“ iPhone時刻”出現,我們能夠看到AI Native原生產品。
在大模型落地領域,智譜AI是最早在國內做商業化的大模型公司之一。我們從三月份到現在已經累計接觸超過兩千家企業,共創超過兩百家企業,這裡面覆蓋的方向非常分散,我們發現在非常多的場景裡,企業已經能夠落地價值併產生應用,所以大模型有沒有用這件事在今天已經不需要再被討論了,關鍵在於你如何快速找到你的業務和大模型的最大公約數,並且及時建立正向循環運轉起來。
這對每一家想要擁抱大模型的企業都提出了要求,一方面你需要縱向來梳理自己企業核心的業務節點,另一方面你可以橫向把大模型常見的能力羅列出來,這樣,橫縱座標系會組成一系列的結合交叉點,作爲企業你要評估這其中的場景適不適合模型能力發揮,適合哪一種模型能力,以及在我們業務當中是否足夠重要。
今天我們可以看到AI從Empower(賦能)我們的產品變成AI Native原生產品的一個過渡。從最開始完全沒有AI的時代,我們全部是業務功能組成的產品;到了後面開始有AI Empower了,在裡面有一些單獨模塊由AI來應用,以至於到今天可能會出現一個獨立的copilot功能,全程貫穿我們的產品;未來我們相信一定會出現完全基於AI原生的產品和商業模式,變成所謂AI Native。
基於這個背景,企業怎麼規劃自己的路徑,我們也簡單做了一點思考。
首先從上層來看,企業內部的已有的業務鏈條應該實現流程的信息化,確保內部大量流程都已經有數據,這是第一步。第二部,需要慢慢把這些業務的數據變成業務的數字化,讓它開始有語義。能集中、及時地有效統一語義的數據是大模型利用的基礎。
到了下一步,也就是決策的智能化。基於人工智能,企業內部流程的效率將得到提升,這其中包括了業務本身,包括了流程的自動化,還有一些增強分析、預測、輔助決策的能力。
我們簡單把這個過程劃分了幾個階段,從最開始只是簡單用一用AI,到L1開始,我們開始做一些內部提效的工具,用各種各樣的產品來使用AI,實現內部提效。再進一個階段(L2),我們在業務中有一些具體模塊可以被AI賦能了,用到的都是一些單點,比如智能客服、用戶打標籤、頭像、畫像等,這些不會串聯主要業務,但在單點上已經幫業務帶來跟以往不一樣的能力。
再進一步到L3,其實我們可以用AI來重構核心業務,也就是我們的核心產品是基於AI重新設計的。比如說在醫療場景裡做智能診斷、輔助診斷,或者在廣告公司生成文案,以及汽車的智能駕艙,都相當於使用了AI能力重新設計了產品體驗。最後一步是L4,我們希望企業能夠以AI爲核心,讓AI成爲重要戰略驅動力,以此來重構整個商業模式。
我們簡單拋磚引玉,和大家介紹一下在過去看到的一些場景裡,大模型怎麼用。
比如廣告文案的生成。2021、2022年時,美國的Jasper、Copy AI都已經跑通了這個商業路徑,帶來幾千萬美金的營收。國內也有很多廣告公司使用AI幫助提升廣告生成的效率。
在辦公領域,像WPS、NotionAI等大模型也已經開始應用。無論是會議紀要的生成,還是招聘領域裡對於JD的生成,都有落地案例。
在數據分析方面,無論你做的是企服還是研究報告分析,都可以由大模型快速生成一些基礎版本來輔助決策。
還有電商領域也值得一提,在中國我們的電商渠道比較分散,每個分散的渠道都有自己對應的語言、風格和習慣。如果靠人一個個去寫,成本就非常高,大模型則可以極大提高文本落地的速度。
另外,信息抽取也是關鍵的應用。企業裡經常有大量非結構化數據,這是一個未被開採的富礦。我們原來受限於技術能力,做信息抽取的成本很高。而今天大模型可以用比原來低兩個數量級的成本,把非結構化數據轉化爲結構化數據。
比如在銷售場景中,銷售與客戶的溝通可以藉助大模型從裡面快速抽取出用戶的畫像、用戶的需求,結構化地輸入到CRM。這個流程原來可能需要一個專門的技術團隊花很長時間去做算法調優、標註等,而今天只需要一個Prompt工程師花上一天時間就可以搞定,效率非常高。
甚至你可以利用大模型進一步實現銷售質檢,和客戶溝通的過程中是不是該說的話都說了?這個大模型也能夠做輔助,包括一些數據的清洗標註,從評論裡收集關鍵結構的信息等,這些智譜在商業化落地過程中都進行了探索。
另一個值得一提的領域是信息檢索,我們今天所面臨的信息其實是非常複雜的,數據來源非常複雜、異構,模態也是多樣的,甚至還有很多噪音。這導致檢索的成本比原來大了很多。而今天你完全可以藉助大模型來幫你做這件事,幫你把檢索回來的文檔都讀一遍,再直接針對你的問題做回答。甚至你可以用自然語言的方式追問,比如提供一份70頁合同,你問哪些條款會導致合同失效,大模型可以馬上給出答案。這種能力甚至包括了視頻,我們原來檢索視頻只能檢索出來標題和封面,而大模型可以把所有文字字幕閱讀出來,整理成內容給你反饋。
許多大型的項目,其信息是非常分散,難以整體觀察的,大模型因此可以變成你的顧問,幫你快速解答。這是對智能對話的全新升級,手機端的語音助手,包括各種遊戲、虛擬社交、情感、汽車智能駕艙,都可以被大模型賦能。
還有一些針對代碼的應用,一方面我們有代碼類模型可以直接輔助程序員提高寫代碼效率,直接建網站。另外還有NL2SQL,直接轉成SQL語句,幫你查詢自己的數據,相當於給每一個銷售、每一個運營都配置一個獨立的分析師,來提高效率。大模型可以極大提升生產效率和降低維護的成本。
實際上還有非常多不同的場景,其實是在被大模型賦能,我們也隨着和客戶的合作,不斷拓展大模型的邊界,我們覺得能解決的問題還有非常多。
最後,我簡單和大家介紹一下我們所理解的大模型落地的實踐路線,不敢說“最佳”,所以加了一個引號,在今天依然還是很早期,只是我們在這裡一些實踐的想法,供大家參考。
這裡包括了兩個維度:首先要考慮企業是不是大模型ready了,你要先了解自己的企業,再瞭解大模型。瞭解企業這一端,首先我們對大模型要有一個合理的期待,我們發現很多企業會把大模型當成一個許願池,希望它能解決一切問題,任何問題丟給它,它都能解決,現實當中是做不到的,它只是一種技術的能力。所有企業在接入大模型之前先要自己內部做審視,我們的數字化程度是否充足,所有業務數據是否都在裡面,有沒有這樣的數據支撐我們去做AI化;是否明確找到一個能夠落地的場景,這個場景是大模型所擅長的,且是業務的痛點;我們是否有一個明確可衡量的指標,確保它能測試;我們能否有一個全職負責人追蹤這件事,把它落下來。以及最後我們需要在裡面有一個合理的期待,既不要短期的高估大模型的能力,也不要長期低估它的潛力。以大模型今天迭代的速度,我們建立一個自己的路線,一步一步,每一次形成一個精密的閉環,讓我們不斷看到它的價值,再逐步地前行,到最後讓我們能夠完全建立一個基於大模型企業的競爭力。
第二個維度是從模型側出發。大模型獲取知識的方式只有三種,預訓練,相當於通用能力;微調,相當於領域能力;Prompt,相當於任務能力。這就要求企業主知道企業內部數據和競爭力該如何分解,哪一部分以哪種方式進入大模型,而不是把所有的東西混合到一起。這不是一個所謂簡單的“大力出奇跡”的過程,並不是數據越多,模型效果越好,正確地拆解,合理的分佈非常很重要,這要求企業既深入理解自己的組織,又理解大模型。
當你在上述兩個維度做好了充分準備猴,下面你要做的就是選擇一個好的基座模型了。在國內市場,一個好的基座模型意味着它能夠穩定、長期持續的更新,有足夠豐富的產品能夠滿足你的業務,並且還有很好的合規和支持服務能力。
最後,圍繞着大模型,我們需要構建一個基於AI的組織架構,這個方面我們並不是專家,但總的來說這個組織內應該包括prompt工程師、數據工程師、微調工程師, 以及專門的負責大模型業務的BP,像佈道者一樣把大模型能力深入到業務的各個環節中去。
企業最終的目標,應該是讓所有這些環節形成一個正循環,這個循環是一方面能夠源源不斷產生新的大模型時代的數據資產,構成我們的壁壘和競爭力,另一方面這些資產又能夠灌回模型當中,變成我們自己的業務價值,把它耦合到業務場景當中去。如何實現這個正循環,是今天每一個擁抱大模型的企業都應該去深入思考的問題。