提升生成式AI的價值,研發與應用相統一迫在眉睫
通信世界網消息(CWW)近年來,生成式AI發展如火如荼,從最初的“百模大戰”到近來的“百機大戰”,這兩種規模性的投入和發展,雖都有研發和應用之意,且研發是爲了商用,但是前者更側重於高水平的研發,後者則傾向於應用研發並儘快投入應用,其中不可避免地存在一些認知和操作上的矛盾。解決這些矛盾的過程,就是促進研發與應用統一的過程,這必將帶動人工智能水平的提升和智能產業的發展。
生成式AI在研發與應用上的矛盾
AI無疑擁有巨大的增長潛力和廣闊的應用前景。然而,對於AI大模型、行業模型、智能體的研發屬於科學、技術還是工程,業內存在不同的說法,同時在研發和應用方面存在若干矛盾和挑戰。
大模型研發擴張與應用放緩的矛盾
大模型的出現顛覆了人們的認知,不少公司將大模型研發當作投資重點,意圖搶佔行業制高點,但這些公司並不清楚大模型的規律,在研發過程中才逐漸感受到大模型對龐大算力、海量數據和算法的嚴苛要求。從宏觀層面看,“百模大戰”極有可能導致重複建設和資源浪費的問題。儘管通用大模型在營銷、辦公、客服、人力資源、基礎作業等領域已開始應用,但是各行業對AI成果的應用速度有所放緩,並且通用大模型已有成果更適合toC領域,面向產業轉化的情況較少。而投資界、科技界、社會大衆以及媒體都將目光聚焦在模型的功效上,以至有人呼籲不要只在模型研發上“內卷”,還要在應用研發上發力,沒有應用,大模型將一文不值。事實上,不能讓人們的注意力長期停留在對大模型的爭論中,要讓科技工作者關注AI的深入研發,讓更多企業投入到AI已有成果的應用中,以此推動人工智能的探索和發展。
通用大模型與行業大模型的對立
當前,AI逐漸從全面探索階段邁向規模試點和特定領域的智能生成階段,需要根據不同領域的需求定製AI解決方案。通用大模型和行業大模型都是生成式AI領域嶄新的探索方向,前者側重於廣泛領域和理論研發,後者大多是針對特定領域的應用研發。研發通用大模型所需的數據量大、算力損耗多,很難在短期內實現應用落地,因此不少公司轉向行業大模型研發,這是在探索和實踐過程中一種現實的選擇。
然而,圍繞大模型的深入研發和已有成果的儘快應用,在不同觀點的爭論中逐漸形成兩種較爲明顯的態度:一種是追求技術,主張走通用大模型之路,以擁有“更大更強的AI能力”;另一種則是希望將AI成果儘快應用於市場,走產業發展之路,也就是將“足夠的AI能力”快速變現於商業場景,利用市場龐大且獨特的數據構建競爭“壁壘”。這兩種觀點皆有其合理性,但都容易走向極端,行業應該倡導二者“相互理解、相互吸收”,將力量集中於符合我國實際情況的研發和應用方向上,以此推進“AI+”行動的落地。
開源模式與閉源模式的張力
大模型的開源和閉源是研發企業所選擇的不同模式。開源即開放軟件源代碼,允許任何人獲取並修改軟件的源代碼,藉助更大範圍的開發者、研究者和愛好者的協作,拓寬技術創新邊界,爲人工智能的發展注入活力。閉源則是軟件源代碼僅掌握在軟件編寫者或系統開發商手中,通過對核心技術和商業模式的保護,使企業能從技術成果中獲得經濟回報,在涉及敏感信息和高安全要求的領域,閉源形式尤爲重要。
大模型的這兩種模式反映了技術進步與社會價值、經濟效益、安全保障之間平衡關係的探索,而開源和閉源之爭,實際上是對這種平衡的不同選擇和追求。選擇開源的企業希望通過全球合作推動技術創新和應用發展;選擇閉源的企業則以保護自身技術和商業利益爲重點。例如,OpenAIo1模型在交互過程中默認隱藏了思維鏈,或許是不想讓其他開發者和用戶知曉模型思考的全過程。開源和閉源的矛盾,體現在商業模式和技術選擇方面,也反映出不同企業對未來發展的戰略考量。
黑石集團董事長蘇世民認爲,企業在大模型研發方面更具優勢,無論是從數據積累情況、算力投入規模,還是從研發本身所具備的技術和工程特性來看,相較於大學,企業在大模型研發上更易於取得突破。同時,通用大模型的研發爲行業模型、智能體以及各行各業的應用提供支持,並且在應用過程中,各行業豐富的場景、海量的數據、優勢的資源投入,又反過來進一步強化了通用大模型的研發,使科技研發和應用相輔相成,最終達成有機統一。
如何將AI研發與應用統一起來
AI的研發和應用是邏輯發展上的統一體,出現上述矛盾有其特殊背景和原因,需在深入發展進程中加以化解。
發展鏈路將研發與應用統一起來
自大模型誕生以來,生成式AI逐漸形成了一條獨特的發展脈絡,即“大模型—行業模型—智能體—機器人”的發展鏈路。在這個鏈路中,每個環節都有其相對獨立性,它們按照技術邏輯有序地發展。
一要重點發展幾家通用大模型,提高我國AI技術競爭力。
目前,行業對通用大模型尚無統一的定義,多數人理解的大模型包括大語言模型和多模態大模型。通用大模型在技術和理論層面展現出了強大能力,可爲各個領域賦能並帶去機遇,是重塑人類社會的重要因素。不過,通用大模型不僅所需的參數規模和算力規模都非常大,且在遇到數據瓶頸、算力瓶頸的情況下,不知還需要多長時間、多大投入,才能夠實現新的突破。按照Kimi創始人楊植麟的理解,OpenAIo1模型在天然數據不足的情況下,藉助較好的基礎模型展開強化學習,由此創造出很多非天然的數據,提升了模型的數據質量和計算效率,進而催生出更爲深入的思考和推理,實際上該模型創造了一種新的範式。
由此可見,深入研發通用大模型,意味着要持續迎接挑戰,向通用人工智能的目標邁進。因此,從事大模型研發的企業不必過多,而由於美國對我國實施AI技術限制,我國必須要自主研發出一些具備世界競爭力的通用大模型。人工智能專家吳軍認爲,“現在全世界成規模的大模型企業沒有幾家,美國大概有5~10家,歐洲基本上就法國有一家,每個國家都構建一個大模型是不現實的,這很耗費資金,我國應重點扶植不超過10家。”目前,我國的Baichuan3、智譜GLM-4、騰訊混元、通義千問2.1、文心一言4.0、華爲盤古、Kimi、豆包等大模型走在行業發展前列。除上述大模型做得好的公司外,我國互聯網大廠、相關大型企業擁有海量數據,且有實力解決算力問題,這也符合大模型研發的條件。
大模型具備通識和泛化能力,但由於在應用過程中存在數據隱私、算法偏見,以及數學和邏輯推理能力不足等問題,因此通用大模型難以滿足具體行業的特定需求、專業性能和經濟效率。而由於缺少細分度更高的產品,在公有云提供服務時會引發企業對私有數據、敏感數據安全性的擔憂,大模型的使用也需要通過傳統的磨合流程來實現產品與市場的契合。目前將通用大模型融入核心業務流程的案例較爲少見,相比之下,行業大模型更有利於發展專業能力和實現精準賦能。但也有專家指出,現在的產品在很大程度上是由模型能力決定的,要把產品和模型更緊密地結合起來進行思考。例如,在產品上實現某個功能,其背後需要對應模型能力的支撐。此外,有互聯網大廠的企業家強調,大模型賦能智能體的實踐意義更大,應用前景廣闊。
二要大力發展行業模型和業務模型,發揮我國產業齊全和技術應用的優勢。
行業模型是指“利用通用大模型技術,針對特定數據和任務進行訓練或優化,從而形成具備專用知識與能力的模型及應用。”國際上更多地使用垂直模型這一表述,在我國還有垂類模型、領域模型、專屬模型等稱謂。行業模型本質上是一種解決方案,從用戶更關注產品而非技術的這一實際情況出發,儘快將技術轉化成產品,纔有利於解決問題。行業大模型提供的不僅是產品和工具,還有定製服務與支持,這需要用戶參與共建。一方面,企業爲了提升自身競爭力、實現智能化轉型、滿足市場需求,期望將數據轉化爲核心驅動力,因此主動尋找最佳模型;另一方面,AI技術公司也在選擇對“以人工智能提升發展質量”有需求的特定行業、企業、產業開展合作。研發方和需求方結合,共同深耕“人工智能+行業/產業/企業”,利用行業專業數據或私有數據、特色應用場景等獨特資源,對模型進行定製調整和優化,能夠使其較快地投入應用,有針對性地解決問題,進而創造價值。行業模型和智能體是相互關聯且互補的,二者共同推動AI技術的產業化發展。
三要把智能體和機器人作爲智能發展的重點,培植和壯大智能產業。
智能體是具備智能的實體,它以云爲基礎,以AI爲核心,構建起一個立體感知、全域協同、精準判斷、持續進化且開放的智能系統。智能體包括智能行爲的物理實體和虛擬存在,例如物理形態的機器人和虛擬形態的數字人。智能體的能力遠超近年國內使用的Siri、小愛同學、天貓精靈等智能助手,可以幫助用戶處理更加複雜的任務。在大模型技術的加持下,智能體將具有自主性、感知性和行動能力,可在複雜環境中自主決策、學習進化,更接近人類智能的本質。隨着新型芯片技術的發展,無人汽車、無人機、機器人等顛覆性的智能體將不斷涌現,從而實現更高層次的智能化。這種應用驅動的AI研發,其目的在於使智能體成爲人類廣泛使用的商品,用戶也可根據使用環境和用途,按需定製形狀、大小及功能各異的智能體。
機器人是智能體中重要的一類,與傳統機器人相比,具身智能機器人有泛化性優勢。傳統工業機器人可解決固定搬運、固定點位焊接、噴塗等方式相對固定的問題,但在工序複雜的總裝過程中,工業機器人的表現卻不如人工安裝,而大模型賦能的智能機器人則可以解決此類問題。工業智能機器人的落地應用速度將快於家用機器人,預計在未來3~7年實現批量生產,家用機器人因任務複雜程度高,且對於任務完成的滿意程度標準各異,需要5~10年才能實現量產。
上述智能方式均需開展技術研發,也都有很高的應用價值,它們共同構成了人工智能的發展格局。研發爲應用打基礎,應用是研發的目的,在宏觀上體現了研發與應用的統一。
揚長避短將AI研發和應用統一起來
AI發展包含研發、應用等環節,不過並非每個企業都要按順序將各環節做一遍。在全球化、數智化、市場化的大背景下,只有揚長避短,才能在AI發展進程中實現相互成就與發展。目前,在人工智能的各個環節中,美國在研發方面處於領先地位,並帶動技術應用。美國去工業化後,其產業結構以金融和服務業爲主,而通用大模型的應用能夠直接覆蓋金融、財務、審計、研發、法律、醫療等領域。我國產業齊全、製造業發達,更適合AI快速應用於產業、行業和社會等各個層面,加之我國擁有互聯網應用、數字技術應用的豐富經驗,在通用大模型研發的帶動下,大模型已在金融、服務、文教、醫療、創作等領域廣泛落地。
當前,除了幾家推出通用大模型的企業應加大研發力度之外,還要發揮我國在技術應用方面的優勢,重點加強行業大模型、業務模型、智能體、機器人等不同方向的應用研究,使少數骨幹公司的大模型研發成爲賦能各項AI應用的“蓄水池”,使AI的各種應用直接服務於具體產業,讓它們既能承接通用大模型的技術賦能,又能結合行業、企業和社會應用的場景和需求,向智能產業、智能應用方向發展。同時,將豐富的應用場景等資源和問題反哺給大模型研發,形成通用大模型研發與AI應用“相輔相成、相互促進”的良性循環。
運用靈活方式將研發與應用統一起來
我國“百模大戰”中的企業大多是研發通用大模型的,在全球範圍內,我國研發的大模型數量位居前列,且有開源和閉源兩種模式。隨着AI技術邏輯的演進,行業對大模型的認識不斷深化,從能力、需求、成本、市場等多個角度進行考量,並不需要過多的公司都擠在大模型研發這座“獨木橋”上,此前一些致力於大模型研發的公司,可適當轉到AI應用“賽道”。
一種方式是,原本做通用模型研發的公司改做行業大模型。這些公司積累了紮實的知識基礎和豐富的交互體驗,知道如何承接大模型的技術賦能,進而做好行業模型。另一種方式是,基於通用開源大模型開展行業大模型研發。這種方式能夠針對模型結構、參數等按需調整,更好地適配用戶的個性化需求。市場上的金融、法律、教育、傳媒、文旅等行業模型,大多是在Llama、SD、GLM、Baichuan等國內外主流開源大模型的基礎上構建的。以上兩種方式都無需大量的算力和數據,可節省大量訓練時間和成本,也能放心地利用私有數據提升應用效果,減少數據安全方面的擔憂,使企業更好地從AI技術研發轉化到應用研究上來。
此外,企業還可以開發一種比行業模型更靈活性的領域模型或業務模型,這類模型更適合國內市場極爲豐富的業務場景,有助於促成生成式AI的規模化商用。領域模型更適用於超大規模的AI應用市場和多種服務模式。中國信息通信研究院數據顯示,2023年我國人工智能產業應用進程持續推進,核心產業規模達到5784億元,其中不少屬於行業大模型、領域模型以及AI工具的應用。例如,有一家公司開展AI視頻面試業務,2023年業績比上一年翻了一倍有餘;義烏一個女老闆運用前沿的AI視頻技術,化身語言達人,能夠熟練切換多國語言介紹自家生意。諸如此類的AI研發和應用案例,都值得推廣。
提升生成式AI發展質量和價值的建議
我國人工智能研發勢頭正旺,智能產業前景樂觀,AI應用有望迎來蓬勃發展。不過,從現階段的探索和實踐情況來看,行業需進一步夯實AI基礎建設、開展技術創新、拓寬商用渠道,統籌處理AI研發、產業化和應用之間的關係。
營造良好的政策和服務環境。我國已針對AI的標準、能力、倫理、創新、治理等方面,出臺了相關政策和法律,以確保技術發展與社會的價值觀和倫理標準相符,營造出擁抱AI發展的社會環境。政府部門、行業協會和市場監管部門對於剛起步的生成式AI研發和應用,應該秉持包容的態度,逐漸引導規範,使其走上健康發展的軌道。
AI技術產業化要爲產業的智能化開路。運營商、軟硬件設備提供商、互聯網企業是大模型應用的先行者,它們數字化程度高、數據積累豐富、技術接受能力強,將成爲大模型落地較早的領域。這些領域的大模型應用場景廣豐富,覆蓋了營銷、客服、內容生成等諸多環節,目前已有豐富和成熟的經驗,其帶動示範作用以及提供的大模型服務、工具、產品,正在傳導到製造等產業,促進企業從數字化向智能化轉型升級。隨着各種智能載體逐漸成熟落地,在改造、提升傳統產業的同時,企業將朝着產業智能化的方向快速發展。
打造堅實的AI技術底座。行業要着力建設算力中心,促進算力統籌協同。隨着性能和易用性的提升,國產算力將獲得AI公司和應用企業的青睞。要有效地積聚高質量數據,擴大數據交易,發揮數據的資源和要素作用。要以創新精神研發智能產業的不同載體,避免同質化問題,展現技術、產業和應用的特點和優勢,打造與衆不同的產品和服務,進而提升價值、規模推廣。
*本文刊載於《通信世界》
總第956期 2024年11月25日 第22期