從這場智能客服魔法對抗賽上,我看到了AGI落地的正確姿勢
綜合報道
7min read
從這場智能客服魔法對抗賽上,我看到了AGI落地的正確姿勢
拉風的極客2024/09/26
摘要
捲了兩年大模型之後,國內 AI 創業者想通了。
剛剛落幕的雲棲大會百鍊杯「智能好客服」PK 賽現場,上演了一場智能客服領域的「魔法對抗」。
比賽規則很簡單,8 支參賽企業賽前卷算法,現場看效果,主辦方阿里雲提供模型開發平臺百鍊,選手用各自的解題思路去構建「智能好客服」而好的標準便是把個色人格的消費者都接待滿意。
不過,主辦方派出的聊天客戶,卻並非真人。而是同樣通過百鍊刻意爲了「刁難」參賽隊伍打造的不同人設 agent:其中,既有講話錯別字連篇還不會網購的阿姨;也有正在氣頭上的暴躁都市麗人。
只有魔法,才能打敗魔法。參賽企業的應對,也堪稱教科書級別。
比如冠軍雲夢科技,靠着一羣技術宅團隊做出了能應對暴躁都市麗人的 agent。面對買家溝通時的情緒波動,不僅能連續妥善識別應對,甚至還能分清「黃二白」「混油皮」這樣的專業美妝術語,並根據買家對產品的特定需求,迅速推薦適合的產品,最後,還能在眼花繚亂的促銷活動中,給出用戶精準無誤的解釋。
獲得了此次比賽亞軍的合力億捷,則派出了剛進入公司的職場新人,培訓了兩天不到,就直接通過阿里雲百鍊平臺,讓 Agent 就完成了三版迭代,回答的有效性從 80% 提升至 96%。
更「激進」的,是最佳創意獎得主企業雲蝠智能,乾脆放棄程序員參與,直接派來了公司的財務迎戰「退休老大媽」agent,全程負責這次比賽的應用開發。而在此之前,這位財務,僅僅接受了 20 分鐘的大模型與提示詞培訓。
當然,智能客服只是大模型發揮作用的經典場景之一;以此爲切口,大賽主辦方阿里雲試圖傳達的更深層次意圖在於:
大模型,已經真正進入卷應用的時代。
01 爲什麼是智能客服
關於這場挑戰賽,很多人的都有一個疑問,大模型明明有很多炫酷的應用,比如自動駕駛,比如生物製藥,爲什麼要選擇智能客服這麼一個看起來一點也不性感的方向?
一個基礎的行業共識是,大模型應用爆發時代已經來臨,每種生意都值得在大模型時代重做一遍。但每種生意的門檻與成本收益比卻不盡相同。
圖片來源:阿里雲
毫無疑問,智能客服會是大模型落地持久戰中,一個成本低、收益高的重要賽道,而它的落地場景,也滲透到了日常生活的方方面面。
一方面,智能客服是大模型長文本、多輪對話能力最直接的應用。
另一方面,智能客服背後潛藏的,是一個商業化潛力巨大藍海市場。IDC 報告《中國智能客服市場份額,2023 :新舊交替,增長可期》中顯示,2023 年中國智能客服市場規模已達到 30.8 億人民幣,較上一年增長近 37%。
更重要的是,智能客服場景往往非常垂直,想要進入這個行業,只需要開源模型微調;但想要做好這個行業,在各行各業累積起的獨家數據優勢則是必不可少的一環。
也是因此,在現實中,面對智能客服機械式的問答,80% 的用戶都會選擇轉接人工。
就以常見的買衣服來說,客服進行推薦時,往往需要用戶的身高體重數據,但大部分用戶並不能給出一個精準回答,而且有人習慣用公斤有人習慣用斤,有人統計身高數據用釐米,有人用米,三圍數據上,更是有人有釐米,有人用尺……
這就需要模型不僅能精準理解用戶需求,對用戶給出的數據進行統一的單位轉化,也需要能夠根據判斷出的用戶需求,做出精準的款式與尺碼推薦。
而一旦涉及到更復雜情況,比如用戶講話方言、用戶情緒波動、多輪對話,以及用戶隨時的打斷,那麼,如何正確理解用戶的講話內容、保證用戶的體驗,就成了擺在眼前的攔路虎。這中間不僅比拼模型的技術能力,更考驗對場景的理解以及對用戶需求的精準洞察。
未來的市場很大,眼前的問題也不小,那如何彌合這種技術到落地之間的鴻溝?
這屆百鍊杯企業級 AI 應用開發挑戰賽,百鍊平臺與浩鯨科技、亞信科技、合力億捷、貝斯平、雲夢智能、匯智智能、煜象科技、雲蝠智能在內的 8 家行業知名獨立開發商一同,爲智能客服落地打了個樣。
02 HR 也能做大模型應用,百鍊憑什麼?
與移動互聯網時代,技術成熟與行業爆發之間需要漫長的等待期不同;大模型產業自 OpenAI 正式推出 ChatGPT 的那一天起,商業化就被按下了加速鍵。
短短兩年時間,AI 繪畫,AI 陪伴,AI 文案,就以摧枯拉朽之勢將無數行業的格局與工作流顛覆,下游應用的爆發,更遠遠超出了所有人的預期:
數據顯示,2030 年中國 AGI 應用市場規模將達到 4543.6 億元人民幣,更爲重要的是,AGI 的應用市場還處在加速增長階段:截至 2024 年 6 月 15 日,中國大模型市場共計發佈中標公告 230 個,遠超 2023 年全年的 190 個。
在一片蓬勃爆發的廣闊藍海,誰抓住了最多的開發者,誰就拿到了通往未來的門票。
圖片來源:視覺中國
而如何培養更多的開發者,則需要一個門檻足夠低,低到公司財務與HR也能動手開發的大模型應用開發平臺。
2023 年 10 月,阿里雲發佈了大模型應用服務平臺——百鍊。通過集成通義以及上百款三方和垂直領域模型 API,並配套相應的開發工具,百鍊可以讓即使沒有模型自研能力的中小企業開發者,也能以「拖拉拽」式的開發方式,在 5 分鐘內創建自己的專屬 AI 應用。
其中,底層算力上,百鍊依託阿里雲,可以支持千億級模型的萬級併發推理需求;讓開發者把精力更多放在數據、業務、場景創新上。
而在生態側,上百款大模型 API 接入之外,百鍊同時還提供全鏈路模型服務和豐富的工具箱,並針對不同客戶需求,推出了三種不同的大模型應用方式:
針對定製化需求較低,主打「開箱即用」的企業,百鍊可以提供通義、Llama、ChatGLM 等在內上百款大模型 API,同時提供百川等系列三方模型的託管服務。
針對有一定定製化需求的微調型用戶,百鍊則提供從數據管理、模型調優、評測到部署的全鏈路模型服務。不僅讓用戶找到最合適的模型,同時讓用戶的算力支出,實現彈性調用,整個訓練過程可視化。
而針對那些想要打造自身 RAG 應用的企業,百鍊則提供 Assistant API,用戶可在百鍊上輕鬆創建知識庫,並一鍵開啓 RAG 應用,通過 Assistant API 聯合輸出。
不僅是針對不同開發水平的客戶給出不同的開發模式;針對特定場景,百鍊也推出了不同的落地扶持思路。
就比如針對此次比賽選定的客服場景,往往單一的大模型並不能很好的解決用戶意圖識別等問題。百鍊平臺通過提供完整的全鏈路模型工具,開源、閉源等多種模型選擇,參賽者可以自由的選擇不同的模型與工具進行組合搭配,以及大模型與小模型的聯動,從而集多模型之所長,來更好的回答用戶產生的問題。
再比如,應答客服場景中經常出現的專業知識,僅僅依靠模型以及開源數據,無法對做出精準回答,百鍊則提供了集成 prompt 優化工具、流程管理工作流、插件等能力,開發者可以通過藉助 RAG 搭建專屬領域的知識庫,來很好解決大模型的「專業知識短板」。
此外,通過高性能的模型調用服務、完整的應用創建流程、支持使用開放架構創建智能體應用,百鍊更是做到了零門檻上手,財務也能開發大模型應用。
門檻降下來了,用戶規模自然也就漲上去了。
根據雲棲大會的最新消息,當前百鍊平臺服務客戶數已達 30 萬,其中,付費客戶數較上一個季度增長超過 200%。大批開發者放棄私有化部署,直接在百鍊上使用與微調各類 AI 大模型,構建自己的大模型應用。迄今爲止,百鍊已經成爲當前市場排名第一的大模型應用服務平臺。
03 技術到落地,仍需千錘百煉
不難看出,相比單純講述參數堆砌,打榜卷模型,本次比賽更多聚焦到了那些國內最早真正嘗試 AI 應用到各行各業的人,以及爲企業提供軟件定製開發的 ISV 在各行各業深耕探索的開發者,甚至是對技術一無所知的行業一線員工。解決他們大模型落地過程中的開發上手難,產品用戶體驗等細節問題。
而這也是阿里雲今年對外傳達出的重要信號:深入產業,纔是現下大模型產業最重要的關鍵詞。
事實上,在大模型落地中,類似智能客服的尺碼不統一、用戶說方言、產品專業壁壘高深這樣的問題並非孤例。
如何從上千頁的產品說明中找到工程師需要的那一頁,如何讓財務輕鬆處理厚厚的票據,用戶到底需要精準的正確還是模糊的可能性組合……都是擺在眼前,一個又一個具體而瑣碎的問題。
而阿里雲的答案是從技術中來,到落地中去,做大模型、做雲服務、投資、做 MaaS、辦比賽,做標杆,也做基礎設施,把自己捲成國內大模型產業鏈中最努力也最全能的公司,從傳統的雲計算廠商一步步升級成爲大模型時代的基礎設施。
一直堅持下去,不只是因爲大模型前路似錦,藍海廣闊;更是因爲通往未來的路,就是一步步,一點點從解決怎麼搭建客服 RAG 這樣的小問題中摸索着走出來的。
真正的落地,從來都是一路咬着牙千錘百煉。
*頭圖來源:阿里雲
本文爲極客公園原創文章,轉載請聯繫極客君微信 geekparkGO
大模型