售前比售後機器人控制邏輯更復雜,僅憑大規模數據後發優勢難趕超!

(原標題:售前比售後機器人控制邏輯更復雜,僅憑大規模數據後發優勢難趕超!)

實現人與機器的自然交互,一直以來都是全世界人類的共同願望,無數科學家傾盡畢生精力致力於實現這個目標語言,作爲人與外界交流最有效的工具,成爲機器智能的重點研究對象,而對話型機器人則成爲實現人機交互最早的突破口。

圖靈測試開始,

對話機器人探索從未停

自計算機科學和密碼學的先驅阿蘭·麥席森·圖靈於1950年提出圖靈測試,人們對於讓機器具備人類智能的探索就從未停止。如1966年MIT開發的精神治療師ChatbotEliza,1995年基於模式匹配的NLPchatbotAlice,2011到2012年興起的Siri、Watson、GoogleNow,2015年聲名鵲起的AmazonAlexa、MicrosoftCortana、微軟⼩冰,以及2017年開始掀起國內聊天機器人熱潮的百度度秘、阿里小蜜、騰訊雲小微、小愛同學、天貓精靈等等,都是對話機器人不斷成熟和商業化探索落地的成果。

在商業化和落地上,在線智能客服是最早應用對話機器人的應用領域之一。國外應用對話機器人的時間較早,但由於國內電商業更加發達,所以國內在智能客服機器人上的應用範圍更加廣泛,也更加成熟,智能客服商業化產品五花八門,在醫療教育、智能汽車等衆多行業得到大量應用。

易聊科技的智能AI客服,也是其中的佼佼者。

國內最早入局的一批人

易聊科技是國內最早一批入局智能客服領域的科技企業,2014年從在線客服SaaS與定製起家,如今在醫療、教育等20多個行業領域深耕智能客服多年,在國內售前機器人市場份額已超過80%,轉化率也處於行業較高水平,如在醫療領域,細分場景的轉化率分別可以達到:整 形35%,男科30%,口腔(齒科)30%,白癜風35%,精神科38%;在教育領域,細分場景轉化率可達到:資格證類55%,職業 技能60%,學歷提升58%。

2014年,國外的聊天機器人話題已經相當火熱,亞馬遜Alexa,微軟Cortana、小冰等聊天機器人經常出現在媒體頭版頭條上,而在國內百度、阿里、騰訊等國內科技巨頭開始大面積佈局聊天機器人之前,易聊科技就已經率先一步入局售前智能客服領域,佔得先機,先後推出兩款智能客服產品:EasyLiao智能在線客服系統(IM)和EachBotAI智能接待機器人。

售前比售後機器人控制邏輯更復雜,

僅憑大規模數據後發優勢難趕超

在廣闊的客服機器人領域,易聊選擇了市場應用更加廣泛,難度也相對更高的售前機器人陣列。EasyLiao智能在線客服系統提供售前數據打通、線索跟進控制和售後客戶管理的傳統客服系統解決方案,EachBotAI則是基於客服聊天大數據作爲深度學習語料,應用自然語言理解、神經網絡人工智能技術核心的商業應用的智能營銷服務機器人。

EachBot機器人運營意圖

在這裡,不得不提一下售前和售後機器人之間的差異。從技術角度來說,兩種機器人的側重點和實現難度差別是非常大的,簡而言之,售前機器人的邏輯控制較後者更爲複雜。這也意味着做好售前機器人難度更大。

易聊售前機器人與售後機器人的主要差別,在於以下幾點:

1.通常是多輪對話,對話更具深度。售前場景不僅僅是對單句問題的解答,相較而言,售後面對的訪客,往往已經對問題有一定認識,能夠提出較爲明確的問題,並具有組織,售前訪客很多情況下不知道要問什麼問題,或只能提出模糊的問題,或最初提出的問題並不能滿足自身需求,所提問題只是一系列問題的開始,售前機器人需要引導對話,讓訪客不斷明確問題,因此並不是解釋一件事情,而是協助訪客發現問題再做解答。

2.多輪對話內在邏輯必須緊密,無論話題是否一致。售前機器人必須把控對話實質,以自身目標爲導向,對話始終圍繞主題,或暫時看似偏離主題,但內在邏輯不變,因爲話題的變化也是爲最終達成目標。

3.機器人的反應要求更迅速。售後場景下,訪客解決問題的意願明確、強烈,因此對售後反饋的響應速度相對寬容,而售前場景下,訪客的意願模糊,如果響應不及時,流失嚴重。

因爲最早有效進入售前機器人領域,易聊科技在售前機器人領域裡形成了一定的技術和產品壁壘。在王函石看來,AI三要素爲算法、數據、算力,其中算法和數據的結合非常緊密,數據很大程度上決定了算法的效果,這也是大數據時代特徵,由於易聊先行獲得客戶數據,第一時間對算法、模型知識庫進行了優化,因此其算法的性能隨之提高,客戶體驗的提高帶來了更多的客戶和數據,進而爲算法的提升提供更大的空間。在這種正向循環下,客戶對AI產品的應用就是對AI產品性能的優化,這種AI技術上的馬太效應,必然使易聊與潛在競品之間拉開距離。

另一方面,當越來越多玩家進入智能客服領域時,很難單純通過大規模數據的後發優勢打破先入者的優勢壁壘。

因爲算法效果雖然基於數據,但並不能完全自動化將數據轉化爲知識和智慧,單純依靠數據和算力很難解決售前問題。售前機器人的邏輯控制較售後複雜,多輪對話造成在對話進入較深層次後所需數據不足,即存在數據稀疏問題,需要人類專家知識,涉及到對客戶價值的理解,在這一點上我們的運營部門有豐富的經驗。

這種細分條件後的數據不足問題,大數據時代仍然普遍存在,爲提高效果,數據細分是必然,而相對數據不足,也成爲必然。純粹從理論上講,在不考慮持續提升效果的情況下,即靜態地看,數據、算力纔有足量的可能。算法研發的一大目標是無限接近全自動解決問題,路徑則是利用算法不斷提升人工效率,減少人工。

——易聊首席科學家王函石

技術“尖兵團”攻克核心算法模型問題

如何搭建這個技術挑戰更大的系統,是易聊技術團隊的任務。在CTO邴立新的帶領下,由自然語言處理科學家和機器學習算法研究員組成,擁有十三年即時通訊技術的團隊,與融合最新AI技術的團隊一起攻克核心算法模型的問題。

市面上智能客服產品不少,但真正“智能”,能夠達成目標的產品就少之又少了,問題就在於核心的系統架構上。易聊的智能客服促成的成交率在60%以上,之所以能夠做到比較自然地引導用戶達成交易,與其獨特的系統架構與核心AI算法創新有關。

系統架構

據瞭解,易聊的EachBot AI基於Python語言開發,使用了TensorFlow引擎,應用了Apache Spark大數據平臺。自然語義理解和行業知識圖譜可以實現毫無違和感的話術合成、詞義消岐、多輪對話、上下文理解、情緒識別,以及長短時間記憶網絡、自動歸納、特徵值、詞語省略與語言行爲等功能,這使得機器人能夠更加靈活、全面、精準、智能地處理訪客信息。而利用Python簡單高效的處理邏輯,靈活多樣可移植和豐富的可擴展性,易聊機器人平臺更加簡潔、清晰,能夠輕鬆整合其他模塊,不斷完善自己。 易聊即時通訊的底層系統架構,則採用了J2EE體系結構,比業界通用的.NET/PHP更加靈活、穩定。運行環境爲Unix/Linux,比Windows更加穩定、安全。在通信安全上採用HTTPS及SSL加密,安全性更強。

即時通訊的底層系統架構

核心算法創新:意圖識別、

對話控制及知識庫構建自動化

通俗地說,意圖識別指的就是分析訪客話語,抽取特徵(語義標籤),識別訪客意圖和信息;對話邏輯控制,就是根據意圖、訪客信息,在場景間轉換,特徵遷移,根據更加細節的特徵以及規則產生式,生成回答,該過程形成圖狀結構,控制對話流以導向既定目標,比如索聯

目前在業界,模型方法主要應用在意圖識別部分,提高識別正確率是模型優化的目標。而易聊售前機器人經過6個大版本的迭代,識別正確率已經從86%提升到98%以上,在部分場景下接近100%的識別正確率。

易聊智能客服的機器學習過程基於多種訓練模型,從較簡單的線性判別模型(如LinearSVC)、集成判別模型(如xgboost),到較爲複雜的深度神經網絡(DNN,如Transformer),動態貝葉斯網絡(DBN,如耦合馬爾科夫鏈),結合Bert等預訓練語言模型,依存文法分析、語義角色分析等計算語言學方法,並獨創了一些模型算法。

當然,模型算法上的創新是易聊客服機器人性能大幅提升的關鍵,易聊自研瞭如適用於語言文本的圖聚類算法,以及融合多種語言特徵的分層判別算法,在效果提升的同時,把時間、空間複雜度控制在較低水平,並根據模型佔用算力的差異,採用分層識別架構,降低了算力代價和對數據規模的要求。相較於早期簡單識別方法,新方法在大幅提高識別精度的前提下,識別速率幾乎沒有下降。

另一方面,從更加宏觀的AI角度看,售前機器人其實是一個典型的專家系統,包括了知識庫和推理邏輯,而專家系統是知識工程的一種應用形式,因此售前機器人的技術特點、難點與知識工程相似,除機器人運行過程中的意圖識別和對話邏輯控制外,即除了運用知識外,真正的難點在於如何獲取知識,構建知識庫。<br>客服場景下的對話是不斷實時更新的,因此醫療需要構建的是一個產生式多輪對話控制知識庫,自2014年以來,易聊積累了海量對話數據,系統需要打標的有超30億條對話記錄,超5億通對話。如此大規模的對話數據,需要更便捷地被構建到知識庫中。

爲此,易聊放棄了費時費力的純人工構建方式,自研了知識庫構建半自動化方法,如自動索聯判別、話術抽取、QA提取等,可以在不增加人力的前提下大幅提高構建效率,並提供了自主搭建功能和預製模板,將構建知識庫的功能開放給客戶,以提高構建知識庫的效率和效果,滿足客戶個性化需求。目前,易聊表示正在研發更少人力的自動構建知識庫方法,包括從客戶提供的數據中自動提取出結合上下文的成對問答並直接用於推理,目標是逐漸逼近全自動方式,以極少的人力完成知識庫構建。

易聊售前機器人產生式知識庫(目前)包含了:

1、1000000+語義標籤(特徵,分爲100+版本、1000+維度);

2、近60000場景;

3、近1000000遷移產生式。

深耕醫療與教育行業7年多,易聊在這兩大領域積累了行業知識庫,這些知識語義消歧和語義填充,讓機器人更好地瞭解用戶的意圖,提升轉化率。

值得注意的是,易聊智能客服還使用了多種機器學習技術,如主動學習、小樣本學習、遷移學習、強化學習等。

這些技術都是什麼概念呢?我們舉例簡單解釋一下。首先,當數據進入學習系統後,系統會對數據做一次自動標註,如果標註正確率不夠高,則接入訓練模型,算法從中抽取出置信度較低,接近判別邊界的數據,然後交給人工標註後再標註,之後再進行學習。這其實就是一個主動學習的過程,算法自動篩選出可靠性差的標註數據,交由人工更正,反覆觸發這個機制,就可以得到更加高質量的標註數據,提高系統判別精度。

小樣本學習方面,系統首先使用啓發式規則做標註,結合主動學習過程,由人工標註糾正標註質量差的樣本,最終基本上可以達成足量樣本學習的目標。模型的遷移學習能力指,所訓練出的模型,在實際數據與開發數據存在差異時仍然可以保持其處理效果。

強化學習原理

除此之外,易聊表示目前還在研發適用於對話邏輯控制的強化學習方法,即通過達成的處理結果反推處理過程及其組合的優劣,以尋找最優的處理過程,這種優化機制非常適合售前對話型機器人訓練,因爲售前場景下,雖然容易判斷是否達成最終目的,比如判斷是否獲得線索,卻很難評判中間的每句對話及處理過程在達成最後目標的角度上是否合理。

售前機器人計算邏輯的革新

對於售前機器人,王函石還從計算邏輯層面給出了一個全新的思路。他認爲,用更加現代的AI角度來看,售前場景可以視爲機器人(座席)與訪客2個智能體間的博弈(並非零和博弈),因此可以採用智能決策理論對傳統計算邏輯重構。智能決策基於以效用爲基礎的經濟學理論,在AI復現此理論的過程中,採用了貝葉斯網絡及效用函數,並以期望效用最大化作爲計算模型的優化目標,其中貝葉斯網絡通過對話數據計算在特定上下文下不同應答的條件概率,即對客觀世界進行建模,而效用函數刻畫對話結果的優劣,即對客戶主觀價值進行建模,兩者結合後最大程度的貼合營銷場景。

在優化模型的過程中,易聊客服機器人系統將採用主動學習方法對容易偏離標準(容易出錯)的樣本進行重點學習,採用強化學習,以對話結果爲出發點,逆向追蹤對話過程中的不同環節並加以獎懲,以結果爲導向優化過程。

相較於原來計算邏輯和知識庫構建方法,新的計算邏輯因爲基於最本質的決策過程,是不限行業的通用方法,不侷限於售前或售後的對話場景,適應範圍提升至全領域,既適應於新客戶、新行業的問題,也可以用於營銷的其他環節。

在這些AI技術的加持下,易聊客服機器人系統逐步克服AI領域的很多技術“頑疾”,如模糊性問題、情緒識別、內在表示、潛在標識等。

對話機器人的未來:智能決策

目前,易聊售前機器人的知識邏輯已支持單次對話能力達到30-50輪,接下來,易聊表示還要在對話邏輯上進行革新,最大的變化將是要引入智能決策能力。因爲對話控制主要是在知識庫上進行推理,實際上是條件判斷在場景下的遷移,未來引入智能決策後,就不僅可以根據規則判斷是或不是,還可以判斷概率有多大的問題,用強化學習的方式從效率進行反推,找出概率背後的問題所在,實現對話的結果最優,是易聊智能系統下一個階段的目標。

回顧從第一代自研系統到如今多次系統更新迭代,易聊系統認爲智能機器人最重要的就是邏輯,而邏輯的核心部分就是知識,而現在知識構建過程中,大多數廠商其實人工參與量非常大,而因爲易聊入局較早,前期工作充足,所以在整個行業中具有先發優勢。提高構建速度,就佔據了高地。

而在競爭越來越激烈的智能客服市場中,要想維持這個壁壘,創造更多的壁壘,就需要更多的創新。

未來,真正的智能對話機器人應該是更靈活的,目前機器人目的比較單一,以後需要更加智能,完成更多樣化的任務,達到強人工智能的水平。

——易聊科技CTO邴立新

大數據和雲計算時代的到來,讓對話機器人正在經歷着技術與應用、商業化的深刻變化,也讓實現更加智能的人機交互系統的目標變得前所未有的清晰。讓我們一起期待,下一次對話機器人質的蛻變!

邴立新,易聊CTO,2005年畢業於瀋陽工業大學,05年初入職北京天融信網絡安全有限公司,任職高級開發工程師,研發互聯網安全監控相關產品。2006年初創業成立多友公司,創始合夥人,擔任CTO,研發在線客服產品,即目前易聊的IM產品前身,2012年左右該產品市場佔率第一,純IM營業額達到2000萬左右,教育行業佔有率達70%。2014年二次創業,成立易聊,2018年調整戰略重點做SaaS客戶。2018年初推出第一版AI機器人產品,並迅速迭代三大版本,AI轉化率超越人工水平,能夠獨立值守。到目前AI產品已完成共六個大版本迭代,機器人轉化率進一步提升。

王函石,易聊首席科學家,AI算法帶頭人。2011年畢業於北京理工大學,研究方向爲人工智能、自然語言處理、智能問答。在首都師範大學任教6年後,王函石2017年從學術轉向產業,在小米智能科技擔任數據科學家,從事結構化、非結構化數據分析、建模,涉及人工智能、自然語言處理、機器學習、數據挖掘等領域的模型研發。加入易聊科技後,他作爲AI算法帶頭人,負責統計模型、機器學習模型的研發、選型、調優、測試,並將AI計算模型研究成果應用於易聊售前機器人、企微(SCRM)、CRM和外呼等業務中,優化運營效率、效果提升工具。

好消息!易聊IM永久免費已開放,試用即獲好禮!

無論是從對行業現狀的洞察、對客戶需求的剖析、對自我發展的要求來看,IM永久免費都勢在必行。因此,易聊在線客服系統(IM)面向全行業永久免費。

活動期間試用,即可獲得600元京東購物卡,即刻體驗!