科大訊飛副總裁王瑋:AI大模型與智能SaaS應用正加速賦能千行百業|2024 ITValue Summit 數字價值年會

科大訊飛副總裁,聽見科技總經理 王瑋

9月11日-14日,由鈦媒體與ITValue共同主辦的2024 ITValue Summit 數字價值年會在三亞舉行。會議由鈦媒體集團、ITValue聯合主辦,此次峰會主題爲“Ready For AI”,交流經驗教訓,交叉行業思考,推動創新交易,以創新場景爲基礎,共同探索AI驅動下數字經濟時代的全新機遇,共同打造一場數字經濟時代的AI創新探索盛宴。

大會首日,科大訊飛副總裁、聽見科技總經理王瑋以“AI+SaaS,開啓智慧辦公新生態”爲主題發表演講。

王瑋表示,AI 大模型正與每個人息息相關。不管是醫療、會議,還是物流等領域,以大模型爲核心的生成式 AI 技術正在幫助人們提質增效。從語言到認知,訊飛聽見是辦公場合的應用利器,目前訊飛聽見在智能語音轉寫工具領域排行第一。

“我們希望,訊飛聽見能夠成爲你隨身的語音記錄助手,不僅能夠記錄,而且還能把文字進行提煉,幫你歸納整理做待辦。”王瑋指出,大模型技術促使SaaS智慧辦公服務實現更多的落地商業應用。

據悉,訊飛智慧辦公SaaS平臺,是科大訊飛推出的智慧辦公綜合網站。以SaaS辦公產品爲核心,融合科大訊飛旗下多款智能硬件,爲用戶提供全面、便捷、智能的AI辦公產品及服務。核心的SaaS產品主要包含訊飛聽見、訊飛同傳、訊飛寫作、訊飛會議,基於AI能力幫助用戶從記錄、溝通、創作、協同工作流中提效,創造新質生產力。

2010年,隨着訊飛語音輸入法驗證了訊飛專攻的語音技術的市場規模以及商業化價值,訊飛在商業化產品探索中,決定開啓做爲技術付費的產品,商業模式當下最適配以及市場校驗最快的賽道就是SaaS。

2015年,科大訊飛上線訊飛聽見轉寫網站,並正式對外發布正式版訊飛聽見產品家族,依靠19.8元/小時的轉寫服務,網站上線半年後獲得100萬用戶。成爲中國SaaS產品市場上最早的一批付費工具產品,並且一路發展到今天成爲中國智能語音轉寫領域第一。訊飛同期還發布首款錄音筆。

訊飛智慧辦公SaaS 平臺是訊飛戰略發展中的重要一環。截至目前,訊飛智慧辦公SaaS平臺報告期內生態用戶超過2億,覆蓋用戶超過7500萬,2024年平臺升級後聚合訊飛旗下多款智慧辦公硬軟件產品,用戶可實現訊飛辦公產品的一站式選擇和使用,隨星火大模型能力搭載後,訊飛寫作新增付費用戶數超1240%,平臺整體付費用戶數超20%,並與中國電信、中國工商銀行等企業達成合作,助力千行百業 AI 提效。

同時,訊飛聽見層面,目前是智能語音轉寫第一品牌、手機應用商城效率轉寫排行第一,也是業內最早起家做智能語音轉寫和付費SaaS的產品;訊飛同傳層面,其已經爲數十家世界500強企業持續提供AI同傳服務。公有云業務上,訊飛同傳新增註冊同比增長168%。

此次演講中,王瑋坦言,AI 訊飛星火加持的應用可以讓每個人可以更加美好,爲這個社會做更多的幫助,在中間要找到值得期待的地方。

王瑋強調,未來,AI 技術一定會對傳統千行百業進行變革。隨着新技術、新產品、新產業不斷變化,訊飛會找到新的方向和位置。科大訊飛堅持“軟硬一體”,尤其擁有自主可控、底層算力、算法、國際格局,有源頭的技術生態,利用星火大模型智能體與場景業務對接,形成軟件+硬件+服務的訊飛SaaS生態,讓 AI 賦能千行百業。

以下是科大訊飛副總裁,聽見科技總經理王瑋演講內容整理:

非常榮幸今天受劉湘明總的邀請來到美麗三亞,今天的開場既輕鬆又活潑,而且更加有內涵。所以我就在想,我今天用什麼樣的一種風格跟大家做交流。

大家可以看到,近兩年,不管是做IT,還是做人工智能(AI),都不得不說“大模型”這三個字,不說好像就已經Out了。

2023年10月,Gartner發佈2024年十大戰略技術趨勢,到2026年將有超過80%的企業使用生成式AI。而谷歌CEO桑達爾·皮查伊(Sundar Pichai)透露,當前有超過35%的企業已經在利用 AI。

因此,AI 大模型正在與每一個人息息相關。

不管是我們聽到的醫療領域,還是物流領域,大模型、生成式 AI 到來之後都和我們產生的關係。

如果你是一名職員在一家廣告公司裡,還要想想做記錄,現在有一些耳機已經幫你轉成文字,甚至還給你做了紀要。尤其,現在一些客服人員在 AI 的輔助下效率得到極大提高。

如果你是一名程序員,生成式 AI 到來之後,這些類ChatGPT產品可以做對話、搭網站,一定程度上替代原來我寫代碼。因此,科大訊飛內部的程序員都有利用 AI 進行輔助,原本花三個月開發的工作,現在一個月就可以完成,甚至整個測試代碼也開始用 AI 不斷做改變。當然,有一些核心的代碼還需要一些高端的算法工程師自己編寫。

實際上,生成式 AI 到來之後,對媒體行業也有顛覆式改變,以前我們都要自己寫,現在我搭一個框架,是不是可以讓AI幫我改寫、縮寫、擴寫,甚至是潤色。我們自己也有一個訊飛寫作,很多網絡小說家如今也開始讓大模型對話,輔助它創作,現在有很多的追更小說已經用大模型進行配合。

大模型已經到來以後,改變了我們(生活中)的方方面面。從去年開始,科大訊飛一步步不斷迭代訊飛星火認知大模型,這個大模型是在完全自主可控的底座上面去做的。去年說“百模大戰”,大家都在講故事說概念。而科大訊飛是唯一一家不僅講故事,而且還按照時間節點做,一個個都能落地的企業。

今年1月30日,我們完成了在全國產化算力底座上的萬卡集羣;6月27日,我們正式發佈了星火4.0,增加了一些多模態交互和使用能力,現在已經全面對標GPT-4 Turbo。而且,現在訊飛也參加到大模型測試單位,整個公司都圍繞生成式 AI 構建底層算力、中間算法和數據、上層應用的生態。

然而,我們也同時感受到,一輪一輪發展後,大模型讓一腳油門踩下去到了80%,但回頭一看,幾個億沒了,進入到下半場是怎麼落地、怎麼應用。

科大訊飛成立至今已有25個年頭,我們是平臺+賽道,包括一個通用能力的底座模型,上面則賦能各行各業進行應用,比如教育、醫療、工業等場景。在工業方面,我們現在有很多“工業黑燈工廠”,而且訊飛和中國石油、中國移動共同發佈行業大模型。很顯然,AI 已經在各個領域都進行了應用。

下面我想跟大家分享辦公領域的應用。

實際上,辦公是我們在整個業務線中比較通用的領域。在2015年之後,我們發現辦公室當中大家要經常開會,而開會的時候希望把每個人的講話都能記錄下來,因此,以這個需求爲依託,我們打造了語音轉文字技術,並且發展成爲平臺和商業化。我們並沒有走完全的C端路線,而是在相對垂直領域裡提供付費訂閱模式,現在已經成爲國內頭部辦公服務平臺之一。不管是聽見、寫作,還是同傳、會議,訊飛開始打造出一套SaaS辦公平臺。

核心層面,首先是 AI 和語言。語言的背後是數據,哲學家說“語言即世界”,你聽到的、表達的內容是你的觀點。因爲訊飛從起家就開始做語音識別、語音合成。因此,無論是識別,還是合成,訊飛聽見做的是感知智能。而到了寫作,大模型做的是認知。

從語言到認知,訊飛聽見是辦公場合的應用利器,同時還是在智能錄音工具領域排行第一,大部分人是一線年輕人,有一些大學生、留學生學習時一邊聽老師講課,一邊記錄下來。我們希望,訊飛聽見能夠成爲你隨身的語音記錄助手,不僅能夠記錄,而且還能把文字進行提煉,做代辦。

其次,有了這樣的語言記錄之後,下一步做什麼?做出海、要溝通,有很多同傳和翻譯需求。另外,現在文旅非常的火,包括今年上半年放開入境之後,在溝通、導覽方面都能看到訊飛的翻譯技術,而且訊飛的翻譯機賣得不錯,還有導覽大廳上都已經在落地使用了。

再次是寫作。訊飛目前還有 AI 寫作產品。相比其他產品,訊飛寫作的優點在於,有語音素材可以一鍵導入,以前有一些生成式 AI 寫作需要人進行輔助,因爲大模型還有最後1公里、幻覺等問題。但訊飛寫作藉助已有素材或已有溯源內容再去寫作,而且圖文並貌,從而讓你的寫作更加事半功倍。

最後是會議。訊飛既然做辦公,尤其三年疫情形成線上會議,而疫情後,這種跨越式的和視頻的交流已經變成生活的習慣,在會議背後有很多同傳翻譯、提煉、寫作等工作,而且會議還可以潛入辦公中、遠程醫療等場景。

所以,利用大模型技術進行業務和場景結合,形成軟件+硬件+服務的生態,構建了訊飛辦公,尤其是訊飛SaaS辦公的應用。

說完應用落地,和大家分享一下現在一些場景應用。

首先,我們在兩會、香港立法會都參與其中,包括提供 AI 翻譯、同傳等功能,港府的立法會所有的開會最後的信息都在網上公開,對外輸出的數字增加了一倍以上,現在我們也積極的進入到第三期,用大模型幫他做溝通,或者是發佈,幫他做一些輔助立法的工作。

不僅如此,科大訊飛還是冬奧會和冬殘奧會的翻譯技術提供商,去年亞運會,我們還和央廣進行合作。而今年剛結束的巴黎奧運會,我們也用 AI 技術提供同傳服務,促進賽事、大賽無障礙交流。此外,也有很多世界500強公司開會時也使用訊飛同傳服務。

而會議層面,截至目前,累計有500萬間的 AI 會議室,包括政府和大型企業。現在我們也特別希望把這樣的應用讓更多的人用起來,現在我們也在加大SaaS平臺服務力度,也在讓更多的消費者使用。

鈦媒體有一句話,大模型到來之後,AI 時代讓大家人人平等,都能使用到。而訊飛也是這樣的理念。

在國內,聽障人士有2000萬,國際上更多,所以訊飛聽見發起了 AI 聲音,免費把我們的應用開放給中國聽障人士,只要上傳了二代聽障證書就可以免費使用。現在很多聽障人士是識字的,我們給聽障人羣捐贈定向1億分鐘,用了這樣的設備之後,可以正常的交流。

人工智能來了以後,爲不能而戰的人戰鬥,每天這種感動的故事在發生。我們也相信,在人工智能的加持下,它可以讓每個人可以更加美好,爲這個社會做更多的幫助,我們在中間要找到值得期待的地方。

未來,隨着 AI 技術不斷髮展,一定會對傳統行業發生變化。我覺得人最好的是學習力很強,會隨着新技術、新產品、新產業的變化後,我們會重構,每個人找到新的方向和新的位置。我們堅持軟硬一體,尤其是底層算力、算法、數據,都是自主可控、國際格局,中美在硬科技上的加持對抗之外,我們一定要有源頭的技術生態。而且,大模型來了之後,現在我們還需要有各種各樣的智能體,跟場景業務進行對接,賦能各行各業。

以前我們講,“互聯網+”,或者是“+互聯網”。現在是“人工智能+”,或者是“+人工智能”,或者是“大模型+”、“+大模型”,技術不僅是技術,還是要落地,最後是重塑和繁榮整個行業生態。

從古老的行業開始,語言是民族的象徵,而一種新的 AI 技術正在重塑語言這個行業。最後希望我們攜手共建,共同繁榮生態,用最新的技術一起迎接美好的未來。謝謝大家!

(本文首發於鈦媒體App,作者|林志佳,編輯|胡潤峰)