小度,換上新腦

“如今的小度,換了一個新的大腦。”

在距離2024年百度Create AI開發者大會一週前的一次交流中,小度CEO李瑩對36氪如此形容小度的蛻變。

而在大會開場,小度爲這個全新的“大腦”留下懸念。百度集團創始人、董事長兼CEO李彥宏,與小度添添AI平板機器人進行了一段互動:

“幫我安排一下日程,今天活動結束後,我會和張總一起用晚餐,之後在酒店有個管理層的會議,大概需要1個半小時,希望10點之前可以結束。明早我準備晨跑,看看天氣如何,然後上午8點有個早會,請幫我安排好日程。”

這段普通的指令暗藏玄機,既有簡單的新聞問詢,也有複雜的日程安排。此前的小度,大概率會以“抱歉”遺憾收尾。但在會上,小度給出了近乎完美的答案:

這份蛻變背後的最大變量,在於一顆基於百度文心大模型的“最強大腦”:DuerOS X。

在AI算力從雲端逐漸轉移到終端應用、大模型從軟件應用逐漸滲透至硬件產品,已經連接超4600萬家庭的“國民AI夥伴”小度,自然而然的站在了AI技術變革的浪潮之巔。

“小度AI智能助手是百度文心大模型的重要且規模龐大的落地應用,Duer OS X作爲全新的AI native OS,完成全面‘換腦’,引領AI原生應用邁向全新的高度,它將爲我們帶來前所未有的智能體驗,開啓全新的智能生活篇章。”李瑩談到。

縱觀小度換上DuerOS X這顆“新腦”的過程,就會發現,這是一串被百度冠以“最好”形容詞的“AI+硬件產品”的打磨鏈條:

支持複雜日程安排、高語境交流等場景的,是性能最好的大模型文心4.0;負責響應用戶不同問題和需求的,是國內最大的智能體平臺百度“靈境矩陣”上的2000多個Agent;用於平衡小度解決問題精確度和推理成本的技術,則是最前沿的MoE(混合專家模型)架構;決定“大腦”聰慧程度的訓練數據,則來自國內智能音響領域最完整的數據庫——小度近十年來積累的高質交互數據。

“新腦”換來的,是更機靈、懂你的小度,也是百度全新軟硬一體時代的開啓。

小度蛻變的開始,可以回溯到近十年前——在2015年9月的百度世界大會上,小度的前身,搭載着DuerOS的對話式人工智能秘書“度秘”完成了首秀。

彼時的李瑩,負責百度知識圖譜的研發,也爲度秘產品提供支撐。她對36氪形容,當時的搜索,遵循的Top One是“一條結果,滿足一個問題”。這條Top One原則,讓度秘的“大腦”,更貼近於傳統搜索,用戶問一個問題,度秘給出一個準確的回答。

在“人工智障”戲稱流行的年代,DuerOS這顆“大腦”的表現無疑是驚豔的。

DuerOS最早被大家熟知,是在2017年的“百度AI開發者大會”正式發佈的對話式操作系統,利用語音技術、自然語言處理技術、搜索技術等,打造了聽清、聽懂、滿足用戶需求的人工智能對話系統。

然而,當時間來到2023年,“一條結果,滿足一個問題”,已經無法再讓用戶滿足。

“簡單來說,如果小度還是這個水平,就不夠聰明瞭。”李瑩對36氪坦言。

若想設置一個複雜的日程,比如“8:00 am完成任務1,繼續完成任務2,且任務2必須在10:00 am前完成”,小度的回答是一句令人遺憾的“抱歉”;再比如,“在搜索引擎原來搜不了的東西,在小度上也一樣回答不了”。

但相對地,大模型的發展對小度等智能硬件而言,又是最好的機遇。高通CEO Cristiano Amon曾總結,計算機的發展史,就是算力從超算等大型設備一步步轉移至終端設備上的過程。素有“消費電子春晚”之稱的CES(國際消費電子產品展),2024年的主題則是“AI for Everything”。

主打家庭場景的小度,站在了離用戶情感空間最近的位置。

但僅僅是站在風口中,對小度而言還遠遠不夠。爲小度換上一個AI原生的“新腦”——DuerOS X,是小度在新戰場的新武器。

2005年,蘋果創始人史蒂夫·喬布斯在斯坦福大學的畢業典禮上,曾將自己當下的成就,比作“Connecting the dots”,即過去點滴的積累。

若是細數DuerOS X誕生的必要條件,就可以發現,小度爲此刻的蛻變串聯了百度、小度將近10年的dots。

“小度從來不是一家單純的硬件公司。”小度曾在不同場合一再強調智能硬件,不僅僅是硬件的戰場,而也是一場“大腦”——軟件的比拼。

對“大腦”的強調和持續打磨,讓小度“換腦”顯得水到渠成。從DuerOS跨越到DuerOS X,最大的變量是百度的通用大模型基座“文心”——這又是一個跨度超過十年、有關百度立身的根本和“讓所有人能使用最先進的生產力工具”樸素願景的故事。

李瑩 百度集團副總裁、小度科技CEO

大模型應該怎麼和硬件結合?硬件的形態應該怎麼做?能落地的場景有哪些?

小度的同事們反覆研究了CES上的智能硬件產品,得出了一個有些令人沮喪的結論:有意思的產品很多,但技術還沒跨越可商業化應用的鴻溝。

“但大模型給人的驚喜是,它每天都在進步,能力的邊界在擴展,成本也在持續優化。”李瑩說道。

但給小度“換腦”,並不僅僅是接入文心大模型這麼簡單,而是從數據工程,到技術框架,再到產品應用的全面重造和適配。

“海峰老師(百度集團CTO,文心大模型負責人)他們已經從金礦裡面煉出金子,”李瑩對36氪打了個比方,“我們要做的是把金子變成戒指或者耳環。”

小度“換腦”的第一件事,就是技術框架的重構。這需要團隊有很強的工程及算法能力,讓系統的適配性、魯棒性更強,系統效率更高。小度從第一天起就是軟硬一體,工程能力很強,可以快速做重構。

另外,就是要基於小度的場景,做不同的數據工程工作。比如,爲了給小度創造不同的AI夥伴人設,要去做大量和精細的數據工程,比如數據收集/標註、訓練和調優,還要爲每個人設去設計獨特的Prompt(提示詞),以幫助模型更好地理解和塑造人設。

要讓小度更像人,意味着系統的交互方式也要圍繞着“像人交流一樣”去打造。不少軟硬件和操作系統接入大模型,都僅僅是在過去的鍵鼠或者觸屏的交互方式上做疊加。“小度一開始就是針對多模態交互設計的。”李瑩介紹。從芯片、攝像頭,細到麥克風陣列,小度爲大模型驅動的多模態交互,做了不少調試。面對如今的小度,用戶用語音、文字,甚至是手勢和表情,就能非常自然地表達自己的需求。

在一般場景下,文心大模型已經足夠好用。但面對用戶需求複雜的家庭場景,小度發現:通用大模型解決問題的精準度和成本都面臨現實問題。

小度的解法是,採用模型路由架構取長補短。所謂的模型路由,可以簡單理解成用一個模型團隊,分工處理複雜任務,團隊中的每個模型,就是術業專攻的“專家”。

採用模型路由架構,對花了一年多時間建模型生態的百度而言,有着得天獨厚的優勢。“現在文心大模型的不同尺寸和特點的模型,小度全在用。”李瑩告訴36氪,採用模型路由結構,既能在小度上充分利用不同模型的優勢,還能根據任務的難易程度合理調度模型資源,控制成本,比如僅僅讓小度設置一個簡單的定時提醒,就不需要用到大模型旗艦版。

今天,給小度“換腦”的大工程,有了DuerOS X這份答卷。

小度將DuerOS X定義爲“全球首個AI原生操作系統”。在李瑩看來,“AI原生”不僅意味着DuerOS X的性能變得更加強大,還意味着操作系統的角色發生了改變:

市面上多數智能硬件產品的操作系統,充當的往往是軟件和硬件之間的中間件,解決的是資源分配和任務調度問題,並不理解用戶。但得益於大模型的理解、生成、邏輯、記憶等能力,AI原生操作系統最重要的角色,則是擔任端到端地解決用戶意圖和任務之間的中間件。

那麼用戶會如何感知到小度換腦後的進化呢?

如果用一句話總結DuerOS X的用戶體驗:就是它更聰明、能幹、懂你,以及能更好地提供陪伴。換言之,相比過去“有用”的 AI 助手,現在的小度更“有靈魂”、更像真人了。

“就好比以前的小度負責保質保量地完成任務,現在的小度還會預測用戶的意圖、主動發起追問,不會把天聊死了。”李瑩告訴36氪。不像以前只能一對一的指令式問答,而是更自然的多輪對話,是用戶可以從“換腦”後的小度身上,得到的最爲直觀的感受。

小度的“聰明”還體現在中國人講求的“耳聰目明”,即多模態的感知技術的增強。一個典型的功能是繪畫導師,即使沒有專業的繪畫功底的用戶也不用擔心,只要在屏幕上簡單地勾出輪廓,小度就能直接將簡筆畫“精裝”,生成精緻的繪畫作品。用戶還可以通過簡單的文字描述,來生成一個屬於自己的故事繪本。

更“像真人”還體現在小度對用戶的個性化記憶能力。比如用戶對小度說過,對小龍蝦過敏,那麼當小度爲用戶推薦宵夜的時候,會特別提醒“別吃小龍蝦,會過敏”。這種能力有賴於小度的個性化長短記憶的存儲、提取、理解能力的提升,讓小度接得住用戶的每一次“考古提問”。

另一個有趣的體驗,則是小度不僅有了“臉”,還長出了“軀幹”。基於大模型驅動的數字人技術,小度可以在屏幕上生成個性化的數字人形象。無論是作爲孩子的可愛夥伴,還是老人們的陪聊對象,通過小度的屏幕,都成了可被感知的真切存在。在今年的春節期間,小度上線了家庭AI年寵——“度龍龍”。它知道很多年俗知識文化,可愛的樣子深受小朋友們喜愛,小朋友們的聊天對話的次數和時長,明顯增加,在陪聊的同時,長了知識,可謂是寓教於樂。

而在不那麼明顯的地方,DuerOS X也下足了功夫。“小度現在不是一個‘人’在爲你服務,而是背後站了一羣‘人’。 ”李瑩表示。百度2023年9月推出的文心智能體(Agent)平臺,匯聚了2000多個功能各異的AI Agent,如醫生、老師、律師、國學大師、星座達人、健身教練等等智能體。接入文心智能體生態,意味着小度可以根據不同人羣多樣化的需求,調度最合適的Agent來完成任務。比如它可以是用戶的AI健身顧問,大到提供健身規劃,小到問一下這個水果多少熱量、是否適合減肥期間食用。

所謂的“AI原生”,也體現在DuerOS X背靠的,是百度的AI應用生態。這就意味着,小度的“新腦”將會持續地迭代,能力的邊界也將不斷擴展。

在過去,軟硬件適配是個成本高昂的重工程,比如,而基於DuerOS的開發,因爲大模型變得更簡單了,AI可以省去重複適配流程,無縫植入到各種智能硬件中,內容生態也可以通過Agent的接入輕鬆適配——未來,小度的“大腦”,將擁有更繁榮的應用、內容和服務生態。

“‘換腦’沒有終點,這必然是個繼續演進的過程。”李瑩表示,“質變已經完成了,接下來就是根據用戶反饋持續打磨。而新的“大腦”會根據用戶返回數據越多變得效果越好,越聰明!”

2022年底,一名小度用戶突然收到了一條來自百度的短信:“緊急!您的家人正在用‘小度急救助手’求救!”

通過小度App的遠程視頻功能,這名用戶發現,自己的姥爺並沒有像往常一樣早起。他第一時間告知了離姥爺家最近的舅舅,最後成功救治了感染新冠和腦供血不足的姥爺。

這個故事爲李瑩帶來了很大的觸動。“我一直覺得AI能夠讓人們的生活和工作效率更高,讓人們的生活也更便捷。”李瑩告訴36氪,“我相信技術要從科學突破再往前邁一步,去驅動產品變革。”

小度CEO,這是這位在百度20年的老將的新身份。和小度一起站在AI風口的中心,她仍然懷揣着滿腔熱忱:“之前我主要聚焦在互聯網軟件領域,現在,我要去進一步探索軟硬一體化的產品,包括它的設計理念、產品邏輯,以及智能硬件消費品的玩法等等,都爲我打開了新的興趣領域。”

角色是新的,但“技術驅動產品變革”的樸素實用主義,在李瑩身上一直沒有變過。2018年,李瑩正式從研發的後臺走到了產品的前臺,擔任百度地圖事業部總經理。兩年後,李瑩被任命爲百度集團首席信息官,着手發展AI時代的智能工作平臺“如流”。

百度地圖解決的是出行效率,百度如流提高的則是人們的工作效率,在李瑩看來,這些業務本質上都是用技術驅動產品變革,用AI的能力,讓產品服務於用戶。她告訴36氪:“從這個角度而言,小度和我過去做的事情是一脈相承的。”

後來,2023年10月,當李瑩接任小度CEO時,她表達了自己的期待:“AI是⼩度的基因和底⾊,它不是⼀個單純的硬件消費品,這是它與其他‘賣貨’公司最⼤的不同。⼩度本質上是AI的應⽤載體,⼤模型爲⼩度帶來千載難逢的機遇。”

理念一脈相承,但AI新時代的硬仗還是要打。在新一輪的大模型技術浪潮中,李瑩和小度得出的答案是:讓小度成爲無處不在的AI夥伴。

DuerOS X這顆新“大腦”,已經生長出了添添AI平板機器人,還在接入小度智能音箱和智能屏、添添閨蜜機、小度健身鏡、智能學習平板、小度全屋智能,成爲用戶的AI閨蜜、AI教練、AI家教、AI管家,以及角色更百變的AI夥伴。

“⼩度的產品定位從誕⽣起就沒有變,我們的願景始終是讓AI 助⼿⾛進千家萬戶,現在⼤模型技術讓這個願景更近了。”李瑩總結。