國外遊戲作家:嚇死了,谷歌NotebookLM的假AI播客正在評論我的書!
新智元報道
編輯:Aeneas
【新智元導讀】谷歌NotebookLM的文字生播客功能,簡直太驚豔了。一位掃雷遊戲作家聽到自己的書變成的播客後,反應是又驚又喜。想象一下那些沒人做成播客的心頭好冷門書,小編有了一個大膽的想法……
谷歌的NotebookLM功能,能迅速把文字生成播客,一經推出就引起了強烈反響。
而就在最近,一位遊戲作家發現,自己出版的一本掃雷的書,竟然已經被NotebookLM生成了假的AI播客!
看到自己的書被濃縮成了兩個不存在的人之間的時長12分半的對話,作者Kyle Orland大呼:我被嚇到了!
當然,如果仔細聽,就會發現播客音頻中仍然存在不少問題,顯然它還無法取代專業播客。
但即便如此,Orland仍然感慨道:播客這樣的格式,是我們接受複雜信息的一種更吸引人、更有趣的方式。
比起基於文本的聊天機器人給我們的枯燥的回覆,它顯然爲生成式AI指明一個更有魅力的未來。
谷歌NotebookLM
谷歌的NotebookLM,是一年多前推出的。
根據谷歌介紹,它的功能是「作爲虛擬研究助理,基於您選擇來源總結事實、解釋複雜的想法,並且爲新的聯繫集思廣益」。
不過就在上週,谷歌添加了「音頻概述」的功能。
一下子,NotebookLM就有了新的賣點:一篇冷冰冰的文檔,可以變成引人入勝的音頻了!
不過有趣的是,谷歌在任何地方都沒有使用「播客」這個詞,而是表示這個功能可以幫你「總結材料,在主題之間建立聯繫,甚至開一些戲謔的玩笑」。
沃頓商學院教授Ethan Mollick發帖的時候,給予了這個產品正確的叫法——「播客」。
Mollick教授將這個播客評爲「當前最好的AI演示」。
同時他也表示,這很令人不安。
當然,AI播客中,幻覺問題依然無法避免。
但Mollick教授表示,總結、提煉和處理多個大文檔的能力,能讓我們對AI進行事實覈查,這纔是它的最大價值所在。
受到Ethan Mollick的啓發,Orland決定把自己的這本書輸入NotebookLM。
他很期待,這本關於掃雷遊戲的大概30000字的書,如果變成虛擬播客,會是什麼樣子。
僅僅幾分鐘後,Orland就看到了文章開頭的畫面。
他身臨其境地體驗到,如果自己出現在NPR的「Pop Culture Happy Hour」節目,或者受邀出現在一個戲謔風的播客節目中,會是什麼樣子。
AI主持人開始瞎編了
Orland發現,NotebookLM的摘要,涵蓋了自己這本書的主要部分——
激發掃雷靈感的遊戲的史前史;20世紀90年代,專注於商業業務的微軟爲Windows Entertainment Pack展開的艱苦戰鬥;掃雷預裝在數百萬臺企業和政府計算機上而引發的道德恐慌;以及圍繞遊戲競爭場景的種種令人驚訝的作弊爭議。
總的來說,任何一個聽到這個播客的人,都可以大致瞭解我這本書的內容,就跟許多真實的播客一樣。
雖然在這篇假播客中,並沒有出現大面積的幻覺,但還是有一些地方在小細節上出了紕漏,或者直接給出文本中不支持的假設。
比如,例如,在討論掃雷遊戲的前身Mined-Out 時,AI播客說:「所以這就是那些方塊和旗幟開始發揮作用的地方......」
然而,Mined-Out並沒有這兩個功能,全是AI瞎編的。
顯然,如果我們需要使用NotebookLM的摘要播客去了解學術文章或新聞報道,如果出現類似的幻覺,或者漏掉書中一些關鍵部分,會很勸退。
不過,我們可以使用這種摘要獲得一些「克里夫筆記」式的東西,對於那些我們沒有時間或者沒有興趣完整閱讀的大部頭書,它還是很有吸引力的。
而且,跟閱讀「克里夫筆記」不同,這種簡潔的播客風格可以提供一種令人愉快的背景噪音,非常適合外出散步或辦事時聽。
AI,忽然溫情了起來
正是這種自然、詼諧的演示,讓NotebookLM 的新功能從其他能生成文本摘要的AI產品中脫穎而出。
Orland表示,這感覺就好像自己碰巧在咖啡館偷聽到兩個人在討論自己的書。
然而,這兩個人在現實中並不存在。
而且,他們對這本書表現出的讚揚態度,可能也是通過算法而設計好的。
開始,一位「播客主持人」將這本書描述爲來自「軟盤和撥號調制解調器之國」的故事。
如此有趣的表達,作者並沒有在書中使用過,AI的這種幽默讓他捧腹大笑。
接着這位主持人調侃着講出「比爾·蓋茨在微軟辦公室裡偷偷溜達」,暗示了作者在書中最喜歡的佚事。
隨後,這兩位假主持人以一種很自然的對話,探討了這樁佚事。
兩人「播客」格式的來回對話風格,也允許一些有趣但偏離本書要點的話題出現。
比如,當討論《掃雷》前作《Mined-Out》中的蠕蟲電影明星遇險少女時,這兩位AI主持人似乎有點心煩意亂。
然後,兩位「主持人」以一種隨意的方式提出了掃雷的改進版本,該版本是爲了解決微軟原版掃雷的問題而設計的。
兩人的對話形式中,呈現出了一種溫和、輕鬆的節奏,但呈現出的信息是很密集的。
而且,聽起來很自然的停頓和重複,也能幫助強調一些要點。
比如,主持人1談到「幾乎每臺計算機上都預裝了這款令人難以置信的上癮的益智遊戲」,另一個聲音就會回答,「在每臺計算機上?」
或者,某位主持人談到「我們發現最初的掃雷遊戲在生成隨機棋盤的方式上存在缺陷」,另一個聲音就會跳出來驚呼「一個缺陷!」
氣氛組的勁兒是給足了。
當然,兩位AI假人的對話還是有一些問題。
比如,兩個聲音似乎一直在「我讀過這本書」和「我對你分享的書中事實感到驚訝」這兩種感覺之間來回橫跳,這就很難讓人相信其中任何一個是真誠的。
而過於驚訝的反應,也會讓人因爲厭蠢而有點惱火。
另外,AI還會在錯誤的地方斷句,或者出現一些奇怪的笑聲。
儘管如此,它依然令Orland驚喜。
他舉例說,比如在某些時刻,它引出某些事的方式,微妙地迎合了他的作者自我意識,這讓他非常受用。
最後Orland總結道,在聽完NotebookLM的總結後,自己會想象到這不久的將來,這些假播客將成爲自己的「正餐」。
尤其是那些那些不太容易引起真人播主興趣的專業書籍或主題。
通過將生成式AI文本重新包裝成「兩個人聊天」的模式,谷歌爲有時似乎非人性化的技術,換上了一層和藹可親的面孔。
參考資料:
https://arstechnica.com/ai/2024/09/fake-ai-podcasters-are-reviewing-my-book-and-its-freaking-me-out/