☰

OpenAI canvas一夜封神！超強AI編碼研究神器，ChatGPT再次顛覆人機交互

新智元報道

編輯：桃子喬楊

【新智元導讀】ChatGPT橫空出世以來，首次迎來界面史詩級升級！全新canvas界面，開啓了人類與AI協作研究、編碼的新時代，更代表着終極AGI人機交互形態。

時隔兩年，ChatGPT終迎來界面全新升級！

這一次，OpenAI官宣推出canvas。它不再是簡單的對話框，而是能與ChatGPT「並肩作戰」的全新界面。

不論是寫作，還是編碼，都可以開啓全新的合作方式。

canvas基於GPT-4o構建，目前仍在測試階段，可在所有模型中手動選擇。

而且所有Plus用戶不用等待，直接可用。未來，OpenAI還計劃向所有免費用戶全面推出。

canvas不僅可以讓你與ChatGPT一起做研究，還能寫代碼、郵件等等，最重要的是還能幫你一起腦洞。

有趣的是，canvas還可以添加emoji。奧特曼在線發起投票，看看有多少人喜歡這個功能。

另外，canvas面板中，還多了一個快捷菜單，讓協作更加輕易便捷了。

審查代碼、修改bug、添加評論、log等等，一鍵完成。

在Canvas界面助力下，GPT-4o編碼性能飛躍18%！

這是要紛紛取代了GitHub Copilot、Cursor編碼神器了。網友們驚歎道，OpenAI絕殺了Cursor。

還有人說，canvas的推出，是OpenAI對最大勁敵Anthorpic的Claude artifacts最大的回擊。

在經歷如此巨大人事變動同時，OpenAI近日多次發佈更新，是向外界、投資者給出了我們依舊有實力的反饋。

話不多說，看看歷經兩年，ChatGPT究竟帶了怎樣劃時代的鉅變。

肝代碼研究，原來這麼輕鬆

canvas項目負責人Karina Nguyen表示，我對終極AGI界面的願景，是一張空白的畫布。

隨着時間的推移，它會根據人類偏好，自我改進。

而且，它會創造與人類互動的新方式，重新定義人類與AI，以及整個互聯網的聯繫。

canvas便是，這樣一種終極AGI界面的完美「代言人」。

那麼，它究竟如何幫人類研究、寫代碼、創作呢？

接下來，讓我們一睹爲快。

做研究

當你需要完成一項藝術史研究報告，在canvas便可以完成研究。

首先，將你的需求告訴ChatGPT，它便開始搜索一切所有相關的報道——Rembrandt的自畫像技巧。

隨之，canvas在屏幕右側開啓了全新界面，一篇研究報告，正在速成。

當你對其中生成的一句話，不太確定是否正確。只需要選中，然後即刻就能喚醒ChatGPT，隨地取問。

又或者，當你想要更改文中的小標題，不如讓ChatGPT給點建議。

最驚豔的是，右下角「鉛筆」樣子的圖表，可以開啓文獻的閱讀模式，可以一句一句地瀏覽。

最後，你可以讓ChatGPT爲你添加參考文獻、書目引用。

寫郵件

你還可以讓ChatGPT搜索一家最好的餐廳，它會幫你彙總所有在SF城市米其林餐廳。

然後讓它在爲你寫一封郵件，發給最好的朋友。

寫代碼

另外，你還可以在canvas界面中，完成代碼的生成，還是可以編輯的那種。

以往ChatGPT只是給出結果，並不能一同編輯。

讓ChatGPT用Rust寫一API網絡服務器，它便同以往一般，爲你生成了代碼。

然後，要求對其中一段代碼，添加登錄註冊路由。

並且，你還可以自己改寫其中的內容。

在界面右下角，還有一個工具欄，可以進行代碼審查、轉換語言、修改bug、添加log、還有添加評論功能。

比如，針對剛剛生成代碼進行審查，以及修復bug，ChatGPT瞬間就完成了。

發明新食譜

更驚豔的是，在canvas模式下，還可以創造發明新的idea。

比如，你想做一個不一樣的蘋果派，可以讓ChatGPT搜索總結出，最通用的蘋果派的食譜。

假設你沒有其中一種材料——Nutmeg（肉豆蔻），然後你們可以一同創作全新的做法。

與ChatGPT並肩作戰

目前，ChatGPT已常被用於協助寫作和編碼方面的任務。

儘管聊天界面易於使用並且適用於許多任務，但對於需要編輯和修訂的項目，仍然有些不便。

canvas的推出，正是要爲這類工作提供新的界面，而且能讓ChatGPT更好地理解用戶提供的任務上下文。

當ChatGPT檢測到可能有幫助的場景時，canvas會自動打開，也可以直接在提示詞中包含「使用canvas」的字樣來處理現有項目。

對於寫作任務，快捷編輯欄中包含5種選項，從下至上依次爲：

- 建議編輯：ChatGPT爲指定內容提供內聯建議和反饋

- 調整長度：將文字內容編輯得更短或更長

- 更改閱讀級別：調整文字的閱讀難度，從幼兒園到研究生院

- 最後潤色：檢查語法、清晰度和一致性

- 添加表情符號：爲強調或有顏色標記的內容添加相關emoji符號

比如，可以高亮特定部分來引起ChatGPT的關注，並讓模型在考慮整個項目的同時，提供內聯反饋和建議。

奧特曼還發起了在線投票，「添加emoji是不是OpenAI有史以來發布的最好功能？」

對於編碼任務，快捷鍵又和寫作不同：

快捷鍵從下至上依次爲：

- 檢查代碼：ChatGPT提供內聯建議以改進代碼

- 添加日誌（logs）：插入print語句以幫助調試和理解代碼

- 添加註釋：爲代碼添加註釋

- 修復bug：檢測並重寫有問題的代碼以解決bug

- 移植到一種語言：將您的代碼轉換爲JavaScript、TypeScript、Python、Java、C++或PHP

「點到哪裡改哪裡」，修改代碼也將和修改文字一樣直觀簡單。

爲什麼要更新用戶界面？

OpenAI在博客中表示，如果要讓人工智能變得更有用、更易用，就需要重新思考我們如何與它互動。而canvas，就是一種全新的方法，未來還將經歷快速迭代。

終極AGI界面canvas，GPT-4o也被優化了

爲了讓模型更適應canvas模式，團隊也對GPT-4o進行了必要的修法，添加了一些核心行爲：

- 觸發canvas的打開，進行書寫和編碼

- 生成多樣化的內容類型

- 進行有針對性的編輯

- 重寫文檔

- 提供內聯形式的修改意見

值得一提的是，對GPT-4o進行的這些訓練採用了OpenAI的合成數據生成技術，包含了從o1模型中提取的輸出。

此外，團隊還使用了20多項自動內部評估來衡量進展情況。

首先，一個關鍵的挑戰是定義何時觸發canvas。模型既需要靈敏識別有檢查、修改需求的任務，比如「寫一篇關於咖啡豆歷史的博客文章」，同時也要避免過度觸發，比如「幫我做一份新的晚餐食譜」這種一般的任務就不太需要canvas。

與帶有提示指令的基線模型相比，調整後的GPT-4o的觸發決策正確率分別達到了83%和94%

第二個挑戰涉及在canvas被觸發後調整模型的編輯行爲，特別是決定何時進行有針對性的編輯而不是重寫整個內容。

這就要訓練模型，在用戶明確選擇文本時，更傾向於執行有針對性的編輯而非重寫。隨着模型不斷完善，這種行爲的能力也在不斷髮展。

相比基線模型，帶有canvas的GPT-4o在寫作和編碼任務上有18%的性能提升

最後，訓練模型以生成高質量的代碼註釋同樣需要細緻的迭代過程。

這個評估任務與前兩種情況不同。canvas是否觸發以及是否進行了有針對性的編輯行爲，很容易進行自動化評估，但以自動化方式衡量代碼註釋的質量，因此團隊選擇了人工評估。

相比基線模型，集成canvas後的GPT-4o在註釋準確性方面有30%的提升，質量提高了16%。

這表明，與帶有詳細指令的零樣本提示相比，合成數據的訓練顯著提高了模型的響應質量和行爲。

網友玩瘋了

canvas一經發布，已在全網掀起熱議。

Every初創公司創始人表示，很明顯，OpenAI不僅僅是在構建聊天機器人，他們還試圖爲AI時代構建一種全新的操作系。

一名開發者表示，canvas界面是遊戲改變者。

他剛剛通過canvas和ThreeJS一起創建了一個tesseract/Hypercube可視化工具，並稱自己喜歡統一的UX聊天、在線評論和觀看GPT-4o在代碼上發揮其魔力，所有這些都在一個地方完成完成，永不過時。

還有網友表示，canvas界面做的非常好，而且一切都是實時流暢的。

不過，它讓我們意識到一個重要的問題，我們還不確定與AI協作寫作的最佳方式是什麼。

話雖如此，canvas讓工作更加集成集成（cyborglike），而不是簡單地輪流進行任務（centaurlike）。

還有人紛紛悼念Cursor。

核心貢獻團隊

canvas背後核心團隊也隨之全部公佈。

研究主管是Karina Nguyen，還有3位核心研究人員Kai Chen, Michael Wu, Tarun Gogineni，12位核心工程/產品/設計師。

值得一提的是，提供支持技術領導人當中，還有離職的CTO Mira Murati。

Karina Nguyen

在加入OpenAI之前，Karina Nguyen曾在Anthropic任職，專注研究模型對齊能力和誠實研究，以減少LLM的幻覺。

值得一提的是，她曾領到了Claude Instant 1.2訓練，在API中製作了該模型。

此前，作爲一名設計工程師，Nguyen與Primer.ai、Dropbox、Square和《紐約時報》的團隊在研發原型、新聞工具和產品功能方面進行了合作。

Kai Chen

Kai Chen在賓夕法尼亞大學獲得了計算機科學本科學士學位。

她於2023年初加入OpenAI，此前Kai Chen還聯合創辦了兩家公司，一個是AI助手領域的Dispatch、還有一家自動化勞動任務項目的Port Tecjnologies。

Michael Wu

Michael Wu目前是OpenAI的應用研究員。

此前，他曾以應用研究科學家身份，在Facebook工作了三年，任職期間訓練了自然語言理解和深度學習模型。

此外，他還在Primer AI擔任機器學習工程師、Dropbox擔任軟件工程師，在Naver Corp擔任機器學習實習生，在蘋果公司擔任機器學習實習生。

2015年，Michael Wu在麻省理工學院獲得了計算機科學和數學學士學位。

參考資料：

https://openai.com/index/introducing-canvas/

https://x.com/karinanguyen_/status/1841889811931791642

OpenAI canvas一夜封神！超強AI編碼研究神器，ChatGPT再次顛覆人機交互

相關資訊