OpenAI canvas一夜封神!超強AI編碼研究神器,ChatGPT再次顛覆人機交互
新智元報道
編輯:桃子 喬楊
【新智元導讀】ChatGPT橫空出世以來,首次迎來界面史詩級升級!全新canvas界面,開啓了人類與AI協作研究、編碼的新時代,更代表着終極AGI人機交互形態。
時隔兩年,ChatGPT終迎來界面全新升級!
這一次,OpenAI官宣推出canvas。它不再是簡單的對話框,而是能與ChatGPT「並肩作戰」的全新界面。
不論是寫作,還是編碼,都可以開啓全新的合作方式。
canvas基於GPT-4o構建,目前仍在測試階段,可在所有模型中手動選擇。
而且所有Plus用戶不用等待,直接可用。未來,OpenAI還計劃向所有免費用戶全面推出。
canvas不僅可以讓你與ChatGPT一起做研究,還能寫代碼、郵件等等,最重要的是還能幫你一起腦洞。
有趣的是,canvas還可以添加emoji。奧特曼在線發起投票,看看有多少人喜歡這個功能。
另外,canvas面板中,還多了一個快捷菜單,讓協作更加輕易便捷了。
審查代碼、修改bug、添加評論、log等等,一鍵完成。
在Canvas界面助力下,GPT-4o編碼性能飛躍18%!
這是要紛紛取代了GitHub Copilot、Cursor編碼神器了。網友們驚歎道,OpenAI絕殺了Cursor。
還有人說,canvas的推出,是OpenAI對最大勁敵Anthorpic的Claude artifacts最大的回擊。
在經歷如此巨大人事變動同時,OpenAI近日多次發佈更新,是向外界、投資者給出了我們依舊有實力的反饋。
話不多說,看看歷經兩年,ChatGPT究竟帶了怎樣劃時代的鉅變。
肝代碼研究,原來這麼輕鬆
canvas項目負責人Karina Nguyen表示,我對終極AGI界面的願景,是一張空白的畫布。
隨着時間的推移,它會根據人類偏好,自我改進。
而且,它會創造與人類互動的新方式,重新定義人類與AI,以及整個互聯網的聯繫。
canvas便是,這樣一種終極AGI界面的完美「代言人」。
那麼,它究竟如何幫人類研究、寫代碼、創作呢?
接下來,讓我們一睹爲快。
做研究
當你需要完成一項藝術史研究報告,在canvas便可以完成研究。
首先,將你的需求告訴ChatGPT,它便開始搜索一切所有相關的報道——Rembrandt的自畫像技巧。
隨之,canvas在屏幕右側開啓了全新界面,一篇研究報告,正在速成。
當你對其中生成的一句話,不太確定是否正確。只需要選中,然後即刻就能喚醒ChatGPT,隨地取問。
又或者,當你想要更改文中的小標題,不如讓ChatGPT給點建議。
最驚豔的是,右下角「鉛筆」樣子的圖表,可以開啓文獻的閱讀模式,可以一句一句地瀏覽。
最後,你可以讓ChatGPT爲你添加參考文獻、書目引用。
寫郵件
你還可以讓ChatGPT搜索一家最好的餐廳,它會幫你彙總所有在SF城市米其林餐廳。
然後讓它在爲你寫一封郵件,發給最好的朋友。
寫代碼
另外,你還可以在canvas界面中,完成代碼的生成,還是可以編輯的那種。
以往ChatGPT只是給出結果,並不能一同編輯。
讓ChatGPT用Rust寫一API網絡服務器,它便同以往一般,爲你生成了代碼。
然後,要求對其中一段代碼,添加登錄註冊路由。
並且,你還可以自己改寫其中的內容。
在界面右下角,還有一個工具欄,可以進行代碼審查、轉換語言、修改bug、添加log、還有添加評論功能。
比如,針對剛剛生成代碼進行審查,以及修復bug,ChatGPT瞬間就完成了。
發明新食譜
更驚豔的是,在canvas模式下,還可以創造發明新的idea。
比如,你想做一個不一樣的蘋果派,可以讓ChatGPT搜索總結出,最通用的蘋果派的食譜。
假設你沒有其中一種材料——Nutmeg(肉豆蔻),然後你們可以一同創作全新的做法。
與ChatGPT並肩作戰
目前,ChatGPT已常被用於協助寫作和編碼方面的任務。
儘管聊天界面易於使用並且適用於許多任務,但對於需要編輯和修訂的項目,仍然有些不便。
canvas的推出,正是要爲這類工作提供新的界面,而且能讓ChatGPT更好地理解用戶提供的任務上下文。
當ChatGPT檢測到可能有幫助的場景時,canvas會自動打開,也可以直接在提示詞中包含「使用canvas」的字樣來處理現有項目。
對於寫作任務,快捷編輯欄中包含5種選項,從下至上依次爲:
- 建議編輯:ChatGPT爲指定內容提供內聯建議和反饋
- 調整長度:將文字內容編輯得更短或更長
- 更改閱讀級別:調整文字的閱讀難度,從幼兒園到研究生院
- 最後潤色:檢查語法、清晰度和一致性
- 添加表情符號:爲強調或有顏色標記的內容添加相關emoji符號
比如,可以高亮特定部分來引起ChatGPT的關注,並讓模型在考慮整個項目的同時,提供內聯反饋和建議。
奧特曼還發起了在線投票,「添加emoji是不是OpenAI有史以來發布的最好功能?」
對於編碼任務,快捷鍵又和寫作不同:
快捷鍵從下至上依次爲:
- 檢查代碼:ChatGPT提供內聯建議以改進代碼
- 添加日誌(logs):插入print語句以幫助調試和理解代碼
- 添加註釋:爲代碼添加註釋
- 修復bug:檢測並重寫有問題的代碼以解決bug
- 移植到一種語言:將您的代碼轉換爲JavaScript、TypeScript、Python、Java、C++或PHP
「點到哪裡改哪裡」,修改代碼也將和修改文字一樣直觀簡單。
爲什麼要更新用戶界面?
OpenAI在博客中表示,如果要讓人工智能變得更有用、更易用,就需要重新思考我們如何與它互動。而canvas,就是一種全新的方法,未來還將經歷快速迭代。
終極AGI界面canvas,GPT-4o也被優化了
爲了讓模型更適應canvas模式,團隊也對GPT-4o進行了必要的修法,添加了一些核心行爲:
- 觸發canvas的打開,進行書寫和編碼
- 生成多樣化的內容類型
- 進行有針對性的編輯
- 重寫文檔
- 提供內聯形式的修改意見
值得一提的是,對GPT-4o進行的這些訓練採用了OpenAI的合成數據生成技術,包含了從o1模型中提取的輸出。
此外,團隊還使用了20多項自動內部評估來衡量進展情況。
首先,一個關鍵的挑戰是定義何時觸發canvas。模型既需要靈敏識別有檢查、修改需求的任務,比如「寫一篇關於咖啡豆歷史的博客文章」,同時也要避免過度觸發,比如「幫我做一份新的晚餐食譜」這種一般的任務就不太需要canvas。
與帶有提示指令的基線模型相比,調整後的GPT-4o的觸發決策正確率分別達到了83%和94%
第二個挑戰涉及在canvas被觸發後調整模型的編輯行爲,特別是決定何時進行有針對性的編輯而不是重寫整個內容。
這就要訓練模型,在用戶明確選擇文本時,更傾向於執行有針對性的編輯而非重寫。隨着模型不斷完善,這種行爲的能力也在不斷髮展。
相比基線模型,帶有canvas的GPT-4o在寫作和編碼任務上有18%的性能提升
最後,訓練模型以生成高質量的代碼註釋同樣需要細緻的迭代過程。
這個評估任務與前兩種情況不同。canvas是否觸發以及是否進行了有針對性的編輯行爲,很容易進行自動化評估,但以自動化方式衡量代碼註釋的質量,因此團隊選擇了人工評估。
相比基線模型,集成canvas後的GPT-4o在註釋準確性方面有30%的提升,質量提高了16%。
這表明,與帶有詳細指令的零樣本提示相比,合成數據的訓練顯著提高了模型的響應質量和行爲。
網友玩瘋了
canvas一經發布,已在全網掀起熱議。
Every初創公司創始人表示,很明顯,OpenAI不僅僅是在構建聊天機器人,他們還試圖爲AI時代構建一種全新的操作系。
一名開發者表示,canvas界面是遊戲改變者。
他剛剛通過canvas和ThreeJS一起創建了一個tesseract/Hypercube可視化工具,並稱自己喜歡統一的UX聊天、在線評論和觀看GPT-4o在代碼上發揮其魔力,所有這些都在一個地方完成完成,永不過時。
還有網友表示,canvas界面做的非常好,而且一切都是實時流暢的。
不過,它讓我們意識到一個重要的問題,我們還不確定與AI協作寫作的最佳方式是什麼。
話雖如此,canvas讓工作更加集成集成(cyborglike),而不是簡單地輪流進行任務(centaurlike)。
還有人紛紛悼念Cursor。
核心貢獻團隊
canvas背後核心團隊也隨之全部公佈。
研究主管是Karina Nguyen,還有3位核心研究人員Kai Chen, Michael Wu, Tarun Gogineni,12位核心工程/產品/設計師。
值得一提的是,提供支持技術領導人當中,還有離職的CTO Mira Murati。
Karina Nguyen
在加入OpenAI之前,Karina Nguyen曾在Anthropic任職,專注研究模型對齊能力和誠實研究,以減少LLM的幻覺。
值得一提的是,她曾領到了Claude Instant 1.2訓練,在API中製作了該模型。
此前,作爲一名設計工程師,Nguyen與Primer.ai、Dropbox、Square和《紐約時報》的團隊在研發原型、新聞工具和產品功能方面進行了合作。
Kai Chen
Kai Chen在賓夕法尼亞大學獲得了計算機科學本科學士學位。
她於2023年初加入OpenAI,此前Kai Chen還聯合創辦了兩家公司,一個是AI助手領域的Dispatch、還有一家自動化勞動任務項目的Port Tecjnologies。
Michael Wu
Michael Wu目前是OpenAI的應用研究員。
此前,他曾以應用研究科學家身份,在Facebook工作了三年,任職期間訓練了自然語言理解和深度學習模型。
此外,他還在Primer AI擔任機器學習工程師、Dropbox擔任軟件工程師,在Naver Corp擔任機器學習實習生,在蘋果公司擔任機器學習實習生。
2015年,Michael Wu在麻省理工學院獲得了計算機科學和數學學士學位。
參考資料:
https://openai.com/index/introducing-canvas/
https://x.com/karinanguyen_/status/1841889811931791642