☰

OpenAI釋出語音助理擴大使用

OpenAI在舊金山舉辦第二屆開發者大會「DevDay」。（路透）

OpenAI於1日舉辦開發者大會，專注於展示應用程式介面（API）新功能，包含將把旗下語音助理開放給企業和開發人員，整合到各自的App中，爲人工智慧（AI）系統擬真語音對話應用在各種工作奠下根基。

OpenAI在舊金山舉辦第二屆開發者大會「DevDay」，公司前一週才經歷技術長穆拉提離職的一連串人事動盪，還有公司轉型爲營利企業的爭議，今年活動顯得格外低調。

OpenAI在會中針對開發者宣佈四項可以降低成本、並讓AI應用可以更加普及的功能，分別是增加指令快取（prompt caching）功能減少成本與延遲、讓開發者可以微調圖像模型（vision fine-tuning）、提供模型提煉（model distillation）、開放即時API（Realtime API）導入即時對話服務。

其中備受關注的是即時API功能，讓開發者打造多模態（語音、文字、圖像）、更低延遲的對話應用，並且更輕鬆地將進階語音功能整合到應用程式中。例如，讓AI代理人打電話訂購巧克力。

還有讓AI更易於使用的模型提煉，被視爲一項變革。開發人員可以使用OpenAI大型模型來「訓練」更小的模型，以此創造出針對特定需求的客製化版本，同時運行速度更快，成本更低。舉例來說，醫療照護新創公司可利用這項功能，開發能在一般硬體設備上執行的AI診斷工具，讓資源有限的環境更容易獲得AI解決方案。

OpenAI認爲，隨着包括Google和蘋果公司在內的科技集團競相將所謂的AI代理人帶給消費者，AI助理將在2025年「成爲主流」。

現場示範的聲音並未自稱爲AI語音助理，這種未表明自己是AI身分的做法，可能會引發一些用戶以及隱私及數位權利維權者的疑慮。OpenAI在示範後表示，不會強制要求開發者以任何特定方式告知用戶他們正在和AI互動。但OpenAI指出，他們規定開發者一般必須告知用戶何時使用AI。

OpenAI釋出語音助理 擴大使用

相關資訊

OpenAI釋出語音助理擴大使用