OpenAI釋出語音助理 擴大使用

OpenAI在舊金山舉辦第二屆開發者大會「DevDay」。(路透)

OpenAI於1日舉辦開發者大會,專注於展示應用程式介面(API)新功能,包含將把旗下語音助理開放給企業和開發人員,整合到各自的App中,爲人工智慧(AI)系統擬真語音對話應用在各種工作奠下根基。

OpenAI在舊金山舉辦第二屆開發者大會「DevDay」,公司前一週才經歷技術長穆拉提離職的一連串人事動盪,還有公司轉型爲營利企業的爭議,今年活動顯得格外低調。

OpenAI在會中針對開發者宣佈四項可以降低成本、並讓AI應用可以更加普及的功能,分別是增加指令快取(prompt caching)功能減少成本與延遲、讓開發者可以微調圖像模型(vision fine-tuning)、提供模型提煉(model distillation)、開放即時API(Realtime API)導入即時對話服務。

其中備受關注的是即時API功能,讓開發者打造多模態(語音、文字、圖像)、更低延遲的對話應用,並且更輕鬆地將進階語音功能整合到應用程式中。例如,讓AI代理人打電話訂購巧克力。

還有讓AI更易於使用的模型提煉,被視爲一項變革。開發人員可以使用OpenAI大型模型來「訓練」更小的模型,以此創造出針對特定需求的客製化版本,同時運行速度更快,成本更低。舉例來說,醫療照護新創公司可利用這項功能,開發能在一般硬體設備上執行的AI診斷工具,讓資源有限的環境更容易獲得AI解決方案。

OpenAI認爲,隨着包括Google和蘋果公司在內的科技集團競相將所謂的AI代理人帶給消費者,AI助理將在2025年「成爲主流」。

現場示範的聲音並未自稱爲AI語音助理,這種未表明自己是AI身分的做法,可能會引發一些用戶以及隱私及數位權利維權者的疑慮。OpenAI在示範後表示,不會強制要求開發者以任何特定方式告知用戶他們正在和AI互動。但OpenAI指出,他們規定開發者一般必須告知用戶何時使用AI。