微調 GPT-4o AI 模型新維度,OpenAI 開放圖片視覺微調功能

IT之家 10 月 2 日消息,OpenAI 公司昨日(10 月 1 日)發佈博文,宣佈爲 GPT-4o 模型引入視覺微調(vision fine-tuning)功能,除了文本之外還支持微調圖像。

OpenAI 表示自開放微調 GPT-4o 以來,數十萬開發者使用數據集(僅文本)微調了該模型,從而提高了駕馭某些特定任務的能力。

OpenAI 在博文中展示了一些合作伙伴的微調案例:

Garb :通過視覺微調,提升了交通標誌定位準確性 20% 和限速標誌定位 13%。

Automat:成功率從 16.60% 提升至 61.67%,並在信息提取任務中 F1 分數提升 7%。

Coframe:通過微調提升了網站生成的一致性和佈局正確性 26%。

OpenAI 宣佈項所有付費用戶開放視覺微調功能。

在 2024 年 10 月 31 日之前,每天免費提供 100 萬訓練 token,用於針對 GPT-4o 模型進行圖片微調。

2024 年 10 月 31 日之後,GPT-4o 微調訓練收費,每 100 萬訓練 token收費25 美元(IT之家備註:當前約 176 元人民幣)

推理每 100 萬 token 輸入收費 3.75 美元(當前約 26.3 元人民幣)

推理每 100 萬 token 輸出收費 15 美元(當前約 105 元人民幣)。