☰

微調 GPT-4o AI 模型新維度，OpenAI 開放圖片視覺微調功能

IT之家 10 月 2 日消息，OpenAI 公司昨日（10 月 1 日）發佈博文，宣佈爲 GPT-4o 模型引入視覺微調（vision fine-tuning）功能，除了文本之外還支持微調圖像。

OpenAI 表示自開放微調 GPT-4o 以來，數十萬開發者使用數據集（僅文本）微調了該模型，從而提高了駕馭某些特定任務的能力。

OpenAI 在博文中展示了一些合作伙伴的微調案例：

Garb ：通過視覺微調，提升了交通標誌定位準確性 20% 和限速標誌定位 13%。

Automat：成功率從 16.60% 提升至 61.67%，並在信息提取任務中 F1 分數提升 7%。

Coframe：通過微調提升了網站生成的一致性和佈局正確性 26%。

OpenAI 宣佈項所有付費用戶開放視覺微調功能。

在 2024 年 10 月 31 日之前，每天免費提供 100 萬訓練 token，用於針對 GPT-4o 模型進行圖片微調。

2024 年 10 月 31 日之後，GPT-4o 微調訓練收費，每 100 萬訓練 token收費25 美元（IT之家備註：當前約 176 元人民幣）

推理每 100 萬 token 輸入收費 3.75 美元（當前約 26.3 元人民幣）

推理每 100 萬 token 輸出收費 15 美元（當前約 105 元人民幣）。

相關資訊