英偉達開源新模型,叫板 GPT-4 震撼發佈!
Nvidia(英偉達),它在人工智能行業中製造了一些 備受追捧的 GPU ,已宣佈 其發佈了一個開源大型語言模型,據報道,該模型的性能和 OpenAI 、Anthropic 、Meta 和 Google 等領先的專有模型相當。
該公司在 最近發佈的白皮書中 推出了其新的 NVLM 1.0 系列,並且它由參數爲 720 億的 NVLM-D-72B 模型引領。“我們推出 NVLM 1.0,這是一系列前沿的多模態大型語言模型,在視覺語言任務方面取得了最先進的成果,能夠與領先的專有模型(比如 GPT-4o)和開放訪問模型相媲美,”研究人員寫道。
據報道,新的模型系列據稱已能夠達成“生產級多模態”,在各類視覺和語言任務中的表現都很出色,並且與 NVLM 系列所基於的基礎 LLM 相較而言,其基於文本的響應也有所改進。“爲了實現這一目標,我們在多模態訓練中精心打造並整合了一個高質量的純文本數據集,同時還存在大量的多模態數學和推理數據,進而提升了跨模態的數學和編碼能力,”研究人員解釋說。
其結果是得到了一個大型語言模型,它不僅能輕鬆解釋一個梗有趣的原因,還能逐步解決複雜的數學方程。憑藉其多模態訓練方式,英偉達還成功地將該模型在常見行業基準中的純文本準確率平均提高了 4.3 個百分點。
Nvidia 似乎下定決心要確保該模型符合開源倡議的最新“開源”定義,不僅將其訓練權重公開以供公衆審查,還承諾在不久的將來發布該模型的源代碼。這與 OpenAI 和谷歌等競爭對手的做法大不相同,他們對其大型語言模型的權重和源代碼細節小心翼翼地加以保護。通過此舉,Nvidia 已把 NVLM 系列定位成不一定直接跟 ChatGPT-4o 和 Gemini 1.5 Pro 競爭,而是作爲第三方開發者構建自己的聊天機器人和人工智能應用程序的基礎。