數學推理能力超o1,kimi的數學推理模型它要來了!
作者|子川
來源|AI先鋒官
kimi的最新模型,它要來了!
在11月16號下午,也是Kimi面向全社會開放服務一週年之際,kimi宣佈推出它們新一代數學推理模型 k0-math。
此次數學推理模型k0-math直接對標 OpenAI o1的 o1-mini 和 o1-preview 。
在中考、高考、考研以及包含入門競賽題的 MATH 等 4 個數學基準測試中,k0-math 初代模型取得的成績已經完全超越 o1-mini 和 o1-preview 模型。具體數據如下圖所示:
同時在兩個難度更大的競賽級別的數學題庫OMNI-MATH 和 AIME 基準測試中, k0-math 初代模型的成績分別達到了o1-mini 最高成績的 90% 和 83%
k0-math在解數學題上會和目前市面上的模型有稍不同。不僅思考時間會更長,同時解題過程中會列出多種解題方法,最後反覆驗證,纔會給出準確答案。
就像這樣式的。
就連簡單的1+1,它也會給出好幾個解題過程,最後纔會給出答案“1+1=2”。
同時k0-math 模型 還不能解答 LaTeX 格式難以描述的幾何圖形類問題。
大家會喜歡這樣準確性更高同時解題時間更長的交互嗎?
除了發佈 k0-math以外,Kimi 探索版也將上線更多具有推理能力的功能。
意圖增強:將抽象的問題和模糊的概念具體化,去理解用戶的真實需求。比如用戶提問“某產品的用戶忠實度”,Kimi 會把“用戶忠誠度”這個模糊的問題轉發爲具體的“活躍度、留存率、使用頻率和時長”等維度分析用戶的忠實度。
信源分析:在搜索回答來源時,先會進行一輪篩選,篩選出更具權威性和可靠的信息源,並且可以在答案中一鍵定位信源具體的出處。
鏈式思考:基於 COT 思維鏈處理能力,對問題進行逐步的鏈式拆解。
比如:當營銷人員在選擇廣告平臺時,想要了解“有哪些社交媒體廣告平臺,哪個最有效”。
Kimi會首先拆解這個問題,列出主要的社交媒體廣告平臺,然後分別搜索每個平臺的優勢、用戶羣體和適用場景,最後分析整合這些高質量的信息,推薦一個最適合不同需求的廣告平臺及其理由。
k0-math模型和更強的Kimi探索版,未來幾周就將分批陸續上線Kimi網頁版和Kimi智能助手APP,大家可以淺淺期待一下。
掃碼邀請進羣,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。
往期文章回顧