☰

數學推理能力超o1，kimi的數學推理模型它要來了！

作者｜子川

來源｜AI先鋒官

kimi的最新模型，它要來了！

在11月16號下午，也是Kimi面向全社會開放服務一週年之際，kimi宣佈推出它們新一代數學推理模型 k0-math。

此次數學推理模型k0-math直接對標 OpenAI o1的 o1-mini 和 o1-preview 。

在中考、高考、考研以及包含入門競賽題的 MATH 等 4 個數學基準測試中，k0-math 初代模型取得的成績已經完全超越 o1-mini 和 o1-preview 模型。具體數據如下圖所示：

同時在兩個難度更大的競賽級別的數學題庫OMNI-MATH 和 AIME 基準測試中， k0-math 初代模型的成績分別達到了o1-mini 最高成績的 90% 和 83%

k0-math在解數學題上會和目前市面上的模型有稍不同。不僅思考時間會更長，同時解題過程中會列出多種解題方法，最後反覆驗證，纔會給出準確答案。

就像這樣式的。

就連簡單的1+1，它也會給出好幾個解題過程，最後纔會給出答案“1+1=2”。

同時k0-math 模型還不能解答 LaTeX 格式難以描述的幾何圖形類問題。

大家會喜歡這樣準確性更高同時解題時間更長的交互嗎？

除了發佈 k0-math以外，Kimi 探索版也將上線更多具有推理能力的功能。

意圖增強：將抽象的問題和模糊的概念具體化，去理解用戶的真實需求。比如用戶提問“某產品的用戶忠實度”，Kimi 會把“用戶忠誠度”這個模糊的問題轉發爲具體的“活躍度、留存率、使用頻率和時長”等維度分析用戶的忠實度。

信源分析：在搜索回答來源時，先會進行一輪篩選，篩選出更具權威性和可靠的信息源，並且可以在答案中一鍵定位信源具體的出處。

鏈式思考：基於 COT 思維鏈處理能力，對問題進行逐步的鏈式拆解。

比如：當營銷人員在選擇廣告平臺時，想要了解“有哪些社交媒體廣告平臺，哪個最有效”。

Kimi會首先拆解這個問題，列出主要的社交媒體廣告平臺，然後分別搜索每個平臺的優勢、用戶羣體和適用場景，最後分析整合這些高質量的信息，推薦一個最適合不同需求的廣告平臺及其理由。

k0-math模型和更強的Kimi探索版，未來幾周就將分批陸續上線Kimi網頁版和Kimi智能助手APP，大家可以淺淺期待一下。

掃碼邀請進羣，我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型，順便學一些AI搞錢技能。

往期文章回顧

相關資訊