AI大佬齊聚國際頂會KDD 2024,中國隊刷臉!大模型教育應用分析論文被錄用

新智元報道

編輯:編輯部

【新智元導讀】AI時代下,智適應教育成爲全新的範式。在剛剛結束的KDD 2024大會上,國內一家前沿教育企業登上這個國際舞臺,向所有人分享了真正個性化學習應該有的樣子。

進入開學季,一個詞兒也跟着爆火——「無痛學習」。

如今,AI已經以前所未見的速度,迅速融入大學生的學習和生活,越來越多人開始體會到,從「有痛學習」變成「無痛學習」是什麼感受。

AI改變的,僅僅是高校生嗎?當然不是。

最近一個新聞曝出,眼看着要開學,成都的一位小孩哥,用AI量產手抄報,瘋狂趕暑假作業。

無論你的態度是擁抱還是遲疑,無可否認的是,如今AI已經在深刻影響着教育領域。從小學生到大學生,無一能逃過這場大潮。

AI的特性,爲何能跟教育融合得如此恰當呢?

原因就在於,教育應該是千人千面的,但老師卻不可能無時無刻地關注到每一個學生,而AI,則完全打破了現實中的桎梏。

而且,得益於LLM、AIGC等前沿技術實現,傳統的自適應教育已經逐漸進化爲更加智能化的「智適應」學習。

在國外,一些代表性教育機構看準契機,紛紛在智適應教育中佈局。

比如,Duolingo Max採用了角色扮演技術,讓學生可以通過模擬情景與AI進行對話。

Khanmigo利用個性化LLM對話的形式平臺,通過不斷提問的方式,幫助學生構建知識,提供個性化教學,最終答疑解惑。

不會直接告訴學生答案,而是一步步引導

吳恩達的Coursera以開放式在線課程爲基礎,提供的是在線智適應學習課程和混合學習的模式。

顯而易見,智適應教育方式,正在成爲AI教育領域界的共識。

恰巧,在剛剛結束不久的ACM KDD 2024上,閉幕式的重磅圓桌討論環節,聚焦的正是GenAI+教育。

席間,聖母大學教授、AAAS/AAAI/ACM/IEEE Fellow Nitesh Chawla,明尼蘇達大學教授、IEEE Fellow George Karypis、松鼠Ai聯合創始人樑靜博士,美國東北大學教授、ACM/IEEE Fellow Ricardo Baeza-Yates四人,一起在臺上探討了生成式AI的未來方向,以及潛在的創新應用。

不僅如此,松鼠Ai研發團隊在KDD主會上,發表了一篇關於LLM,尤其是教育大模型,在時間序列分析中應用的論文。

他們還組織了Workshop,並在GenAI Day上發表了主題演講。

衆所周知,作爲全球數據挖掘領域歷史最悠久、規模最大的國際頂會,也是國內評級的A類學術會議,KDD每年都會吸引數千名來自世界各地的頂尖學者、企業代表參會。

而在這樣的國際頂會上,鮮有企業能夠參與到學術論壇的討論當中。可見,這次被大會邀請前來做客同時還在會上發佈論文的松鼠Ai,在AI教育領域是有真才實學的。

那麼問題來了,這些大佬,對當前AI發展是怎麼看的?

真正AI個性化學習,是什麼樣子

很多年前,AI還沒有像現在這麼流行,當時公司經受了許多懷疑——爲什麼要在教育中使用AI?能用它做什麼?

答案是,學生提供真正個性化的學習平臺和內容。

如今,所有人都在思考,如何用生成式AI來幫助我們。

如果只是想利用這些工具快速賺錢,在短時間內迅速成立公司的話,這種心態其實是非常危險的。

但如果我們能以智慧的方式利用這項技術,比如用它進行數據分析,幫助學生更好地學習,而非快速生成內容,則是一個很有意義的機會。

目前來說,我們正處於從一個階段向另一個階段的過渡中,走向了人與機器互動。

當我們開始通過語言和多模態能力進行互動,就已經開始進入機器人工業革命。

與之對比鮮明的是,我們纔剛剛從傳統教育中走出來。

即使我們已經擁有了AI技術,有了MOOC,有了在線教育和遠程學習,有了語音或語義識別,它仍然是傳統的學習方式。

因爲,它不是真正個性化的。

什麼是真正的個性化學習?很多人以爲在ChatGPT上輸入一個問題、得到答案就是個性化學習,其實並不然。

對此樑靜表示,關於個性化學習,大部分使用者甚至很多公司還都不真正瞭解,所以我們還需要很長的時間來展示什麼是真正的人性化學習、智適應教育技術,讓人們理解、體驗、犯錯、再體驗...。

而下一步,就將是AI、個性化學習與智適應、多模態、大模型能力的結合。

基於AI的「智適應教育」,不僅可以讓學生獲得更高的分數,還可以讓學生在相同的教學時間裡培養更多能力。

想象一下,在同樣空間中,不同年齡的學生們圍坐一週,而桌子中心沒有老師。

有時,需要共同完成小組作業;有時,需要合力開腦洞攻克難題。學生們僅通過互聯的設備,自主學習。

老師,變身成爲了助教、數據分析師、情感鼓勵及引導的育人的導師。

這,就是智適應大模型未來應該有的樣子,也是教育行業的未來。

生成式AI,在教育領域大放異彩

如今的K12教育中,存在着不少弊端,這已經成爲大多數人的共識。

而當我們進入技術大爆炸的新時代,學校和家長希望孩子接受的,無疑是更智能化、個性化的教育。

生成式AI,是否有可能在教育領域探索出更多創新的應用場景?

如果能做到這一點,未來的教育方式將徹底改變,給廣大學生和教育工作者帶來前所未有的價值。

恰巧,生成式AI的特點,和K12教育領域的應用場景是天然契合的。

教育LLM通用標準:個性化學習

那麼,在GenAI(生成式人工智能)賦能教育中,是否有個通用的衡量標準?而這個標準應該是什麼?

2022年,谷歌曾發佈的一份報告中,提到了未來教育的三大趨勢,其中之一便是「個性化學習」智適應。

報告地址:https://edu.google.com/future-of-education/

個性化學習,就是學生自主幹預學習,不能有外力干擾,這對於能力培養至關重要。

在這個過程中,他們會與同伴合作,也會向老師請教問題。

另一份來自2021年EY報告中,如同自動駕駛一樣,根據智能化程度高低,將教育分劃分爲L0-L5六個等級。

L0很好理解,是指傳統真人教學,完全沒有使用自動化工具。

L1典型代表是,直播課、錄播課。拍照搜題等輔助工具,代表着L2。

L3-L5,AI完全切入教學環節,將教學全流程數據打通,提供千人千面的教學體驗。

L5完全是由AI教學,意味着學生僅使用AI系統就能學習,不需要任何外部資源,其中典型代表是松鼠Ai。

來源:安永中國智適應學習行業白皮書

如何實現L5「完全智適應教育」

具體在K12領域,已經深耕了十年之久的松鼠Ai發現,生成式AI能夠通過分析學生的學習數據,動態地調整學習內容和難度。

這樣,就可以爲每個學生提供最合適的學習路徑。

因爲這種教學方式是基於數據驅動的,它不僅能提高學習效率,還能有效填補學生的知識空白,促進學生的全面發展。

那麼,生成式AI是如何增強學生的學習效果的?

以下例子,爲我們精準展示了它的強大。

- 知識點分解

真正的掌握學習技能,必然是能吃透體系中的每個知識點,做到融會貫通。

松鼠Ai恰恰能通過蘇格拉底式的引導性提問,激發學生主動思考,深化理解,打造出更爲高效、人性化的學習環境。

如何做到的?

這是因爲,基於松鼠Ai獨有的、所積累的2400萬學生的100億學習行爲全流程數據,大模型被「餵養」後,在推薦算法、深度知識追蹤等技術上都實現了突破式迭代。

由此,模型能更好地捕捉數據中的複雜關係和模式,更快速發現知識點和知識點之間,知識點和題目之間,題目和孩子能力之間的關係。

這樣,它就能更高效地繪製學生的學習畫像,提供針對性的個性化服務。

- 錯誤分析

松鼠Ai的新版多模態智適應大模型,引入了草稿紙內容智能分析功能。

通過這個功能,它能深度解析學生解題過程的每一步,精準定位題目理解、邏輯推理、計算及手寫謄抄等各類錯誤。

這樣,就能確保學生和教師迅速、精準地把握問題所在,從而針對性地補足自己的弱點。

這背後,得益於新版本多模態大模型在常規測評效率與準確性上的飛躍,尤其是在主觀題評分上。

比如這個案例中,它精準地給出了分數,詳細解析了扣分點,實現了對學生學習成效的全面洞察。

- 人機交互

在智能人機交互上,全新的多模態智適應大模型也達到了全新高度。

它支持文字與語音的互動模式,覆蓋了100+互動對話場景。

更貼心的是,它具備高精度的情緒識別能力。

因此,如果學生在這個過程中出現困惑、開心、注意力分散等情緒變化,模型都能準確捕捉到,用時即時地給予個性化反饋與鼓勵。

而且,爲了營造更全面且沉浸式的視聽學習體驗,松鼠Ai還對智能掃讀筆與耳機進行了升級革新,致力於構建一個完善的智適應學習生態系統。

其中顛覆傳統的旗艦之作——智能老師S211白鷺,採用了獨特的數字紙張技術,提供原彩、彩墨、水墨三種顯示模式,配合高清攝像頭,可實時捕捉學習細節。

在用戶體驗和健康關懷上,都在行業內設立了全新標杆。

智適應多模態智適應大模型LAM

那麼,松鼠Ai提出的這個智適應多模態大模型——LAM,其背後的運作機制是怎樣的?

具體來說,模型架構一共包含了三大關鍵組件:知識圖譜、推薦系統,和檢索增強生成(RAG)。

推薦系統中有不同的規劃和智能體,包括短期路徑規劃、長期路徑規劃。

其他組件還有,情感解析、路徑追溯(不同的學生都有自己的學習路徑)、大模型反饋和總結。

此外,AI系統還包含了家長目標、學生畫像兩個重要的部分。

在智能體架構中,整個智能體被稱爲「智適應智能體」。

該體系下面包含了不同的智能體,比如數據分析智能體、自動教學智能體(teaching autonomous driving agent)、教學問答智能體、推理智能體、閱讀綜合理解智能體等等。

不僅如此,針對不同學科,還有不同學科的智能體,比如物理、英語、科學等。

這麼多智能體,並得是獨立的存在,而是通過協作,與學生互動,爲其提供個性化學習內容的推薦。

爲了讓多智能體有效協作,研究團隊還爲此提供了環境支持。

他們將智適應引擎,設置爲三層。

第一層是目標、學習地圖、內容地圖、錯因分析本體。

當AI系統爲不同學生設定目標後,並非是一個「死目標」。

它會根據們的學習速度、進度,以及數據分析,動態調整目標,爲其做出更合理的推薦。

此外,錯誤分析本體,針對學生犯錯,能夠提供有針對性的分析。

第二層是學習記錄。

這裡,AI系統會記錄下所有學生的學習資料,並對其進行評估。

第三層,是通過交互來實現的。

學生與AI交互過程中,實時數據便會反饋到智適應引擎中,然後交由AI計算分析。

最後,AI系統根據學生下一步學習內容,給出新的推薦,可能是知識,也可能是能力MCM,還有可能是一些實踐。

除了以上提到的架構,松鼠Ai的引擎中,還融入了其他一些非常重要的技術。

第一個,便是世界首個「全學科微顆粒知識圖譜」。

全世界的國家中,每個年級每個學科都有不同的學習目標。

松鼠Ai研究團隊所做的,便是將這些學習目標,分解成更加細緻精確的層面,以便算法構建。

舉個例子,一個關於「分數加法和減法」的目標,可以被分解爲第二層(分數的加法、分數的減法、簡單分數計算、多步分數計算等的學習目標)。

從第二層,還可以分解出第三層更加精細的學習目標,如下圖所示。

最終,一個學習目標,能夠到達的最底層是「第九層」。

同時,松鼠Ai智適應大模型還有一個預測引擎。

它可能會根據學生在10個小時學習內容,預測將要完成100個學習目標。

而且,隨着學習進度的變化,預測也會改變。

另外,還有一個推薦引擎,如上所述,在智能體第一層中,目標會動態改變。

如下圖所示中,是一張根源問題追溯系統。

以最高十年級,最低七年級爲例,由下而上,綠色線是指學生已掌握的學習目標、知識、能力。

假設一個學生正在上十年級,遇到了一些無法理解的知識。

這時,AI系統就會根據題目追根溯源,建議學生重新溫習七年級學習課程。

在確保他掌握絆住腳的學習目標後,AI纔會繼續推進學習進程。

再來看一個例子,有三個學生對於學習目標的掌握情況,均是80%。

可以看到,每個同學掌握程度雖相同,但另外20%粉紅色知識點掌握分佈有所不同。

這說明了,儘管他們達到了相似的掌握水平,卻有着各自的優點和弱點。

這也是,爲什麼需要打造一個問題追溯系統的原因。

左右滑動查看

此外,智適應大模型還包含了MCM系統,它代表了思考方式、能力、方法論。

爲什麼學生需要接受MCM訓練?這是因爲,不同的行業、不同的職業,需要不同的MCM。

可以從不同學科來看,語言、物理、數學等,它們對學生所具備的能力素養,有着不同的要求。

經過詳細的剖解,可以看出,松鼠Ai的多模態智適應大模型LAM與LLM有着很大的不同。

當我們使用ChatGPT等模型時,通過提問得到回答,還有歷史紀錄。

而當你下一次進入這個平臺時,它不會給出推薦,並且不會理解個人之前的學習行爲,以及整體掌握知識的程度。

這也是,智適應大模型爲什麼存在的原因。

它不僅有學習者的歷史記錄,不同的學習行爲,還能爲學生推薦下一步應該學習的內容。

並且,它還會提供非常詳細的成績單和數據,爲未來學習規劃提供建議。

模型持續迭代升級

在多模態智適應大模型中,松鼠Ai研發團隊在這次KDD大會上,提出了全新算法——時間序列分析。

在題爲《Foundation Models for Time Series Analysis: A Tutorial and Survey》論文中,他們系統性地探討了大模型在時間序列分析中的應用。

論文地址:https://arxiv.org/pdf/2403.14735

具體來說,論文分析了大模型在教育的應用,包括在教育時序數據分析中的應用。時間序列分析在教育場景中的應用日益廣泛,例如,通過分析學生的行爲數據、測試成績和學習習慣,可以預測學生的學習進度,優化教學策略。

時序Generative AI通過在大規模教育數據集上進行預訓練,能夠更好地捕捉複雜的時間依賴性和非線性關係,從而在多個教育場景中實現最優的預測和分類效果。

文章也提供了多種未來可能的研究方向,例如結合多模態數據(如文本、圖像、語音)進一步提升模型的泛化能力,以及如何通過自監督學習技術減少對標註數據的依賴。

這些研究不僅有助於提升時間序列分析的準確性和效率,還爲個性化教育和智適應教育提供了堅實的技術基礎。

松鼠Ai能在本次KDD大會上與世界各地的頂尖學者你來我往,可以體現出松鼠Ai在商業之外所擁有的包括學術、科研等綜合硬實力。

同時,我們也期待在AI時代全面來臨的當下,可以看到更多中國企業出現在這樣的頂級峰會上。

AI,接近最理想的教育場景

著名教育家蘇霍姆林斯基說過——

「從我手裡經過的學生成千上萬,奇怪的是,留給我印象最深的並不是無可挑剔的模範生,而是別具特點、與衆不同的孩子。」

在AI落地教育的種種場景裡,我們可以驚喜地發現,「每個孩子人手一個導師」的理想設定,已經無比接近現實。

或許,這就是現階段AI對於人類最深遠的意義之一。

AI老師給予孩子們的,不是一些零碎知識,而是幾把鑰匙。

到那時,每個學生在畢業時,帶走的不僅僅我一些知識和技能,而是帶走渴求知識的火花,並使它終生不熄地燃燒下去。