科學家嘗試培養AI持續學習能力

參考消息網8月23日報道 據英國《新科學家》週刊網站8月21日報道,支持聊天生成預訓練轉換器(ChatGPT)等人工智能(AI)系統的算法無法邊工作邊學習,這迫使科技公司不得不花費數十億美元從頭開始訓練新模型。儘管這是業界一直關注的問題,但一項新研究表明,模型的設計方式存在固有問題,不過也許有辦法解決它。

目前,大多數人工智能都是所謂的“神經網絡”,其靈感來源於大腦的工作原理。人工智能“神經網絡”的處理單元被稱爲“人工神經元”。它們在開發過程中通常會經歷不同的階段。首先,開發者對人工智能進行訓練,通過算法對人工神經元進行微調,以更好地反映給定的數據集。然後,人工智能可被用於應對新數據,比如輸入ChatGPT的文本。不過,一旦模型的神經元在訓練階段就被設定好,它們就無法更新並利用新數據進行學習。

這意味着,如果有了新數據,大多數大型人工智能模型都必須重新接受訓練,而這一過程可能非常昂貴,尤其是當這些新數據集由整個互聯網的大部分數據組成時。

研究人員一直想知道,這些模型能否在接受初始訓練後吸收新知識,從而降低成本,但一直不清楚它們能否做到這一點。

現在,加拿大阿爾伯塔大學的希班什·多哈雷和他的同事測試了最常見的人工智能模型能否適應持續學習。研究團隊發現,它們很快就失去了學習新知識的能力,大量的人工神經元在接觸到新數據後就會停留在零值上。

多哈雷說:“如果你把它想象成你的大腦,那麼一旦90%的神經元都死了,剩下的就不夠你學習時用了。”

多哈雷及其團隊首先利用ImageNet數據庫訓練人工智能系統。該數據庫由1400萬張帶有標籤的房屋或貓等簡單物體的圖像組成。但他們並沒有按照標準行事(即訓練人工智能一次,然後通過讓其多次嘗試區分兩幅圖像來測試它),而是在區分每對圖像之後重新訓練模型。

他們用這種方法測試了一系列不同的學習算法,發現經過幾千次的再訓練後,這些網絡似乎無法學習且表現很差,許多神經元似乎“死了”,即值爲零。

研究團隊還通過強化學習來訓練人工智能,讓其模擬螞蟻如何學習行走。強化學習是一種常見方法,它教給人工智能成功是什麼樣子,並通過試錯找出規律。他們試着調整這種技術以實現持續學習,具體方式是,每換一種表面供螞蟻行走,就重新訓練算法。之後他們發現,這也會導致人工智能明顯喪失學習能力。

多哈雷說,這個問題似乎是這些系統的學習方式所固有的,但有一種方法可以解決問題。研究人員開發了一種算法,在每輪訓練後隨機激活一些神經元,這似乎減少了表現不佳的情況。

多哈雷說:“如果一個(神經元)已經死了,那麼我們只需讓它復活。現在它又能學習了。”

英國牛津大學的馬克·範德維爾克說,這種算法看起來很有前途,但還需要在更大的系統中進行測試,才能確定它是否有用。

他說:“持續學習問題的解決方案是一個價值數十億美元的重大問題。一個真正全面的解決方案可以讓你不斷更新模型,這將大大降低訓練這些模型的成本。”(編譯/劉白雲)