科技.人文聯合講座/AI知識幻覺
布爾斯汀(Daniel J. Boorstin; 1914-2004)。林一平/繪
林一平
隨着AI技術在各行各業中的廣泛應用,最令人擔憂的是陷入「AI知識幻覺」的陷阱。今日我們常用的AI技術,不論是分析型(Analytic)AI或生成式(Generative)AI,都依賴正確標註的數據進行訓練。然而,許多學校在教授AI時往往忽略了數據本身的重要性。結果,學生們常常不清楚輸入數據的特性,甚至標註錯誤,未經驗證就急於將數據投入AI模型,導致「垃圾進,垃圾出」(Garbage in, Garbage out)的現象。這種不適當的AI發展不僅浪費了大量的算力和電力,還助長了「AI知識幻覺」。結果是,教育成本隨之增加。因此,學生學習如何理解和使用正確的數據(包括質與量)纔是臺灣是否能AI大躍進的關鍵。
臺灣可用於AI訓練的數據量遠少於美國和中國。而數據格式的混亂及不互通更成爲阻礙AI技術發展的重要挑戰。農業部洞悉此一問題,在發展智慧農業時特別重視數據格式的標準化,讓各種農業物聯網設備能互通,這是一個具有遠見的舉措。在業界,不少公司早已注重數據科學(Data Science),例如華邦電子在其新進員工訓練中加入了數據科學相關內容,讓他們瞭解能處理公司數據的重要性,我也有幸曾受邀擔任相關課程的講師。
經濟部中小企業署最近積極規畫培訓傳統企業導入AI,並邀請專家學者編撰教學教材。署方在檢視初版授課大綱後,發現教材偏重於資訊專業論述,不適合其他非資訊領域的學員。經過多次討論後,我們認爲課程重點應該是讓學員瞭解數據,而非專注於學習AI模型的原理。例如在紡織廠,員工需要學習的是瞭解紡織機生成的數據代表什麼意義、如何正確標註這些數據,並知道如何找到對應的AI工具來解決問題。在運用AI工具時,講師不應要求紡織員工學習電腦語言、修改AI模型或填寫超參數,因爲這樣會增加學習難度。正確的方法是找到友善的AI工具,學員只需通過圖形化介面輸入專業數據即可獲得結果,無需編寫程式。
我的結論是,非資訊領域的百工百業要實現AI賦能,應培訓員工瞭解其專業數據,並提供不需編寫程式的AI工具。而AI專家的責任則在於開發這樣的無碼工具,最好能如ChatGPT這般親民。只有百工百業的員工瞭解自己專業的數據,運用AI時纔不會造成知識的幻覺。
(作者爲前科技部代理部長)