Orange與OpenAI、Meta合作開發定製非洲語言AI模型

鞭牛士報道,11月26日消息,據CNBC報道,法國電信巨頭Orange週二表示將與微軟支持的 OpenAI 和 Facebook 所有者Meta合作,建立定製的人工智能模型,旨在更好地理解非洲地區語言。

Orange 表示,它正在與 OpenAI 和 Meta 合作開發定製 AI 模型,這些模型基於各自的 Whisper 和 Llama 開源 AI 模型(可根據特定需求進行調整的公開系統),可以理解大多數對話系統無法理解的西非語言。

目前,大型人工智能公司用於訓練算法的數據大部分都來自美國,這意味着當涉及歐洲、中東和非洲等不同地區時,他們的模型可能會失去文化和語言等重要背景信息。

Orange 首席人工智能官史蒂夫·賈瑞特 (Steve Jarrett) 表示,這意味着這些模型很難理解用不太常用的語言編寫的文本和語音通信。

「有了開放模型,你就可以進行所謂的微調,也就是向模型中引入最初訓練時未包含的額外信息。」賈勒特在接受 CNBC 採訪時表示。「我們正在添加對西非地區語言的識別,目前任何人工智能都無法理解這些語言。」

Orange 計劃在 2025 年初首先推出包含兩種西非地區語言沃洛夫語和普拉姆語的 AI 模型,這兩種語言的使用人數分別約爲 1600 萬人和 600 萬人。

沃洛夫語是塞內加爾、岡比亞和毛里塔尼亞南部的一種語言,而普拉爾語則主要在塞內加爾使用。

Orange 表示,開源 AI 模型將由 Orange 對外提供,並免費授權用於非商業用途,包括公共衛生和教育。Orange 計劃擴大其定製 AI 模型計劃,最終覆蓋所有 18 個西非國家。

賈勒特告訴 CNBC:我們在西非國家開展業務,那裡的聯絡中心使用很多當地語言,但目前的人工智能模型無法理解這些人輸入或說的話。

Orange 的人工智能負責人表示,OpenAI 的 GPT、Meta 的 Llama 和 Anthropic 的 Claude 等主要大型語言模型並不太適合非洲人的需求,因爲它們並未專門針對來自該地區的數據進行訓練。

主權人工智能推動

此舉利用了全球範圍內越來越受關注的概念,即主權人工智能。

這一術語指的是各個國家和地區應該通過本地化數據存儲和處理來確保它們代表特定的語言、文化和歷史,從而尋求對人工智能系統所依賴的核心技術基礎設施的更大控制權。

Orange 還希望將數據處理和 OpenAI 模型的託管本地化到歐洲數據中心。Orange 表示,這將使其能夠提前獲得 OpenAI 最新、最先進的 AI 模型,並幫助其構建新的應用程序,例如用於客戶服務的 AI 語音系統。

賈瑞特表示,考慮到與該技術巨大的能源需求相關的環境問題,Orange 致力於“負責任地”使用人工智能,並且不會總是對每個問題都使用龐大的語言模型 [LLM]。

除了使用人工智能系統來改善客戶服務之外,Orange 還使用該技術來改善其業務的核心部分:移動網絡。

賈瑞特告訴 CNBC:在網絡方面,我們不僅使用 [AI] 來優化我們的網絡規劃方式,還優化我們如何正確運營網絡。

「所有網絡設備產生的數據量非常龐大,藉助人工智能系統,我們可以幫助識別數據中的模式,甚至在客戶注意到之前,這些模式就可以幫助我們識別和預測故障。」