聯發科推出BreeXe大型語言模型與「達哥」自動生成式AI平臺
聯發科在今年釋出其對應70億組參數規模的大型自然語言模型Breeze-7B之後,此次再次推出名爲「BreeXe」的大型語言模型,以及相應的自動生成式人工智慧服務平臺「MediaTek DaVinci」,更以「達哥」作爲暱稱。
依照聯發創新基地負責人許大山博士說明,「BreeXe」是由聯發科位於英國劍橋、倫敦,以及臺大創新機第三方合作打造的大型自然語言模型,更強調「BreeXe」是當前繁體中文能力表現最好的模型,並且能以450億組參數規模超越OpenAI的GPT 3.5表現,單次可處理超過4萬字的文字內容,更比Mistral AI提出的客製化模型Mistral對應10倍以上執行能力。
而針對臺灣地區使用繁體中文處理能力,聯發科強調加入諸多在地化微調訓練,甚至也加入理解諸多在地用語設計,例如可以理解「母湯」是臺語「不行」意思,而不會像之前會理解成「粵語」內容。
同時,「BreeXe」透過NVIDIA提供的Taipei-1超級電腦DGX GH200進行訓練,接下來也計劃將「BreeXe」處理能力提升達GPT-4等級。
至於對於自動生成式人工智慧服務平臺「MediaTek DaVinci」的看法,聯發科以瑞士刀作爲比喻,將透過此平臺結合不同外掛資源,使其能對應不同應用場景,讓更多結合人工智慧的服務可以更快借此服務平臺建構。
目前「MediaTek DaVinci」除了收錄「BreeXe」,先前也已經收錄包含微軟旗下人工智慧模型,以及OpenAI的GPT、DALL.E3,更包含Anthropic日前推出的Claude 3,期望能透過此平臺協助更多開發者、企業導入自動生成式人工智慧應用資源。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》