「盤中寶」巨頭將首次發佈這類模型等最新產品,該技術具備商用潛力,生產力工具蓄勢待發,這家公司相關技術能力已有落地應用

財聯社資訊獲悉,9月24日,“2024 火山引擎AI創新巡展”將落地深圳。本次巡展中,火山引擎將公佈豆包大模型的最新增長情況,首次發佈視頻生成模型等最新產品,帶來更多模型家族的能力升級,以及火山方舟、釦子專業版、HiAgent 平臺、AI全棧雲等產品的最新進展。

一、視頻大模型迎來Sora時刻,生產力工具蓄勢待發

國產大模型快速更新迭代,過去一個月時間內,國內主流大模型基本上都更新了模型版本或發佈新應用產品,各大模型廠商持續打磨產品,推出了針對效率辦公、創意創作、智能搜索、實時互動等場景的功能,大模型技術加速融入用戶的生產和生活。視頻生成是當前大模型在多模態方向上的前沿應用,豆包大模型推出視頻生成模型,將進一步豐富大模型應用場景,爲內容創作、娛樂、廣告營銷等多個行業帶來全新的增長機遇。

浙商證券表示,中文語境下,國內模型文生視頻表現優於國外。根據SuperCLUE的測評結果,在中文環境下,國內外多模態能力總體水平差距不大,海外模型在基礎認知能力方面領先,國內模型應用能力有優勢,國內文生視頻模型整體表現好於國外。德邦證券指出,視頻大模型迎來Sora時刻,生產力工具蓄勢待發。視頻大模型具備商用潛力,下游應用正在儲能。未來隨着用戶習慣的培育以及算力基礎設施的完善,視頻大模型的或者辦公、廣告、電影、遊戲等多領域具有廣闊的前景。

二、相關上市公司:萬興科技、捷成股份、當虹科技

萬興科技音視頻多媒體大模型天幕,聚焦數字創意垂類創作場景,以音視頻生成式AI技術爲基礎,涵蓋文生視頻、文生3D視頻、視頻AI配樂、數字人播報等近百項音視頻原子能力,同時支持全球不同語言,致力於爲全球用戶提供音視頻創作完整解決方案,相關能力已在filmora、播爆等產品上落地應用。

捷成股份研發的AIGC一鍵成片系統ChatPV,基於多模態大模型能力,可將視頻片段、圖片、音頻等素材,根據提示詞自動生成視頻腳本、廣告詞、分鏡腳本等,並根據視頻腳本和分鏡腳本自動摘取相關素材生成完整的視頻,根據創作者要求一鍵生成高質量視頻,極大提升了視頻創作者的工作效率和內容生成效果。

當虹科技多模態視聽大模型整合了視頻、音頻、圖像、文本和三維模型等跨模態內容的推理與生成能力,包括文本生成、文生視頻、圖生視頻等生成式算法。