阿里整大活,一張照片就能生成視頻
阿里推出AI圖生視頻模型EMO
只要一張照片加上音頻,就能讓你說話唱歌,阿里做到了。
最近,阿里新上線了一款AI圖片-音頻-視頻模型技術EMO,用戶只需要提供一張照片和一段任意音頻文件,EMO即可生成會說話唱歌的AI視頻。以及實現無縫對接的動態小視頻,最長時間可達1分30秒左右。
阿里研究團隊表示,EMO可以生成具有表情豐富的面部表情和各種頭部姿勢的聲音頭像視頻,同時,其可以根據輸入視頻的長度生成任意持續時間的視頻。
你可以想象一下,用單張靜態AI美女頭像就可以生成唱歌視頻,讓前段時間OpenAI sora生成的女主唱歌,或者說用一張張國榮的肖像就可以“復活”張國榮唱粵語歌。
值得一提的是,生成的視頻中人物表情非常到位,口型、語速也都能完全匹配。
EMO框架介紹 圖源:GitHub官網
結合最近Sora在全球爆火的消息,以及國內各大公司都積極佈局AI生成視頻的動作,阿里這次新推出EMO,是要緊跟市場形勢。
比較來看,與Sora由文本生成視頻不同的是,阿里的EMO是圖片生成視頻。但無論如何,視頻生成模型賽道已經成爲各大科技互聯網公司的投入重點。在近日的財報電話會上,百度董事長李彥宏表示,多模態的融合,從文字到視頻是非常重要的未來基礎模型開發方向,百度已經進行投資並將持續進行投資。
對於阿里來說,在AI方面的佈局,阿里從來沒有掉隊過。
去年4月,阿里已經推出了“通義千問”語言大模型,具備多輪對話、文案創作、邏輯推理等功能。在當時的阿里雲峰會上,阿里雲智能集團CEO張勇還高調宣佈,阿里巴巴所有產品未來將接入“通義千問”大模型,進行全面改造。
不僅包括天貓、淘寶這樣阿里集團最核心的產品,還涉及釘釘、高德地圖、閒魚、餓了麼、優酷、盒馬、淘票票等其他產品。
在主營電商業務,阿里已經推出面向C端用戶的AI產品“淘寶問問”,類似於淘寶的導購,幫助用戶更便捷地購物。阿里還將AI用在不同領域,比如探索醫療AI前沿技術、在招聘方面搭建“招聘+AI平臺”等。
晚點LatePost報道稱,阿里巴巴旗下淘天集團和國際數字商業集團都已經建立了完整的AI團隊。去年11月末,淘天集團將原本約20個團隊收攏爲4個,分別負責阿里媽媽、C端消費者、B端商家以及行業特色應用,並且對內發佈了淘天自己的大模型產品“圖靈”。
阿里內部一直在強調AI的重要性,馬雲甚至在阿里內網發聲,AI電商時代纔剛剛開始,對誰都是機會,也是挑戰。
如今,隨着市場的不斷變化,阿里需要轉型變革。用阿里集團CEO吳泳銘一句話:“AI時代,阿里巴巴要成爲一家服務全社會AI創新的、開放的科技平臺企業。”
AI時代,阿里雲承擔重任
阿里要成爲一家科技公司,關鍵在阿里雲。尤其是在AI方面,阿里雲是阿里巴巴在AI佈局上的重中之重,是各項業務能夠應用到AI的核心引擎。
阿里雲在人工智能領域的佈局提升了阿里巴巴整體的市場競爭力。通過訓練和優化大模型,阿里雲提供更加準確和高效的自然語言處理、圖像識別、語音識別等服務,這些服務可以應用於阿里巴巴的各個業務場景中,如電商、物流、金融等,從而推動業務的創新和發展。
反之,各行業對於AI雲服務的需求,也爲阿里雲AI業務的發展提供了廣闊的市場規模。此前阿里雲原董事長兼CEO張勇曾表示,AI雲服務需求非常旺盛,增量機會剛剛開始釋放。
2023年以來,阿里雲發佈了一系列生成式AI模型,這些模型都受到市場歡迎。6月,阿里雲通義大模型推出了新產品“通義聽悟”,可對音視頻內容進行轉寫、檢索、摘要和整理等,幫助用戶在開會、上網課、看視頻時更輕鬆瀏覽視頻內容。
發佈當月,通義聽悟用戶數已達36萬,處理音頻時長5萬小時,處理文字超8億。
7月,阿里雲又推出繪畫創作大模型“通義萬相”,可輔助人類進行圖片創作,未來可應用於藝術設計、電商、遊戲和文創等應用場景。
同一個月,妙鴨相機向公衆開放,這是一款基於AI技術的寫真生成工具。當月內“妙鴨相機”就多次登頂IOS應用排行榜,排隊人數峰值能達到4000-5000。甚至成爲中國AIGC領域第一個爆火的C端產品,一上線就實現了付費使用。
圖源:妙鴨相機
可以預見,目前上線的AI圖生視頻模型EMO,或許又是一個火爆的AI產品。而阿里的這些AI技術的發展,離不開阿里雲基礎設施建設。
去年11月,阿里巴巴集團CEO吳泳銘,明確了阿里雲的戰略定位,即“AI驅動、公共雲優先”,表示爲各行各業提供穩定高效的AI基礎設施,共建開放繁榮的AI生態。
然而就在當月,阿里雲就迎來了新一輪組織架構調整,幅度很大,不僅在阿里集團層面成立了一個基礎設施委員會,同時阿里雲在產研線、商業線以及包括供應鏈&IDC等在內的其他8個部門也均產生變動。
繼11月底進行組織結構調整後,阿里雲又進一步調整了業務重心,精簡爲政企客戶定製的行業解決方案項目制業務,並砍掉 IoT(物聯網)業務線硬件集成業務並縮減相關人員。同時,阿里雲還逐步擴大了公共雲事業部和AI部門的招聘規模。這也意味着,阿里雲重新進行資源整合,將重心轉移至公共雲事業部和AI部門。
當前阿里雲面臨的是瞬息萬變的市場環境,必須要不斷改變與革新,時刻迎接挑戰。
國內雲計算市場仍是藍海
在過去,阿里雲一直佔據着中國公共雲市場的主要份額,有着顯著優勢。隨着越來越多的企業進入雲服務市場,阿里面對的市場的競爭格局更加複雜。
阿里不得不採取行動,2月29日,阿里雲全線下調雲產品官網售價,平均降價幅度超過20%,最高降幅達55%。這是阿里雲史上最大力度的一次降價,涉及100多款產品、500多個產品規格,覆蓋計算、存儲、數據庫等所有核心產品。
圖源:阿里雲
而在去年4月,阿里雲已經宣佈對核心產品進行大規模降價。如今,阿里雲的降價力度遠超去年,可見阿里對進一步擴大公共雲基數和規模的急切。畢竟,除了阿里雲,其他雲服務廠商也打起來價格戰。比如去年騰訊雲、移動雲、京東雲等均給出了不小的降價和促銷力度。
可以看出,各大互聯網企業加速搶奪市場份額。之所以競爭愈發激烈,是因爲國內雲計算市場仍處於藍海,還有很大的發展空間。
據瞭解,中國雲計算髮展了十多年,但公共雲滲透率仍大幅低於歐美成熟市場。中國市場的服務器存量規模2000萬臺,而美國爲2100萬臺,但美國以公共雲形式提供服務的算力佔比爲60%,中國僅爲28%。
可見,我國在公共雲服務領域以及整體算力資源的利用效率上尚存顯著提升空間,而這背後蘊藏的,無疑是巨大的增長潛力和發展機遇。
如今對於阿里雲來說,外部競爭愈發激烈,而阿里雲在提高雲服務的穩定性方面還需進一步加強。
總的來說,隨着公有云市場硝煙再起,阿里雲需要在AI與公共雲市場中建立、守住優勢。
作者 | 周文君