AI週報|亞馬遜再投資Anthropic27.5億美元;越來越多音樂、遊戲從業者面臨AI競爭
亞馬遜完成對Anthropic 40億美元投資
3月28日,亞馬遜宣佈完成對Anthropic 40億美元的投資,以深化推進生成式AI技術的發展,這筆投資分兩次完成。去年9月,亞馬遜進行了12.5億美元的初始投資,彼時亞馬遜曾表示將投資最高40億美元,獲得少數股份。此次亞馬遜再投資27.5億美元,完成了對Anthropic的投資承諾。
根據雙方的戰略合作協議 ,Anthropic選擇亞馬遜雲科技(AWS)作爲其關鍵任務工作負載的主要雲服務提供商,包括安全性研究及未來基礎模型開發。Anthropic將利用Amazon Trainium和Amazon Inferentia芯片來構建、訓練和部署未來的模型,並承諾爲全球亞馬遜雲科技客戶提供對其未來基礎模型在Amazon Bedrock上的長期訪問權限。
點評:Anthropic過去一直被視爲OpenAI最大的競爭對手之一。就在3月初,Anthropic發佈了其最新大模型系列Claude 3,其中最強的Opus在多項基準測試中得分都超過了GPT-4 和Gemini 1.0 Ultra。亞馬遜押注初創AI公司,也凸顯了大型科技公司對於AI技術的重視。在生成式AI領域,微軟已經通過向OpenAI投資130億美元取得了先發優勢,微軟還投資了歐洲AI初創公司Mistral,亞馬遜與Anthropic的合作,使得其在與微軟和谷歌爭奪AI領域領導地位的競爭中獲得一個有利的AI合作伙伴。
AI音樂生成工具Suno可生成2分鐘音樂
Suno近日更新V3版本後引發音樂行業人士關注,這款AI工具可生成2分鐘音樂。記者實測發現,Suno生成的音樂十分流暢,人聲清晰,可以準確表現搖滾、流行等音樂風格,但目前對其他提示詞的理解仍有限。聽到Suno AI創作的音樂後,就匠音樂創始人張昭軼對記者評價,“完成度很高,質量也很好。”他認爲,那些功能性音樂和快餐類音樂,可以被AI低成本量產。記者從多名音樂從業者瞭解到,AI音樂工具目前更多是取代簡單的音樂創作,但這已能替代一部分編曲工作並改變音樂製作流程。而在專業的遊戲音樂製作、學術音樂創作等方面,AI作用還有限。
點評:接受記者採訪時,有音樂製作人表達了對Suno替代部分音樂人工作的憂慮,Suno如今展現出來的能力,已能讓一些低層次編曲生意沒有生存空間,在此基礎上,或許未來網紅熱曲等功能性較強的音樂也會由AI直接生成,有音樂人甚至預計AI會取代90%音樂人。在Suno之外,也有音樂創作者向記者表示,還有MusicLM等其他AI工具。未來哪種AI音樂生成工具能勝出還未成定數,能肯定的是,AI會逐漸滲透進音樂製作。不過,AI雖然降低了音樂創作的門檻,但音樂創作的上限依然很高,這可能是AI很難替代的。
OpenAI公佈Sora第一批試用反饋
當地時間3月25日,OpenAI發佈博客,展示了多位藝術家使用視頻生成模型Sora製作的作品,以及他們對Sora如何融入藝術創作過程和藝術業務的初步想法。自2月推出Sora以來,OpenAI一直在與世界各地的視覺藝術家、設計師、創意總監以及電影製作人合作,瞭解Sora如何在他們的創作中發揮作用。
通過使用Sora,藝術家們創作了《氣球頭》《保羅·特里羅》等一系列實驗性短片,談及這次創作體驗,《氣球頭》導演之一伍德曼(Walter Woodman)表示,“Sora在創造看似真實的事物方面表現出色,但更讓我們激動的是它創造完全超現實內容的能力。這無疑是抽象表現主義的新紀元。”另一位導演表示,Sora可以做到的,不再是幫助複製舊有的事物,而是將最新的、此前或許從未有機會實現的創意成爲現實,這是其最大的魅力。
點評:OpenAI展示了七個實驗性視頻,讓人們見證了OpenAI的視頻生成模型Sora在藝術創作領域中的潛力。不過,目前Sora生成視頻並未向普通用戶開放。OpenAI CTO米拉·穆拉蒂(Mira Murati)在3月13日的一次採訪中透露,Sora正在進行紅隊測試,以確保工具的安全性,並且不會產生偏見或其他有害問題。Mira稱將於今年讓Sora與廣大用戶正式見面。
OpenAI展示新音頻模型Voice Engine
OpenAI在官網展示了自定義音頻模型Voice Engine。用戶提供15秒左右參考聲音,Voice Engine可生成與原音相似的音頻,OpenAI還顯示了其他用途,如幫助有言語疾病的人恢復聲音。OpenAI在2022年年底就開發了該模型,但出於安全考慮,目前還在小規模測試。
點評:OpenAI在官網上提到合成類似人類聲音的安全性問題,並表示,合成語音技術的廣泛部署應該伴隨着語音身份驗證,以驗證原始說話者對於自己聲音添加到相關服務是否知情。近日AI音頻領域頻有進展,包括AI音樂合成工具Suno和OpenAI還在小規模測試的Voice Engine,AI的安全性問題值得關注。此前,已有一些AI孫燕姿、AI周杰倫等音樂在網上傳播,未來或許每個普通人的聲音都可以低成本AI合成且真假難辨,如果不對AI聲音合成加以限制,可能會導致AI詐騙等社會問題。
越來越多遊戲美術人員需面對AI競爭
近日國內最大的遊戲公司騰訊近日拿出了遊戲AI引擎GiiNEX,使用大模型等生成式AI技術,提供2D圖像、動畫、劇情等多種能力。本站CEO丁磊近日則表示:"今天AI能做到的事情,比過去十年還要重大。"種種跡象表明,隨着AI工具滲透,不論是大遊戲公司還是小遊戲製作團隊,在使用AI提升效率的同時,遊戲製作人員都需要適應AI這個潛在競爭對手的存在。盛趣遊戲美術總監林蕤告訴第一財經記者,目前擁有自己專用AI工具和大模型的公司團隊越來越多。在理想情況下,現在AI已經能幫助完成70%以上游戲美術工作。
點評:AI對遊戲美術的滲透早在一年前就開始,那時候對業內的影響還是以替代部分外包美術公司畫師爲主。但隨着AI生圖工具迭代,以及AI視頻生成Sora面世,更多從業者需要適應AI的存在。
實際上,AI對遊戲美術等環節人力的替代,與AI替代程序員完成部分代碼是相似的,AI首先能做的還只是一些基礎工作,這也意味着,AI如果要對人類從業者進行取代,將是從技術含量低、初級的崗位開始。當AI可以完成基礎性工作的時候,人類從業者更應該思考的是,如何發揮人的優勢、如何做一些更有創造性的工作。
智元機器人工商變更,投前估值達70億
近日,智元機器人關聯公司上海智元新創技術有限公司發生工商變更,新增股東紅杉中國、M31資本、上汽投資,同時註冊資本由約6699.4萬元人民幣增至約6939.1萬元人民幣,被傳新一輪投資。不過,據相關人士表示,該公司最新一輪融資還是去年12月,此次新增的股東實際上是上一次融資時候的投資人,但工商變更有相應的審覈流程,因此導致了滯後性。
自2023年2月成立以來,智元機器人已拿下5輪融資,背後資方包括高瓴創投、奇績創壇、高榕資本、經緯創投、BV百度風投、比亞迪、上汽投資等明星產業資本和財務投資機構。最新一輪投資時,有消息流出,智元機器人投前估值達70億元。
點評:智元機器人堪稱VC圈最火爆項目之一,公司背後,其創始人是曾經的華爲天才少年、B站Up主——稚暉君彭志輝,其搭檔是上海交大教授閆維新。智元機器人於去年8月推出遠征A1智元具身智能機器人,團隊曾透露,遠征A1的商業化將首先應用於工業智造領域,他們在和汽車公司、3C製造商接觸。在大模型的帶動下,擁有智能本體的人形機器人被認爲是下一個具有想象力的賽道。
AI視頻生成公司HeyGen募集新一輪融資:估值4.4億美元
據媒體援引知情人士消息,數字人視頻生成初創公司HeyGen正在募集6000萬美元的最新一輪融資,領投方爲Benchmark,Benchmark 也是Snap 和 Uber 的早期投資者之一。據報道,HeyGen目前正在按照投資前估值4.4億美元進行融資,市場測算較4個月前的估值水平增長了6倍。
HeyGen 是一款 AI 數字人產品,去年10月,一系列郭德綱流利飈英文相聲、讓泰勒·斯威夫特說地道中文的視頻在全網傳播,其背後的公司HeyGen也隨之爆紅,成爲AI視頻領域的明星初創公司。HeyGen原名Surreal詩云科技,由前Snap軟件工程師Joshua Xu以及前字節產品設計師Wayne Liang於2020年底創立,總部位於洛杉磯,早期中國投資者包括紅杉中國以及真格基金。
點評:HeyGen試圖瞄準市場營銷人員和銷售人員等B端商業客戶,將自己與Pika Labs和Genmo等競爭對手區分開來。公司曾在博客中透露,產品上線後178天,公司的年度經常性收入就達到了100萬美元,上線7個月就已達到盈利狀態。AIGC的出現無疑給數字人領域的創企帶來了新的故事。
AI芯片公司地平線衝刺IPO
上市傳聞已久,地平線終於在3月26日向港交所遞交招股書。招股書顯示,地平線過去三年收入增長的同時,研發開支也在增長,年經調整虧損淨額超10億元。從2021年到2023年,地平線研發支出分別達到11.44億元、18.8億元、23.66億元,分別等於對應年份收入的245%、207.6%和152.5%。從合併損益表看,地平線過去三年收入、毛利維持增長,毛利率也維持在70%左右的較高水平,但收入規模還不夠大的情況下,研發支出高昂成爲其虧損的一大原因。
點評:地平線是國內主要智駕芯片公司之一。據蓋世汽車研究院數據,去年智駕域控芯片裝機量排行前十名中,地平線旗下兩款芯片市佔率共8.2%,國內廠商愛芯元智凌芯01市佔3.8%,華爲昇騰610市佔1.9%,而特斯拉FSD裝機量份額37%,英偉達Drive Orin-X市佔率33.5%。可以看出外資智駕廠商仍舊強勢,國內廠商要在巨頭環伺的市場中存活並擴大市場份額並不容易。
在智能駕駛發展早期,地平線等廠商不可避免要投入高昂的研發費用、參與技術競賽。而從市場策略上,擴大用戶羣則是擴大銷售規模的一條路徑。地平線已計劃在今年4月推出征程6系列,與以往的系列不同,新系列將同時涵蓋旗艦版和中低階產品。地平線能否同時把握住不同細分市場的客戶,接下來拭目以待。
商湯發佈財報,2023年生成式AI業務營收增兩倍
3月26日晚,人工智能軟件公司商湯科技發佈2023年全年業績,實現全年營收34億元,同比減少11%,主要原因是集團主動收縮了智慧城市業務。另外商湯年度虧損64.94億元,2022年同期爲虧損60.45億元。值得注意的是,2023年,商湯生成式AI業務實現了同比200%的增長,佔總收入比例超過35%。
商湯科技董事長兼CEO徐立在業績發佈會上表示,2023年,集團明確了新的三大業務板塊:生成式AI、傳統AI和智能汽車;以生成式AI業務爲重點發展方向,同時保持傳統AI業務和智能汽車的優勢。“集團生成式AI業務收入達12億人民幣,這是商湯成立十年以來,以最快速度從無到有、超過10億收入體量的新業務。”
點評:對於AI企業來說,近一年多以來,生成式AI的出現無疑爲其未來再添新的想象力。此次業績會上,徐立表示生成式AI對商湯來說已不僅僅是技術領域的變革性創新,更成爲公司的核心業務。商湯生成式AI業務的增長,得益於各行各業對大模型的訓練和推理的廣泛需求,這預示着中國硬科技投資的新週期正式開啓。徐立透露,公司預計4月份發佈“日日新5.0”版本,性能全面對標GPT4-Turbo。
大參數大語言模型DBRX開源
大數據人工智能公司Databricks開源了通用大模型DBRX,這是一款1320億參數的混合專家模型(MoE)。該模型在英偉達GDX Cloud上訓練,在語言理解(MMLU)、編程(HumanEval)和數學(GSM8K)基準上表現優於LLaMa2-70B、Grok-1等開源大模型,在語言理解、編程和數學方面優於GPT-3.5。Databrick在AI領域多有佈局,此前公司收購了AI初創公司MosaicML,還有消息稱,Databricks公司去年第四季度的客戶交易數據創下歷史紀錄,這與公司業務更多使用生成式AI有關。
點評:3月18日,馬斯克大模型公司xAI剛剛宣佈開源3140億參數大模型Grok-1,同日國內創業企業潞晨科技Colossal-AI團隊全面開源Open Sora模型,本週又有參數量上千的大語言模型開源。開源在大語言模型競爭中越發成爲不可忽視的力量。相對閉源商用的大模型,企業可在開源大模型的基礎上進行預訓練或微調,且可以部署在自己的服務器上,安全性可更有保障,此外,客觀而言,大語言模型開源還能爲AI公司“打廣告”,吸引客戶購買自己參數量更大的大模型服務。開源和閉源兩股力量未來還有望繼續博弈,給用戶提供更多樣的選擇。
谷歌Gemini Nano模型將登陸Pixel 8
3月28日,谷歌宣佈Pixel 8將在下一個Pixel功能中支持Gemini Nano,這將是一個開發者預覽版,這個模型將爲兩個擴展功能提供動力,包括在錄音機應用中的摘要總結功能,以及在Gboard(虛擬鍵盤)應用中的智能回覆功能。Pixel 8是去年穀歌推出的智能手機,Gemini Nano則是去年底谷歌發佈的Gemini AI模型的輕量級版本。在此之前,谷歌已宣佈其高端智能手機Pixel 8 Pro將搭載Gemini Nano。
點評:不久前,有消息稱蘋果正與谷歌洽談,關於在iPhone中使用谷歌Gemini AI引擎,蘋果還有傳言將與百度文心一言在下一代iPhone中合作,但百度方面暫無迴應。近日,手機芯片廠商聯發科則已在天璣9300等旗艦芯片上部署通義千問18億、40億參數大模型,實現大模型在手機芯片端深度適配,以實現端側AI。
不難看出,不論是芯片廠商、大語言模型廠商還是手機廠商,在AI手機競賽中都在加速跑。如果能抓住AI手機風口,利潤或將是豐厚的。此前三星首款AI手機Galaxy S24在韓國開售28天就突破100萬部銷量,刷新S系列手機銷量突破100萬的最快紀錄,這便是一個很好的案例。
IDC:中國生成式AI投資五年複合增長率達86.2%
近日,知名行研機構IDC發佈了2024年V1版IDC《全球人工智能和生成式人工智能支出指南》。IDC數據顯示,2022年AI IT總投資規模爲1324.9億美元,並有望在2027年增至5124.2億美元,年複合增長率(CAGR)爲31.1%。聚焦生成式AI,IDC調查發現,到2027年45%的企業將掌握並使用生成式AI來共同開發數字產品和服務,從而使收入增長比競爭對手翻一番。IDC預測,全球生成式AI市場年複合增長率或達85.7%,到2027年全球生成式AI市場規模將接近1500億美元。
中國生成式AI市場洞察方面,IDC數據顯示,2022年生成式AI佔AI市場投資總規模的4.6%。隨着生成式AI技術的快速發展,2027年生成式AI投資佔比將達到33.0%,投資規模超130億美元,五年複合增長率(CAGR)爲86.2%。
點評:據IDC的觀點,生成式AI將成爲向自動化邁進的關鍵技術,在通用生產力、業務特定功能或行業特定任務方面都能產生影響。例如,企業員工可以使用生成式AI來總結報告、生成職位描述、優化工作任務或獲取有關某一主題的知識。軟件開發者可以利用生成式AI工具豐富和加速與開發相關的工作流程並改變開發體驗。IDC數據顯示,軟件和信息服務、銀行與通訊行業是人工智能投資最多的三個行業,2027年佔比分別爲23.8%、9.7%與9.4%。