☰

硅谷爆發AI人才荒！馬斯克自曝xAI挖走特斯拉CV負責人，OpenAI偷用百萬小時油管視頻訓GPT-4丨AIGC大事日報

1、OpenAI改進微調API 擴展定製模型訓練計劃

2、OpenAI或違規使用YouTube視頻數據訓練GPT-4

3、ChatGPT商業產品付費用戶達60萬

4、阿爾特曼參與創辦的AI公司正洽談10億美元融資

5、馬斯克的xAI公司洽談30億美元融資

6、馬斯克的xAI設法從特斯拉挖工程師

7、馬斯克將提高特斯拉AI工程師薪酬

8、通義千問開源320億參數模型

9、谷歌計劃對AI驅動的搜索引擎收費

10、谷歌推出Gemma 1.1版本多輪對話質量提高

11、假冒Midjourney頁面獲百萬人關注

12、長視頻生成模型StreamingT2V發佈

13、AI視頻理解模型MiniGPT4-Video發佈

14、斯坦福團隊推出端側可跑的Octopus v2模型

15、Cohere推出RAG優化的大模型Command R+

16、Lambda以英偉達芯片作爲抵押獲5億美元貸款

17、英偉達與印尼電信公司將投建2億美元的AI中心

18、Meta修改深度僞造內容管理規則

19、曝Meta的AI圖像生成器存在種族偏見

20、圖像網站考慮授權130億照片和視頻訓練AI

21、比利時AI創企完成4200萬美元融資

22、信雅達大模型智能問答產品發佈

23、美國和歐盟就AI安全和治理達成合作

24、華盛頓法官禁止使用AI增強視頻作爲案件證據

25、以軍被曝用AI生成殺戮名單狂轟濫炸加沙

26、調查顯示AI正在削減工人數量

1、OpenAI改進微調API 擴展定製模型訓練計劃

根據OpenAI官網，OpenAI於4月4日推出微調API新功能，並宣佈擴展“自定義模型”的計劃，以幫助企業客戶開發更強大的定製生成式AI模型。爲了讓開發人員能夠更好地控制模型微調，OpenAI推出了基於Epoch的檢查點創建、模型比較、第三方集成、全面的驗證指標、超參數配置、微調儀表板改進等功能。同時，OpenAI將去年11月推出的自定義模型計劃擴展，宣佈其輔助微調產品成爲定製模型計劃的一部分。

指南地址：https://platform.openai.com/docs/guides/fine-tuning

2、OpenAI或違規使用YouTube視頻數據訓練GPT-4

據《紐約時報》4月6日報道，隨着2021年底OpenAI面臨數據供應問題，研究人員創建了一款名爲Whisper的語音識別工具，用以將YouTube視頻轉錄爲對話文本，最終轉錄了超100萬小時的YouTube視頻，用於訓練GPT-4。YouTube禁止將其視頻用於“獨立”於該視頻平臺的應用程序，OpenAI的做法可能違反了YouTube的規則。《紐約時報》記者認爲，OpenAI、谷歌和Meta在尋求在線信息來訓練最新的AI系統時，都存在無視公司政策及規避版權法的行爲。

3、ChatGPT商業產品付費用戶達60萬

據《華爾街日報》4月5日報道，OpenAI首席運營官布拉德·萊特凱普（Brad Lightcap）近期透露，已有60萬用戶正在爲ChatGPT商業產品付費，也就是ChatGPT Enterprise或ChatGPT Team。據稱，92%的財富500強公司正在以某種形式使用ChatGPT，每週有1億人積極使用ChatGPT。

4、阿爾特曼參與創辦的AI公司正洽談10億美元融資

據外媒The Information 4月5日報道，由前蘋果首席設計師喬納森·艾維（Jony Ive）和OpenAI首席執行官薩姆·阿爾特曼（Sam Altman）創立的一家神秘AI公司近期已開始與風險投資領域的一些知名人士進行融資談判。一位參與該過程的人士表示，該公司已經與Emerson Collective和Thrive Capital討論了交易，計劃籌集最多10億美元資金。

5、馬斯克的xAI公司洽談30億美元融資

據《華爾街日報》4月5日報道，與埃隆·馬斯克（Elon Musk）關係密切的投資者近期正在商談幫助他的AI公司xAI在一輪融資中籌集30億美元，這將使該公司估值達到180億美元。

6、馬斯克的xAI設法從特斯拉挖工程師

據外媒The Information 4月3日報道，當埃隆·馬斯克（Elon Musk）建立他的AI創企xAI時，他不得不與大型科技巨頭和許多其他初創公司爭奪人才。不過，他近期已設法從特斯拉挖來了幾名有前途的工程師，比如特斯拉機器學習科學家伊桑·奈特（Ethan Knight）在3月份跳槽到了xAI。伊桑是前特斯拉計算機視覺的負責人，之前曾考慮加入OpenAI，也是過去12個月內第三位加入xAI的特斯拉工程師。

7、馬斯克將提高特斯拉AI工程師薪酬

據外媒The Information 4月4日報道，特斯拉首席執行官埃隆·馬斯克 (Elon Musk) 週四透露，特斯拉將提高其AI團隊工程師的薪酬，這表明他正在應對OpenAI等公司日益激烈的人才競爭。

8、通義千問開源320億參數模型

阿里雲通義千問今日開源320億參數模型Qwen1.5-32B，可最大限度兼顧性能、效率和內存佔用的平衡，例如相比14B模型，32B在智能體場景下能力更強；相比72B，32B的推理成本更低。迄今通義千問共開源了7款大語言模型，在海內外開源社區累計下載量突破300萬。

基礎能力方面，通義千問320億參數模型在MMLU、GSM8K、HumanEval、BBH等多個測評中表現優異，性能接近通義千問720億參數模型，遠超其他300億級參數模型；Chat模型方面，Qwen1.5-32B-Chat模型在MT-Bench評測得分超過8分，與Qwen1.5-72B-Chat之間的差距相對較小；多語言能力方面，通義千問團隊選取了12種語言，在考試、理解、數學及翻譯等多個領域做了測評，Qwen1.5-32B的多語言能力只略遜於通義千問720億參數模型。

9、谷歌計劃對AI驅動的搜索引擎收費

據路透社4月3日報道，谷歌正在考慮對其AI驅動的搜索引擎的高級功能收費，包括將AI驅動的搜索功能納入其高級訂閱服務等，該服務已經在Gmail和Docs中提供了新的Gemini AI助手的訪問權限。

10、谷歌推出Gemma 1.1版本多輪對話質量提高

根據Hugging Face網站，谷歌於4月6日推出了開源模型Gemma的新版本Gemma 1.1，包括7B和2B兩個版本。Gemma 1.1使用新的RLHF方法進行訓練，在質量、編碼能力、真實性、指令遵循和多輪對話質量方面取得了顯着的進步。谷歌還修復了多輪對話中的一個錯誤，並確保模型響應並不總是以“Sure”開頭。

Hugging Face地址：https://huggingface.co/google/gemma-1.1-7b-it

11、假冒Midjourney頁面獲百萬人關注

據外媒BleepingComputer報道，近期有黑客正在利用Facebook廣告和劫持頁面來推廣虛假AI服務，例如Midjourney、OpenAI的Sora、GPT-5以及DALL-E，以竊取密碼的惡意軟件襲擊毫無戒心的用戶。其中，一個冒充Midjourney的惡意Facebook頁面聚集了120萬粉絲，並在最終被刪除之前保持活躍近一年，該頁面於2024年3月8日被關閉。

12、長視頻生成模型StreamingT2V發佈

根據GitHub網站，UT奧斯丁等機構於4月5日發佈了視頻生成模型StreamingT2V的代碼和模型。此前3月22日，團隊在arXiv上發表論文，提出了一種AI視頻生成技術StreamingT2V，可以生成高度一致、長度可擴展的視頻。據介紹，StreamingT2V能夠生成1200幀、時長120秒的長視頻，且理論上可以生成無限長的視頻。

GitHub地址：https://github.com/Picsart-AI-Research/StreamingT2V

論文地址：https://arxiv.org/abs/2403.14773

13、AI視頻理解模型MiniGPT4-Video發佈

根據arXiv網站，KAUST和哈佛大學研究團隊在4月4日發表的論文中提出MiniGPT4-Video框架，一個專爲視頻理解而設計的多模態大模型。該模型能夠處理時間視覺和文本數據，使其能夠熟練地理解視頻的複雜性。MiniGPT4-video不僅考慮視覺內容，還集成了文本對話，允許模型有效地回答涉及視覺和文本組件的查詢。據稱，該模型優於現有的最先進的方法，在MSVD、MSRVTT、TGIF和TVQA基準測試上分別獲得4.22%、1.13%、20.82%和13.1%的成績，模型和代碼已公開。

論文地址：https://arxiv.org/pdf/2404.03413.pdf

GitHub地址：https://vision-cair.github.io/MiniGPT4-video/

14、斯坦福團隊推出端側可跑的Octopus v2模型

根據arXiv網站，斯坦福團隊研究人員於4月2日推出端側可運行的Octopus v2模型。基於新方法，具有20億個參數的Octopus v2模型能夠在準確性和延遲方面超越GPT-4的性能，並將上下文長度減少95%。與具有基於RAG的函數調用機制的Llama-7B相比，該方法的速度提高了35倍。

論文地址：https://arxiv.org/pdf/2404.01744.pdf

15、Cohere推出RAG優化的大模型Command R+

根據AI獨角獸Cohere官網，Cohere於4月4日推出Command R+，一種先進的高級檢索增強生成（RAG）優化的大語言模型，也是該公司目前最強大、可擴展的大型語言模型。該模型具有128k tokens上下文窗口，提供RAG並被加入引用以減少幻覺，支持10種主要語言多語言覆蓋，支持全球業務運營，並可用於自動化複雜業務流程。Command R+系列現已在微軟Azure上提供，並且很快將向其他雲提供商提供。

官方地址：https://txt.cohere.com/command-r-plus-microsoft-azure/

16、Lambda以英偉達芯片作爲抵押獲5億美元貸款

據路透社4月4日報道，美國智能雲廠商Lambda近期已從包括麥格理集團（Macquarie Group）在內的貸方獲得了5億美元的貸款，其將提供英偉達芯片作爲抵押品。

17、英偉達與印尼電信公司將投建2億美元的AI中心

據路透社4月4日報道，英偉達和印度尼西亞電信公司PT Indosat Ooredoo Hutchison計劃於2024年在中爪哇建立一個AI中心，價值2億美元。該AI中心可能由電信基礎設施或人力資源中心組成，並將位於梭羅市。

18、Meta修改深度僞造內容管理規則

據路透社4月5日報道，Meta週五宣佈修改相關數字媒體政策，準備測試其監管AI技術生成的欺騙性內容的能力。新方法將改變公司對操縱內容的處理方式，從專注於刪除特定帖子轉向保持內容不變，同時向觀衆提供有關其製作方式的信息。

19、曝Meta的AI圖像生成器存在種族偏見

據外媒The Verge 4月4日報道，記者近期多次嘗試使用“亞洲男人和白人朋友”、“亞洲男人和白人妻子”、“亞洲女人和白人丈夫”等提示詞來創建圖像，Meta的AI圖像生成器都無法勝任。對此該記者認爲，AI系統的生成不準確問題反映了其創建者、培訓者及其使用的數據集存在偏見。

20、圖像網站考慮授權130億照片和視頻訓練AI

據路透社4月5日報道，老牌圖像託管網站Photobucket近期正在與多家科技公司進行談判，以授權Photobucket的130億張照片和視頻用於訓練生成式AI模型。公司考慮每張照片5美分到1美元之間的價格，每個視頻超過1美元的價格，價格因買家和所尋求的圖像類型而異。

21、比利時AI創企完成4200萬美元融資

據外媒TechCrunch 4月5日報道，比利時AI初創公司Robovision近期完成4200萬美元A輪融資，由比利時農業科技投資者Astanor Ventures和Target Global共同領投，使企估值達到1.8億美元。Robovision聚焦打造一個“無代碼”計算機視覺AI平臺，在不需要軟件開發人員或數據科學家參與的條件下，助客戶使用其平臺上傳數據、標記數據、測試模型並將其部署到生產中。

22、信雅達大模型智能問答產品發佈

根據信雅達科技股份有限公司官方公衆號，信雅達運營智能知識助手“小雅”於4月3日發佈。作爲信雅達數字化運營條線全新推出的大模型智能問答產品，“小雅”是一款專爲商業銀行打造的辦公輔助工具，基於信雅達“雅問知識湖”，結合銀行金融知識庫，提供專業問答服務。

23、美國和歐盟就AI安全和治理達成合作

根據歐盟官網，歐盟和美國4月5日發表聯合聲明確認加強AI領域合作。該協議主要涵蓋AI安全和治理領域，同時雙方還打算在許多其他技術問題上進行廣泛合作，例如制定數字身份標準以及對平臺施加壓力以捍衛人權。

24、華盛頓法官禁止使用AI增強視頻作爲案件證據

據外媒NBC News 4月3日報道，華盛頓州一名負責監督三重謀殺案的法官在近期的裁決中禁止使用AI增強的視頻作爲證據，專家稱該裁決可能是美國刑事法院的首例。法庭文件顯示，一名男子被指控於2021年在西雅圖地區一家酒吧外開槍，造成三人死亡、兩人受傷，該男子的律師曾試圖引入經過機器學習軟件增強的手機視頻。文件稱，增強後的圖像“不準確、具有誤導性且不可靠”。

25、以軍被曝用AI生成殺戮名單狂轟濫炸加沙

財聯社4月5日電，以色列媒體《+972》雜誌（注：+972爲以色列的國際區號）4月3日發表一篇題爲《“薰衣草”：人工智能機器指揮以色列在加沙狂轟濫炸》的文章，援引六名以色列現任情報官員的信源，曝光了以軍在本輪巴以衝突中使用一款自主開發、名爲“薰衣草（Lavender）”的人工智能程序，生成“殺戮名單”。報道稱，在本輪衝突、特別是衝突早期，以軍就是憑藉這份由人工智能生成的、最多時包含了多達37000人的“殺戮名單”，在加沙地帶狂轟濫炸。

26、調查顯示AI正在削減工人數量

據路透社4月5日報道，人力資源提供商Adecco近期在一份基於對全球2000家大公司高管的調查的報告中提到，約41%的高管預計由於AI技術的發展，公司員工隊伍將減少。AI將導致許多公司在未來五年內僱用更少的員工。不過，儘管Adecco調查的大多數高級管理人員都表示AI是遊戲規則的改變者，但大多數人表示他們在採用該技術方面尚未取得足夠的進展。

硅谷爆發AI人才荒！馬斯克自曝xAI挖走特斯拉CV負責人，OpenAI偷用百萬小時油管視頻訓GPT-4丨AIGC大事日報

相關資訊