硅谷爆發AI人才荒!馬斯克自曝xAI挖走特斯拉CV負責人,OpenAI偷用百萬小時油管視頻訓GPT-4丨AIGC大事日報
1、OpenAI改進微調API 擴展定製模型訓練計劃
2、OpenAI或違規使用YouTube視頻數據訓練GPT-4
3、ChatGPT商業產品付費用戶達60萬
4、阿爾特曼參與創辦的AI公司正洽談10億美元融資
5、馬斯克的xAI公司洽談30億美元融資
6、馬斯克的xAI設法從特斯拉挖工程師
7、馬斯克將提高特斯拉AI工程師薪酬
8、通義千問開源320億參數模型
9、谷歌計劃對AI驅動的搜索引擎收費
10、谷歌推出Gemma 1.1版本 多輪對話質量提高
11、假冒Midjourney頁面獲百萬人關注
12、長視頻生成模型StreamingT2V發佈
13、AI視頻理解模型MiniGPT4-Video發佈
14、斯坦福團隊推出端側可跑的Octopus v2模型
15、Cohere推出RAG優化的大模型Command R+
16、Lambda以英偉達芯片作爲抵押獲5億美元貸款
17、英偉達與印尼電信公司將投建2億美元的AI中心
18、Meta修改深度僞造內容管理規則
19、曝Meta的AI圖像生成器存在種族偏見
20、圖像網站考慮授權130億照片和視頻訓練AI
21、比利時AI創企完成4200萬美元融資
22、信雅達大模型智能問答產品發佈
23、美國和歐盟就AI安全和治理達成合作
24、華盛頓法官禁止使用AI增強視頻作爲案件證據
25、以軍被曝用AI生成殺戮名單狂轟濫炸加沙
26、 調查顯示AI正在削減工人數量
1、OpenAI改進微調API 擴展定製模型訓練計劃
根據OpenAI官網,OpenAI於4月4日推出微調API新功能,並宣佈擴展“自定義模型”的計劃,以幫助企業客戶開發更強大的定製生成式AI模型。爲了讓開發人員能夠更好地控制模型微調,OpenAI推出了基於Epoch的檢查點創建、模型比較、第三方集成、全面的驗證指標、超參數配置、微調儀表板改進等功能。同時,OpenAI將去年11月推出的自定義模型計劃擴展,宣佈其輔助微調產品成爲定製模型計劃的一部分。
指南地址:https://platform.openai.com/docs/guides/fine-tuning
2、OpenAI或違規使用YouTube視頻數據訓練GPT-4
據《紐約時報》4月6日報道,隨着2021年底OpenAI面臨數據供應問題,研究人員創建了一款名爲Whisper的語音識別工具,用以將YouTube視頻轉錄爲對話文本,最終轉錄了超100萬小時的YouTube視頻,用於訓練GPT-4。YouTube禁止將其視頻用於“獨立”於該視頻平臺的應用程序,OpenAI的做法可能違反了YouTube的規則。《紐約時報》記者認爲,OpenAI、谷歌和Meta在尋求在線信息來訓練最新的AI系統時,都存在無視公司政策及規避版權法的行爲。
3、ChatGPT商業產品付費用戶達60萬
據《華爾街日報》4月5日報道,OpenAI首席運營官布拉德·萊特凱普(Brad Lightcap)近期透露,已有60萬用戶正在爲ChatGPT商業產品付費,也就是ChatGPT Enterprise或ChatGPT Team。據稱,92%的財富500強公司正在以某種形式使用ChatGPT,每週有1億人積極使用ChatGPT。
4、阿爾特曼參與創辦的AI公司正洽談10億美元融資
據外媒The Information 4月5日報道,由前蘋果首席設計師喬納森·艾維(Jony Ive)和OpenAI首席執行官薩姆·阿爾特曼(Sam Altman)創立的一家神秘AI公司近期已開始與風險投資領域的一些知名人士進行融資談判。一位參與該過程的人士表示,該公司已經與Emerson Collective和Thrive Capital討論了交易,計劃籌集最多10億美元資金。
5、馬斯克的xAI公司洽談30億美元融資
據《華爾街日報》4月5日報道,與埃隆·馬斯克(Elon Musk)關係密切的投資者近期正在商談幫助他的AI公司xAI在一輪融資中籌集30億美元,這將使該公司估值達到180億美元。
6、馬斯克的xAI設法從特斯拉挖工程師
據外媒The Information 4月3日報道,當埃隆·馬斯克(Elon Musk)建立他的AI創企xAI時,他不得不與大型科技巨頭和許多其他初創公司爭奪人才。不過,他近期已設法從特斯拉挖來了幾名有前途的工程師,比如特斯拉機器學習科學家伊桑·奈特(Ethan Knight)在3月份跳槽到了xAI。伊桑是前特斯拉計算機視覺的負責人,之前曾考慮加入OpenAI,也是過去12個月內第三位加入xAI的特斯拉工程師。
7、馬斯克將提高特斯拉AI工程師薪酬
據外媒The Information 4月4日報道,特斯拉首席執行官埃隆·馬斯克 (Elon Musk) 週四透露,特斯拉將提高其AI團隊工程師的薪酬,這表明他正在應對OpenAI等公司日益激烈的人才競爭。
8、通義千問開源320億參數模型
阿里雲通義千問今日開源320億參數模型Qwen1.5-32B,可最大限度兼顧性能、效率和內存佔用的平衡,例如相比14B模型,32B在智能體場景下能力更強;相比72B,32B的推理成本更低。迄今通義千問共開源了7款大語言模型,在海內外開源社區累計下載量突破300萬。
基礎能力方面,通義千問320億參數模型在MMLU、GSM8K、HumanEval、BBH等多個測評中表現優異,性能接近通義千問720億參數模型,遠超其他300億級參數模型;Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench評測得分超過8分,與Qwen1.5-72B-Chat之間的差距相對較小;多語言能力方面,通義千問團隊選取了12種語言,在考試、理解、數學及翻譯等多個領域做了測評,Qwen1.5-32B的多語言能力只略遜於通義千問720億參數模型。
9、谷歌計劃對AI驅動的搜索引擎收費
據路透社4月3日報道,谷歌正在考慮對其AI驅動的搜索引擎的高級功能收費,包括將AI驅動的搜索功能納入其高級訂閱服務等,該服務已經在Gmail和Docs中提供了新的Gemini AI助手的訪問權限。
10、谷歌推出Gemma 1.1版本 多輪對話質量提高
根據Hugging Face網站,谷歌於4月6日推出了開源模型Gemma的新版本Gemma 1.1,包括7B和2B兩個版本。Gemma 1.1使用新的RLHF方法進行訓練,在質量、編碼能力、真實性、指令遵循和多輪對話質量方面取得了顯着的進步。谷歌還修復了多輪對話中的一個錯誤,並確保模型響應並不總是以“Sure”開頭。
Hugging Face地址:https://huggingface.co/google/gemma-1.1-7b-it
11、假冒Midjourney頁面獲百萬人關注
據外媒BleepingComputer報道,近期有黑客正在利用Facebook廣告和劫持頁面來推廣虛假AI服務,例如Midjourney、OpenAI的Sora、GPT-5以及DALL-E,以竊取密碼的惡意軟件襲擊毫無戒心的用戶。其中,一個冒充Midjourney的惡意Facebook頁面聚集了120萬粉絲,並在最終被刪除之前保持活躍近一年,該頁面於2024年3月8日被關閉。
12、長視頻生成模型StreamingT2V發佈
根據GitHub網站,UT奧斯丁等機構於4月5日發佈了視頻生成模型StreamingT2V的代碼和模型。此前3月22日,團隊在arXiv上發表論文,提出了一種AI視頻生成技術StreamingT2V,可以生成高度一致、長度可擴展的視頻。據介紹,StreamingT2V能夠生成1200幀、時長120秒的長視頻,且理論上可以生成無限長的視頻。
GitHub地址:https://github.com/Picsart-AI-Research/StreamingT2V
論文地址:https://arxiv.org/abs/2403.14773
13、AI視頻理解模型MiniGPT4-Video發佈
根據arXiv網站,KAUST和哈佛大學研究團隊在4月4日發表的論文中提出MiniGPT4-Video框架,一個專爲視頻理解而設計的多模態大模型。該模型能夠處理時間視覺和文本數據,使其能夠熟練地理解視頻的複雜性。MiniGPT4-video不僅考慮視覺內容,還集成了文本對話,允許模型有效地回答涉及視覺和文本組件的查詢。據稱,該模型優於現有的最先進的方法,在MSVD、MSRVTT、TGIF和TVQA基準測試上分別獲得4.22%、1.13%、20.82%和13.1%的成績,模型和代碼已公開。
論文地址:https://arxiv.org/pdf/2404.03413.pdf
GitHub地址:https://vision-cair.github.io/MiniGPT4-video/
14、斯坦福團隊推出端側可跑的Octopus v2模型
根據arXiv網站,斯坦福團隊研究人員於4月2日推出端側可運行的Octopus v2模型。基於新方法,具有20億個參數的Octopus v2模型能夠在準確性和延遲方面超越GPT-4的性能,並將上下文長度減少95%。與具有基於RAG的函數調用機制的Llama-7B相比,該方法的速度提高了35倍。
論文地址:https://arxiv.org/pdf/2404.01744.pdf
15、Cohere推出RAG優化的大模型Command R+
根據AI獨角獸Cohere官網,Cohere於4月4日推出Command R+,一種先進的高級檢索增強生成 (RAG)優化的大語言模型,也是該公司目前最強大、可擴展的大型語言模型。該模型具有128k tokens上下文窗口,提供RAG並被加入引用以減少幻覺,支持10種主要語言多語言覆蓋,支持全球業務運營,並可用於自動化複雜業務流程。Command R+系列現已在微軟Azure上提供,並且很快將向其他雲提供商提供。
官方地址:https://txt.cohere.com/command-r-plus-microsoft-azure/
16、Lambda以英偉達芯片作爲抵押獲5億美元貸款
據路透社4月4日報道,美國智能雲廠商Lambda近期已從包括麥格理集團(Macquarie Group)在內的貸方獲得了5億美元的貸款,其將提供英偉達芯片作爲抵押品。
17、英偉達與印尼電信公司將投建2億美元的AI中心
據路透社4月4日報道,英偉達和印度尼西亞電信公司PT Indosat Ooredoo Hutchison計劃於2024年在中爪哇建立一個AI中心,價值2億美元。該AI中心可能由電信基礎設施或人力資源中心組成,並將位於梭羅市。
18、Meta修改深度僞造內容管理規則
據路透社4月5日報道,Meta週五宣佈修改相關數字媒體政策,準備測試其監管AI技術生成的欺騙性內容的能力。新方法將改變公司對操縱內容的處理方式,從專注於刪除特定帖子轉向保持內容不變,同時向觀衆提供有關其製作方式的信息。
19、曝Meta的AI圖像生成器存在種族偏見
據外媒The Verge 4月4日報道,記者近期多次嘗試使用“亞洲男人和白人朋友”、“亞洲男人和白人妻子”、“亞洲女人和白人丈夫”等提示詞來創建圖像,Meta的AI圖像生成器都無法勝任。對此該記者認爲,AI系統的生成不準確問題反映了其創建者、培訓者及其使用的數據集存在偏見。
20、圖像網站考慮授權130億照片和視頻訓練AI
據路透社4月5日報道,老牌圖像託管網站Photobucket近期正在與多家科技公司進行談判,以授權Photobucket的130億張照片和視頻用於訓練生成式AI模型。公司考慮每張照片5美分到1美元之間的價格,每個視頻超過1美元的價格,價格因買家和所尋求的圖像類型而異。
21、比利時AI創企完成4200萬美元融資
據外媒TechCrunch 4月5日報道,比利時AI初創公司Robovision近期完成4200萬美元A輪融資,由比利時農業科技投資者Astanor Ventures和Target Global共同領投,使企估值達到1.8億美元。Robovision聚焦打造一個“無代碼”計算機視覺AI平臺,在不需要軟件開發人員或數據科學家參與的條件下,助客戶使用其平臺上傳數據、標記數據、測試模型並將其部署到生產中。
22、信雅達大模型智能問答產品發佈
根據信雅達科技股份有限公司官方公衆號,信雅達運營智能知識助手“小雅”於4月3日發佈。作爲信雅達數字化運營條線全新推出的大模型智能問答產品,“小雅”是一款專爲商業銀行打造的辦公輔助工具,基於信雅達“雅問知識湖”,結合銀行金融知識庫,提供專業問答服務。
23、美國和歐盟就AI安全和治理達成合作
根據歐盟官網,歐盟和美國4月5日發表聯合聲明確認加強AI領域合作。該協議主要涵蓋AI安全和治理領域,同時雙方還打算在許多其他技術問題上進行廣泛合作,例如制定數字身份標準以及對平臺施加壓力以捍衛人權。
24、華盛頓法官禁止使用AI增強視頻作爲案件證據
據外媒NBC News 4月3日報道,華盛頓州一名負責監督三重謀殺案的法官在近期的裁決中禁止使用AI增強的視頻作爲證據,專家稱該裁決可能是美國刑事法院的首例。法庭文件顯示,一名男子被指控於2021年在西雅圖地區一家酒吧外開槍,造成三人死亡、兩人受傷,該男子的律師曾試圖引入經過機器學習軟件增強的手機視頻。文件稱,增強後的圖像“不準確、具有誤導性且不可靠”。
25、以軍被曝用AI生成殺戮名單狂轟濫炸加沙
財聯社4月5日電,以色列媒體《+972》雜誌(注:+972爲以色列的國際區號)4月3日發表一篇題爲《“薰衣草”:人工智能機器指揮以色列在加沙狂轟濫炸》的文章,援引六名以色列現任情報官員的信源,曝光了以軍在本輪巴以衝突中使用一款自主開發、名爲“薰衣草(Lavender)”的人工智能程序,生成“殺戮名單”。報道稱,在本輪衝突、特別是衝突早期,以軍就是憑藉這份由人工智能生成的、最多時包含了多達37000人的“殺戮名單”,在加沙地帶狂轟濫炸。
26、 調查顯示AI正在削減工人數量
據路透社4月5日報道,人力資源提供商Adecco近期在一份基於對全球2000家大公司高管的調查的報告中提到,約41%的高管預計由於AI技術的發展,公司員工隊伍將減少。AI將導致許多公司在未來五年內僱用更少的員工。不過,儘管Adecco調查的大多數高級管理人員都表示AI是遊戲規則的改變者,但大多數人表示他們在採用該技術方面尚未取得足夠的進展。