騰訊混元開源Hunyuan3D-1.0;崑崙萬維發佈天工AI高級搜索功能;GPT-4o mini的6.7/8.3 倍|極新早報

“貽誤時機或張惶失措,就等於喪失一切。”

文|小魚

編輯 | 雲舒

出品|極新

要點速覽

1、 騰訊混元開源 Hunyuan3D-1.0:首個同時支持文生和圖生的 3D 開源大模型

2、 崑崙萬維發佈天工 AI 高級搜索功能,升級分析推理、金融 / 科研能力

3、 GPT-4o mini 的 6.7/8.3 倍,Claude 3.5 Haiku AI 模型每百萬 tokens 輸入 1 美元 / 輸出 5 美元

4、 超越 OCR,谷歌 AI 技術 InkSight 可精準識別手寫文字

5、騰訊發佈MoE大語言模型

6、智譜AI概念震盪反彈 豆神教育觸及20cm漲停

▌IPO/投融資

1、AI+Chemistry科技創新服務商「深度原理」完成種子++輪融資,投資方爲祥峰投資。

深度原理是一家AI+Chemistry科技創新服務商,專注於人工智能驅動化學領域的科學研究,致力於通過人工智能技術加速材料化學創新。公司結合深度學習(Deep Learning)和第一性原理思考(First Principles),重新深入解構分子世界運行原理。旨在融合人工智能(AI),量子化學(Quantum Chemistry)和高通量實驗(HTE)技術,通過AI決策模型和生成式AI在化學反應中的應用,形成多級、多精度的工作流程,顛覆傳統「自上而下實驗試錯」的化學材料發現模式,加速化學材料研發創新。

2、通用型仿生人形機器人研發商「月泉仿生」完成1億人民幣Pre-A輪融資,由洪泰基金領投,長興基金、啓航投資跟投。

月泉仿生是一家通用型仿生人形機器人研發商,專注於從事人形機器人本體、核心零部件及仿生智能裝備的研發和產業化。核心業務涵蓋仿生運動智能、仿生健康系統與裝備、仿人機器人等爲方向的仿生科技研發、推廣。已實現機器人整機結構、核心結構件、動力系統等全鏈條自研,並提出瞭如仿生韌帶等具備柔性和高強度耐用的新材料編織生產方式等。

3、通用航空動力裝置研發商「鴻鵬航空」完成數千萬人民幣A+輪,由大橫琴集團領投,銀珠資本、超越摩爾基金跟投。

鴻鵬航空是一家通用航空動力裝置研發商,公司專注於航空發動機的設計、研發、生產和維修保障業務,已形成包括渦槳、活塞、混動增程動力系統在內的多層次產品體系。旗下產品包括D系列重油活塞發動機、G系列汽油活塞發動機、TP系列渦槳發動機和E系列混動增程動力系統。

4、工業應用領域聲學檢測AI技術研發商「諦聲科技」完成股權投資,投資方爲港鐵公司。

諦聲科技是一家工業應用領域聲學檢測AI技術研發商,致力於爲工業智造、能源、電力、軌道交通客戶提供AI智能聲學故障檢測、運維等多元化解決方案。基於聲學監測技術原理,已推出兩款設備監測產品:一款是融合了大型麥克風陣列和攝像頭的聲學相機(也稱聲像儀),另一款是基於小型分佈麥克風陣列實現故障信號的模式識別設備——Cap(又名智能工業聽診器)。

▌科技要聞

1、騰訊混元開源 Hunyuan3D-1.0:首個同時支持文生和圖生的 3D 開源大模型

11 月 5 日消息,騰訊混元今日開源了 Hunyuan3D-1.0 大模型,官方稱這是首個同時支持文生和圖生的 3D 開源大模型。

▲ 文生模型

▲ 圖生模型

模型採用兩階段生成方法,官方表示在保證質量和可控的基礎上,10 秒即可生成 3D 資產:

第一階段,團隊採用了一種多視角擴散模型,輕量版模型能夠在大約 4 秒內生成多視角圖像。這些多視角圖像從不同的視角捕捉了 3D 資產的豐富的紋理和幾何先驗,將任務從單視角重建鬆弛到多視角重建

第二階段,團隊引入了一種前饋重建模型,利用上一階段生成的多視角圖像。該模型能夠在大約 3 秒內快速而準確地重建 3D 資產。重建模型學習處理多視角擴散引入的噪聲和不一致性,並利用條件圖像中的可用信息高效恢復 3D 結構

最終該模型可以實現輸入任意單視角實現三維生成

官方表示該模型的泛化能力和可控性強,可重建各類尺度物體,大到建築,小到工具花草。(IT之家)

2、崑崙萬維發佈天工 AI 高級搜索功能,升級分析推理、金融 / 科研能力

11 月 5 日消息,崑崙萬維天工 AI 今日發佈最新版本的 AI 高級搜索功能,迎來四個方面的升級:

全面升級多層次分析推理能力

升級的金融投資專業 AI 搜索

升級的科研學術專業 AI 搜索

針對文檔 AI 閱讀分析的智能優化(IT之家)

3、GPT-4o mini 的 6.7/8.3 倍,Claude 3.5 Haiku AI 模型每百萬 tokens 輸入 1 美元 / 輸出 5 美元

11 月 5 日消息,Anthropic 昨日(11 月 4 日)發佈博文,宣佈開發者可以通過第一方 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI,調用 Claude 3.5 Haiku 模型。

Claude 3.5 Haiku 對標的是 OpenAI 的 GPT-4o Mini 和谷歌的 Gemini 1.5 Flash,在多項 AI 基準測試中超越了 Anthropic 上一代中最大的模型 Claude 3 Opus。

Anthropic 表示目前 Claude 3.5 Haiku 模型僅上線文本模態,未來將支持圖像輸入。

不過最令開發者感到驚訝的是產品 API 定價,每百萬 tokens 輸入售價爲 1 美元、每百萬 tokens 輸出售價爲 5 美元,通過提示詞緩存可節省最多 90% 的成本,通過 Message Batches API 可節省 50% 的成本。

查詢公開資料,OpenAI 的 GPT-4 mini 模型的每百萬 tokens 輸入售價爲 0.15 美元、每百萬 tokens 輸出售價爲 0.6 美元(IT之家備註:當前約 4.3 元人民幣)。

谷歌的 Gemini 1.5 Flash 模型在提示詞小於 12.8 萬個 token 情況下,每百萬 tokens 輸入售價爲 0.075 美元、每百萬 tokens 輸出售價爲 0.3 美元;超出 12.8 萬個 tokens 情況下,每百萬 tokens 輸入售價爲 0.15 美元、每百萬 tokens 輸出售價爲 0.6 美元。(IT之家)

4、超越 OCR,谷歌 AI 技術 InkSight 可精準識別手寫文字

11 月 5 日消息,Google Research 展示了一種使用人工智能讀取手寫內容的新方法,名爲 InkSight 的系統能夠直接從手寫文字的圖片中提取出數字文本,無需任何中間設備。

傳統的手寫文字識別技術主要依賴於光學字符識別 (OCR),但這種方法在處理複雜背景、模糊不清或低光照條件下的手寫文字時往往表現不佳。InkSight 則採用了不同的思路,通過模仿人類學習閱讀的過程,即通過不斷地重寫文本,來學習整個單詞的外觀和含義。這需要研究人員訓練 AI 模型,使其能夠識別和模仿人類的手寫風格。

InkSight 在處理複雜場景時表現更爲出色,例如當照片光線昏暗、文本部分遮擋或背景干擾時,InkSight 能夠更準確地識別手寫文字。研究人員發現,人類能夠閱讀 InkSight 生成的文本描摹的準確率高達 87%,其中三分之二的描摹結果與真實手寫幾乎無法區分。

對於喜歡手寫的人來說,InkSight 具有巨大的潛力。想象一下,只需將手寫筆記拍攝照片,即可立即將其轉換爲可搜索的數字文本。對於那些字跡潦草的人來說,InkSight 可以將難以辨認的手寫內容轉化爲清晰、準確的打印文本。

從更廣闊的視角來看,這項技術對於破譯和和將幾個世紀以來的手寫文本轉換爲數字形式具有重要意義。即使對於那些數字化程度較低的語言,InkSight 也能幫助保護手寫遺產,併爲這些語言的數字化訓練提供更多資源。

谷歌並不是唯一一家致力於開發手寫識別 AI 工具的公司。亞馬遜的 Kindle Scribe 電子閱讀器也具備將手寫筆記轉換爲可讀文本的功能。此外,Goodnotes 等數字筆記應用也推出了手寫識別和編輯功能,可以將手寫文字轉換爲可編輯的數字文本。(IT之家)

▌股市風雲

1、騰訊發佈MoE大語言模型

11月5日,騰訊發佈Hunyuan-large。據官方數字,該模型是業界參數規模最大的開源MoE(專家)大語言模型,總參數389B,上下文長度256K,模型層數64層,用到了合成數據。騰訊機器學習平臺總監康戰輝表示,今天業內用的更多還是自然數據,但自然數據增長跟不上模型的需求。(第一財經)

2、智譜AI概念震盪反彈 豆神教育觸及20cm漲停

智譜AI概念震盪反彈,豆神教育觸及20cm漲停,中科曙光、科藍軟件、因賽集團、奧飛數據、華策影視等跟漲。 ( 東方財富Choice數據 )

▌好文推薦

“有的嚴防死守,有的靜待時機。"

更多幹貨分享敬請關注我們的公衆號與視頻號~超多精彩對話內容等待您的解鎖!

掃碼加入【極新】科技行業交流羣,探索科技前沿趨勢,本羣適合創始人、CXO、行業高管。

關於極新:

極新是垂直於產業AI的創投和行業研究媒體,致力於陪伴和記錄科技企業進步和產業成長。已與多家平臺和創新企業深度對話和合作,包括華爲雲、阿里雲、百度智能雲、金山雲、飛書、火山引擎、釘釘、東軟、Zoho、容聯雲、百家雲等平臺企業,以及智譜AI、百川智能、格靈深瞳、深勢科技、百圖生科、瑞萊智慧、創客貼、生數科技等高成長公司。

2024投融資趨勢追蹤:| | | | | |||

深度對話·創新&增長的源動力:| | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |