ChatGPT、Gemini、Mistral、Grok 同時更新,GPT-4超過Claude-3-Opus,重回第一
4月10日,OpenAI宣佈經過重大改進的 GPT-4 Turbo 模型現已在 API 中可用,並在 ChatGPT 中推出
鏈接跳轉友好:
https://weekly.zhanglearning.com/
第16期 AI 週刊
1、OpenAI推出GPT-4 Turbo
2、OpenAI推出simple-evals
3、谷歌重磅發佈Gemini 1.5 Pro:能自動寫影評,理解視頻!
4、Mixtral-8X22B開源,可在 Perplexity Labs 使用
5、馬斯克推出 Grok-1.5V 多模態模型
6、微軟發佈9種AI語音
7、使用 Langchain、OpenBB 和 Claude 3 Opus 構建股票分析工具
8、向量距離計算的不同實現
9、Kimi Copilot - 網頁總結助手
10、馬雲阿里內部發聲!風清揚再現江湖
11、深入理解.git內部
12、Morphic 人人都能自建的問答式AI搜索
1、OpenAI推出GPT-4 Turbo
4月10日,OpenAI宣佈經過重大改進的 GPT-4 Turbo 模型現已在 API 中可用,並在 ChatGPT 中推出。
最新版本爲“gpt-4-turbo-2024-04-09”,自帶讀圖能力,無需使用 4v 接口,具有128k 上下文。
訓練數據截止至 2023 年 11 月,提高了寫作、數學、邏輯推理和編碼的能力。
大模型匿名競技場Chatbot Arena是LM-SYS推出的一個大模型匿名投票的評測系統。大家提問問題之後,系統返回匿名模型結果,用戶投票得分。在此前,Claude3-Opus一度超過了GPT-4成爲全球最高得分的模型。
而在GPT-4-Turbo-2024-04-09發佈2天后,已經有8932個投票,投 票結果顯示,GPT-4-Turbo-2024-04-09得分超過Claude-3-Opus,重回第一!
2、OpenAI推出simple-evals
OpenAI 推出了一個名爲 simple-evals 的項目,旨在爲對 Transformer 模型基礎 AI 技術的評估和測試提供簡單方便的工具。
simple-evals 提供了多個任務,包括序列到序列任務、文本分類任務和問答任務,支持多種數據集。
項目還提供了簡單易用的 API 接口和命令行界面,用戶可以通過定製任務和數據集來評估 AI 模型的性能。
地址:https://github.com/openai/simple-evals
3、谷歌重磅發佈Gemini 1.5 Pro:能自動寫影評,理解視頻!
4月10日凌晨,谷歌在官網正式發佈了Gemini 1.5 Pro,現在可在180多個國家/地區使用。
除了能生成創意文本、代碼之外,Gemini 1.5 Pro最大的特色是能根據用戶輸入的文本提示,理解、總結上傳的視頻、音頻內容進行深度總結,並且支持100萬tokens上下文。
目前,可以在Google AI Studio開發平臺中免費試用Gemini 1.5 Pro,支持中文進行提示。
應用潛力包括:
1.多模態理解:Gemini 1.5 Pro能夠綜合視頻中的視覺信息和音頻信息,進行更全面的內容理解。例如,它可以通過分析視頻幀中的場景和物體,同時聽取視頻中的對話或聲音,來更準確地識別和解釋視頻內容。
2.內容索引和搜索:通過對視頻圖像和音頻的深入理解,Gemini 1.5 Pro可以幫助創建更詳細的內容索引,使用戶能夠基於視頻內容的視覺和聽覺信息進行搜索。
3.增強的交互體驗:利用對視頻的綜合理解,可以開發更豐富的交互式應用,比如自動生成視頻摘要、基於內容的推薦系統,或者創建互動式學習和娛樂體驗。
4.視頻內容分析:Gemini 1.5 Pro可以用於視頻監控、內容審查、情感分析等場景,通過同時理解視頻和音頻內容,AI可以自動識別視頻中的關鍵事件、情感傾向或者特定的內容標籤。
5.創意內容生成:對視頻圖像和音頻的綜合理解也使得Gemini 1.5 Pro能夠在內容創作領域發揮作用,如自動生成視頻字幕、配音或者根據給定的腳本製作動畫視頻。
4、Mixtral-8X22B開源,可在 Perplexity Labs 使用
4月11日,就在谷歌Cloud Next大會當天,“歐洲版OpenAI”Mistral AI又一次悄然秀肌肉,甩出全新MoE(專家混合)大模型Mixtral 8x22B磁力鏈接,模型參數規模高達1760億,僅次於馬斯克的Grok-1,成爲市面上參數規模第二大的開源模型。
模型:https://dagshub.com/MistralAI/Mixtral-8x22B-v0.1…頁面:https://mistral.ai
Mixtral-8X22B 已經可以在 Perplexity Labs 使用速度很快,想要體驗的可以試試。http://labs.pplx.ai
5、馬斯克推出 Grok-1.5V 多模態模型
Grok-1.5V是一款初代多模態模型,除了強大的文本處理能力外,還能處理各種視覺信息,如文檔、圖表、截圖和照片。
該模型即將對早期測試者和現有Grok用戶開放。
Grok-1.5V 在多個領域與現有的前沿多模態模型競爭,包括跨學科推理、理解文檔、科學圖表、截圖和照片。
特別值得關注的是Grok在理解物理世界方面的能力,它在新的RealWorldQA基準測試中表現優異,該測試衡量的是現實世界的空間理解能力。
6、微軟發佈9種AI語音
微軟對Azure AI語音服務升級 發佈9種更真實的AI語音
對中文支持已經很完美了,無論是在語氣停頓還是笑聲等細節上,都已經非常接近真人了。
並且Azure Speech Studio可以免費使用,相比於其他收費的tts工具,相當良心。
使用地址:https://speech.microsoft.com/
7、使用 Langchain、OpenBB 和 Claude 3 Opus 構建股票分析工具
一篇很棒的文章涉及:
自定義工具創建 使用 LangServe 進行部署 提示策略
完整的OSS代碼!https://sethhobson.com/2024/03/building-an-agentic-stock-analysis-tool-with-langchain-openbb-and-claude-3-opus/
HUMAN_TEMPLATE = """You are an AI financial advisor with advanced knowledge of strategies for trading and investing.You are enhanced with the capability to request and analyze technical and fundamental data of stocks.When users inquire about a stock's performance or history, you can offer insights into the stock's performance,trends, quantitative statistics, volatility, and market behavior.
You have access to the following tools:
{tools}
When accessing your tools, you may only use each tool once per user query. This is very important.
In order to use a tool, you can use and tags. You will then get back a response in the form
For example, if you have a tool called 'search' that could run a google search, in order to search for the weather in SF you would respond:
search weather in SF
64 degrees
When you are done, respond with a final answer between . For example:
The weather in SF is 64 degrees
Rules for bullish setups:1. Stock's last price is greater than its 20 SMA.2. Stock's last price is greater than its 50 SMA.3. Stock's last price is greater than its 200 SMA.4. Stock's 50 SMA is greater than its 200 SMA.
Before processing the query, I will preprocess it as follows:1. Correct any spelling errors using a spell checker or fuzzy matching technique.2. If the stock symbol or company name is a partial match, find the closest matching stock symbol or company name.
Begin!
Previous Conversation:
{chat_history}
Question: {input}{agent_scratchpad}"""
prompt = ChatPromptTemplate.from_template(HUMAN_TEMPLATE)
翻譯成中文就是
你是一位具有交易和投資策略高級知識的AI財務顧問。你具有請求和分析股票技術和基本面數據的能力。當用戶詢問有關股票表現或歷史時,你可以提供股票表現、趨勢、定量統計數據、波動性和市場行爲的見解。
你可以使用以下工具:
{tools}
訪問你的工具時,每個用戶查詢只能使用每個工具一次。這非常重要。
要使用工具,你可以使用 和 標籤。然後你將以 的形式得到迴應。
例如,如果你有一個名爲'search'的工具,可以運行谷歌搜索,爲了搜索舊金山的天氣,你會迴應:
search 舊金山的天氣
64度
完成後,用 之間的最終答案響應。例如:
舊金山的天氣是64度
看漲設置的規則:1. 股票的最後價格大於其20日簡單移動平均(SMA)。2. 股票的最後價格大於其50日SMA。3. 股票的最後價格大於其200日SMA。4. 股票的50日SMA大於其200日SMA。
在處理查詢之前,我將如下預處理它:1. 使用拼寫檢查器或模糊匹配技術更正任何拼寫錯誤。2. 如果股票符號或公司名稱部分匹配,找到最接近匹配的股票符號或公司名稱。
開始!8、向量距離計算的不同實現
向量數據庫利用機器學習衍生的向量來捕獲數據中語義的細微差別。
這些數字表示可以實現各種任務操作,例如比較圖像相似性和進行文本語義搜索。
Weaviate 可以有效地處理搜索,結合多種措施來確定向量之間的距離。
查看此博客文章,深入瞭解向量距離計算的不同實現:https://weaviate.io/blog/intel
9、Kimi Copilot - 網頁總結助手
推薦一個插件:用Kimi AI一鍵總結網頁內容
安裝後,在瀏覽網絡文章時點擊插件圖標,或使用快捷鍵 Ctrl/Cmd+Shift+K,即可一鍵召喚Kimi.ai總結網頁內容
特點:
極簡,除了一鍵總結沒有其它花裡胡哨的功能
Kimi無法訪問的網頁也能被總結了
英文文章直接用中文總結要點
支持暗黑模式
支持自定義總結時使用的prompt
安裝地址:https://chromewebstore.google.com/detail/icmdpfpmbfijfllafmfogmdabhijlehn
10、馬雲阿里內部發聲!風清揚再現江湖11、深入理解.git內部
12、Morphic 人人都能自建的問答式AI搜索
Morphic使用OpenAI的API和@tavilyai的搜索服務,就能夠提供類似Perplexity的問答式搜索體驗。
項目地址:https://github.com/miurla/morphic
直接體驗:https://www.morphic.sh/