Anthropic 推出 Finance Agents — 10 個垂直模板、Vals AI 基準 64.37%、客戶含 Citadel 與 BNY
Anthropic 推出 10 個現成可用的金融 agent 模板,搭配受治理的資料連接器(Moody's MCP、D&B、Fiscal AI、IBISWorld)。Claude Opus 4.7 在 Vals AI Finance Agent 基準以 64.37% 領先。
AI 開發者每日通訊
AI 進展太快,沒有任何單一資訊源跟得上。模型、Agent 框架、機器人示範、評測每天都在更新。我們建立 Builder Daily,讓 AI 開發者每天打開一個頁面,就能看到「真正落地的東西」並理解新聞背後的趨勢——五種語言、訊號優於雜訊、不需訂閱。
Anthropic 推出 10 個現成可用的金融 agent 模板,搭配受治理的資料連接器(Moody's MCP、D&B、Fiscal AI、IBISWorld)。Claude Opus 4.7 在 Vals AI Finance Agent 基準以 64.37% 領先。
歐盟理事會與議會 5 月 7 日達成暫定協議。合成內容標示寬限期從 6 個月縮短為 3 個月 — 2026 年 12 月 2 日截止。獨立高風險:2027 年 12 月 2 日。嵌入式高風險:2028 年 8 月 2 日。
Nvidia 2026 年 AI 股權承諾突破 $400 億。新增:3,000 萬股 IREN 認股權證 $70 履約價(約 $21 億)+ $34 億 5 GW Childress 託管雲端合約,以及 $32 億 Corning 期權。
Picobot 5/9 推出 — 單一 9MB Go 二進位檔,閒置 10MB RAM、29MB Alpine Docker 映像。內建 16 個工具(檔案、shell、網路、cron、記憶、子代理)。可跑於 $5 VPS、Pi、舊 Android。
arXiv 2604.24763
2026-04-27
Zhiheng Liu, Weiming Ren, Xiaoke Huang
原生統一多模態模型,影像直接用 patch embedding 編碼 — 無 VAE、無獨立 vision encoder。在規模化下細粒度感知獲勝。
arXiv 2604.22074
2026-04-23
Qinan Yu, Alexa Tartaglini, Peter Hase
提出 CIR(推理因果重要性)與 SR(推理充分性)兩個指標。RLVR 改善正確率但未必改善 CIR 或 SR。
arXiv 2604.19295
2026-04-21
Qingyang Zhang, Xinke Kong, Haitao Wu
Test-time training 框架,policy 在未標註題目上精煉、critic 在標註資料上週期性校準。OLMO3-7B 在 AIME 2024 從 33.0% 升到 51.1%。
2026-05-09 · benchmark
| Model | Latency | 成本 | 評語 |
|---|---|---|---|
| claude-opus-4-7 | 2240ms | $0.011 | 勝 |
| gpt-5 | 1890ms | $0.009 | 勝 |
| gemini-3-pro | 2050ms | $0.007 | 平 |
| qwen3.6-35b-a3b-nvfp4 | 920ms | $0.001 | 勝 |
測試模型是否抓到 off-by-one(start 應為 findIndex(...) + 1),且不破壞 cursor=null 分支。延遲於 client-side 量測。成本依 2026 年 5 月公開定價。所有模型給予完全相同的 prompt。
精選代理
Subagent:抓取排序過的 AI 新聞、產出雙語 MDX、開 GitHub PR 供操作者審核合併。
cp .claude/agents/digest-publisher.md ~/.claude/agents/