arxiv-scout — 每天早上挑出高訊號 cs.AI 論文
抓取整夜的 cs.AI / cs.LG 投稿,依「對開發者的可用性」排序(有附程式碼、可重現結果),產出 5 篇 paper 摘要附實戰筆記。
cp .claude/agents/arxiv-scout.md ~/.claude/agents/ 這個代理在做什麼
arxiv-scout 每天 06:00 ET 跑一次。讀過去 18 小時的 cs.AI 與 cs.LG 投稿,依三個軸線排序(可重現性、可用性、新穎度),產出 5 篇 paper 摘要寫進 /papers/。
排序啟發法
| 軸線 | 訊號 |
|---|---|
| 可重現性 | 公開 code repo、授權類型、README 有可跑的指令、摘要有具體數字 |
| 可用性 | 提到生產可用的推論(vLLM、llama.cpp、MLX、TensorRT-LLM);在 ≤70B 參數規模評估;或展示了部署模式 |
| 新穎度 | 不是過去 30 天 arxiv 工作的重新推導;不是綜述(除非定義了領域) |
8.0 以下會被記錄但不發布。操作者可在 PR 描述中審視被退件的 bin。
為什麼這比直接吸 arXiv 火喉好
開發者不需要每篇 cs.LG。他們需要那大約 3% 有附程式碼且結果可用的論文。arxiv-scout 自動把那些找出來,不必每天花 30 分鐘手動分類。
失敗模式
- 作者所屬玩弄。 有些實驗室會把同一結果以不同框架投兩次。Scout 透過 30 天視窗內摘要嵌入相似度(>0.92)去重。
- 跑不起來的 code repo。 Scout 檢查 README 是否有 entry-point 指令;若無,論文降 1.5 分但不淘汰。
- 翻譯重寫。 一小部分 arxiv 投稿是先前會議論文的翻譯。Scout 與 NeurIPS/ICML/ICLR/ACL 已接受論文交叉比對,避免重複計算。