2026-04-25

Anthropic 對 agent 對 agent 商務做了封閉測試

Anthropic 給 69 位員工 $100 預算，讓 agent 在四個不同模型設定的市集互買互賣，共 186 筆交易、約 $4K 流動，且模型品質造成明顯不對稱。

Anthropic 進行了一個封閉實驗：69 位員工各拿 $100 預算，讓代表自己的 agent 在四個平行市集（不同模型設定）互相買賣。根據 TechCrunch 報導，實驗產生 186 筆交易、約 $4,000 流動。被分配到更先進模型的使用者客觀上拿到更好結果 — 但參與者無法從體驗中察覺自己的 agent 處於劣勢。

實戰筆記

這是我看過第一份 agent 對 agent 商務的公開實證資料。對設計 agent 中介市集的人有兩點啟發：

不對稱對劣勢方是隱形的。 預先設計，不要假設「市場會自動調節」 — 一方根本看不出自己在輸。
在協議層限制模型等級，而非使用者自選。如果平台允許「自帶 agent」，有較佳模型的有錢使用者會贏，而你的平台會吸收信任損害。

要做 agent 中介商務的人，發布前值得收藏這篇等同論文的報導。

來源

TechCrunch — Anthropic agent-on-agent commerce test ↗

Anthropic 對 agent 對 agent 商務做了封閉測試

實戰筆記

來源

標籤