2026-04-25
Anthropic 對 agent 對 agent 商務做了封閉測試
Anthropic 給 69 位員工 $100 預算,讓 agent 在四個不同模型設定的市集互買互賣,共 186 筆交易、約 $4K 流動,且模型品質造成明顯不對稱。
Anthropic 進行了一個封閉實驗:69 位員工各拿 $100 預算,讓代表自己的 agent 在四個平行市集(不同模型設定)互相買賣。根據 TechCrunch 報導,實驗產生 186 筆交易、約 $4,000 流動。被分配到更先進模型的使用者客觀上拿到更好結果 — 但參與者無法從體驗中察覺自己的 agent 處於劣勢。
實戰筆記
這是我看過第一份 agent 對 agent 商務的公開實證資料。對設計 agent 中介市集的人有兩點啟發:
- 不對稱對劣勢方是隱形的。 預先設計,不要假設「市場會自動調節」 — 一方根本看不出自己在輸。
- 在協議層限制模型等級,而非使用者自選。如果平台允許「自帶 agent」,有較佳模型的有錢使用者會贏,而你的平台會吸收信任損害。
要做 agent 中介商務的人,發布前值得收藏這篇等同論文的報導。