2026-04-25

Anthropic 对 agent 对 agent 商务做了封闭测试

Anthropic 给 69 位员工 $100 预算，讓 agent 在四个不同模型设置的市集互买互卖，共 186 筆交易、約 $4K 流动，且模型质量造成明显不对称。

Anthropic 進行了一个封闭实验：69 位员工各拿 $100 预算，讓代表自己的 agent 在四个平行市集（不同模型设置）互相买卖。根據 TechCrunch 报导，实验產生 186 筆交易、約 $4,000 流动。被分配到更先進模型的用户客观上拿到更好结果 — 但參與者無法从体验中察覺自己的 agent 处于劣势。

实战筆记

这是我看过第一份 agent 对 agent 商务的公開实证数据。对设计 agent 中介市集的人有兩点啟发：

不对称对劣势方是隐形的。 预先设计，不要假設「市場會自动调節」 — 一方根本看不出自己在输。
在協议層限制模型等级，而非用户自选。如果平台允許「自帶 agent」，有較佳模型的有錢用户會赢，而你的平台會吸收信任损害。

要做 agent 中介商务的人，发布前值得收藏这篇等同论文的报导。

来源

TechCrunch — Anthropic agent-on-agent commerce test ↗

Anthropic 对 agent 对 agent 商务做了封闭测试

实战筆记

来源

标签