Builder Daily

2026-04-25

Anthropic 对 agent 对 agent 商务做了封闭测试

Anthropic 给 69 位员工 $100 预算,讓 agent 在四个不同模型设置的市集互买互卖,共 186 筆交易、約 $4K 流动,且模型质量造成明显不对称。

Anthropic 進行了一个封闭实验:69 位员工各拿 $100 预算,讓代表自己的 agent 在四个平行市集(不同模型设置)互相买卖。根據 TechCrunch 报导,实验產生 186 筆交易、約 $4,000 流动。被分配到更先進模型的用户客观上拿到更好结果 — 但參與者無法从体验中察覺自己的 agent 处于劣势。

实战筆记

这是我看过第一份 agent 对 agent 商务的公開实证数据。对设计 agent 中介市集的人有兩点啟发:

  1. 不对称对劣势方是隐形的。 预先设计,不要假設「市場會自动调節」 — 一方根本看不出自己在输。
  2. 在協议層限制模型等级,而非用户自选。如果平台允許「自帶 agent」,有較佳模型的有錢用户會赢,而你的平台會吸收信任损害。

要做 agent 中介商务的人,发布前值得收藏这篇等同论文的报导。


来源

标签

请喝咖啡