2026-05-28 — views
Nvidia、AMD、CoreWeave 同时投资 Tensormesh——KV 缓存重用成为推理原语
为什么值得读 三家对手——Nvidia、AMD、CoreWeave——同时投资就是信号:KV 缓存重用(别重算已算过的)正被视为基础、中立的推理堆栈层,而非赢者通吃的产品。推理时代的经济学,浓缩于一轮募资。
Tensormesh 获 Nvidia、AMD、CoreWeave 投资 2000 万美元(5/27),并推出 Tensormesh Inference——产品化的 KV 缓存重用,宣称延迟与 GPU 成本最高降 10 倍。
2026 年 5 月 27 日,Tensormesh 宣布获得 2000 万美元新募资——一轮种子延伸,使总募资达 2450 万美元——投资者阵容格外一致:AMD Ventures、CoreWeave 与 NVentures(Nvidia 创投),外加 Valley Capital Partners 与 Laude Ventures。同时,公司推出 Tensormesh Inference 正式上线。
问题:为同一份计算付两次钱
Tensormesh 瞄准它所谓企业最昂贵的 AI 问题——重算 GPU 已经处理过的东西。在 transformer 推理中,KV 缓存(模型读取提示时建立的 key/value 张量)通常在请求之间被丢弃,因此共享上下文——长系统提示、文档、对话历史——每次都要从头重算。Tensormesh 存储并重用这些已算结果,消除冗余计算,宣称延迟与 GPU 花费最高降 10 倍。
它随附一个成本节省仪表板,实时呈现财务影响:追踪缓存命中率(已缓存对总提示 token),并持续换算成美元数字,而非要团队凭信任接受节省。
为何股东名单才是重点
引人注目的不是募资规模,而是谁签了支票。Nvidia、AMD 与 CoreWeave 在芯片与云端领域是竞争对手,却共同投资同一家初创。这种一致性发出共同信念:KV 缓存重用是推理堆栈的基础层,而非他们任一家想独占的赢者通吃产品。若推理在各自硬件上变得更便宜、更具黏性,每家都受益——所以一个中立、产品化的缓存层是水涨船高。资金将投入产品、与三家的硬件层整合,以及开源贡献。
为何重要
这是**“推理之年”经济学浓缩成一轮募资。当模型从展示走向生产,成本中心从训练转向服务,而最便宜的 token 是你永不重算的那一个。缓存、路由与量化正成为真正的利润杠杆——资本如今流向模型与用户之间的管路**,而不只是模型本身。一家把 KV 缓存变成企业基础设施、且由它赖以运行的三家公司出资的初创,清楚标示了价值正往哪里迁移。
实务笔记
若你以任何规模在服务 LLM,请先量测你的缓存命中率——这是预测重用层能为你省多少的单一数字。具有大量共享前缀的工作负载(对同一语料的 RAG、长固定系统提示、多轮对话)才有 10 倍级胜点的可能;大多为独特提示的工作负载则省得少得多。也要权衡隔离问题:跨请求重用已算状态的缓存,需要硬性的租户边界,否则你可能让一位用户的上下文渗进另一位的。节省是真的,但”共享缓存”与”数据隔离”是一个你必须刻意设定、而非默认继承的取舍。
较少被讨论的角度
若推理层围绕 KV 缓存这类共享原语而商品化,竞争前沿就上移一层——移到谁能把缓存、路由与量化一起编排成最便宜可靠的 token。这正是模型路由所演绎的同一论点:模型日益成为可替换的后端,而能长存的生意,是那些优化智能交付的。Tensormesh 由硬件厂商自己背书,是一场赌注:这个管路层大到足以撑起一家公司——且核心到连对手都想占一席。
来源
- Tensormesh Raises $20M from Investors Including AMD Ventures, CoreWeave, NVentures — BusinessWire ↗
- Tensormesh taps Nvidia, AMD and CoreWeave for funding to fix AI model memory problems — SiliconANGLE ↗
- Tensormesh Raises $20M, Launches AI Inference Platform Built on KV Caching — HPCwire ↗