2026-05-28 — views

Nvidia、AMD、CoreWeave 同时投资 Tensormesh——KV 缓存重用成为推理原语

为什么值得读三家对手——Nvidia、AMD、CoreWeave——同时投资就是信号：KV 缓存重用（别重算已算过的）正被视为基础、中立的推理堆栈层，而非赢者通吃的产品。推理时代的经济学，浓缩于一轮募资。

Tensormesh 获 Nvidia、AMD、CoreWeave 投资 2000 万美元（5/27），并推出 Tensormesh Inference——产品化的 KV 缓存重用，宣称延迟与 GPU 成本最高降 10 倍。

2026 年 5 月 27 日，Tensormesh 宣布获得 2000 万美元新募资——一轮种子延伸，使总募资达 2450 万美元——投资者阵容格外一致：AMD Ventures、CoreWeave 与 NVentures（Nvidia 创投），外加 Valley Capital Partners 与 Laude Ventures。同时，公司推出 Tensormesh Inference 正式上线。

问题：为同一份计算付两次钱

Tensormesh 瞄准它所谓企业最昂贵的 AI 问题——重算 GPU 已经处理过的东西。在 transformer 推理中，KV 缓存（模型读取提示时建立的 key/value 张量）通常在请求之间被丢弃，因此共享上下文——长系统提示、文档、对话历史——每次都要从头重算。Tensormesh 存储并重用这些已算结果，消除冗余计算，宣称延迟与 GPU 花费最高降 10 倍。

它随附一个成本节省仪表板，实时呈现财务影响：追踪缓存命中率（已缓存对总提示 token），并持续换算成美元数字，而非要团队凭信任接受节省。

为何股东名单才是重点

引人注目的不是募资规模，而是谁签了支票。Nvidia、AMD 与 CoreWeave 在芯片与云端领域是竞争对手，却共同投资同一家初创。这种一致性发出共同信念：KV 缓存重用是推理堆栈的基础层，而非他们任一家想独占的赢者通吃产品。若推理在各自硬件上变得更便宜、更具黏性，每家都受益——所以一个中立、产品化的缓存层是水涨船高。资金将投入产品、与三家的硬件层整合，以及开源贡献。

为何重要

这是**“推理之年”经济学浓缩成一轮募资。当模型从展示走向生产，成本中心从训练转向服务，而最便宜的 token 是你永不重算的那一个。缓存、路由与量化正成为真正的利润杠杆——资本如今流向模型与用户之间的管路**，而不只是模型本身。一家把 KV 缓存变成企业基础设施、且由它赖以运行的三家公司出资的初创，清楚标示了价值正往哪里迁移。

实务笔记

若你以任何规模在服务 LLM，请先量测你的缓存命中率——这是预测重用层能为你省多少的单一数字。具有大量共享前缀的工作负载（对同一语料的 RAG、长固定系统提示、多轮对话）才有 10 倍级胜点的可能；大多为独特提示的工作负载则省得少得多。也要权衡隔离问题：跨请求重用已算状态的缓存，需要硬性的租户边界，否则你可能让一位用户的上下文渗进另一位的。节省是真的，但”共享缓存”与”数据隔离”是一个你必须刻意设定、而非默认继承的取舍。

较少被讨论的角度

若推理层围绕 KV 缓存这类共享原语而商品化，竞争前沿就上移一层——移到谁能把缓存、路由与量化一起编排成最便宜可靠的 token。这正是模型路由所演绎的同一论点：模型日益成为可替换的后端，而能长存的生意，是那些优化智能交付的。Tensormesh 由硬件厂商自己背书，是一场赌注：这个管路层大到足以撑起一家公司——且核心到连对手都想占一席。