2026-05-28 — views

Nvidia、AMD、CoreWeave 同時投資 Tensormesh——KV 快取重用成為推論原語

為什麼值得讀三家對手——Nvidia、AMD、CoreWeave——同時投資就是訊號：KV 快取重用（別重算已算過的）正被視為基礎、中立的推論堆疊層，而非贏者全拿的產品。推論時代的經濟學，濃縮於一輪募資。

Tensormesh 獲 Nvidia、AMD、CoreWeave 投資 2000 萬美元（5/27），並推出 Tensormesh Inference——產品化的 KV 快取重用，宣稱延遲與 GPU 成本最高降 10 倍。

2026 年 5 月 27 日，Tensormesh 宣布獲得 2000 萬美元新募資——一輪種子延伸，使總募資達 2450 萬美元——投資者陣容格外一致：AMD Ventures、CoreWeave 與 NVentures（Nvidia 創投），外加 Valley Capital Partners 與 Laude Ventures。同時，公司推出 Tensormesh Inference 正式上線。

問題：為同一份運算付兩次錢

Tensormesh 鎖定它所謂企業最昂貴的 AI 問題——重算 GPU 已經處理過的東西。在 transformer 推論中，KV 快取（模型讀取提示時建立的 key/value 張量）通常在請求之間被丟棄，因此共享脈絡——長系統提示、文件、對話歷史——每次都要從頭重算。Tensormesh 儲存並重用這些已算結果，消除冗餘運算，宣稱延遲與 GPU 花費最高降 10 倍。

它隨附一個成本節省儀表板，即時呈現財務影響：追蹤快取命中率（已快取對總提示 token），並持續換算成美元數字，而非要團隊憑信任接受節省。

為何股東名單才是重點

引人注目的不是募資規模，而是誰簽了支票。Nvidia、AMD 與 CoreWeave 在晶片與雲端領域是競爭對手，卻共同投資同一家新創。這種一致性發出共同信念：KV 快取重用是推論堆疊的基礎層，而非他們任一家想獨占的贏者全拿產品。若推論在各自硬體上變得更便宜、更具黏性，每家都受益——所以一個中立、產品化的快取層是水漲船高。資金將投入產品、與三家的硬體層整合，以及開源貢獻。

為何重要

這是**「推論之年」經濟學濃縮成一輪募資。當模型從展示走向生產，成本中心從訓練轉向服務，而最便宜的 token 是你永不重算的那一個。快取、路由與量化正成為真正的利潤槓桿——資本如今流向模型與使用者之間的管路**，而不只是模型本身。一家把 KV 快取變成企業基礎設施、且由它賴以運行的三家公司出資的新創，清楚標示了價值正往哪裡遷移。

實務筆記

若你以任何規模在服務 LLM，請先量測你的快取命中率——這是預測重用層能為你省多少的單一數字。具有大量共享前綴的工作負載（對同一語料的 RAG、長固定系統提示、多輪對話）才有 10 倍級勝點的可能；大多為獨特提示的工作負載則省得少得多。也要權衡隔離問題：跨請求重用已算狀態的快取，需要硬性的租戶邊界，否則你可能讓一位使用者的脈絡滲進另一位的。節省是真的，但「共享快取」與「資料隔離」是一個你必須刻意設定、而非預設繼承的取捨。

較少被討論的角度

若推論層圍繞 KV 快取這類共享原語而商品化，競爭前沿就上移一層——移到誰能把快取、路由與量化一起編排成最便宜可靠的 token。這正是模型路由所演繹的同一論點：模型日益成為可替換的後端，而能長存的生意，是那些優化智慧交付的。Tensormesh 由硬體廠商自己背書，是一場賭注：這個管路層大到足以撐起一家公司——且核心到連對手都想佔一席。