2026-05-28 — views
Nvidia、AMD、CoreWeave 同時投資 Tensormesh——KV 快取重用成為推論原語
為什麼值得讀 三家對手——Nvidia、AMD、CoreWeave——同時投資就是訊號:KV 快取重用(別重算已算過的)正被視為基礎、中立的推論堆疊層,而非贏者全拿的產品。推論時代的經濟學,濃縮於一輪募資。
Tensormesh 獲 Nvidia、AMD、CoreWeave 投資 2000 萬美元(5/27),並推出 Tensormesh Inference——產品化的 KV 快取重用,宣稱延遲與 GPU 成本最高降 10 倍。
2026 年 5 月 27 日,Tensormesh 宣布獲得 2000 萬美元新募資——一輪種子延伸,使總募資達 2450 萬美元——投資者陣容格外一致:AMD Ventures、CoreWeave 與 NVentures(Nvidia 創投),外加 Valley Capital Partners 與 Laude Ventures。同時,公司推出 Tensormesh Inference 正式上線。
問題:為同一份運算付兩次錢
Tensormesh 鎖定它所謂企業最昂貴的 AI 問題——重算 GPU 已經處理過的東西。在 transformer 推論中,KV 快取(模型讀取提示時建立的 key/value 張量)通常在請求之間被丟棄,因此共享脈絡——長系統提示、文件、對話歷史——每次都要從頭重算。Tensormesh 儲存並重用這些已算結果,消除冗餘運算,宣稱延遲與 GPU 花費最高降 10 倍。
它隨附一個成本節省儀表板,即時呈現財務影響:追蹤快取命中率(已快取對總提示 token),並持續換算成美元數字,而非要團隊憑信任接受節省。
為何股東名單才是重點
引人注目的不是募資規模,而是誰簽了支票。Nvidia、AMD 與 CoreWeave 在晶片與雲端領域是競爭對手,卻共同投資同一家新創。這種一致性發出共同信念:KV 快取重用是推論堆疊的基礎層,而非他們任一家想獨占的贏者全拿產品。若推論在各自硬體上變得更便宜、更具黏性,每家都受益——所以一個中立、產品化的快取層是水漲船高。資金將投入產品、與三家的硬體層整合,以及開源貢獻。
為何重要
這是**「推論之年」經濟學濃縮成一輪募資。當模型從展示走向生產,成本中心從訓練轉向服務,而最便宜的 token 是你永不重算的那一個。快取、路由與量化正成為真正的利潤槓桿——資本如今流向模型與使用者之間的管路**,而不只是模型本身。一家把 KV 快取變成企業基礎設施、且由它賴以運行的三家公司出資的新創,清楚標示了價值正往哪裡遷移。
實務筆記
若你以任何規模在服務 LLM,請先量測你的快取命中率——這是預測重用層能為你省多少的單一數字。具有大量共享前綴的工作負載(對同一語料的 RAG、長固定系統提示、多輪對話)才有 10 倍級勝點的可能;大多為獨特提示的工作負載則省得少得多。也要權衡隔離問題:跨請求重用已算狀態的快取,需要硬性的租戶邊界,否則你可能讓一位使用者的脈絡滲進另一位的。節省是真的,但「共享快取」與「資料隔離」是一個你必須刻意設定、而非預設繼承的取捨。
較少被討論的角度
若推論層圍繞 KV 快取這類共享原語而商品化,競爭前沿就上移一層——移到誰能把快取、路由與量化一起編排成最便宜可靠的 token。這正是模型路由所演繹的同一論點:模型日益成為可替換的後端,而能長存的生意,是那些優化智慧交付的。Tensormesh 由硬體廠商自己背書,是一場賭注:這個管路層大到足以撐起一家公司——且核心到連對手都想佔一席。
來源
- Tensormesh Raises $20M from Investors Including AMD Ventures, CoreWeave, NVentures — BusinessWire ↗
- Tensormesh taps Nvidia, AMD and CoreWeave for funding to fix AI model memory problems — SiliconANGLE ↗
- Tensormesh Raises $20M, Launches AI Inference Platform Built on KV Caching — HPCwire ↗