Cerebras 上調 IPO 區間至 $125–$135:訂單超額認購 20 倍,金額達 $100 億
Cerebras 將 IPO 區間從 $115–125 上調至 $125–135,超額認購 20 倍($100 億訂單對 $35 億額度),估值將超過 $266 億。CBRS 5/13 定價。
Cerebras 將 IPO 區間從 $115–125 上調至 $125–135,超額認購 20 倍($100 億訂單對 $35 億額度),估值將超過 $266 億。CBRS 5/13 定價。
四家中國實驗室在 12 天內相繼推出前沿等級編碼模型。GLM-5.1 以 MIT 授權在 SWE-Bench Pro 達 58.4%,與 Kimi K2.6 並列最高。API 成本比西方前沿模型低 5–25 倍。
Cloudflare 以 Rust 開發的 Infire 推論引擎採用分離式 Prefill/Decode 架構,在 H100 滿載下比 vLLM 0.10 高出 20% 吞吐量;伴隨推出的 Unweight 系統可無損壓縮模型權重 15–22%。
vLLM v0.20.0:752 commits、320 貢獻者。預設 CUDA 13.0、PyTorch 2.11、Transformers v5、Python 3.14、FlashAttention 4 預設、TurboQuant 2-bit KV cache 4 倍容量。