Speculative KV coding: losslessly compressing KV cache by up to ~4× using a predictor model 未分類 X Facebook はてブ LINE Pinterest コピー 2026.06.07 予測モデルでKVキャッシュをロスレス圧縮する手法。8ビット浮…このサイトの記事を見る