Inference cost at scale with napkin math 未分類 X Facebook はてブ LINE Pinterest コピー 2026.06.21 32BモデルとKVキャッシュを用い、1GPUで6〜60人の同…このサイトの記事を見る