Apple Siliconでネイティブ動作する高速MLX推論…
このサイトの記事を見る
GitHub – SharpAI/SwiftLM: ⚡ Native MLX Swift LLM inference server for Apple Silicon. OpenAI-compatible API, SSD streaming for 100B+ MoE models, TurboQuant KV cache compression, + iOS iPhone app. · GitHub
未分類