ZAYA1-8B Matches DeepSeek-R1 on Math with Less Than 1B Active Parameters. – Firethering 未分類 X Facebook はてブ LINE Pinterest コピー 2026.05.07 訓練済みモデルを公開したニュースだ。総量8.4B、推論時76…このサイトの記事を見る