ハードウェア 8GB VRAMでMoEが2.4倍速!Qwen3.5-A3B徹底検証
「MoEはVRAMが必要」という常識を覆す実測データ。RTX 4060 8GB環境でQwen3.5-A3B(35B)を実際に動かした結果、Denseモデルより2.4倍も高速だった驚きの理由を解説。ローカルLLM導入の参考になります。
ハードウェア
ローカルLLM
ハードウェア