ハードウェア llama.cpp b9294:Adreno GPUでMoE推論が加速!スマホ実装検証 llama.cpp b9294でAdreno GPU向けMoEカーネルが一般化。MixtralやDeepSeek V3など、Qualcomm搭載スマホでも高速なローカル推論が可能に。クラウド依存を脱却し、最新ビルドのメリットと導入方法を徹底解説。 2026.05.24 ハードウェア