Android AI

llama.cpp b9294：Adreno GPUでMoE推論が加速！スマホ実装検証

llama.cpp b9294でAdreno GPU向けMoEカーネルが一般化。MixtralやDeepSeek V3など、Qualcomm搭載スマホでも高速なローカル推論が可能に。クラウド依存を脱却し、最新ビルドのメリットと導入方法を徹底解説。

2026.05.24

ハードウェア