Android AI

ハードウェア

llama.cpp b9294:Adreno GPUでMoE推論が加速!スマホ実装検証

llama.cpp b9294でAdreno GPU向けMoEカーネルが一般化。MixtralやDeepSeek V3など、Qualcomm搭載スマホでも高速なローカル推論が可能に。クラウド依存を脱却し、最新ビルドのメリットと導入方法を徹底解説。