Snapdragon

AI研究

llama.cpp b9301 速報!Snapdragon PC向けFlashAttention進化

llama.cpp b9301 が公開され、Snapdragon X 搭載 PC の推論性能が劇的に向上します。Hexagon 最適化と FlashAttention の repl 改良により、NPU/DSP を活用した高速化を実現。ローカルLLM推論の最新動向とメリットを詳しく解説します。
ハードウェア

llama.cpp v0.6でSnapdragon推論速度劇的に向上!CPU機能全活用

llama.cpp v0.6のツールチェーン更新により、Snapdragon環境でのローカルLLM推論速度が劇的に向上。コンパイラフラグ見直しでCPU全機能を活用し、ARMデバイスのパフォーマンス底上げを実現。詳細と設定手順を解説。