Hexagon

AI研究

llama.cpp b9301 速報!Snapdragon PC向けFlashAttention進化

llama.cpp b9301 が公開され、Snapdragon X 搭載 PC の推論性能が劇的に向上します。Hexagon 最適化と FlashAttention の repl 改良により、NPU/DSP を活用した高速化を実現。ローカルLLM推論の最新動向とメリットを詳しく解説します。