tokens/sec

ローカルLLM

Qwen 3.5 27BをRTX 4090で動かすと最大38 tokens/sec!徹底測定結果と最適化方法

Qwen 3.5 27BをRTX 4090で実行した際のトークン速度(最大38 tokens/sec)と最適化方法を解説。実測データと技術的要因を詳しくご紹介。