ローカルLLM SWE-bench崩壊!OpenAI公式警告:ローカルLLM評価の真実と代替指標 OpenAIがSWE-bench Verifiedに重大欠陥を指摘。業界標準の崩壊で変わるAI評価基準とは?ローカル環境でLLMを運用するあなたに、モデル選定の新しい視点と代替指標を徹底解説。今すぐチェック。 2026.04.29 ローカルLLM