VS Code でローカルの Ollama を動かしている読者なら、コーディング補助も「ローカル LLM をそのまま使いたい」と考えるはずです。Continue.dev は、まさにその要求に正面から応えるオープンソースの AI コーディングアシスタント拡張機能です。GitHub Copilot のようなクラウド SaaS と違って Bring Your Own Key (BYOK) 方式を採り、Ollama や LM Studio に向けた完全ローカル運用から、Anthropic Claude や OpenAI GPT-5 などフロンティアモデルへの同居設定まで、すべてを1つの config.yaml で統合します。
本記事は、2026年5月時点での Continue.dev 最新版(拡張本体は 1.5 系、changelog 公開済みの最新は v1.5.34、2026年1月リリース)をもとに、ゼロからインストールしてローカル Ollama + クラウドのハイブリッド構成を組み、Chat / Edit / Autocomplete / Agent の4モードを実用レベルで使い切るまでを徹底的に解説します。公式ドキュメントを読みに行かなくてもこの1記事で完結できるよう、コマンドも設定ファイルも丸ごと載せています。
Continue.dev とは
Continue.dev は continuedev/continue リポジトリで開発されている、VS Code・JetBrains・Vim 向けのオープンソース AI コーディングアシスタント拡張機能です。ライセンスは Apache 2.0、初回リリースは2023年で、2026年5月時点で GitHub Star は3万を超えています。
最大の特徴は「IDE には統合されているが、モデルは完全に自分で選べる」という設計思想です。GitHub Copilot や Cursor のようにベンダー指定のクラウドモデルに縛られず、ローカルの Ollama / LM Studio / vLLM、Anthropic Claude、OpenAI GPT-5 系、Google Gemini、Mistral、xAI Grok など15以上のプロバイダを役割(role)別に組み合わせて運用できます。たとえば「Chat だけ Claude Opus、Autocomplete はローカル Qwen3-Coder 7B、Embed はローカル nomic-embed-text」というような構成が config.yaml 1ファイルで完結します。
開発元・ライセンス・基本情報
- 開発元: Continue Inc.(米国、2023年創業の OSS スタートアップ)
- ライセンス: 拡張機能本体は Apache 2.0、Continue Hub は商用フリーミアム
- 対応 IDE: VS Code、JetBrains IDEs(IntelliJ・PyCharm・WebStorm 等)、Vim(Plugin/CLI)
- 対応 OS: Windows 10/11、macOS 12+、Ubuntu 20.04+ / 22.04 / 24.04 ほか主要 Linux
- 記事執筆時点の最新版: changelog 公開済みのリリースは v1.5.34(2026年1月9日)、GitHub Releases ではさらに先行する v1.5.45 系まで配信中
- 公式サイト: https://www.continue.dev/
- 公式ドキュメント: https://docs.continue.dev/
最新リリース情報(2026年5月時点)
Continue.dev は2025年春以降、ほぼ毎月のメジャーアップデートを継続しています。直近の主要バージョンを時系列で整理します。「v1.5.x」は CLI / core 側のバージョンで、VS Code 拡張機能側は別バージョン番号(v1.3.x や v1.1.x など)が振られている点に注意してください。
- 2026-01-09 v1.5.34: 公開リンクで配布できる「Shared Agents」とコードレビュー受信箱を追加。エージェント起動時の追加指示プロンプトに対応
- 2025-11-03 v1.5.8 / v1.1.78-vscode: OpenAI Responses API(GPT-5 Codex 統合)、ストリーミング差分を瞬時の find/replace 編集に置換するファストアプライ、xAI Grok Code Fast 1 統合
- 2025-10-21 v1.5.2 / v1.3.21-vscode: ワークスペース外へのファイルアクセス許可制御、エージェントのエラーハンドリング改善
- 2025-10-06 v1.4.47: MCP サーバの標準 JSON 設定形式に対応、
--idオプションでリモートエージェントへ接続 - 2025-09-12 v1.4.39: UI/UX 刷新、git-aware CLI、
/info診断コマンド追加 - 2025-08-29 v1.2.1-vscode: GPT-5 サポート、MCP サーバの OAuth 認証、編集チェーン
- 2025-06-13 v1.0.12-vscode: 編集モード合理化、MCP の SSE / Streamable HTTP 対応
- 2025-03-26 v1.0.5-vscode: Agent モードの正式リリース、複数チャットタブ、ローカルアシスタント定義
大きな潮流は「MCP(Model Context Protocol)対応の深化」「Agent モードのプロダクション品質化」「Continue Hub(共有資産マーケットプレイス)の拡充」の3点です。これらの新機能の活用方法は、後述の「応用・カスタマイズ」セクションで詳しく扱います。
他ツールとの比較
2026年5月時点で代表的な競合・代替ツールと比較します。各バージョンは執筆時点での公式リポジトリ・公式サイトの実測値です。
| 項目 | Continue.dev | GitHub Copilot | Cursor | Cline | Aider |
|---|---|---|---|---|---|
| 最新版(2026-05時点) | v1.5.34(core)/ v1.3.x(vscode) | SaaS(バージョン非公開) | 3.6(2026-05-29) | v3.86.0(2026-05-28) | v0.86.1(タグ、main は更新継続) |
| 提供形態 | VS Code/JetBrains/Vim 拡張 | マルチ IDE 拡張 + CLI | 独立した VS Code フォーク IDE | VS Code/JetBrains/Cursor 拡張 + CLI プレビュー | ターミナル CLI |
| ライセンス | Apache 2.0 | プロプライエタリ SaaS | プロプライエタリ | Apache 系 OSS | Apache 2.0 |
| ローカル LLM 直結 | ◎ Ollama / LM Studio / vLLM ネイティブ | × クラウド必須 | △ OpenAI 互換のみ間接対応 | ◎ Ollama / LM Studio 公式統合 | ◎ Ollama / LM Studio 対応 |
| BYOK(自前 API キー) | ◎ 15+ プロバイダ | × | △(Pro+/Ultra で一部) | ◎ 30+ プロバイダ | ◎ 主要プロバイダ全対応 |
| Agent / 自律実行 | ◯(Agent モード) | ◎(Agent Mode + CLI) | ◎(Background Agents + Composer 2.5) | ◎ Plan/Act モードの自律エージェント特化 | ◯ /architect モード |
| Autocomplete(補完) | ◎ 専用 role で切替可能 | ◎(強み) | ◎ Tab 補完(独自モデル) | × 非搭載 | × |
| 料金モデル | OSS 無料 + Hub Starter $3/100万tok・Team $20/seat/月 | Free / Pro $10 / Pro+ $39 / Business $19 / Enterprise $39(2026-06から AI Credits 従量制) | Hobby 無料 / Pro $20 / Pro+ $60 / Ultra $200 / Teams $40/seat | OSS 無料(BYOK のみ) | OSS 無料(BYOK のみ) |
| MCP(Model Context Protocol) | ◎ JSON/YAML 宣言、OAuth、SSE/Streamable HTTP | ◎ GitHub MCP Server 経由 | ◎ MCP / Skills / Hooks | ◎ MCP Marketplace | △ 限定的 |
| 機密性・オフライン | ◎ 完全オフライン構成可能 | × 必ずクラウド経由 | △ Privacy Mode あり | ◎ ローカル運用可能 | ◎ ローカル運用可能 |
ローカル LLM を主軸にしたい読者にとって、現実的な選択肢は Continue.dev / Cline / Aider の3つです。Cursor と GitHub Copilot は強力ですが、いずれもクラウド主体で完全ローカル運用には向きません。さらに Roo Code(Roo Cline)は 2026年5月15日にリポジトリがアーカイブされ、v3.54.0 を最終リリースとして開発終了しています(コミュニティフォーク「ZooCode」が後継として活動中)。新規導入は推奨しません。
Continue.dev が選ばれる場面
- VS Code / JetBrains を捨てたくないが、Cursor のようにエディタごと乗り換えるのは避けたい
- Ollama や LM Studio で動かしている既存のローカル LLM をそのままコーディング補助に流用したい
- Chat だけクラウド・補完はローカルなど、役割別にモデルを使い分けたい
- 機密リポジトリで「コードを外部に送信しない」要件を満たしたい
他ツールが向く場面
- Cline: 補完は不要で、長時間のエージェント自律実行(ブラウザ操作・複数ファイル一括編集)に振り切りたい
- Aider: IDE を使わない CLI 中心の作業フロー、git のコミット単位でレビューしながら進めたい
- Cursor: 最先端の独自モデル(Composer 2.5)と Tab 補完の体験を重視、エディタ乗り換えに抵抗がない
- Copilot: GitHub と完全統合したい、組織で SOC 2 / 監査ログ込みで運用したい
メリット・デメリット
メリット
- ベンダーロックインがない: 15以上のプロバイダから自由に組み合わせ可能、コスト最適化も柔軟
- ローカル LLM ネイティブ対応: Ollama のエンドポイント(
http://localhost:11434)を指定するだけで完全オフライン運用が成立 - 役割別モデルルーティング:
config.yamlの roles で chat / edit / apply / autocomplete / embed / rerank / summarize に異なるモデルを割り当てられる - MCP 対応: 任意の外部ツール(DB クライアント、API クライアント、社内ナレッジ)をモデルから呼べる
- Continue Hub による資産共有: アシスタント定義・ルール・プロンプトをチーム間で配布
- Apache 2.0 で商用利用可能: 拡張機能本体は無料、Hub 機能のみ任意の有料プラン
デメリット
- 初期セットアップが重い: BYOK 方式のため、API キー取得とモデル設定で15〜30分かかる
- config.yaml の学習コスト: roles・providers・MCP・context provider など概念が多い(旧
config.jsonからの移行で躓きやすい) - ローカルモデル品質はハード依存: VRAM 8GB クラスでは Qwen3-Coder 7B 程度が現実解で、補完精度はクラウドモデル比で劣る
- 「YOLO モード」(全自動承認)が廃止: 安全側の設計が強化された反面、エージェント実行で承認操作の頻度が増えた
- 一部新興プロバイダで HTTP エラー応答: MiniMax-M2.1 や Riverflow V2 Fast など最新モデルで対応が後追いになることがある
- Windows でのクラッシュ報告: 一部バージョンで
TypeError: Cannot read properties of undefined(Issue #12498)など、安定性は改善途上
動作要件
| 項目 | 最小 | 推奨 | 備考 |
|---|---|---|---|
| OS | Windows 10 22H2 / macOS 12 / Ubuntu 20.04 | Windows 11 23H2+ / macOS 14+ / Ubuntu 22.04+ | 32bit OS 非対応 |
| IDE | VS Code 1.85+ / IntelliJ 2023.1+ | VS Code 1.95+ / IntelliJ 2024.3+ | VS Code Insiders も可 |
| RAM | 8GB(クラウドモデルのみ運用時) | 32GB(ローカル 7B モデル運用時) | ローカル 30B 級は 64GB 推奨 |
| GPU(ローカル運用時) | NVIDIA GTX 1660 6GB / Apple M1 8GB | NVIDIA RTX 4070 Ti SUPER 16GB / Apple M2 Pro 32GB | CPU のみでも動くがレスポンス劣化大 |
| ディスク | 500MB(拡張機能本体) | 50GB+(ローカルモデル数本格納) | NVMe SSD 推奨 |
| ネットワーク | クラウド利用時のみ必須 | — | 完全ローカル構成ならオフライン動作可 |
ローカル LLM で快適に Autocomplete を効かせたい場合、最低でも VRAM 8GB クラスの GPU が必要です。VRAM 12GB あれば Qwen3-Coder 14B の Q4 量子化版が動き、補完品質が実用レベルに達します。
インストール手順
Windows(VS Code 拡張機能経由・推奨)
Continue.dev は VS Code Marketplace から最も簡単に導入できます。
# 1. VS Code を起動
# 2. サイドバーの拡張機能アイコンをクリック(または Ctrl+Shift+X)
# 3. 検索ボックスに「Continue」と入力
# 4. 発行元が「Continue」(公式アカウント)の拡張機能を選択
# 5. [Install] をクリック
# CLI でインストールする場合
code --install-extension Continue.continue
# JetBrains IDE の場合は IDE のプラグインマーケットプレイスから「Continue」で検索
インストール後、左サイドバーに Continue のアイコン(縦線の入った四角)が追加されます。初回起動時にウェルカム画面が出るので、後述の「初期設定」に進んでください。
macOS(VS Code 拡張機能経由)
# Homebrew で VS Code がインストール済みの場合
brew install --cask visual-studio-code
# Continue 拡張機能をインストール
code --install-extension Continue.continue
# JetBrains 系は Toolbox App 経由でインストール後、プラグイン画面で「Continue」を検索
Linux(Ubuntu / Debian 系)
VS Code 自体は VS Code 公式ダウンロードページから .deb パッケージを入手するのが最も簡単です。Snap 派なら snap install code --classic でも導入できます。インストール後の Continue 拡張機能追加は他 OS と同じです。
# VS Code 本体は公式 .deb を取得(または snap install code --classic)
# その後、Continue 拡張機能を CLI からインストール
code --install-extension Continue.continue
Ollama の併設インストール(ローカル LLM 運用する場合)
Continue.dev 単独では LLM 推論ができないため、ローカル運用には Ollama などの推論ランタイムが必要です。2026年5月時点で Ollama は v0.24.0(2026-05-14 リリース)が最新で、OpenAI Codex App 統合や、/api/show キャッシュによる IDE 連携の高速化(v0.23.2 でメディアン約6.7倍)が入っています。
# Windows: 公式インストーラーをダウンロード
Invoke-WebRequest -Uri "https://ollama.com/download/OllamaSetup.exe" -OutFile "OllamaSetup.exe"
Start-Process -FilePath ".\OllamaSetup.exe" -Wait
# 起動確認
ollama --version # v0.24.0 など
# コーディング向けモデルを取得
ollama pull qwen3-coder:7b
ollama pull qwen3-coder:14b # VRAM 12GB+ 推奨
ollama pull nomic-embed-text # 埋め込み用
# サーバーは自動起動、ポート 11434 で待ち受け
curl http://localhost:11434/api/tags
# macOS
brew install ollama
brew services start ollama
# Linux
curl -fsSL https://ollama.com/install.sh | sh
sudo systemctl enable --now ollama
# 共通: モデル取得
ollama pull qwen3-coder:7b
ollama pull nomic-embed-text
初期設定
拡張機能をインストールしただけでは何も動きません。最初の起動で config.yaml を準備するのが最重要ステップです。
config.yaml の場所
- Windows:
%USERPROFILE%\.continue\config.yaml(例:C:\Users\<username>\.continue\config.yaml) - macOS / Linux:
~/.continue/config.yaml
VS Code サイドバーの Continue アイコンを開き、右上の歯車から「Open config.yaml」を選ぶと該当ファイルがエディタで開きます。旧 config.json は v1.0 以降で非推奨となり、新規セットアップでは YAML 一択です。
最小構成:完全ローカル運用(Ollama のみ)
name: local-only
version: 1.0.0
schema: v1
models:
- name: Qwen3 Coder 7B (Chat/Edit)
provider: ollama
model: qwen3-coder:7b
apiBase: http://localhost:11434
roles:
- chat
- edit
- apply
defaultCompletionOptions:
contextLength: 32768
temperature: 0.2
- name: Qwen3 Coder 1.5B (Autocomplete)
provider: ollama
model: qwen2.5-coder:1.5b-base
apiBase: http://localhost:11434
roles:
- autocomplete
- name: Nomic Embed (Embeddings)
provider: ollama
model: nomic-embed-text
apiBase: http://localhost:11434
roles:
- embed
context:
- provider: code
- provider: docs
- provider: diff
- provider: terminal
- provider: problems
- provider: folder
- provider: codebase
ハイブリッド構成:ローカル + Claude / GPT
name: hybrid-pro
version: 1.0.0
schema: v1
models:
- name: Claude Sonnet (Chat 高品質)
provider: anthropic
model: claude-sonnet-4-6
apiKey: YOUR_ANTHROPIC_API_KEY
roles:
- chat
- edit
- apply
- name: GPT-5 (Agent)
provider: openai
model: gpt-5
apiKey: YOUR_OPENAI_API_KEY
roles:
- chat
- name: Qwen3 Coder Local (Autocomplete)
provider: ollama
model: qwen2.5-coder:1.5b-base
apiBase: http://localhost:11434
roles:
- autocomplete
- name: Nomic Embed Local (Embeddings)
provider: ollama
model: nomic-embed-text
apiBase: http://localhost:11434
roles:
- embed
context:
- provider: code
- provider: docs
- provider: diff
- provider: terminal
- provider: problems
- provider: folder
- provider: codebase
- provider: web
API キーは環境変数からも参照できます。apiKey: ${{ secrets.ANTHROPIC_API_KEY }} のように書くと、OS 環境変数または Continue Hub のシークレットから注入されます。リポジトリにコミットする .continue/configs/*.yaml ではキーをハードコードせず、必ずシークレット参照に切り替えてください。
日本語化
Continue 拡張機能の UI 言語は VS Code 本体のロケールに従います。VS Code が日本語化されていれば、Continue のチャット UI も自動的に日本語ラベルに切り替わります(ボタンや一部ヘルプテキスト範囲)。チャットの応答自体は config.yaml の rules に「常に日本語で回答してください」と書いておけば確実に日本語で返ってきます。
rules:
- 常に日本語で回答してください。コード内のコメントも日本語で書いてください。
- コードの修正提案は diff 形式で示し、影響範囲を必ず説明してください。
- 推測ではなく、与えられたコードベースとファイルの内容を根拠に回答してください。
基本的な使い方
Chat モード
VS Code のサイドバーから Continue を開くか、Ctrl+L(macOS は Cmd+L)でチャットを起動します。現在開いているファイル、選択範囲、ターミナル出力、差分などをそのままコンテキストとして送れます。
@code— コードベース全体から関連箇所をセマンティック検索して添付@docs— 登録済みのドキュメント(公式ドキュメント、社内 wiki)からマッチ箇所を添付@diff— 現在の git 差分を添付@terminal— 直近のターミナル出力を添付@file— 任意のファイルを丸ごと添付@folder— フォルダ単位で添付@problems— 現在の VS Code Problems パネル(lint/型エラー)を添付
Autocomplete モード
エディタでタイピング中、カーソル位置から先のコードを灰色で予測表示します。Tab で確定、Esc でキャンセル。config.yaml の roles: [autocomplete] に割り当てたモデルが使われます。
補完が遅い場合は、autocompleteOptions でデバウンス時間や最大トークン数を調整します。
autocompleteOptions:
debounceDelay: 250
maxPromptTokens: 1024
maxSuffixPercentage: 0.25
multilineCompletions: auto
useCache: true
useFileSuffix: true
Edit モード
エディタでコードを選択して Ctrl+I(macOS は Cmd+I)でインライン編集ダイアログを開きます。指示を入力すると差分が表示され、Ctrl+Shift+Enter で承認、Ctrl+Backspace で却下できます。Fast Apply(AST 解析による高速差分適用)により、大規模ファイルでも数秒で反映されます。
Agent モード
2025年3月に正式リリースされた Agent モードは、複数ファイル横断のタスクを自律的に実行します。チャット欄左上のモードセレクタで「Agent」を選ぶか、Ctrl+Shift+L で起動します。プロンプト例:
「
src/api/配下の全エンドポイントに対して、リクエストバリデーション用の Zod スキーマを追加してください。既存のテストが壊れないようにsrc/api/__tests__/も更新してください。」
Agent はファイル読み取り → 差分生成 → 編集適用 → テスト実行を自動で繰り返し、各ステップでユーザーに承認を求めます。安全側の設計のため、ワークスペース外へのファイルアクセスや破壊的なシェル実行は明示承認が必要です。
実践的な使い方
ケース1: 既存コードベースのリファクタリング
レガシーな Python コードを段階的にモダン化する流れ。
- Chat モードで
@codebase 認証ロジックの全体像を教えてと尋ねて構造を把握 - 対象ファイルを開き
Ctrl+Iで「dataclass化して、型ヒントを Python 3.12 の新構文に変えて」と指示 - 変更後、ターミナルで
pytest -q tests/test_auth.pyを実行 - 失敗があれば
@terminalでテスト出力を添付して「このエラーを修正して」
ケース2: 新規機能の TDD 開発
Agent モードを使った仕様駆動開発。
Agentモードで以下を順番に実行してください。
1. tests/test_user_search.py に、ユーザー名・メール・電話番号で検索できる
UserSearchService の Pytest テストケースを5つ書いてください。
(正常系2、境界値2、異常系1)
2. テストが全て失敗することを確認してください。
3. src/services/user_search.py に最小実装を書き、テストを全てパスさせてください。
4. 最後に black と ruff でフォーマット・lint をかけてください。
Agent は各ステップでファイル作成・編集・テスト実行を行い、失敗時は自動でリトライします。
ケース3: ドキュメント参照付きのライブラリ調査
新しいライブラリの使い方を即座に身につけたいときに @docs が活躍します。config.yaml にドキュメントソースを登録しておきます。
context:
- provider: docs
params:
startUrl: https://docs.pydantic.dev/latest/
maxDepth: 3
faviconUrl: https://docs.pydantic.dev/latest/favicon.ico
登録後、チャットで @docs pydantic フィールドバリデーターの書き方 と尋ねると、公式ドキュメントの該当ページを根拠付きで引用しながら回答してくれます。
応用・カスタマイズ
MCP(Model Context Protocol)でツール拡張
v1.4.47 以降、MCP サーバを JSON / YAML で宣言できるようになりました。GitHub・Slack・PostgreSQL・社内 API などをモデルから呼び出せます。
mcpServers:
- name: github
type: stdio
command: npx
args:
- "-y"
- "@modelcontextprotocol/server-github"
env:
GITHUB_PERSONAL_ACCESS_TOKEN: ${{ secrets.GITHUB_TOKEN }}
- name: postgres
type: stdio
command: npx
args:
- "-y"
- "@modelcontextprotocol/server-postgres"
- "postgresql://DB_USER:DB_PASSWORD@localhost:5432/mydb"
- name: filesystem
type: streamable-http
url: http://localhost:8080/mcp
headers:
Authorization: Bearer ${{ secrets.MCP_API_KEY }}
Agent モードからは「github ツールで未対応の Issue を取得して、優先度の高いものから自動的にブランチを切ってください」のように MCP ツールを利用できます。
Continue Hub でアシスタント共有
Continue Hub(hub.continue.dev)はアシスタント定義・MCP サーバ・ルールを公開・配布するマーケットプレイスです。チームで「Python データサイエンス用」「TypeScript フロントエンド用」のように役割別アシスタントを共有できます。v1.5.34 では公開リンクで配布できる「Shared Agents」が追加されました。
カスタムスラッシュコマンド
config.yaml に prompts を定義すると、チャットで /コマンド名 として呼び出せます。
prompts:
- name: review
description: コードレビュー
prompt: |
以下のコードを厳しくレビューしてください。
1. バグや競合状態の可能性
2. 命名・可読性
3. パフォーマンス
4. テストの抜け
指摘は重要度(critical/major/minor)でラベル付けしてください。
- name: explain
description: コード解説
prompt: |
このコードが何をしているか、初学者向けに行単位で解説してください。
副作用と隠れた前提条件を必ず明示してください。
- name: jp-comment
description: 日本語コメント付与
prompt: |
このコードに、関数単位で日本語の docstring と
行ごとのコメントを追加してください。元のロジックは変更しないでください。
役割別モデルルーティングの応用
v1.5 系では役割(role)に chat / edit / apply / autocomplete / embed / rerank / summarize の7種があり、role ごとに別モデルを指定できます。たとえば「apply(差分適用)だけ高速・低コストの Morph v0 を使う」「rerank はローカル bge-reranker」のように細かく最適化できます。
models:
- name: Claude Sonnet (Chat/Edit)
provider: anthropic
model: claude-sonnet-4-6
apiKey: ${{ secrets.ANTHROPIC_API_KEY }}
roles: [chat, edit]
- name: Morph Fast Apply
provider: openai
model: morph-v0
apiBase: https://api.morphllm.com/v1
apiKey: ${{ secrets.MORPH_API_KEY }}
roles: [apply]
- name: Qwen2.5 Coder 1.5B (Autocomplete)
provider: ollama
model: qwen2.5-coder:1.5b-base
apiBase: http://localhost:11434
roles: [autocomplete]
- name: Nomic Embed
provider: ollama
model: nomic-embed-text
apiBase: http://localhost:11434
roles:
- name: BGE Reranker
provider: ollama
model: bge-reranker-v2-m3
apiBase: http://localhost:11434
roles: [rerank]
パフォーマンス最適化
Ollama 側の最適化
- OLLAMA_KEEP_ALIVE を延長: モデルを VRAM に長時間保持して再ロードコストを削減
$env:OLLAMA_KEEP_ALIVE = "30m" - OLLAMA_NUM_PARALLEL: 同時リクエスト数を増やすことで Chat と Autocomplete の並行処理が高速化
export OLLAMA_NUM_PARALLEL=4 - OLLAMA_FLASH_ATTENTION: 対応モデルで Flash Attention を有効化(VRAM 節約 + 速度向上)
export OLLAMA_FLASH_ATTENTION=1 - /api/show キャッシュの活用: Ollama v0.23.2 以降は IDE 連携のメディアンレイテンシが約6.7倍速くなっているので、最新版への更新を推奨
Continue.dev 側の最適化
- autocomplete のデバウンス調整:
debounceDelay: 350程度にするとタイピング中の不要リクエストを抑制 - contextLength の現実的な設定: モデルの最大コンテキストに合わせる(過大に設定すると VRAM 不足で OOM)
- @codebase のインデックス対象を絞る:
.continueignoreファイルでnode_modules、.venv、distを除外 - Fast Apply の利用: 大規模ファイル編集時は Relace Instant Apply や Morph v0 を
applyrole に指定して差分適用を高速化
.continueignore の例
node_modules/
.venv/
venv/
__pycache__/
.git/
dist/
build/
.next/
.nuxt/
target/
*.min.js
*.lock
*.log
coverage/
よくあるエラーとトラブルシューティング
1. Ollama に接続できない(ECONNREFUSED)
原因: Ollama サーバが起動していない、またはポート 11434 が別プロセスに使われている。
# 状態確認
curl http://localhost:11434/api/tags
# Windows でサービス再起動
net stop ollama
net start ollama
# macOS
brew services restart ollama
# Linux
sudo systemctl restart ollama
2. TypeError: Cannot read properties of undefined(Issue #12498)
原因: Windows 環境で特定バージョン(v1.3.38 系)に発生するクラッシュ。対処: 最新の VS Code 拡張機能(v1.3.21 以降の安定版)に更新する。VS Code の Marketplace から「Continue」を再インストールしてキャッシュをクリア。
3. config.yaml が認識されない
原因: YAML のインデント不整合、または schema: v1 の指定漏れ。対処: VS Code の YAML 拡張機能(redhat.vscode-yaml)を入れて構文チェックを有効化。Continue サイドバーの「Open config.yaml」リンク経由で開き、保存後にチャット画面を「Reload」する。
4. Autocomplete が動かない
原因: roles: [autocomplete] を持つモデルが定義されていない、または対象モデルが補完非対応(チャット専用モデル)。対処: 補完専用モデル(qwen2.5-coder:1.5b-base や deepseek-coder:6.7b-base)を別エントリで追加し、明示的に autocomplete role を割り当てる。
5. OpenRouter 経由で extraBodyProperties が送られない(Issue #12334)
原因: v1.5.x 系の OpenRouter プロバイダで、requestOptions.extraBodyProperties が autocomplete リクエストに反映されない不具合。対処: 暫定回避として provider: openai + apiBase: https://openrouter.ai/api/v1 の汎用 OpenAI 互換モードで設定する。
6. モデルが「AUTODETECT」と表示されて呼び出せない(Issue #12400)
原因: config.yaml の model フィールドが空文字または不正な値。対処: モデル名を provider ごとの公式表記に合わせる。Ollama なら ollama list の出力をコピーする。
7. コンテキストウィンドウが途中で切れる
原因: contextLength がモデルの実コンテキスト長より大きい、または小さすぎる。対処: モデルの実装値に合わせる(例: qwen3-coder:7b は 128k 対応だが Ollama 既定では 32k)。
models:
- name: Qwen3 Coder 7B (Long Context)
provider: ollama
model: qwen3-coder:7b
apiBase: http://localhost:11434
defaultCompletionOptions:
contextLength: 65536 # 実 RAM/VRAM 余裕に応じて
maxTokens: 4096
8. Linux で絶対パスが相対パス扱いになる(Issue #9178)
原因: 一部 Linux 環境でモデル参照のパス解釈不具合。対処: apiBase や capabilities 周りのパスを明示的にフル URL で指定し、ホームディレクトリ展開(~)の使用を避ける。
おすすめの組み合わせ・連携
Continue.dev + Ollama + LM Studio の二段構成
用途を分けて Ollama と LM Studio を併用する構成が安定します。Ollama は CLI / サービス常駐型、LM Studio は GUI 操作型という棲み分けで、状況に応じて切り替えられます。LM Studio は 2026年5月29日リリースの 0.4.15 が最新版で、CUDA テンソル並列やマルチ GPU モデルロードに対応しています(バージョン番号が長期間 0.4.x のまま推移しているため「4.x」「5.x」と誤記しないよう注意)。
models:
- name: Ollama Qwen3 Coder (Chat)
provider: ollama
model: qwen3-coder:7b
apiBase: http://localhost:11434
roles: [chat, edit]
- name: LM Studio Qwen3 Coder 14B (Heavy Tasks)
provider: openai
model: qwen3-coder-14b
apiBase: http://localhost:1234/v1
apiKey: dummy
roles: [chat]
Continue.dev + vLLM(マルチユーザー向け)
チームで同じ社内 GPU サーバを共有する場合は、Ollama より vLLM が向いています。vllm serve qwen/Qwen3-Coder-7B --port 8000 で起動した推論サーバを、apiBase: http://gpu-server:8000/v1 として複数の開発者から共有します。
Continue.dev + GitHub Actions(コードレビュー自動化)
Continue Hub の Shared Agents 機能を使い、CI 上で PR を自動レビューさせる運用が可能です。continuedev/continue-cli アクションで設定済みアシスタントを呼び出し、結果を PR コメントとして投稿する流れです。
Continue.dev + 自前 LLM プロキシ(LiteLLM / Aphrodite Engine)
複数のクラウド/ローカルプロバイダを統一エンドポイントに集約したい場合は LiteLLM Proxy が便利です。litellm --config litellm.yaml --port 4000 で起動し、Continue 側は apiBase: http://localhost:4000 だけ向けておけば、内側でモデル切り替えやコスト記録ができます。
推奨 PC スペック
用途別に3段階の構成を提案します。価格は2026年5月時点の日本市場での自作 PC・ノート PC 相場をベースにしています。
| 用途 | 入門(クラウド主体) | 標準(ローカル 7B 主体) | ハイエンド(ローカル 14B+) |
|---|---|---|---|
| 想定シーン | Claude/GPT 中心、ローカルは補完のみ | Qwen3-Coder 7B を完全ローカルで Chat/Edit/Autocomplete に | 14B〜32B クラスを常駐、複数モデル並列 |
| CPU | Core Ultra 5 / Ryzen 5 8000G 系 | Core Ultra 7 / Ryzen 7 9700X | Core Ultra 9 / Ryzen 9 9950X |
| GPU | iGPU またはエントリ GPU(GTX 1660 SUPER 等) | RTX 4070 Ti SUPER 16GB | RTX 5090 32GB(または RTX 5080 16GB ×2 で並列) |
| RAM | 16GB | 32GB DDR5 5600 | 64GB DDR5 5600 |
| ストレージ | 1TB NVMe SSD | 2TB NVMe SSD | 2TB NVMe SSD(Gen5)+ 4TB HDD |
| OS | Windows 11 Pro / macOS 14 | Windows 11 Pro / Ubuntu 24.04 | Ubuntu 24.04 LTS(推論サーバ用途) |
| 想定コスト | 15〜25万円 | 40〜55万円 | 80〜120万円 |
クラウド API(Claude / GPT-5)を併用する場合、入門構成でも月額 $20〜$60 程度の Anthropic API クレジットで業務利用が可能です。完全ローカルにこだわらず、機密性が低いタスクはクラウドへ流すハイブリッド戦略が現実的にコストパフォーマンスが最良です。
まとめ
Continue.dev は、2026年5月時点でローカル LLM を主軸に据えたい開発者にとって最有力の VS Code / JetBrains 向け AI コーディングアシスタントです。Apache 2.0 オープンソース、BYOK 方式、役割別モデルルーティング、MCP 対応、Continue Hub による資産共有という設計は、Cursor や GitHub Copilot のようなクラウド前提のツールとは明確に異なる強みを持ちます。
特に Ollama や LM Studio で既にローカル LLM を運用している読者なら、推論バックエンドを変えずに IDE 統合だけ Continue.dev で得られる費用対効果は非常に大きいです。Chat や Agent には Claude Sonnet、Autocomplete はローカル Qwen3-Coder、Embed はローカル Nomic Embed、というハイブリッド構成を config.yaml 1ファイルで実現できる柔軟性は他のツールにはない価値です。
一方で、初期セットアップに15〜30分かかる点、ローカルモデル品質がハードウェアに強く依存する点、Roo Code 開発終了に見られるように周辺ツールの栄枯盛衰が激しい点は、導入前に把握しておく必要があります。Cline のようなエージェント特化、Aider のような CLI 完結、Cursor のような独自モデル + 統合 IDE といった選択肢と比較して、自分の開発スタイルにフィットするか見極めてください。
公式の今後のロードマップでは、MCP の拡張、Agent モードの長時間タスク耐性向上、Continue Hub のチーム機能強化が続いています。最新情報は 公式 Changelog と GitHub Releases を定期的に確認することをお勧めします。
📦 この記事で紹介した商品
- NVIDIA GeForce RTX 4070 Ti SUPER → Amazonで見る
- Samsung 990 PRO 2TB NVMe SSD → Amazonで見る
- Visual Studio Code実践入門! ~ソフトウェア開発の強力手段 : 飛松 清: Japanese Books → Amazonで見る
- ローカルllm実践入門 – アマゾン → Amazonで見る
- DDR5メモリ 32GB → Amazonで見る
※ 上記リンクはAmazonアソシエイトリンクです。購入いただくと当サイトに紹介料が入ります。

