Open WebUI完全ガイド【2026年5月最新版】Ollama連携・RAG・Web検索まで全部入りセルフホストLLMフロントエンド

Open WebUI完全ガイド 2026年5月最新版 チュートリアル

Open WebUIは、ローカルで動くLLM(大規模言語モデル)に「ChatGPT風の使いやすいインターフェース」を被せるためのセルフホストWebアプリケーションです。OllamaやLM Studio、OpenAI互換APIに接続して、ブラウザ上でマルチモデルの会話、社内ドキュメントを使ったRAG、Web検索、画像生成までを1つの画面でこなせます。本記事執筆時点(2026年5月)の最新版はv0.9.5(2026年5月10日リリース)で、デスクトップアプリ、定時実行チャット、カレンダー連携、SSRF保護強化など、これまでの「Ollamaのフロントエンド」という枠を完全に超えた完成度に達しています。

本記事は、Open WebUIを「全く触ったことがない人」が、本記事1本を読むだけでインストール・初期設定・実用ワークフロー構築まで進められるよう、コマンドと画面操作を省略せずに書き切った決定版ガイドです。Windows・macOS・Linux・Docker・Pythonの全パターンを網羅し、よくあるトラブル10件以上の対処法、推奨ハードウェア、競合ツール(LibreChat、Chatbox、LobeChat、AnythingLLM、LM Studio内蔵Chat)との具体的な比較まで取り扱います。

  1. Open WebUIとは何か
    1. 主な特徴
    2. 開発体制とライセンス
  2. 最新リリース情報(2026年5月最新)
    1. v0.9.5(2026年5月10日)
    2. v0.9.0(2026年4月21日)
    3. v0.8.11(2026年3月25日)
    4. v0.8.9(2026年3月8日)
    5. v0.8.0(2026年1月)から続く流れ
  3. 他ツールとの比較
    1. 用途別の使い分け
  4. メリット・デメリット
    1. メリット
    2. デメリット
  5. 動作要件
    1. 推論バックエンドの動作要件
  6. インストール手順
    1. Windows・macOS・Linux共通: Docker版(最推奨)
    2. OllamaをまだインストールしていないPCでDockerで全部済ませる
    3. Linux: Docker Compose版(Ollama + Open WebUIをまとめて管理)
    4. Windows: pipでインストール(Python派向け)
    5. macOS: pipまたはbrewでインストール
    6. Linux: uvでインストール(最も高速)
    7. 公式デスクトップアプリ(v0.9.0以降)
  7. 初期設定
    1. 管理者アカウントの作成
    2. Ollama接続の確認
    3. OpenAI互換APIの追加
    4. 日本語化
    5. 初期チューニング推奨設定
  8. 基本的な使い方
    1. シンプルなチャット
    2. マルチモデル並列実行
    3. ファイルのアップロードとRAG
    4. チャットの保存・共有
  9. 実践的な使い方
    1. ユースケース1: 社内ドキュメントQAボットを構築する
    2. ユースケース2: Web検索付きリサーチアシスタント
    3. ユースケース3: 画像生成パイプラインとの連携
  10. 応用・カスタマイズ
    1. Pipelinesでカスタムフィルタを書く
    2. 定時実行で日次レポートを自動生成
    3. SSO/OIDC連携
    4. テーマとブランディング
  11. パフォーマンス最適化
    1. UIの体感速度を上げる
    2. RAGの精度と速度を両立
    3. Ollama側のチューニング
    4. 同時アクセスのスケーリング
  12. よくあるエラーとトラブルシューティング
    1. 1. Ollama: Connection refused が表示される
    2. 2. WEBUI_SECRET_KEY が変わってログインできなくなった
    3. 3. RAGで日本語文書がほとんどヒットしない
    4. 4. アップデート後にUIが真っ白になる
    5. 5. Whisper音声入力で CUDA out of memory
    6. 6. 画像生成連携でFailed to connect to image generation
    7. 7. Pipelinesがインストールできない
    8. 8. SQLiteエラー database is locked
    9. 9. WebSocketが切れる(特にKubernetes/Nginxの後ろ)
    10. 10. Apple SiliconでDockerが極端に遅い
    11. 11. アカウント追加できない/新規登録が無効
  13. おすすめの組み合わせ・連携
    1. Ollama + Open WebUI の鉄板構成
    2. vLLM + Open WebUI(高速推論したい場合)
    3. SearXNG + Open WebUI(完全プライベートWeb検索)
    4. ComfyUI + Open WebUI(画像生成パイプライン)
    5. Home Assistant + Open WebUI(家庭内LLMエージェント)
  14. 推奨PCスペック
    1. 入門構成(7B〜13Bモデル、家族で共有)
    2. 標準構成(14B〜32Bモデル、社内10人で共有)
    3. ハイエンド構成(70Bモデル、ヘビーRAG運用)
  15. まとめ
  16. 📦 この記事で紹介した商品

Open WebUIとは何か

Open WebUIは、Timothy Jaeryang Baek氏らが開発するセルフホスト型のLLMフロントエンドです。GitHubリポジトリは2026年5月時点でスター数10万超、世界でもっとも使われているローカルLLM向けWeb UIの座にあります。プロジェクトの正式名称は2024年初頭まで「Ollama WebUI」でしたが、Ollama以外のバックエンド(OpenAI互換API全般、LM Studio、vLLM、TGI、Groq、OpenRouter、Mistralなど)に対応した時点で現在の名称に改名されました。

Open WebUI 公式バナー
Open WebUIの公式バナー(出典: Open WebUI公式GitHubリポジトリ

主な特徴

  • マルチプロバイダー対応: Ollama、OpenAI、Anthropic(OpenAI互換ラッパー経由)、LM Studio、vLLM、TGI、Groq、OpenRouter、Mistral、Azure OpenAI、Cloudflare Workers AIなど、OpenAI互換エンドポイントなら何でも接続可能
  • マルチモデル同時会話: 1つのプロンプトを複数モデルへ同時に投げて回答を横並びで比較できる
  • RAG(検索拡張生成)標準搭載: ドキュメントのドラッグ&ドロップだけでベクトルDBに取り込み、参照引用付きで回答させられる
  • Web検索統合: SearXNG、Tavily、Brave、DuckDuckGo、Google PSE、Serper、Serply、Bing、Mojeek、Jinaなど多数のプロバイダーを切り替えて使える
  • 画像生成連携: AUTOMATIC1111、ComfyUI、OpenAI DALL-E、Gemini Imageに対応した「会話の流れで画像を生成」機能
  • 音声入出力: ブラウザのWeb Speech APIに加え、Whisper、OpenAI TTS、Kokoro、ElevenLabs、Azure音声などを切り替え可能
  • 関数呼び出し / Tools / Pipelines: PythonコードでツールやフィルタをWeb UIから定義でき、エージェント的な動作を構築可能
  • Model Builder: モデルファイル(Ollama Modelfile相当)をGUIで作成・編集・共有できる
  • ユーザー管理: ロールベースのアクセス制御、グループ機能、SSO(OAuth/OIDC/LDAP)対応で社内利用に耐える
  • 完全オフライン動作: 適切に構成すれば外部通信ゼロでローカル運用できる

開発体制とライセンス

Open WebUIは独自の「Open WebUI License」を採用しています。2025年初頭まではBSD-3-Clauseでしたが、商標保護とフォークの乱立を防ぐ目的でカスタムライセンスへ移行しました。個人利用・社内利用・改変は完全に自由ですが、ロゴ・名称の変更、商標削除、サイドカー再配布は制限されます。商用配布や有料SaaS化を検討する場合は公式ライセンスFAQを必読です。

最新リリース情報(2026年5月最新)

v0.9.5は2026年5月10日にリリースされた現行安定版です。v0.8系から半年で50回以上のマイナーリリースがあり、機能追加のスピードが他のLLMフロントエンドを圧倒している点が大きな魅力です。ここでは執筆時点で直近6ヶ月の主要アップデートを時系列で整理します。

v0.9.5(2026年5月10日)

  • SSRF保護のリダイレクト対応: HTTPリクエストがデフォルトで3xxリダイレクトをブロックするようになり、内部ネットワークへの不正アクセスを防ぐ
  • マークダウン表示の独立制御: ユーザーメッセージとアシスタント応答のマークダウン表示を個別にOFFにできるようになった
  • チャネル機能のフル対応: チャンネル内でモデルをメンションした際、ネイティブ関数呼び出しを含む完全なチャット完了パイプラインが走るようになった

v0.9.0(2026年4月21日)

  • 公式デスクトップアプリ登場: Tauriベースの軽量デスクトップ版が公開され、ブラウザを開かずに起動できる
  • 定時実行チャットオートメーション: cron書式で「毎朝7時に天気と株価を要約させる」といった定期実行が可能
  • カレンダーワークスペース追加: チャットセッションがカレンダー表示でき、過去の会話を日付軸で振り返れる

v0.8.11(2026年3月25日)

  • OpenAI Responses API(o1/o3シリーズの推論API)への完全対応
  • ファイルビューのページネーション化で巨大PDFのRAGが軽量化
  • 音声モードのウェイクワード機能追加

v0.8.9(2026年3月8日)

  • 「Open Terminal Notebook」によりJupyter的なコード実行がWeb UIに統合された
  • チャット履歴のSQLiteブラウザ追加
  • 10,000メッセージ超のチャット履歴のレンダリング速度が約3倍に

v0.8.0(2026年1月)から続く流れ

v0.8系全体の方向性は「ChatGPTの代替ではなく上位互換」を狙ったものです。エージェント実行、コードインタプリタ、ノートブック、定時実行、デスクトップアプリ、SSO、監査ログ、料金課金(OpenAI APIをユーザーごとに利用上限管理する機能)と、エンタープライズ向け機能を矢継ぎ早に投入してきました。「ローカルLLMをチームで使う」段階に立つと、選択肢が実質Open WebUI一択になりつつあります。

過去の変更点の詳細は公式リリースノート公式アップデートガイドを参照してください。

他ツールとの比較

2026年5月時点で「ローカルLLM + Webクライアント」の選択肢として競合になり得るのは、LibreChat、AnythingLLM、Chatbox、LobeChat、LM Studio内蔵Chatです。バージョン情報を正確に揃えて比較します。

項目Open WebUI v0.9.5LibreChat v0.8.6-rc1AnythingLLM v1.12.1Chatbox v1.20.1LobeChat v2.2系LM Studio v0.4.14内蔵
UI形態Web(セルフホスト)Web(セルフホスト)デスクトップ+Webデスクトップ専用Web(セルフホスト/SaaS)デスクトップ専用
Ollama連携ネイティブ対応OpenAI互換経由ネイティブ対応ネイティブ対応OpenAI互換経由同一プロセス
RAG標準搭載あり(ChromaDB)あり(PgVector)あり(LanceDB)限定的ありなし(外部連携要)
Web検索10種類以上Tavily等ありありありなし
マルチモデル同時会話標準標準限定ありありあり(横並び比較)
マルチユーザー標準標準標準単一ユーザー標準単一ユーザー
SSO/OIDC標準対応標準対応有料版非対応標準対応非対応
画像生成A1111/ComfyUI/DALL-EDALL-EDALL-EDALL-Eありなし
音声入出力Whisper/TTS等Whisper/TTS限定ありありなし
コード実行PyodideサンドボックスCode Interpreter限定なしありなし
定時実行v0.9.0で追加非対応非対応非対応非対応非対応
ライセンスOpen WebUI LicenseMITMITGPL-3.0Apache-2.0独自(無料/有料)
最小VRAMUI自体は0(推論側依存)00002GB〜(推論内蔵)
導入の手軽さDocker一発Docker一発インストーラインストーラDockerインストーラ

用途別の使い分け

  • 個人で1台のPCで完結したい: LM Studio内蔵Chat、Chatboxの方が単純で速い
  • 家族・小規模チームで共有したい: Open WebUIが最有力(マルチユーザー、RAG、料金管理が標準装備)
  • 企業導入でSSO必須: Open WebUIかLibreChat(どちらもOIDC/SAML対応)
  • とにかく簡易に文書QAだけ欲しい: AnythingLLMが特化していて学習コストが低い
  • UIの華やかさを優先: LobeChatのテーマシステムが最も洗練

メリット・デメリット

メリット

  • 機能の総合力で他を圧倒: RAG、Web検索、音声、画像生成、コード実行、定時実行が全部入り
  • マルチユーザーが標準: 1台のサーバーで家族や同僚全員のチャットを賄える
  • 更新が頻繁: 月10〜20件のリリースがあり、ChatGPT等の新機能を1〜2週間でキャッチアップ
  • 完全オフラインで動かせる: 適切な設定で外部通信を0にでき、機密データ運用に強い
  • Ollama親和性が極めて高い: モデルのpull/削除をWeb UIから直接操作できる
  • Pipelinesによる拡張性: PythonでフィルタやToolを書けば、即UIに反映される
  • OpenAI APIの料金管理機能: ユーザーごとに月額上限を設定できる課金機能を内蔵

デメリット

  • 初回起動に1〜2分かかる: 大量の埋め込みモデルやFAISSインデックスを初期化するため
  • 機能過多で学習コストが高い: 設定画面が10カテゴリ以上あり、初心者は迷う
  • カスタムライセンスの制約: ロゴ・名称変更、商用SaaS化に制限あり
  • UIのリソース消費: 大量のチャット履歴があるとフロントエンドが重くなる傾向
  • Pythonバージョン制約: pipインストールはPython 3.11推奨、3.12/3.13は警告が出る場合あり
  • アップデート時の互換性: メジャー更新でDBスキーマが変わるため、バックアップ必須
  • ChromaDBの肥大化: 大量のRAG文書を入れると数GB単位でディスクを消費

動作要件

Open WebUI自体はLLM推論を実行しないため、UIサーバー自体の要件は軽量です。重い処理はバックエンド(Ollama等)が担当します。

項目最小推奨備考
OSWindows 10 / macOS 12 / Ubuntu 20.04Windows 11 / macOS 14 / Ubuntu 22.04 LTSDocker利用ならOS依存なし
CPU2コア4コア以上推論サーバーは別途
RAM4GB8GB以上RAG/埋め込みで増加
ディスク(UIのみ)2GB10GB以上RAG文書/モデルキャッシュ込み
GPU不要(UI部分)不要推論はOllama/LM Studio側
Python(pipインストール時)3.11.03.11.x最新3.12も動作報告あり
Docker(Dockerインストール時)20.1024.0以降Docker Desktop推奨
ブラウザChrome 100/Firefox 100/Safari 16Chrome/Edge最新WebRTC利用なら最新必須

推論バックエンドの動作要件

Open WebUI自体ではなく、繋ぐ先のLLMが要求するスペックを別途見積もる必要があります。代表的な構成は以下です。

モデルサイズ推奨GPU/VRAM使えるモデル例
7B〜8B量子化NVIDIA RTX 3060(12GB) / Apple M2 16GBLlama 3.1 8B、Mistral 7B、Gemma 2 9B
13B〜14B量子化NVIDIA RTX 4070 Ti SUPER(16GB) / Apple M3 Pro 18GBQwen 2.5 14B、Phi-4 14B
32B量子化NVIDIA RTX 4090(24GB) / Apple M4 Max 36GBQwen 2.5 32B、CommandR 32B
70B量子化NVIDIA RTX 5090(32GB)+RAMオフロード / Apple M4 Ultra 64GBLlama 3.3 70B

インストール手順

Open WebUIには公式に推奨される4つの導入方法があります。本記事では一番安定して使える順に解説します。

  1. Docker(最推奨。OS問わず最も安定)
  2. Docker Compose(Ollamaと一緒に立てたい場合)
  3. pip / uv(Python環境がある人)
  4. 公式デスクトップアプリ(v0.9.0以降、Tauri製)

Windows・macOS・Linux共通: Docker版(最推奨)

事前にDocker DesktopまたはDocker Engineをインストールしておきます。Docker Desktop公式から自分のOS向けインストーラを落として、初期セットアップを終わらせてください。

Ollamaがすでに同じPCで動いている場合は、最も簡単な以下のコマンドで起動できます。

docker run -d \
  -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

Windows PowerShellでは改行を ` で結ぶか、1行にしてください。

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

起動後、ブラウザで http://localhost:3000 を開けばセットアップ画面が表示されます。初回起動時はモデルファイルとフロントエンドアセットの初期化に1〜2分かかるため、ブラウザで「Connection refused」が出ても少し待ってリロードしてください。

OllamaをまだインストールしていないPCでDockerで全部済ませる

NVIDIA GPUを使う場合のオールインワン構成です。Ollamaも一緒にコンテナで立てます。

docker run -d -p 3000:8080 --gpus=all \
  -v ollama:/root/.ollama \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:ollama

ghcr.io/open-webui/open-webui:ollama はOpen WebUIとOllamaが1つのイメージにバンドルされた版です。CPUだけで動かす場合は --gpus=all を外し、 :cuda ではなく :main を選んでください。

Linux: Docker Compose版(Ollama + Open WebUIをまとめて管理)

本番運用で使うなら公式のdocker-compose.yamlをベースに調整するのが定石です。最小構成は以下です。

services:
  ollama:
    image: ollama/ollama:latest
    container_name: ollama
    restart: unless-stopped
    volumes:
      - ollama:/root/.ollama
    ports:
      - "11434:11434"
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]

  open-webui:
    image: ghcr.io/open-webui/open-webui:main
    container_name: open-webui
    restart: unless-stopped
    depends_on:
      - ollama
    environment:
      - OLLAMA_BASE_URL=http://ollama:11434
      - WEBUI_SECRET_KEY=please-change-me
    ports:
      - "3000:8080"
    volumes:
      - open-webui:/app/backend/data

volumes:
  ollama:
  open-webui:

起動はおなじみのコマンドです。

docker compose up -d
docker compose logs -f open-webui

Windows: pipでインストール(Python派向け)

Pythonに慣れているならpipインストールが手軽です。Python 3.11が必須で、3.12では一部依存パッケージのwheelがない場合があります。

# Python 3.11が入っていない場合は先にインストール
winget install Python.Python.3.11

# 仮想環境を作成
python -m venv .venv
.\.venv\Scripts\Activate.ps1

# Open WebUIをインストール
pip install --upgrade pip
pip install open-webui

# 起動(初回は埋め込みモデルのダウンロードで5〜10分)
open-webui serve

open-webui serve を実行するとデフォルトで http://localhost:8080 が立ち上がります。ポートを変えたい場合は open-webui serve --port 3000 のように指定します。

macOS: pipまたはbrewでインストール

Apple Silicon環境ではbrewでPython 3.11を入れた後、上と同じpipの手順で動きます。Rosetta変換は不要です。

brew install python@3.11
python3.11 -m venv ~/.venv/open-webui
source ~/.venv/open-webui/bin/activate
pip install --upgrade pip
pip install open-webui
open-webui serve

Linux: uvでインストール(最も高速)

Rust製パッケージマネージャuvを使うと依存解決が10倍以上速くなります。

curl -LsSf https://astral.sh/uv/install.sh | sh
uv tool install open-webui --python 3.11
open-webui serve

公式デスクトップアプリ(v0.9.0以降)

v0.9.0で追加されたTauri製デスクトップ版は、専用リポジトリからインストーラをダウンロードできます。Open WebUIサーバーがバックグラウンドで自動起動する設計のため、Dockerやpipの設定が不要です。ただし2026年5月時点ではWindows版が安定で、Linux版(AppImage)はGPU検出に難があると報告されています。

初期設定

管理者アカウントの作成

初回 http://localhost:3000 アクセス時に「Sign Up」画面が表示されます。最初に登録したアカウントが自動的に管理者(admin)になる仕様のため、絶対に最初のサインアップを他人にやらせないでください。本番運用ではLAN内に立てた直後、自分でサインアップを終わらせるまで他人にアクセスを共有しないのが鉄則です。

Open WebUIの基本画面
Open WebUIのチャット画面の例(出典: Open WebUI公式GitHubリポジトリ

Ollama接続の確認

右上のアバター →「設定」→「管理者設定」→「接続」→「Ollama API」を開きます。Dockerで --add-host=host.docker.internal:host-gateway を付けて起動していれば、デフォルトの http://host.docker.internal:11434 がそのまま使えます。「Verify Connection」ボタンを押して緑色のチェックが付けばOKです。

OpenAI互換APIの追加

同じ「接続」画面に「OpenAI API」のセクションがあります。URLに https://api.openai.com/v1 (またはLM Studioなら http://host.docker.internal:1234/v1)、Keyに自分のAPIキーを入力して保存します。複数のエンドポイントを追加すれば、チャット画面のモデル選択ドロップダウンに全モデルが統合表示されます。

日本語化

サイドバー左下のアバターアイコン →「Settings」→「General」→「Language」で 日本語 - Japanese を選ぶと即座にUIが翻訳されます。v0.8系以降、翻訳品質は実用域に達しており、英語UIにこだわる必要はありません。

初期チューニング推奨設定

  • 「設定」→「インターフェース」→「Default Model」で頻繁に使うモデルを既定にする
  • 「管理者設定」→「ドキュメント」→「埋め込みモデル」をデフォルトの sentence-transformers/all-MiniLM-L6-v2 から、日本語精度の高い intfloat/multilingual-e5-large へ変更(初回ダウンロードに2GB程度)
  • 「管理者設定」→「Web検索」を有効化(後述)
  • 「管理者設定」→「コード実行」→「Code Interpreter」をPyodideサンドボックスで有効化

基本的な使い方

シンプルなチャット

サイドバー上部の「+」ボタンで新規チャットを作成し、画面上部のドロップダウンでモデルを選択、入力欄に質問を入れて送信します。マークダウン、数式(LaTeX)、コードブロックは自動でレンダリングされます。コードブロック右上の「Run」ボタンを押すと、Pyodide上で安全に実行できます。

マルチモデル並列実行

モデルドロップダウンの「+」アイコンで複数モデルを選択すると、入力した1つのプロンプトが選んだモデル全部に同時に送信されます。回答が縦方向に並んで表示されるため、たとえば「Llama 3.1 8B」「Gemma 2 9B」「Qwen 2.5 14B」を並べて回答品質をベンチマークするといった使い方が定番です。

ファイルのアップロードとRAG

入力欄左の「+」ボタンからPDF、Word、Excel、テキスト、Markdown、コードファイルなどをアップロードします。アップロードしたファイルは自動でChromaDBに埋め込まれ、その後の質問に対して関連箇所を検索しながら回答が生成されます。回答末尾には参照元のドキュメントへのリンクが付き、ハルシネーション抑制に効きます。

チャットの保存・共有

左サイドバーに会話履歴が時系列で並びます。歯車アイコンから「タグ付け」「フォルダ分け」「アーカイブ」「Markdownエクスポート」「リンク共有」が可能です。リンク共有はLAN内の別ユーザーに「この会話を見せたい」場合に重宝します。

実践的な使い方

ユースケース1: 社内ドキュメントQAボットを構築する

もっとも需要の高い使い方が「PDFや社内Wikiを取り込んでChatGPT風に質問できるボット」です。Open WebUIではこれをナレッジ機能(Knowledge)として標準提供しています。

  1. 左サイドバー →「ワークスペース」→「ナレッジ」→「+ 新規」
  2. 名前を「社内マニュアル」など分かりやすく付け、参照したいPDF・docx・mdをまとめて投入
  3. 「ワークスペース」→「モデル」→「+ 新規」を選び、ベースモデル(例: llama3.1:8b)と先ほどのナレッジを紐付け
  4. システムプロンプトに「あなたは弊社のサポート担当です。提供されたドキュメントに基づき日本語で簡潔に答えてください」と入力して保存
  5. チャット画面でこのカスタムモデルを選ぶだけで、ナレッジ参照付き回答が返るようになる

このパターンは200ページ以上のPDFでも数秒で初期化が終わり、ChatGPTのGPTsと完全互換の体験を得られます。

ユースケース2: Web検索付きリサーチアシスタント

「管理者設定」→「Web検索」→「Search Engine」で duckduckgo または searxng を選択して有効化します。SearXNGを使う場合はURLに自前のSearXNGインスタンス(例: http://searxng:8080/search?q=<query>&format=json)を指定します。

有効化後、チャット入力欄の地球儀アイコンをONにして質問すると、モデルが回答前にWeb検索を実行し、結果を要約して引用付きで返してくれます。プライバシー重視ならSearXNG、即応性重視ならBraveやTavilyが向いています。

ユースケース3: 画像生成パイプラインとの連携

同じLAN内にAUTOMATIC1111またはComfyUIを立てている場合、Open WebUIから直接呼び出せます。「管理者設定」→「画像生成」→「Image Generation Engine」で Automatic1111 または ComfyUI を選び、APIエンドポイント(例: http://host.docker.internal:7860)を入力して保存します。

チャット中に「この説明を絵にして」とお願いし、応答メッセージ右下の絵筆アイコンを押すと、その応答テキストをプロンプトとして画像生成が走ります。AIに「英訳→画像生成プロンプト整形」までやらせる流れは、デザイナーや小説家のワークフローと相性が抜群です。

応用・カスタマイズ

Pipelinesでカスタムフィルタを書く

Open WebUIにはPipelinesというプラグイン機構があります。Pythonで以下のような関数を書くだけで、UIに反映される独自フィルタを作れます。

from typing import List, Optional
from pydantic import BaseModel

class Pipeline:
    class Valves(BaseModel):
        pass

    def __init__(self):
        self.name = "PII Redactor"
        self.valves = self.Valves()

    async def inlet(self, body: dict, user: Optional[dict] = None) -> dict:
        import re
        for msg in body.get("messages", []):
            content = msg.get("content", "")
            content = re.sub(r"\d{3}-\d{4}-\d{4}", "[PHONE]", content)
            content = re.sub(r"[\w.+-]+@[\w-]+\.[\w.-]+", "[EMAIL]", content)
            msg["content"] = content
        return body

このファイルを pipelines/ ディレクトリに置いて再起動すれば、すべての送信メッセージから電話番号とメールアドレスが自動で伏字化されます。社内向け運用で重宝するパターンです。

定時実行で日次レポートを自動生成

v0.9.0で追加された定時実行機能は、チャットの右上「⋯」→「Schedule」から cron 式で設定します。例えば 0 7 * * *(毎朝7時)に「今日のニュース要約と昨日のGitHubコミット履歴」を生成させ、結果をWebhook経由でSlackに流す、といった運用が可能です。

SSO/OIDC連携

Google Workspace、Microsoft Entra ID、Keycloak、Authentikなどと連携できます。環境変数で以下を設定します。

ENABLE_OAUTH_SIGNUP=true
OAUTH_CLIENT_ID=your-client-id
OAUTH_CLIENT_SECRET=your-secret
OPENID_PROVIDER_URL=https://accounts.google.com/.well-known/openid-configuration
OAUTH_PROVIDER_NAME=Google

Docker Compose運用なら environment: セクションに追加し、再起動すれば反映されます。

テーマとブランディング

「管理者設定」→「インターフェース」で社内向けのロゴ、サイトタイトル、フッターテキストをカスタマイズできます。ただしOpen WebUIライセンスにより、Open WebUIブランドを完全に除去することは禁じられています。社内利用程度のカスタマイズ範囲内に留めてください。

パフォーマンス最適化

UIの体感速度を上げる

  • ENABLE_FRONTEND_HMR=false を環境変数に設定して本番モードで起動
  • サイドバーのチャット履歴は500件ごとにアーカイブ運用(履歴肥大でレンダリングが重くなる)
  • ChromaDBディレクトリ(data/vector_db)はSSDに配置
  • ブラウザ拡張機能をなるべく無効化したプロファイルでアクセスする

RAGの精度と速度を両立

  • 埋め込みモデルをintfloat/multilingual-e5-large(日本語強い)またはbge-m3(多言語強い)に変更
  • チャンクサイズを 1500、オーバーラップを 200 に調整(日本語の場合の経験則)
  • 「ハイブリッド検索」を有効化して BM25 と埋め込み検索を組み合わせる
  • 「リランカー」に BAAI/bge-reranker-v2-m3 を指定(精度が体感で1段上がる)

Ollama側のチューニング

Open WebUIのチャットが遅いと感じる原因の大半はOllama側のモデルロード時間です。OLLAMA_KEEP_ALIVE 環境変数を -1 または 24h に設定し、モデルを常駐させると2回目以降のレスポンスが瞬時になります。

OLLAMA_KEEP_ALIVE=-1 OLLAMA_NUM_PARALLEL=4 ollama serve

同時アクセスのスケーリング

10人以上が同時に使う環境では、Open WebUIをuvicornのワーカー数を増やして起動します。

UVICORN_WORKERS=4 open-webui serve

さらに大規模ならOpen WebUIをロードバランサ配下で複数台展開し、ChromaDBとRedis(セッション管理用)を外出しする構成が公式に推奨されています。

よくあるエラーとトラブルシューティング

1. Ollama: Connection refused が表示される

Dockerコンテナ内からホストのOllamaに繋ぐ際、localhost はコンテナ自身を指します。http://host.docker.internal:11434 に変更してください。Linuxでは --add-host=host.docker.internal:host-gateway をdocker runに付ける必要があります。

2. WEBUI_SECRET_KEY が変わってログインできなくなった

シークレットキーはJWTセッションの署名に使われるため、変えるとログインしていた全ユーザーが弾かれます。Docker Composeなら一度元のキーに戻すか、コンテナ内のdata/webui.dbを直接編集してセッションテーブルをクリアします。本番では .env ファイルでキーを管理し、絶対に変更しないでください。

3. RAGで日本語文書がほとんどヒットしない

デフォルトの埋め込みモデル sentence-transformers/all-MiniLM-L6-v2 は英語特化です。「管理者設定」→「ドキュメント」→「埋め込みモデル」を intfloat/multilingual-e5-large に変更してから、既存ドキュメントを再インデックスしてください。再インデックスは「ナレッジ」画面の各文書から「再処理」ボタンで実行できます。

4. アップデート後にUIが真っ白になる

ブラウザキャッシュが古いことが原因です。Ctrl + Shift + R でハードリロード、または開発者ツールでサービスワーカーを「Unregister」してください。それでも直らない場合は docker volume rm open-webui で初期化が必要ですが、必ず事前に docker cp open-webui:/app/backend/data ./backup でバックアップを取ってから実施します。

5. Whisper音声入力で CUDA out of memory

大きなWhisperモデル(large-v3)はVRAM 10GB以上必要です。VRAM 8GB環境では WHISPER_MODEL=base または WHISPER_MODEL=small に切り替えてください。日本語の精度は medium 以上で実用域です。

6. 画像生成連携でFailed to connect to image generation

AUTOMATIC1111は --api オプション付きで起動する必要があります。webui-user.batCOMMANDLINE_ARGS=--api を追加して再起動してください。ComfyUI側は標準でAPIが有効ですが、Open WebUIから別マシンを指す場合は --listen 0.0.0.0 での起動が必須です。

7. Pipelinesがインストールできない

Pipelinesは別コンテナまたは別Pythonプロセスで動かす設計です。ghcr.io/open-webui/pipelines:main を9099ポートで立て、Open WebUIの「OpenAI API」接続にこのURLを追加してAPIキーを 0p3n-w3bu!(デフォルト)に設定します。同じコンテナ内に置こうとして失敗するのが最頻出ミスです。

8. SQLiteエラー database is locked

多人数同時アクセスでSQLite制約に当たります。本番運用ではPostgreSQLへ移行してください。環境変数 DATABASE_URL=postgresql://user:pass@host:5432/openwebui を設定すれば、起動時に自動でテーブルを作成します。

9. WebSocketが切れる(特にKubernetes/Nginxの後ろ)

長時間のストリーミング応答がリバースプロキシのタイムアウトに引っかかるパターンです。Nginxの場合は以下の設定を追加してください。

location / {
    proxy_pass http://open-webui:8080;
    proxy_http_version 1.1;
    proxy_set_header Upgrade $http_upgrade;
    proxy_set_header Connection "upgrade";
    proxy_read_timeout 3600s;
    proxy_send_timeout 3600s;
}

10. Apple SiliconでDockerが極端に遅い

Docker Desktop for Macは仮想化レイヤを通すため、ファイルI/O性能がネイティブに比べて1/3程度になります。Apple Silicon環境ではDockerではなくpip/brew経由でネイティブインストールするのが最速です。Ollamaも同様にネイティブ版(公式インストーラ)を使ってください。

11. アカウント追加できない/新規登録が無効

初期設定でサインアップを無効化していると追加できません。「管理者設定」→「全般」→「Sign Up Enabled」をONに戻すか、管理者画面の「ユーザー管理」から個別にメールアドレスを発行してください。

おすすめの組み合わせ・連携

Ollama + Open WebUI の鉄板構成

2026年5月時点で「ローカルLLMをセルフホストする」最強の組み合わせは Ollama v0.24.0 + Open WebUI v0.9.5 です。Ollama側でモデル管理(pull、削除、量子化選択)、Open WebUI側でUIとマルチユーザー機能を分担する役割分担が綺麗で、トラブル切り分けも容易です。

vLLM + Open WebUI(高速推論したい場合)

同時アクセスが多い環境では、OllamaよりもvLLMの方が3〜10倍速いベンチマーク結果が出ています。vLLMはOpenAI互換APIを提供するため、Open WebUIの「OpenAI API」接続に http://vllm:8000/v1 を追加するだけで透過的に使えます。

SearXNG + Open WebUI(完全プライベートWeb検索)

Web検索を外部サービスに頼りたくない場合は、SearXNGをLAN内に立てて連携するのが定番です。Docker Composeで両方を一緒に立てれば、外部送信なしでWeb検索付きの会話が成立します。

ComfyUI + Open WebUI(画像生成パイプライン)

本サイト過去記事のComfyUI解説で構築したワークフローも、API経由でOpen WebUIから呼び出せます。「文章生成 → プロンプト整形 → 画像生成」のフルローカル動画クリエイティブパイプラインが構築可能です。

Home Assistant + Open WebUI(家庭内LLMエージェント)

Home Assistantの会話統合でOpen WebUIをエンドポイントに指定すれば、スマートスピーカー(ESP32 + Atom Echoなど)から自然言語で家電操作ができるようになります。家族向けにマルチユーザー+音声+家電制御が揃った瞬間、ChatGPTを上回る存在になります。

推奨PCスペック

Open WebUI自体は軽量ですが、つなぐLLMの大きさで必要スペックが大きく変わります。用途別に「入門」「標準」「ハイエンド」の3段階でPC構成例を示します。

入門構成(7B〜13Bモデル、家族で共有)

パーツ推奨用途
CPUIntel Core i5-14400 / Ryzen 5 7600Web UIサーバー
GPUNVIDIA RTX 4060 Ti 16GBLlama 3.1 8B、Gemma 2 9B
メモリ32GB DDR5 5600RAG + Ollama常駐
ストレージ1TB NVMe SSDモデル + RAG文書
電源650W 80PLUS GOLD余裕を持って

標準構成(14B〜32Bモデル、社内10人で共有)

パーツ推奨用途
CPUIntel Core i7-14700K / Ryzen 7 9700Xマルチワーカー対応
GPUNVIDIA RTX 4070 Ti SUPER 16GBQwen 2.5 14B、Phi-4 14B
メモリ64GB DDR5 5600Whisper常駐 + RAG拡大
ストレージ2TB NVMe SSDモデル数増加に備える
電源850W 80PLUS GOLDGPU増設の余地

ハイエンド構成(70Bモデル、ヘビーRAG運用)

パーツ推奨用途
CPUIntel Core i9-14900K / Ryzen 9 9950X大規模マルチワーカー
GPUNVIDIA RTX 5090 32GBLlama 3.3 70B量子化
メモリ128GB DDR5 560070Bモデルのオフロード
ストレージ4TB NVMe SSD (Gen5)大量モデル + ベクトルDB
電源1200W 80PLUS PLATINUMRTX 5090は最大600W

Apple Silicon環境ではM4 Max 36GB以上が標準構成相当、M4 Ultra 64GB以上がハイエンド構成相当の体感速度を出します。Mac StudioはMetal推論の効率が高く、消費電力あたりの性能ではWindows機を上回るケースが多いです。

まとめ

Open WebUI v0.9.5は、2026年5月時点で「ローカルLLMにChatGPT級のUIを与える」最終解です。マルチユーザー、RAG、Web検索、画像生成、音声、コード実行、定時実行、SSOまで全部入りで、しかも完全オフラインで動かせます。Ollamaと組み合わせれば、家庭内サーバー1台で家族全員がChatGPT Plus相当の体験を共有でき、企業利用でも数十人規模までスケールします。

導入の最短ルートは「Docker Desktopを入れる → docker run 1行 → localhost:3000 でサインアップ」の3ステップで、慣れれば10分で立ち上がります。最初の管理者アカウント作成だけは絶対に他人にやらせないという1点を守れば、後はGUIから安全に運用できます。

今後のロードマップ(公式のDiscussionsで議論中)では、ネイティブなマルチエージェント機能、より深いMCPプロトコル統合、組織横断のテナント機能、モバイル専用アプリの正式版が計画されています。ローカルLLM時代のフロントエンドのデファクトとなる勢いは当面崩れそうにありません。まずは1台のPCに立てて、その完成度を実感してみてください。

📦 この記事で紹介した商品

※ 上記リンクはAmazonアソシエイトリンクです。購入いただくと当サイトに紹介料が入ります。

タイトルとURLをコピーしました