Open WebUI v0.9.5導入：Ollama連携でRAG・Web検索まで自宅完結【2026年5月】

Open WebUIは、ローカルで動くLLM（大規模言語モデル）に「ChatGPT風の使いやすいインターフェース」を被せるためのセルフホストWebアプリケーションです。OllamaやLM Studio、OpenAI互換APIに接続して、ブラウザ上でマルチモデルの会話、社内ドキュメントを使ったRAG、Web検索、画像生成までを1つの画面でこなせます。本記事執筆時点（2026年5月）の最新版はv0.9.5（2026年5月10日リリース）で、デスクトップアプリ、定時実行チャット、カレンダー連携、SSRF保護強化など、これまでの「Ollamaのフロントエンド」という枠を完全に超えた完成度に達しています。

本記事は、Open WebUIを「全く触ったことがない人」が、本記事1本を読むだけでインストール・初期設定・実用ワークフロー構築まで進められるよう、コマンドと画面操作を省略せずに書き切った決定版ガイドです。Windows・macOS・Linux・Docker・Pythonの全パターンを網羅し、よくあるトラブル10件以上の対処法、推奨ハードウェア、競合ツール（LibreChat、Chatbox、LobeChat、AnythingLLM、LM Studio内蔵Chat）との具体的な比較まで取り扱います。

Open WebUIとは何か
1. 主な特徴
2. 開発体制とライセンス
最新リリース情報（2026年5月最新）
他ツールとの比較
1. 用途別の使い分け
メリット・デメリット
1. メリット
2. デメリット
動作要件
1. 推論バックエンドの動作要件
インストール手順
初期設定
基本的な使い方
実践的な使い方
応用・カスタマイズ
パフォーマンス最適化
よくあるエラーとトラブルシューティング
おすすめの組み合わせ・連携
推奨PCスペック
まとめ
📦 この記事で紹介した商品

Open WebUIとは何か

Open WebUIは、Timothy Jaeryang Baek氏らが開発するセルフホスト型のLLMフロントエンドです。GitHubリポジトリは2026年5月時点でスター数10万超、世界でもっとも使われているローカルLLM向けWeb UIの座にあります。プロジェクトの正式名称は2024年初頭まで「Ollama WebUI」でしたが、Ollama以外のバックエンド（OpenAI互換API全般、LM Studio、vLLM、TGI、Groq、OpenRouter、Mistralなど）に対応した時点で現在の名称に改名されました。

Open WebUI 公式バナー — Open WebUIの公式バナー（出典: Open WebUI公式GitHubリポジトリ）

主な特徴

マルチプロバイダー対応: Ollama、OpenAI、Anthropic（OpenAI互換ラッパー経由）、LM Studio、vLLM、TGI、Groq、OpenRouter、Mistral、Azure OpenAI、Cloudflare Workers AIなど、OpenAI互換エンドポイントなら何でも接続可能
マルチモデル同時会話: 1つのプロンプトを複数モデルへ同時に投げて回答を横並びで比較できる
RAG（検索拡張生成）標準搭載: ドキュメントのドラッグ&ドロップだけでベクトルDBに取り込み、参照引用付きで回答させられる
Web検索統合: SearXNG、Tavily、Brave、DuckDuckGo、Google PSE、Serper、Serply、Bing、Mojeek、Jinaなど多数のプロバイダーを切り替えて使える
画像生成連携: AUTOMATIC1111、ComfyUI、OpenAI DALL-E、Gemini Imageに対応した「会話の流れで画像を生成」機能
音声入出力: ブラウザのWeb Speech APIに加え、Whisper、OpenAI TTS、Kokoro、ElevenLabs、Azure音声などを切り替え可能
関数呼び出し / Tools / Pipelines: PythonコードでツールやフィルタをWeb UIから定義でき、エージェント的な動作を構築可能
Model Builder: モデルファイル（Ollama Modelfile相当）をGUIで作成・編集・共有できる
ユーザー管理: ロールベースのアクセス制御、グループ機能、SSO（OAuth/OIDC/LDAP）対応で社内利用に耐える
完全オフライン動作: 適切に構成すれば外部通信ゼロでローカル運用できる

開発体制とライセンス

Open WebUIは独自の「Open WebUI License」を採用しています。2025年初頭まではBSD-3-Clauseでしたが、商標保護とフォークの乱立を防ぐ目的でカスタムライセンスへ移行しました。個人利用・社内利用・改変は完全に自由ですが、ロゴ・名称の変更、商標削除、サイドカー再配布は制限されます。商用配布や有料SaaS化を検討する場合は公式ライセンスFAQを必読です。

他ツールとの比較

2026年5月時点で「ローカルLLM + Webクライアント」の選択肢として競合になり得るのは、LibreChat、AnythingLLM、Chatbox、LobeChat、LM Studio内蔵Chatです。バージョン情報を正確に揃えて比較します。

項目	Open WebUI v0.9.5	LibreChat v0.8.6-rc1	AnythingLLM v1.12.1	Chatbox v1.20.1	LobeChat v2.2系	LM Studio v0.4.14内蔵
UI形態	Web（セルフホスト）	Web（セルフホスト）	デスクトップ+Web	デスクトップ専用	Web（セルフホスト/SaaS）	デスクトップ専用
Ollama連携	ネイティブ対応	OpenAI互換経由	ネイティブ対応	ネイティブ対応	OpenAI互換経由	同一プロセス
RAG標準搭載	あり（ChromaDB）	あり（PgVector）	あり（LanceDB）	限定的	あり	なし（外部連携要）
Web検索	10種類以上	Tavily等	あり	あり	あり	なし
マルチモデル同時会話	標準	標準	限定	あり	あり	あり（横並び比較）
マルチユーザー	標準	標準	標準	単一ユーザー	標準	単一ユーザー
SSO/OIDC	標準対応	標準対応	有料版	非対応	標準対応	非対応
画像生成	A1111/ComfyUI/DALL-E	DALL-E	DALL-E	DALL-E	あり	なし
音声入出力	Whisper/TTS等	Whisper/TTS	限定	あり	あり	なし
コード実行	Pyodideサンドボックス	Code Interpreter	限定	なし	あり	なし
定時実行	v0.9.0で追加	非対応	非対応	非対応	非対応	非対応
ライセンス	Open WebUI License	MIT	MIT	GPL-3.0	Apache-2.0	独自（無料/有料）
最小VRAM	UI自体は0（推論側依存）	0	0	0	0	2GB〜（推論内蔵）
導入の手軽さ	Docker一発	Docker一発	インストーラ	インストーラ	Docker	インストーラ

用途別の使い分け

個人で1台のPCで完結したい: LM Studio内蔵Chat、Chatboxの方が単純で速い
家族・小規模チームで共有したい: Open WebUIが最有力（マルチユーザー、RAG、料金管理が標準装備）
企業導入でSSO必須: Open WebUIかLibreChat（どちらもOIDC/SAML対応）
とにかく簡易に文書QAだけ欲しい: AnythingLLMが特化していて学習コストが低い
UIの華やかさを優先: LobeChatのテーマシステムが最も洗練

メリット・デメリット

メリット

機能の総合力で他を圧倒: RAG、Web検索、音声、画像生成、コード実行、定時実行が全部入り
マルチユーザーが標準: 1台のサーバーで家族や同僚全員のチャットを賄える
更新が頻繁: 月10〜20件のリリースがあり、ChatGPT等の新機能を1〜2週間でキャッチアップ
完全オフラインで動かせる: 適切な設定で外部通信を0にでき、機密データ運用に強い
Ollama親和性が極めて高い: モデルのpull/削除をWeb UIから直接操作できる
Pipelinesによる拡張性: PythonでフィルタやToolを書けば、即UIに反映される
OpenAI APIの料金管理機能: ユーザーごとに月額上限を設定できる課金機能を内蔵

デメリット

初回起動に1〜2分かかる: 大量の埋め込みモデルやFAISSインデックスを初期化するため
機能過多で学習コストが高い: 設定画面が10カテゴリ以上あり、初心者は迷う
カスタムライセンスの制約: ロゴ・名称変更、商用SaaS化に制限あり
UIのリソース消費: 大量のチャット履歴があるとフロントエンドが重くなる傾向
Pythonバージョン制約: pipインストールはPython 3.11推奨、3.12/3.13は警告が出る場合あり
アップデート時の互換性: メジャー更新でDBスキーマが変わるため、バックアップ必須
ChromaDBの肥大化: 大量のRAG文書を入れると数GB単位でディスクを消費

動作要件

Open WebUI自体はLLM推論を実行しないため、UIサーバー自体の要件は軽量です。重い処理はバックエンド（Ollama等）が担当します。

項目	最小	推奨	備考
OS	Windows 10 / macOS 12 / Ubuntu 20.04	Windows 11 / macOS 14 / Ubuntu 22.04 LTS	Docker利用ならOS依存なし
CPU	2コア	4コア以上	推論サーバーは別途
RAM	4GB	8GB以上	RAG/埋め込みで増加
ディスク（UIのみ）	2GB	10GB以上	RAG文書/モデルキャッシュ込み
GPU	不要（UI部分）	不要	推論はOllama/LM Studio側
Python（pipインストール時）	3.11.0	3.11.x最新	3.12も動作報告あり
Docker（Dockerインストール時）	20.10	24.0以降	Docker Desktop推奨
ブラウザ	Chrome 100/Firefox 100/Safari 16	Chrome/Edge最新	WebRTC利用なら最新必須

推論バックエンドの動作要件

Open WebUI自体ではなく、繋ぐ先のLLMが要求するスペックを別途見積もる必要があります。代表的な構成は以下です。

モデルサイズ	推奨GPU/VRAM	使えるモデル例
7B〜8B量子化	NVIDIA RTX 3060(12GB) / Apple M2 16GB	Llama 3.1 8B、Mistral 7B、Gemma 2 9B
13B〜14B量子化	NVIDIA RTX 4070 Ti SUPER(16GB) / Apple M3 Pro 18GB	Qwen 2.5 14B、Phi-4 14B
32B量子化	NVIDIA RTX 4090(24GB) / Apple M4 Max 36GB	Qwen 2.5 32B、CommandR 32B
70B量子化	NVIDIA RTX 5090(32GB)+RAMオフロード / Apple M4 Ultra 64GB	Llama 3.3 70B

インストール手順

Open WebUIには公式に推奨される4つの導入方法があります。本記事では一番安定して使える順に解説します。

Docker（最推奨。OS問わず最も安定）
Docker Compose（Ollamaと一緒に立てたい場合）
pip / uv（Python環境がある人）
公式デスクトップアプリ（v0.9.0以降、Tauri製）

Windows・macOS・Linux共通: Docker版（最推奨）

事前にDocker DesktopまたはDocker Engineをインストールしておきます。Docker Desktop公式から自分のOS向けインストーラを落として、初期セットアップを終わらせてください。

Ollamaがすでに同じPCで動いている場合は、最も簡単な以下のコマンドで起動できます。

docker run -d \
  -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

Windows PowerShellでは改行を ` で結ぶか、1行にしてください。

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

起動後、ブラウザで http://localhost:3000 を開けばセットアップ画面が表示されます。初回起動時はモデルファイルとフロントエンドアセットの初期化に1〜2分かかるため、ブラウザで「Connection refused」が出ても少し待ってリロードしてください。

OllamaをまだインストールしていないPCでDockerで全部済ませる

NVIDIA GPUを使う場合のオールインワン構成です。Ollamaも一緒にコンテナで立てます。

docker run -d -p 3000:8080 --gpus=all \
  -v ollama:/root/.ollama \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:ollama

ghcr.io/open-webui/open-webui:ollama はOpen WebUIとOllamaが1つのイメージにバンドルされた版です。CPUだけで動かす場合は --gpus=all を外し、 :cuda ではなく :main を選んでください。

Linux: Docker Compose版（Ollama + Open WebUIをまとめて管理）

本番運用で使うなら公式のdocker-compose.yamlをベースに調整するのが定石です。最小構成は以下です。

services:
  ollama:
    image: ollama/ollama:latest
    container_name: ollama
    restart: unless-stopped
    volumes:
      - ollama:/root/.ollama
    ports:
      - "11434:11434"
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]

  open-webui:
    image: ghcr.io/open-webui/open-webui:main
    container_name: open-webui
    restart: unless-stopped
    depends_on:
      - ollama
    environment:
      - OLLAMA_BASE_URL=http://ollama:11434
      - WEBUI_SECRET_KEY=please-change-me
    ports:
      - "3000:8080"
    volumes:
      - open-webui:/app/backend/data

volumes:
  ollama:
  open-webui:

起動はおなじみのコマンドです。

docker compose up -d
docker compose logs -f open-webui

Windows: pipでインストール（Python派向け）

Pythonに慣れているならpipインストールが手軽です。Python 3.11が必須で、3.12では一部依存パッケージのwheelがない場合があります。

# Python 3.11が入っていない場合は先にインストール
winget install Python.Python.3.11

# 仮想環境を作成
python -m venv .venv
.\.venv\Scripts\Activate.ps1

# Open WebUIをインストール
pip install --upgrade pip
pip install open-webui

# 起動（初回は埋め込みモデルのダウンロードで5〜10分）
open-webui serve

open-webui serve を実行するとデフォルトで http://localhost:8080 が立ち上がります。ポートを変えたい場合は open-webui serve --port 3000 のように指定します。

macOS: pipまたはbrewでインストール

Apple Silicon環境ではbrewでPython 3.11を入れた後、上と同じpipの手順で動きます。Rosetta変換は不要です。

brew install python@3.11
python3.11 -m venv ~/.venv/open-webui
source ~/.venv/open-webui/bin/activate
pip install --upgrade pip
pip install open-webui
open-webui serve

Linux: uvでインストール（最も高速）

Rust製パッケージマネージャuvを使うと依存解決が10倍以上速くなります。

curl -LsSf https://astral.sh/uv/install.sh | sh
uv tool install open-webui --python 3.11
open-webui serve

公式デスクトップアプリ（v0.9.0以降）

v0.9.0で追加されたTauri製デスクトップ版は、専用リポジトリからインストーラをダウンロードできます。Open WebUIサーバーがバックグラウンドで自動起動する設計のため、Dockerやpipの設定が不要です。ただし2026年5月時点ではWindows版が安定で、Linux版（AppImage）はGPU検出に難があると報告されています。

初期設定

管理者アカウントの作成

初回 http://localhost:3000 アクセス時に「Sign Up」画面が表示されます。最初に登録したアカウントが自動的に管理者（admin）になる仕様のため、絶対に最初のサインアップを他人にやらせないでください。本番運用ではLAN内に立てた直後、自分でサインアップを終わらせるまで他人にアクセスを共有しないのが鉄則です。

Open WebUIの基本画面 — Open WebUIのチャット画面の例（出典: Open WebUI公式GitHubリポジトリ）

Ollama接続の確認

右上のアバター →「設定」→「管理者設定」→「接続」→「Ollama API」を開きます。Dockerで --add-host=host.docker.internal:host-gateway を付けて起動していれば、デフォルトの http://host.docker.internal:11434 がそのまま使えます。「Verify Connection」ボタンを押して緑色のチェックが付けばOKです。

OpenAI互換APIの追加

同じ「接続」画面に「OpenAI API」のセクションがあります。URLに https://api.openai.com/v1 （またはLM Studioなら http://host.docker.internal:1234/v1）、Keyに自分のAPIキーを入力して保存します。複数のエンドポイントを追加すれば、チャット画面のモデル選択ドロップダウンに全モデルが統合表示されます。

日本語化

サイドバー左下のアバターアイコン →「Settings」→「General」→「Language」で 日本語 - Japanese を選ぶと即座にUIが翻訳されます。v0.8系以降、翻訳品質は実用域に達しており、英語UIにこだわる必要はありません。

初期チューニング推奨設定

「設定」→「インターフェース」→「Default Model」で頻繁に使うモデルを既定にする
「管理者設定」→「ドキュメント」→「埋め込みモデル」をデフォルトの sentence-transformers/all-MiniLM-L6-v2 から、日本語精度の高い intfloat/multilingual-e5-large へ変更（初回ダウンロードに2GB程度）
「管理者設定」→「Web検索」を有効化（後述）
「管理者設定」→「コード実行」→「Code Interpreter」をPyodideサンドボックスで有効化

基本的な使い方

シンプルなチャット

サイドバー上部の「+」ボタンで新規チャットを作成し、画面上部のドロップダウンでモデルを選択、入力欄に質問を入れて送信します。マークダウン、数式（LaTeX）、コードブロックは自動でレンダリングされます。コードブロック右上の「Run」ボタンを押すと、Pyodide上で安全に実行できます。

マルチモデル並列実行

モデルドロップダウンの「+」アイコンで複数モデルを選択すると、入力した1つのプロンプトが選んだモデル全部に同時に送信されます。回答が縦方向に並んで表示されるため、たとえば「Llama 3.1 8B」「Gemma 2 9B」「Qwen 2.5 14B」を並べて回答品質をベンチマークするといった使い方が定番です。

ファイルのアップロードとRAG

入力欄左の「+」ボタンからPDF、Word、Excel、テキスト、Markdown、コードファイルなどをアップロードします。アップロードしたファイルは自動でChromaDBに埋め込まれ、その後の質問に対して関連箇所を検索しながら回答が生成されます。回答末尾には参照元のドキュメントへのリンクが付き、ハルシネーション抑制に効きます。

チャットの保存・共有

左サイドバーに会話履歴が時系列で並びます。歯車アイコンから「タグ付け」「フォルダ分け」「アーカイブ」「Markdownエクスポート」「リンク共有」が可能です。リンク共有はLAN内の別ユーザーに「この会話を見せたい」場合に重宝します。

実践的な使い方

ユースケース1: 社内ドキュメントQAボットを構築する

もっとも需要の高い使い方が「PDFや社内Wikiを取り込んでChatGPT風に質問できるボット」です。Open WebUIではこれをナレッジ機能（Knowledge）として標準提供しています。

左サイドバー →「ワークスペース」→「ナレッジ」→「+ 新規」
名前を「社内マニュアル」など分かりやすく付け、参照したいPDF・docx・mdをまとめて投入
「ワークスペース」→「モデル」→「+ 新規」を選び、ベースモデル（例: llama3.1:8b）と先ほどのナレッジを紐付け
システムプロンプトに「あなたは弊社のサポート担当です。提供されたドキュメントに基づき日本語で簡潔に答えてください」と入力して保存
チャット画面でこのカスタムモデルを選ぶだけで、ナレッジ参照付き回答が返るようになる

このパターンは200ページ以上のPDFでも数秒で初期化が終わり、ChatGPTのGPTsと完全互換の体験を得られます。

ユースケース2: Web検索付きリサーチアシスタント

「管理者設定」→「Web検索」→「Search Engine」で duckduckgo または searxng を選択して有効化します。SearXNGを使う場合はURLに自前のSearXNGインスタンス（例: http://searxng:8080/search?q=<query>&format=json）を指定します。

有効化後、チャット入力欄の地球儀アイコンをONにして質問すると、モデルが回答前にWeb検索を実行し、結果を要約して引用付きで返してくれます。プライバシー重視ならSearXNG、即応性重視ならBraveやTavilyが向いています。

ユースケース3: 画像生成パイプラインとの連携

同じLAN内にAUTOMATIC1111またはComfyUIを立てている場合、Open WebUIから直接呼び出せます。「管理者設定」→「画像生成」→「Image Generation Engine」で Automatic1111 または ComfyUI を選び、APIエンドポイント（例: http://host.docker.internal:7860）を入力して保存します。

チャット中に「この説明を絵にして」とお願いし、応答メッセージ右下の絵筆アイコンを押すと、その応答テキストをプロンプトとして画像生成が走ります。AIに「英訳→画像生成プロンプト整形」までやらせる流れは、デザイナーや小説家のワークフローと相性が抜群です。

応用・カスタマイズ

Pipelinesでカスタムフィルタを書く

Open WebUIにはPipelinesというプラグイン機構があります。Pythonで以下のような関数を書くだけで、UIに反映される独自フィルタを作れます。

from typing import List, Optional
from pydantic import BaseModel

class Pipeline:
    class Valves(BaseModel):
        pass

    def __init__(self):
        self.name = "PII Redactor"
        self.valves = self.Valves()

    async def inlet(self, body: dict, user: Optional[dict] = None) -> dict:
        import re
        for msg in body.get("messages", []):
            content = msg.get("content", "")
            content = re.sub(r"\d{3}-\d{4}-\d{4}", "[PHONE]", content)
            content = re.sub(r"[\w.+-]+@[\w-]+\.[\w.-]+", "[EMAIL]", content)
            msg["content"] = content
        return body

このファイルを pipelines/ ディレクトリに置いて再起動すれば、すべての送信メッセージから電話番号とメールアドレスが自動で伏字化されます。社内向け運用で重宝するパターンです。

定時実行で日次レポートを自動生成

v0.9.0で追加された定時実行機能は、チャットの右上「⋯」→「Schedule」から cron 式で設定します。例えば 0 7 * * *（毎朝7時）に「今日のニュース要約と昨日のGitHubコミット履歴」を生成させ、結果をWebhook経由でSlackに流す、といった運用が可能です。

SSO/OIDC連携

Google Workspace、Microsoft Entra ID、Keycloak、Authentikなどと連携できます。環境変数で以下を設定します。

ENABLE_OAUTH_SIGNUP=true
OAUTH_CLIENT_ID=your-client-id
OAUTH_CLIENT_SECRET=your-secret
OPENID_PROVIDER_URL=https://accounts.google.com/.well-known/openid-configuration
OAUTH_PROVIDER_NAME=Google

Docker Compose運用なら environment: セクションに追加し、再起動すれば反映されます。

テーマとブランディング

「管理者設定」→「インターフェース」で社内向けのロゴ、サイトタイトル、フッターテキストをカスタマイズできます。ただしOpen WebUIライセンスにより、Open WebUIブランドを完全に除去することは禁じられています。社内利用程度のカスタマイズ範囲内に留めてください。

パフォーマンス最適化

UIの体感速度を上げる

ENABLE_FRONTEND_HMR=false を環境変数に設定して本番モードで起動
サイドバーのチャット履歴は500件ごとにアーカイブ運用（履歴肥大でレンダリングが重くなる）
ChromaDBディレクトリ（data/vector_db）はSSDに配置
ブラウザ拡張機能をなるべく無効化したプロファイルでアクセスする

RAGの精度と速度を両立

埋め込みモデルをintfloat/multilingual-e5-large（日本語強い）またはbge-m3（多言語強い）に変更
チャンクサイズを 1500、オーバーラップを 200 に調整（日本語の場合の経験則）
「ハイブリッド検索」を有効化して BM25 と埋め込み検索を組み合わせる
「リランカー」に BAAI/bge-reranker-v2-m3 を指定（精度が体感で1段上がる）

Ollama側のチューニング

Open WebUIのチャットが遅いと感じる原因の大半はOllama側のモデルロード時間です。OLLAMA_KEEP_ALIVE 環境変数を -1 または 24h に設定し、モデルを常駐させると2回目以降のレスポンスが瞬時になります。

OLLAMA_KEEP_ALIVE=-1 OLLAMA_NUM_PARALLEL=4 ollama serve

同時アクセスのスケーリング

10人以上が同時に使う環境では、Open WebUIをuvicornのワーカー数を増やして起動します。

UVICORN_WORKERS=4 open-webui serve

さらに大規模ならOpen WebUIをロードバランサ配下で複数台展開し、ChromaDBとRedis（セッション管理用）を外出しする構成が公式に推奨されています。

よくあるエラーとトラブルシューティング

1. Ollama: Connection refused が表示される

Dockerコンテナ内からホストのOllamaに繋ぐ際、localhost はコンテナ自身を指します。http://host.docker.internal:11434 に変更してください。Linuxでは --add-host=host.docker.internal:host-gateway をdocker runに付ける必要があります。

2. WEBUI_SECRET_KEY が変わってログインできなくなった

シークレットキーはJWTセッションの署名に使われるため、変えるとログインしていた全ユーザーが弾かれます。Docker Composeなら一度元のキーに戻すか、コンテナ内のdata/webui.dbを直接編集してセッションテーブルをクリアします。本番では .env ファイルでキーを管理し、絶対に変更しないでください。

3. RAGで日本語文書がほとんどヒットしない

デフォルトの埋め込みモデル sentence-transformers/all-MiniLM-L6-v2 は英語特化です。「管理者設定」→「ドキュメント」→「埋め込みモデル」を intfloat/multilingual-e5-large に変更してから、既存ドキュメントを再インデックスしてください。再インデックスは「ナレッジ」画面の各文書から「再処理」ボタンで実行できます。

4. アップデート後にUIが真っ白になる

ブラウザキャッシュが古いことが原因です。Ctrl + Shift + R でハードリロード、または開発者ツールでサービスワーカーを「Unregister」してください。それでも直らない場合は docker volume rm open-webui で初期化が必要ですが、必ず事前に docker cp open-webui:/app/backend/data ./backup でバックアップを取ってから実施します。

5. Whisper音声入力で CUDA out of memory

大きなWhisperモデル（large-v3）はVRAM 10GB以上必要です。VRAM 8GB環境では WHISPER_MODEL=base または WHISPER_MODEL=small に切り替えてください。日本語の精度は medium 以上で実用域です。

6. 画像生成連携でFailed to connect to image generation

AUTOMATIC1111は --api オプション付きで起動する必要があります。webui-user.bat の COMMANDLINE_ARGS=--api を追加して再起動してください。ComfyUI側は標準でAPIが有効ですが、Open WebUIから別マシンを指す場合は --listen 0.0.0.0 での起動が必須です。

7. Pipelinesがインストールできない

Pipelinesは別コンテナまたは別Pythonプロセスで動かす設計です。ghcr.io/open-webui/pipelines:main を9099ポートで立て、Open WebUIの「OpenAI API」接続にこのURLを追加してAPIキーを 0p3n-w3bu!（デフォルト）に設定します。同じコンテナ内に置こうとして失敗するのが最頻出ミスです。

8. SQLiteエラー database is locked

多人数同時アクセスでSQLite制約に当たります。本番運用ではPostgreSQLへ移行してください。環境変数 DATABASE_URL=postgresql://user:pass@host:5432/openwebui を設定すれば、起動時に自動でテーブルを作成します。

9. WebSocketが切れる（特にKubernetes/Nginxの後ろ）

長時間のストリーミング応答がリバースプロキシのタイムアウトに引っかかるパターンです。Nginxの場合は以下の設定を追加してください。

location / {
    proxy_pass http://open-webui:8080;
    proxy_http_version 1.1;
    proxy_set_header Upgrade $http_upgrade;
    proxy_set_header Connection "upgrade";
    proxy_read_timeout 3600s;
    proxy_send_timeout 3600s;
}

10. Apple SiliconでDockerが極端に遅い

Docker Desktop for Macは仮想化レイヤを通すため、ファイルI/O性能がネイティブに比べて1/3程度になります。Apple Silicon環境ではDockerではなくpip/brew経由でネイティブインストールするのが最速です。Ollamaも同様にネイティブ版（公式インストーラ）を使ってください。

11. アカウント追加できない／新規登録が無効

初期設定でサインアップを無効化していると追加できません。「管理者設定」→「全般」→「Sign Up Enabled」をONに戻すか、管理者画面の「ユーザー管理」から個別にメールアドレスを発行してください。

推奨PCスペック

Open WebUI自体は軽量ですが、つなぐLLMの大きさで必要スペックが大きく変わります。用途別に「入門」「標準」「ハイエンド」の3段階でPC構成例を示します。

入門構成（7B〜13Bモデル、家族で共有）

パーツ	推奨	用途
CPU	Intel Core i5-14400 / Ryzen 5 7600	Web UIサーバー
GPU	NVIDIA RTX 4060 Ti 16GB	Llama 3.1 8B、Gemma 2 9B
メモリ	32GB DDR5 5600	RAG + Ollama常駐
ストレージ	1TB NVMe SSD	モデル + RAG文書
電源	650W 80PLUS GOLD	余裕を持って

標準構成（14B〜32Bモデル、社内10人で共有）

パーツ	推奨	用途
CPU	Intel Core i7-14700K / Ryzen 7 9700X	マルチワーカー対応
GPU	NVIDIA RTX 4070 Ti SUPER 16GB	Qwen 2.5 14B、Phi-4 14B
メモリ	64GB DDR5 5600	Whisper常駐 + RAG拡大
ストレージ	2TB NVMe SSD	モデル数増加に備える
電源	850W 80PLUS GOLD	GPU増設の余地

ハイエンド構成（70Bモデル、ヘビーRAG運用）

パーツ	推奨	用途
CPU	Intel Core i9-14900K / Ryzen 9 9950X	大規模マルチワーカー
GPU	NVIDIA RTX 5090 32GB	Llama 3.3 70B量子化
メモリ	128GB DDR5 5600	70Bモデルのオフロード
ストレージ	4TB NVMe SSD (Gen5)	大量モデル + ベクトルDB
電源	1200W 80PLUS PLATINUM	RTX 5090は最大600W

Apple Silicon環境ではM4 Max 36GB以上が標準構成相当、M4 Ultra 64GB以上がハイエンド構成相当の体感速度を出します。Mac StudioはMetal推論の効率が高く、消費電力あたりの性能ではWindows機を上回るケースが多いです。

まとめ

Open WebUI v0.9.5は、2026年5月時点で「ローカルLLMにChatGPT級のUIを与える」最終解です。マルチユーザー、RAG、Web検索、画像生成、音声、コード実行、定時実行、SSOまで全部入りで、しかも完全オフラインで動かせます。Ollamaと組み合わせれば、家庭内サーバー1台で家族全員がChatGPT Plus相当の体験を共有でき、企業利用でも数十人規模までスケールします。

導入の最短ルートは「Docker Desktopを入れる → docker run 1行 → localhost:3000 でサインアップ」の3ステップで、慣れれば10分で立ち上がります。最初の管理者アカウント作成だけは絶対に他人にやらせないという1点を守れば、後はGUIから安全に運用できます。

今後のロードマップ（公式のDiscussionsで議論中）では、ネイティブなマルチエージェント機能、より深いMCPプロトコル統合、組織横断のテナント機能、モバイル専用アプリの正式版が計画されています。ローカルLLM時代のフロントエンドのデファクトとなる勢いは当面崩れそうにありません。まずは1台のPCに立てて、その完成度を実感してみてください。

📦 この記事で紹介した商品

NVIDIA GeForce RTX 4070 Ti SUPER → Amazonで見る
大規模言語モデル入門 → Amazonで見る
ゼロから作るDeep Learning → Amazonで見る
GB DDR5メモリ → Amazonで見る
TB NVMe SSD → Amazonで見る

※ 上記リンクはAmazonアソシエイトリンクです。購入いただくと当サイトに紹介料が入ります。