実践ガイド

AIを通すrobots.txtの実物。AI流入が立ち上がった自社サイトの設定を、コピペできる形で公開する

先に結論

AI検索に拾われるかどうかは、robots.txtというテキストファイルの数行で決まります。ここでAIのクローラーを弾いていると、どれだけ良いページを作っても、AIの回答には一生出てきません。

この記事では、立ち上がりの1ヶ月でAI・Bing流入が伸びた自社サイト(VEIL)が実際に使っている設定と、各AI企業の公式仕様で裏取りした2026年版のテンプレートを、そのままコピペできる形で公開します。


まず、その自社サイトの実物

VEILのrobots.txtの、AIに関わる部分はこうなっています。飾りはありません。

User-agent: *
Allow: /

# AI Crawlers
User-agent: GPTBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: ClaudeBot
Allow: /

Sitemap: https://masanosuke.net/sitemap-index.xml

やっていることは一つだけ。AIのクローラーを、明示的に通している。 特別な記述も、裏技もありません。多くのサイトがここで Disallow: / と書いてAIを締め出すなか、VEILはただ扉を開けていた。それだけで、流入の8割をBingとAIから得ています(4サイトの実測)。

ちなみに上の設定は、必要十分ではあるけれど、2026年の今ならもう少し足せます。次がその完全版です。


2026年版・コピペ用テンプレート(各社公式で裏取り済み)

検索表示用のクローラーを全部通し、必要なら学習だけ止められるようにした版です。各ボット名は2026年5月時点で各社公式ドキュメントを確認しています。

User-agent: *
Allow: /

# --- OpenAI ---
User-agent: GPTBot
Allow: /
User-agent: OAI-SearchBot
Allow: /
User-agent: ChatGPT-User
Allow: /

# --- Anthropic(Claude)---
User-agent: ClaudeBot
Allow: /
User-agent: Claude-SearchBot
Allow: /
User-agent: Claude-User
Allow: /

# --- Perplexity ---
User-agent: PerplexityBot
Allow: /
User-agent: Perplexity-User
Allow: /

# --- Google / Microsoft / Apple / Amazon / Common Crawl ---
User-agent: Google-Extended
Allow: /
User-agent: Bingbot
Allow: /
User-agent: Applebot
Allow: /
User-agent: Amazonbot
Allow: /
User-agent: CCBot
Allow: /

Sitemap: https://example.com/sitemap-index.xml

最後のSitemapの行だけ、自分のサイトのアドレスに書き換えてください。これをドメイン直下(https://example.com/robots.txt)に置けば、主要なAI検索の入口が開きます。


「検索表示用」と「学習用」は分けられる

「AIに学習させたくない」という不安はよく聞きます。そこは、分けて考えられます。AIのボットは、役割ごとに名前が違うからです。

ボット運営役割
OAI-SearchBotOpenAIChatGPT検索での表示
GPTBotOpenAIモデルの学習
Claude-SearchBotAnthropic検索結果の品質向上
ClaudeBotAnthropicモデルの学習
PerplexityBotPerplexity検索インデックス(回答での表示)
Google-ExtendedGoogleGeminiの学習可否を制御

学習されたくないなら、学習用(GPTBot・ClaudeBot・Google-Extended)だけをDisallowし、検索表示用(OAI-SearchBot・Claude-SearchBot・PerplexityBot・Bingbot)は許可する。 こう書けば、学習は拒みつつ、AIの回答には出られます。

# 学習は拒否、検索表示は許可する場合の例
User-agent: GPTBot
Disallow: /

User-agent: Google-Extended
Disallow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: PerplexityBot
Allow: /

各ボットの一覧はAIクローラー User-Agent 一覧に、コピペできる実装の周辺は実装スニペット集にまとめてあります。


置いたあとの確認

3つだけ確かめてください。

  1. ブラウザで https://自分のドメイン/robots.txt を開く … 中身がそのまま表示されればOK
  2. 検索表示用のボットを Disallow していないか … 過去の設定で弾いていないか見る
  3. Sitemapの行が自分のサイトを指しているか

WordPressならプラグインかテーマの設定で、ShopifyやXserverでも編集できます。やってはいけないのは、すべてのAIクローラーを一律 Disallow: / で締め出すこと。それは、AI検索という入口を自分の手で閉じる行為です(締め出していないか確認する)。


よくある質問

Q. robots.txtでAIクローラーを許可しないとどうなる? AIの回答に引用されなくなる。検索表示用(OAI-SearchBot・PerplexityBot・Bingbot等)を弾くと、ChatGPT検索・Perplexity・Copilotの回答に出られない。

Q. 学習に使われたくない場合は? 学習用と検索表示用は別のボット。学習用(GPTBot・ClaudeBot・Google-Extended)だけ拒否し、検索表示用は許可すれば、学習を拒みつつ回答には出られる。

Q. robots.txtはどこに置く? ドメイン直下(https://example.com/robots.txt)。置いたらブラウザで直接開いて中身を確認する。


最後に

AI検索の入口は、派手な施策の先にあるわけではありません。テキストファイル1枚、数行の Allow。それを書いているか、弾いているか。

立ち上がったサイトがやっていたのは、扉を開けておく、それだけでした。

AL

AIO Lab 主筆

広告運用 × データ分析のマーケター(40代・エンジニア出身)

Meta・Google・TikTok広告のインハウス運用が最も得意。ROAS・CPA起点の高速PDCAで伸ばし、広告と検索(SEO・GEO)の両面から集客を設計します。強みはデータの「見える化」——GA4・BigQuery・日次広告レポートで、数字を判断に変えること。大手予約サービスのマーケ部長を経て、現在はD2Cスタートアップでマーケ/データ責任者。複数の自社メディアを運営し、Bing・AI検索の流入を実データで検証しています。数値はすべて実測、出典のないデータは扱いません。運営者について →

AI検索の実践知

AIに見つかる構造を、実データから設計する。

ChatGPTやBing経由で実際に流入を取った一次データから、AIに見つけられるサイトの条件を発信しています。

実証事例を読む 記事一覧へ