robots.txtビルダーとは
robots.txtファイルはクローラーにサイトレベルのアクセスルールを提供します。パスを許可または禁止したり、サイトマップを指定したり、クローラーポリシーを文書化したりできます。静的サイトでは、ビルド出力とGitHub Pagesのデプロイが最終フォルダに存在するもののみを公開するため、小さくて予測可能なrobots.txtファイルが必要になることがよくあります。
クイックアンサー
robots.txtを使用して、クローラーにサイトのどの部分にアクセスすべきでないかを指示します。これはクロールトラフィックを制御するものであり、インデックスを制御するものではありません。noindexのようなディレクティブはmetaタグまたはHTTPヘッダーに属します。
Last updated: 2026-05-25
制限事項
- robots.txtの指示は助言であり、悪意のある行為者や一部のAIクローラーは完全に無視する可能性があります。
- robots.txtでページをブロックしても、他のページがリンクしている場合はインデックスを防げません。インデックスを防ぐにはnoindex metaタグまたはHTTPヘッダーを使用します。
- 各サブドメインは独自のrobots.txtファイルを必要とします。example.com/robots.txtのルールはsubdomain.example.comには適用されません。
Sources:MDN Web Docs · W3C Specifications · jquery.app on GitHub
使い方
- 公開サイトURLとサイトマップURLを入力します。
- 通常のクローラーがサイト全体にアクセスを許可されるかどうかを選択します。
- クロールをブロックする本当の理由がある場合にのみ、禁止パスを追加します。
- 結果をrobots.txtとして公開サイトルートにコピーします。
主な用途
- GitHub Pages用のクリーンなrobots.txtファイルを作成する。
- ファイルを手書きせずにサイトマップ参照を追加する。
- 公開前にクローラーのアクセスルールを文書化する。