Qu'est-ce que Constructeur robots.txt ?
Un fichier robots.txt donne aux robots d'exploration des regles d'acces au niveau du site. Il peut autoriser ou interdire des chemins, pointer vers le sitemap et documenter les politiques d'exploration. Les sites statiques ont souvent besoin d'un petit fichier robots.txt previsible car les sorties de construction et les deploiements GitHub Pages ne publient que ce qui existe dans le dossier final.
Réponse rapide
Utilisez robots.txt pour indiquer aux robots d'exploration les parties de votre site auxquelles ils ne doivent pas acceder. Il controle le trafic d'exploration, pas l'indexation — les directives comme noindex appartiennent aux balises meta ou aux en-tetes HTTP.
Last updated: 2026-05-25
Limites
- Les directives robots.txt sont indicatives. Les acteurs malveillants et certains robots d'IA peuvent les ignorer completement.
- Bloquer une page dans robots.txt n'empeche pas l'indexation si d'autres pages pointent vers elle. Utilisez les balises meta noindex ou les en-tetes HTTP pour empecher l'indexation.
- Chaque sous-domaine a besoin de son propre fichier robots.txt. Le fichier a exemple.com/robots.txt ne s'applique pas a sous-domaine.exemple.com.
Sources:MDN Web Docs · W3C Specifications · jquery.app on GitHub
Comment utiliser cet outil
- Saisissez l'URL publique du site et l'URL du sitemap.
- Choisissez si les robots d'exploration normaux doivent etre autorises sur l'ensemble du site.
- Ajoutez des chemins interdits uniquement lorsqu'il y a une vraie raison de bloquer l'exploration.
- Copiez le resultat dans robots.txt a la racine du site publie.
A quoi il sert
- Creer un fichier robots.txt propre pour GitHub Pages.
- Ajouter une reference de sitemap sans ecrire le fichier a la main.
- Documenter l'acces public des robots d'exploration avant le lancement.