Wat is robots.txt-bouwer?
Een robots.txt-bestand geeft crawlers toegangsregels op siteniveau. Het kan paden toestaan of weigeren, naar de sitemap verwijzen en crawler-beleid documenteren. Statische sites hebben vaak een klein, voorspelbaar robots.txt-bestand nodig omdat build-outputs en GitHub Pages-implementaties alleen publiceren wat in de uiteindelijke map bestaat.
Snel antwoord
Gebruik robots.txt om crawlers te vertellen welke delen van uw site ze niet mogen benaderen. Het beheert crawlverkeer, niet indexering — richtlijnen zoals noindex horen thuis in meta-tags of HTTP-headers.
Last updated: 2026-05-25
Beperkingen
- Robots.txt-richtlijnen zijn adviserend. Kwaadwillenden en sommige AI-crawlers kunnen ze volledig negeren.
- Het blokkeren van een pagina in robots.txt voorkomt indexering niet als andere pagina's ernaar linken. Gebruik noindex meta-tags of HTTP-headers om indexering te voorkomen.
- Elk subdomein heeft zijn eigen robots.txt-bestand nodig. Het bestand op voorbeeld.nl/robots.txt is niet van toepassing op subdomein.voorbeeld.nl.
Sources:MDN Web Docs · W3C Specifications · jquery.app on GitHub
Zo gebruik je deze tool
- Voer de openbare site-URL en sitemap-URL in.
- Kies of normale crawlers toegang moeten hebben tot de hele site.
- Voeg alleen geweigerde paden toe wanneer er een echte reden is om crawlen te blokkeren.
- Kopieer het resultaat naar robots.txt in de gepubliceerde site-root.
Waarvoor je het kunt gebruiken
- Maak een schoon robots.txt-bestand voor GitHub Pages.
- Voeg een sitemap-referentie toe zonder het bestand handmatig te schrijven.
- Documenteer openbare crawler-toegang vóór de lancering.