Was ist robots.txt-Builder?
Eine robots.txt-Datei gibt Crawlern seitenweite Zugriffsregeln. Sie kann Pfade erlauben oder verbieten, auf die Sitemap verweisen und Crawler-Richtlinien dokumentieren. Statische Sites benotigen oft eine kleine, vorhersagbare robots.txt-Datei, da Build-Ausgaben und GitHub-Pages-Bereitstellungen nur das veroffentlichen, was im endgultigen Ordner existiert.
Kurze Antwort
Verwenden Sie robots.txt, um Crawlern mitzuteilen, auf welche Teile Ihrer Site sie nicht zugreifen sollen. Es steuert den Crawl-Traffic, nicht die Indizierung -- Direktiven wie noindex gehoren in Meta-Tags oder HTTP-Header.
Last updated: 2026-05-25
Einschränkungen
- robots.txt-Direktiven sind empfehlend. Boswillige Akteure und einige KI-Crawler ignorieren sie moglicherweise vollstandig.
- Das Blockieren einer Seite in robots.txt verhindert keine Indizierung, wenn andere Seiten darauf verweisen. Verwenden Sie noindex-Meta-Tags oder HTTP-Header, um die Indizierung zu verhindern.
- Jede Subdomain benotigt ihre eigene robots.txt-Datei. Die Datei unter example.com/robots.txt gilt nicht fur subdomain.example.com.
Sources:MDN Web Docs · W3C Specifications · jquery.app on GitHub
So nutzt du dieses Tool
- Geben Sie die offentliche Site-URL und Sitemap-URL ein.
- Wahlen Sie, ob normale Crawler auf der gesamten Site erlaubt sein sollen.
- Fugen Sie gesperrte Pfade nur hinzu, wenn es einen echten Grund gibt, das Crawlen zu blockieren.
- Kopieren Sie das Ergebnis in robots.txt im veroffentlichten Site-Root.
Wofür du es nutzen kannst
- Eine saubere robots.txt-Datei fur GitHub Pages erstellen.
- Eine Sitemap-Referenz hinzufugen, ohne die Datei von Hand zu schreiben.
- Offentlichen Crawler-Zugriff vor dem Start dokumentieren.