Qué es Constructor de robots.txt?
Un archivo robots.txt proporciona reglas de acceso a nivel de sitio para los rastreadores. Puede permitir o denegar rutas, señalar al sitemap y documentar políticas de rastreadores. Los sitios estáticos a menudo necesitan un archivo robots.txt pequeño y predecible porque las compilaciones y las implementaciones de GitHub Pages solo publican lo que existe en la carpeta final.
Respuesta rápida
Use robots.txt para indicar a los rastreadores qué partes de su sitio no deben acceder. Controla el tráfico de rastreo, no la indexación — las directivas como noindex pertenecen a meta tags o encabezados HTTP.
Last updated: 2026-05-25
Limitaciones
- Las directivas robots.txt son consultivas. Actores maliciosos pueden ignorarlas.
- Bloquear una página en robots.txt no evita la indexación si otras páginas enlazan a ella.
- Cada subdominio necesita su propio archivo robots.txt.
Sources:MDN Web Docs · W3C Specifications · jquery.app on GitHub
Cómo usar esta herramienta
- Ingrese la URL pública del sitio y la URL del sitemap.
- Elija si los rastreadores normales deben tener acceso permitido en todo el sitio.
- Agregue rutas denegadas solo cuando haya una razón real para bloquear el rastreo.
- Copie el resultado en robots.txt en la raíz del sitio publicado.
Para qué puedes usarla
- Crear un archivo robots.txt limpio para GitHub Pages.
- Agregar una referencia al sitemap sin escribir el archivo manualmente.
- Documentar el acceso público de rastreadores antes del lanzamiento.