Los sitemaps son herramientas muy útiles para influir en el proceso de rastreo e indexación de nuestro sitio web. En este post aprenderemos cómo configurarlos, cómo sacarles partido, y algunos consejos avanzados si quieres llevarlos un poco más allá de sus funciones habituales.
Podríamos definir los sitemaps como archivos creados con información sobre las páginas que contiene un sitio web, así como sus relaciones entre ellas. Los buscadores como Google o Bing las usan para realizar un rastreo más eficiente de los sitios: en vez de ir navegando por nuestra web siguiendo los enlaces, consultan la lista en la que se supone que tendremos las páginas destinadas a ser indexadas. En castellano los podríamos llamar mapa del sitio, aunque cuidado con no confundirlo con una página en html, generalmente enlazada desde el footer, ideada para guiar al usuario por sitios grandes (actualmente en proceso de desuso).
Vamos a decir cosas a priori bastante obvias, pero parece mentira la de sitemaps que no cumplen con lo que vamos a definir. En esencia debemos incluir en los sitemaps las URLs que queremos posicionar, y que por lo tanto consideramos de valor. Para ello nos habremos cerciorado que todas esas páginas son accesibles, y que no podrían ser consideradas thin content ni contenido duplicado.
Además de una relación de las URLs de nuestras páginas, se aconseja incluir también aspectos opcionales como:
Aunque a primera vista puedas pensar que los sitemaps tienen un sólo uso (le enviamos las urls de nuestra web para indexar), los SEOs los usamos para varias cosas, quizá alguna te sorprenda. Estas son las que se me ocurren, aunque podría haber alguna más. Piensa en abstracto que son un conjunto de URLs que le entregas a los bots de Google para que los rastree. Los usos principales son:
TIP: para crear sitemaps manualmente una buena opción es Screaming Frog. Podemos ir a sitemaps, seleccionamos las páginas que queremos incluir, y si queremos incluir imágenes o no.
La documentación de Google es muy clara y generosa. Se aceptan y procesan sitemaps en 3 formatos:
Así que no te compliques la vida, y apuesta por el XML, a menos que el proyecto tenga unas herencias tecnológicas que lo hagan inviable.
Aquí va un listado de condiciones necesarias para tener un sitemap envidiable:
Por lo general, lo recomendable es no tener un sólo sitemap, sino generar varios en función de las características del proyecto, nuestras prioridades de posicionamiento y cómo vamos a querer segmentar el análisis de indexación y posicionamiento.
Os vamos a compartir algo bastante íntimo aunque no es ningún secreto, está disponible para todo el mundo: el sitemap de Latevaweb.
En este caso hemos optado por tres índices de sitemaps, uno para cada idioma. Tenemos el del idioma default, ES, en el lugar habitual https://www.latevaweb.com/sitemap.xml. Pero además, tenemos el sitemap de catalán e inglés cada uno en su carpeta de idioma, como https://www.latevaweb.com/en/sitemap.xml. De este modo podemos controlar la indexación y posicionamiento por idioma, algo relevante en nuestro proyecto.
Si accedemos además a uno de los índices, verás que dentro tenemos sitemaps por tipología de páginas. En nuestro caso servicios, posts de blog, porfolios, autores, etc:
Entregamos así más sitemaps, pero bien segmentados y más ligeros, más sencillos de procesar para los robots. Finalmente si vas a ver un mapa en detalle, verás como usamos el atributo Last modification date, para indicarle la fecha de actualización de los contenidos:
Este no es el único esquema de sitemaps posibles y en nuestros proyectos hemos implementado muchísimos distintos, debes pensar qué estructura encaja mejor en tu proyecto SEO.
A continuación te compartimos esta checklist con todo lo que deberías revisar antes de enviar un sitemap a Google. Interiorizar estos elementos e incorporarlos a nuestra mirada es lo que diferencia a un SEO avanzado de uno principiante, esperemos que sea de ayuda:
No. El orden es completamente indiferente. Afectan aspectos como la fecha de creación y modificación, pero no el orden en el listado
En un sitemap de htmls normalmente se referencia a la imagen principal de cada URL. Sin embargo, podríamos enviar hasta 1.000 imágenes por URL. Si el SEO de imágenes es relevante en tu proyecto, aprovéchalo.
En realidad no. Si tenemos una web pequeña y hemos implementado un buen enlazado interno y canonicals, Google no debería tener problemas para identificar nuestras URLs buenas, rastrearlas e indexarlas.
En cambio para webs grandes es algo imprescindible, pues ayudamos a focalizar nuestro crawl budget en aquello que verdaderamente importa.
No obstante, es una práctica recomendable en cualquier sitio web, tanto grandes como pequeños. Va a ayudar especialmente además a arrancar a sitios nuevos, o bien a webs en los que contengan muchos archivos no html.
En primer lugar, cuando enviamos el sitemap a Search Console Google nos indicará si ha podido acceder y procesarlo. Nos indica si está bien a nivel de formato, no que esté impecable. Con el tiempo
Si usamos Screaming Frog, la herramienta tiene un apartado de sitemaps muy útil. Nos indica las URLs detectadas vs URLs en sitemap, URLs no indexables en Sitemap, y URLs indexables no incluidas en el Sitemap.
O si prefieres una herramienta online, el Validate XML Sitemap de XML Sitemaps Generator puede ser muy buena opción.
Puedes indicarlo con los parámetros priority y frequency, pero Google ya no usa estos parámetros y los va a ignorar.
No hay ninguna garantía sobre ello. Lo que sí sabemos es que si lo creamos y entregamos, lo va a rastrear. Que lo indexe dependerá de otros aspectos, como la calidad y originalidad del contenido. Los sitemaps son una sugerencia para Google, no una directiva. Igualmente puede indexar URLs que no estén en el sitemap, si puede acceder a ellas y encuentra contenido. Si quieres evitarlo, debes bloquearle el acceso a los robots, o bien etiquetarlas con un noindex.
¿Tienes un proyecto en mente? Cuéntanoslo
En este post aprenderemos cómo configurar los Sitemaps, cómo sacarles partido, y algunos consejos avanzados