Sitemaps y SEO, nivel avanzado
21 / 03 / 2024

Sitemaps y SEO, nivel avanzado

Bruno Díaz Marketing Manager
Bruno Díaz
Marketing Manager

En este post aprenderemos cómo configurar los Sitemaps, cómo sacarles partido, y algunos consejos avanzados

Los sitemaps son herramientas muy útiles para influir en el proceso de rastreo e indexación de nuestro sitio web. En este post aprenderemos cómo configurarlos, cómo sacarles partido, y algunos consejos avanzados si quieres llevarlos un poco más allá de sus funciones habituales.

Definición de sitemaps

Podríamos definir los sitemaps como archivos creados con información sobre las páginas que contiene un sitio web, así como sus relaciones entre ellas. Los buscadores como Google o Bing las usan para realizar un rastreo más eficiente de los sitios: en vez de ir navegando por nuestra web siguiendo los enlaces, consultan la lista en la que se supone que tendremos las páginas destinadas a ser indexadas. En castellano los podríamos llamar mapa del sitio, aunque cuidado con no confundirlo con una página en html, generalmente enlazada desde el footer, ideada para guiar al usuario por sitios grandes (actualmente en proceso de desuso).

Qué incluir en los sitemaps (y qué no)

Vamos a decir cosas a priori bastante obvias, pero parece mentira la de sitemaps que no cumplen con lo que vamos a definir. En esencia debemos incluir en los sitemaps las URLs que queremos posicionar, y que por lo tanto consideramos de valor. Para ello nos habremos cerciorado que todas esas páginas son accesibles, y que no podrían ser consideradas thin content ni contenido duplicado.

Además de una relación de las URLs de nuestras páginas, se aconseja incluir también aspectos opcionales como:

  • Fecha de última actualización de cada URL, con la etiqueta lastmod
  • Las relaciones hreflang entre URLs (indicamos que para el contenido X en el idioma 1, sus equivalentes en el resto de idiomas del sitio)
  • las imágenes principales presentes en cada URL (o todas)

¿Para qué usar los sitemaps?

Aunque a primera vista puedas pensar que los sitemaps tienen un sólo uso (le enviamos las urls de nuestra web para indexar), los SEOs los usamos para varias cosas, quizá alguna te sorprenda. Estas son las que se me ocurren, aunque podría haber alguna más. Piensa en abstracto que son un conjunto de URLs que le entregas a los bots de Google para que los rastree. Los usos principales son:

  1. Si publicamos un sitio web nuevo, juega un papel fundamental para facilitar y vehicular el proceso de rastreo e indexación de las URLs que por definición son nuevas.
  2. Si estamos ante un proceso de migración web, nos acelera el proceso de substitución en las SERP. Podemos enviarle por un lado en un sitemap las URLs nuevas, dando todas respuesta 200, y las antiguas, que deberían dar un 301.
  3. También podemos requerir sitemaps para eliminar masivamente URLs que no nos interesen, bien porque hayamos eliminado mucho contenido o por si hemos tenido un ataque de los que generan miles de URLs basura en nuestro dominio. Generalmente las entregaremos dando respuesta 404 o incluso 410.
  4. En el caso de que podamos trocear los sitemaps al máximo (por fecha, tipo de archivo, idioma), nos permitirán realizar un seguimiento de indexación y posicionamiento por segmento.

TIP: para crear sitemaps manualmente una buena opción es Screaming Frog. Podemos ir a sitemaps, seleccionamos las páginas que queremos incluir, y si queremos incluir imágenes o no. 

Formatos de sitemap

La documentación de Google es muy clara y generosa. Se aceptan y procesan sitemaps en 3 formatos:

  1. XML: el más usado y recomendable
  2. RSS: una cosa un poco vintage que antes se usaba para seguir blogs
  3. TXT: se lo comería, pero tendríamos unos sitemaps muy limitados cuento a formatos

Así que no te compliques la vida, y apuesta por el XML, a menos que el proyecto tenga unas herencias tecnológicas que lo hagan inviable.

Requisitos de un buen sitemap

Aquí va un listado de condiciones necesarias para tener un sitemap envidiable:

  • Las URLs deben ser completas, no relativas. Que ya sabemos que estamos en tu sitio web, pero debes ofrecerlo en formato protocolo+dominio+slug
  • El archivo sitemap, que es un archivo físico, debe estar alojado en la carpeta raíz de la web
  • Las URLs deben ser amigables y sin parámetros
  • Debería usar la codificación UTF-8 para evitar problemas con determinados caracteres
  • No debe exceder las 50.000 URLs ni pesar más de 50MB. En el caso de sitios grandes, se aconseja trocear los sitemaps por idiomas o tipologías de URLs
  • Todas las URLs deben dar código 200, es es decir: estar disponibles y no redirigidas
  • El sitemap debe actualizarse automáticamente. En la medida de lo posible deberían evitarse sitemaps manuales, que podríamos crear con herramientas online o con Screaming Frog. Nos pueden servir como un punto de partida o para emergencias, pero no son una solución estable.
  • Debe tener un nombre claro e inequívoco, y estar colgado de la raíz de la web, no puede estar en un lugar cualquiera
  • Ya fuera del sitemap, se aconseja indicar en el archivo robots.txt dónde se alojan nuestros mapas.
  • Todas las URL deber tener como canonicals a sí mismas, de lo contrario l estaríamos enviando una URL que a la vez sugerimos que no indexe.

Cómo crear un sitemap

  • A través de programación, podemos generar un sitemap adaptado a nuestras peticiones
  • A través de herramientas online como XML Sitemaps Generator o con Screaming Frog, pero como comentábamos antes no es recomendable pues sería estático
  • Si tenemos un Wordpress, debemos contar con un plugin completo de SEO como Yoast o Rank Math (consulta nuestra guía sobre Rank Math) , y una de sus funciones es la creación de sitemaps. Estos son muy completos y nos entregan sitemaps por tipología de página, pero tienen algunas limitaciones. Para mi gusto, una limitación no menor es que para Wordpress multiidioma queda todo en un único sitemap. 

Cómo organizar los sitemaps

Por lo general, lo recomendable es no tener un sólo sitemap, sino generar varios en función de las características del proyecto, nuestras prioridades de posicionamiento y cómo vamos a querer segmentar el análisis de indexación y posicionamiento.

  • Si tu proyecto tiene más de un idioma, probablemente te interese tener sitemaps diferenciados por idioma
  • Si en nuestra web tendremos muchas imágenes originales y posicionarlas puede ser una oportunidad, apuesta por un sitemap de imágenes
  • Si en la web contamos con muchos documentos en PDF, por ejemplo si contamos con muchos catálogos, instrucciones de uso, guías de talla o prospectos, entonces probablemente necesites un sitemap de PDFs
  • Si incluimos muchos vídeos en el sitio, considera la posibilidad de incluir un sitemap de vídeos específico
  • Para medios, Google requiere un sitemap especial para Google News, incluyendo las noticias de las últimas 48 horas
  • A nivel de contenido, en determinados proyectos híbridos y grandes nos puede interesar tener sitemaps por tipología de páginas: posts de blog, fichas de producto, listados, servicios, etcétera
  • Finalmente y en blogs o medios, que generan mucho contenido y dependen mucho de la inmediatez y actualidad, en ocasiones se implementan sitemaps organizados por fechas, normalmente por años.

Ejemplos de sitemaps

Os vamos a compartir algo bastante íntimo aunque no es ningún secreto, está disponible para todo el mundo: el sitemap de Latevaweb.

En este caso hemos optado por tres índices de sitemaps, uno para cada idioma. Tenemos el del idioma default, ES, en el lugar habitual https://www.latevaweb.com/sitemap.xml. Pero además, tenemos el sitemap de catalán e inglés cada uno en su carpeta de idioma, como https://www.latevaweb.com/en/sitemap.xml. De este modo podemos controlar la indexación y posicionamiento por idioma, algo relevante en nuestro proyecto.

Si accedemos además a uno de los índices, verás que dentro tenemos sitemaps por tipología de páginas. En nuestro caso servicios, posts de blog, porfolios, autores, etc:

Sitemaps Ejemplo

Entregamos así más sitemaps, pero bien segmentados y más ligeros, más sencillos de procesar para los robots. Finalmente si vas a ver un mapa en detalle, verás como usamos el atributo Last modification date, para indicarle la fecha de actualización de los contenidos:


Sitemaps Ejemplo

Este no es el único esquema de sitemaps posibles y en nuestros proyectos hemos implementado muchísimos distintos, debes pensar qué estructura encaja mejor en tu proyecto SEO.

Checklist para validar Sitemaps

A continuación te compartimos esta checklist con todo lo que deberías revisar antes de enviar un sitemap a Google. Interiorizar estos elementos e incorporarlos a nuestra mirada es lo que diferencia a un SEO avanzado de uno principiante, esperemos que sea de ayuda:

Checklist Sitemaps


Preguntas frecuentes sobre Sitemaps

¿El orden de las URLs de un sitemap afecta?

No. El orden es completamente indiferente. Afectan aspectos como la fecha de creación y modificación, pero no el orden en el listado

¿Cuántas imágenes puedo referenciar en un sitemap?

En un sitemap de htmls normalmente se referencia a la imagen principal de cada URL. Sin embargo, podríamos enviar hasta 1.000 imágenes por URL. Si el SEO de imágenes es relevante en tu proyecto, aprovéchalo.

¿Todas las webs necesitan un sitemap?

En realidad no. Si tenemos una web pequeña y hemos implementado un buen enlazado interno y canonicals, Google no debería tener problemas para identificar nuestras URLs buenas, rastrearlas e indexarlas.

En cambio para webs grandes es algo imprescindible, pues ayudamos a focalizar nuestro crawl budget en aquello que verdaderamente importa. 

No obstante, es una práctica recomendable en cualquier sitio web, tanto grandes como pequeños. Va a ayudar especialmente además a arrancar a sitios nuevos, o bien a webs en los que contengan muchos archivos no html.

¿Cómo puedo saber si mi sitemap es válido?

En primer lugar, cuando enviamos el sitemap a Search Console Google nos indicará si ha podido acceder y procesarlo. Nos indica si está bien a nivel de formato, no que esté impecable. Con el tiempo 

Si usamos Screaming Frog, la herramienta tiene un apartado de sitemaps muy útil. Nos indica las URLs detectadas vs URLs en sitemap, URLs no indexables en Sitemap, y URLs indexables no incluidas en el Sitemap.

O si prefieres una herramienta online, el Validate XML Sitemap de XML Sitemaps Generator puede ser muy buena opción.

¿Puedo indicarle en el sitemap la prioridad de URL y frecuencia de rastreo?

Puedes indicarlo con los parámetros priority y frequency, pero Google ya no usa estos parámetros y los va a ignorar.

¿Google va a indexar los contenidos de nuestro Sitemap?

No hay ninguna garantía sobre ello. Lo que sí sabemos es que si lo creamos y entregamos, lo va a rastrear. Que lo indexe dependerá de otros aspectos, como la calidad y originalidad del contenido. Los sitemaps son una sugerencia para Google, no una directiva. Igualmente puede indexar URLs que no estén en el sitemap, si puede acceder a ellas y encuentra contenido. Si quieres evitarlo, debes bloquearle el acceso a los robots, o bien etiquetarlas con un noindex.

Bruno Díaz Marketing Manager
Sobre el autor/a
Bruno Díaz — Marketing Manager
Profesional de larga trayectoria como consultor de comunicación y marketing digital, y especializado en SEO, SEM y proyectos web. Como Marketing Manager de la agencia, coordino a un equipazo de técnicos de marketing digital del cual estoy muy orgulloso.

Noticias relacionadas

¿Tienes un proyecto en mente? Cuéntanoslo