Encontrar y corregir errores de un Sitemap

Este episodio de Gestionando el SEO lo dedicamos a un tema fundamental para que los motores de búsquedas rastreen tu sitio correctamente, estamos hablando del Sitemap. Vamos a ver qué es, para qué sirve y cómo optimizarlo.

Qué es un Sitemap

Cuando hablamos de un Sitemap, estamos hablando de un archivo .xml que contiene todas las páginas importantes, que se pretenden indexar y posicionar en un sitio web.

Sitemaps

Los Sitemaps poseen las siguientes características:

  • Pueden contener hasta 50.000 URLs
  • Pueden pesar hasta 50MB

Si el Sitemap no cumpliera alguna de estas condiciones, sería necesario dividirlo en Sitemaps más pequeños.

Por qué el Sitemap es importante para el SEO

La importante que tienen los Sitemaps para el SEO está relacionada con que éstos le facilitan a los motores de búsqueda localizar más rápidamente el contenido que hay un sitio web, simplificando así el rastreo e indexación de nuevas URLs.

Partes de un Sitemap

Todos los Sitemap se componen fundamentalmente de 3 partes, las cuales pasamos a explicar:

XML Header

Esta sección le informa a los motores de búsqueda el tipo de archivo que están leyendo, XML; la versión XML, 1.0; y el código de los caracteres, UTF-8.

El XML Header tiene típicamente esta estructura:

<?xml version="1.0" encoding="UTF-8"?>

URL Set

La definición de la URL Set agrupa a todas las URLs del sitio y le indica a los motores de búsqueda cuál es el protocolo standard utilizado: 0.9.

Para los principales motores de búsqueda (Google, Bing y Yahoo) la URL Set se declara:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

URLs individuales

En esta sección se listan todas las URLs que queremos indexar. Es importante aclarar que todas las URLs deben ser declaradas de manera absoluta (no relativa).

Las URLs se declaran de la siguiente manera:

<url>
<loc>https://guidomazzei.com/corregir-errores-sitemap/</loc>
<lastmod>2021-11-15T09:30:53+00:00</lastmod>
</url>

La etiqueta “<loc>” le indica a los motores de búsqueda la ubicación de la URL y la etiqueta “<lastmod>” cuándo fue modificada la página por última vez.

Cómo crear un Sitemap

Hay varias maneras de crear un Sitemap. Se puede crear tanto de manera automática o manual. Veamos cada una de las opciones:

Creación automática de Sitemap en WordPress

Si estamos trabajando con un WordPress, podemos crear el Sitemap de manera automática instalando cualquiera de los principales plugins de SEO (Rank Math, Yoast, All in one SEO).

sitemap

Creación manual del Sitemap

Si no trabajamos con WordPress y queremos crear un Sitemap nosotros mismos, podemos usar alguna de las siguientes herramientas:

Siempre es recomendable seguir la documentación oficial de Google para crear y enviar el Sitemap a Google.

Errores frecuentes en el sitemap y cómo corregirlos

1. Incluir páginas que no se pretenden indexar y posicionar

Un error muy común es incluir en el Sitemap páginas no indexables. Algunos ejemplos son los siguientes casos:

Páginas no Canonicals

Cuando una página no es Canonical, le estamos diciendo a los motores de búsqueda que esa página no debe ser tenida en cuenta y que otra en su lugar es la indicada para indexarse. Si incluimos en el Sitemap URLs no Canonical, le estamos dando una directiva contradictoria a los motores de búsqueda, ya que en el Sitemap solo deben incluirse las URLs que queremos indexar y posicionar. A modo de resumen, solo las páginas Canonical deben estar en el Sitemap.

Páginas con etiqueta “noindex”

Cuando le incluimos la etiqueta “noindex” a una página, le estamos diciendo a los motores de búsqueda que dicha URL no debe ser indexada. Si incluimos estas páginas en el Sitemap, al igual que en caso anterior, le estamos dando una directiva contradictoria a los buscadores.

Páginas con código 4XX o 3XX

Dado que las páginas con código 4XX, son páginas inexistentes, deberíamos quitarlas del Sitemap. Para el caso de las páginas con código 3XX (redirecciones), deberíamos incluir en el Sitemap directamente la URL final (a la cual ha sido redirigida), evitando hacer pasar al bot por la redirección. El Sitemap debe contener únicamente URLs con código 2XX.

2. Incluir páginas con contenido de baja calidad

Como mencionamos antes, en el Sitemap debemos incluir únicamente el contenido que queremos indexar y posicionar. Las páginas con contenido de baja calidad no agregan ningún valor para el usuario, por lo cual no hay necesidad de incluirlas en el Sitemap.

3. No incluir todas las páginas que se pretenden indexar y posicionar

Es importante asegurarse que las páginas de que sí queremos posicionar e indexar se encuentren incluidas en el Sitemap, ya que de esta manera le facilitaremos a los motores de búsqueda la tarea de rastreo, indexación y, como consecuencia, su posterior posicionamiento.

4. Cambiar el nombre o la ubicación por defecto del Sitemap

Siempre que sea posible, debemos tratar de mantener la ubicación del Sitemap dependiendo directamente del dominio raíz (dominio.com/sitemap.xml) e intentar mantener también los nombres por defecto (/sitemap.xml o /sitemap_index.xml). Esto le facilitará a los motores de búsqueda encontrar y rastrear el Sitemap.

5. Incluir las mismas URLs en múltiples Sitemaps

Otra buena práctica de SEO relacionada con la optimización del Sitemap es, cuando tenemos más de un Sitemap en el sitio, no incluir la misma URL en más de un Sitemap. Con la finalidad de evitar enviar señales difusas a los motores de búsqueda y que puedan interpreten correctamente la estructura de nuestro sitio, debemos incluir cada URL únicamente en un solo Sitemap.

6. No declarar el Sitemap en robots.txt

Esta es otra buena práctica de SEO, la cual ayuda a los motores de búsqueda a encontrar y rastrear el Sitemap más fácilmente.

Herramientas para encontrar errores en Sitemap

A continuación mencionamos algunas de las herramientas más utilizadas para auditar y encontrar errores en los Sitemaps.

corregir sitemap

Google Search Console

La herramienta de Google, desde su Índice de Cobertura, nos informa qué URLs han sido indexadas pero no se encuentran en el Sitemap. Esto lo vemos en: Índice de Cobertura > URLs Válidas > Indexada, no enviada en sitemap.

Screaming Frog

Screaming Frog desde su reporte de Sitemap nos indica todos los errores vinculados al Sitemap que ha encontrado.

XML Sitemap Validator

En esta herramienta para analizar Sitemaps, únicamente debemos pegar la URL de nuestro Sitemap y nos reportará cualquier inconveniente que encuentre.

Conclusiones

Con estos consejos ya podrás empezar a corregir tu Sitemap y optimizarlo para los motores de búsqueda. Este no es un tema complejo y corregir estos errores mejorará notablemente la performance de tu sitio.

Si tienes te gustó este post o tienes alguna pregunta, puedes escribirme por Twitter.