¿Qué es, cómo crear, optimizar y corregir errores en un Sitemap XML?
Sitemap XML es una de las herramientas SEO más incomprendidas. No solo se confunde a menudo con el mapa del sitio HTML, sino que su función también se malinterpreta o solo se entiende a medias. Pero ¿Qué es un mapa del sitio XML y cómo se crea? Nuestro artículo le da una visión general.
¿Qué es un Sitemap XML?
Un mapa del sitio es la lista de diferentes URL de un dominio. Se pueden incluir todas o solo una selección de ciertas URL. Es importante distinguir entre el mapa del sitio HTML y XML.
El mapa del sitio HTML funciona principalmente como una navegación para los usuarios y se puede encontrar en la parte frontal de un sitio web. Por lo general, se vincula a través del pie de página o del encabezado. Por un lado, el mapa del sitio HTML aumenta la usabilidad y, por otro lado, también fortalece los enlaces internos, lo que también facilita que los rastreadores de Google busquen en el sitio web.
Los webmasters, por otro lado, no crean el mapa del sitio XML para el usuario de un sitio web, sino solo para los rastreadores de los motores de búsqueda. Por lo general, difiere del mapa del sitio HTML en que consiste exclusivamente en etiquetas XML y está marcado con información adicional especial. Además, no se vincula por separado en el sitio web, sino que solo se envía a través del motor de búsqueda respectivo, en el caso de Google a través de Google Search Console oa través de robots.txt.
La necesidad de un mapa del sitio XML
Surgió porque los motores de búsqueda utilizan el llamado «presupuesto de rastreo» para ahorrar recursos de rastreo. Porque la World Wide Web ha crecido tanto en las últimas décadas que no era posible rastrear un número ilimitado de páginas en cada sitio web. Por ejemplo, Google asigna un presupuesto individual a cada sitio web, lo que determina cuántas páginas se buscan. Aunque este presupuesto ha vuelto a aumentar en los últimos años con el aumento del rendimiento de Internet, los sitemaps especiales siguen desempeñando un papel importante en la optimización de motores de búsqueda.
En última instancia, el mapa del sitio XML debería servir para dar a los rastreadores una indicación de qué páginas individuales de un sitio web son realmente importantes. Sin embargo, siempre debe tener en cuenta que esto es solo una recomendación para los bots de los motores de búsqueda. Proporciona comandos claros sobre qué páginas deben excluirse del rastreo a través de robots.txt.
¿Qué se debe tener en cuenta al crearlo?
Si desea crear un mapa del sitio XML, debe considerar algunos puntos, que también se definen a través de sitemap.org:
- La codificación debe estar en UTF-8.
- Las URL presentes en el mapa del sitio deben provenir de un solo host, es decir, las URL de ejemplo.com y blog.ejemplo.com requieren dos mapas del sitio.
- El tamaño máximo es de 50 000 URL y 50 MB; el archivo se puede comprimir. Se deben enviar múltiples sitemaps para sitios web grandes.
- Si envía más de un mapa del sitio a Google, tiene sentido crear un archivo de índice. Esto luego resume los mapas de sitio individuales y los enlaces a ellos. Esto no solo brinda a los rastreadores de los motores de búsqueda una visión general aún mejor, sino que también se beneficia de una mejor estructura.
- Idealmente, la ubicación de almacenamiento está en el directorio raíz de su servidor web: dominio.com/sitemap.xml. En función de esto, solo se podrán incluir las URL que estén localizadas en el mismo. Por ejemplo, no funciona para crear un mapa del sitio almacenado en un subdominio con URL para un dominio y viceversa.
¿Cómo crear un mapa del sitio XML?
¿Cómo puede crear fácilmente su propio archivo de mapa del sitio? Algunos sistemas de administración de contenido (CMS) como WordPress le permiten configurar mapas de sitios automatizados a través de complementos como Yoast SEO. La ventaja es que estos están actualizados y se actualizan continuamente. Usted crea el Sitemap XML usando el Sitemap Generator de Yoast SEO de la siguiente manera:
- Seleccione la pestaña «XML Sitemaps» en el menú adicional para Yoast SEO.
- Activar el archivo si está desactivado.
- Con «Entradas por página del sitemap» puede regular el número de páginas contenidas individualmente. El valor predeterminado es 1000 URL.
- Los elementos del menú «Tipos de publicación», «Publicaciones excluidas» y «Taxonomías» permiten realizar más configuraciones.
Puede usar «Tipos de publicación» para configurar mapas de sitio para diferentes tipos de página. Esto incluye publicaciones, páginas, archivos multimedia y elementos. Excluye publicaciones individuales a través de «Publicaciones excluidas» utilizando una identificación individual. La pestaña «Taxonomías» también le permite crear categorías adicionales.
Pero también es posible crear mapas de sitio específicos utilizando herramientas de SEO como Screaming Frog. Específicamente en Screaming Frog se procede de la siguiente manera:
- Rastrear la URL.
- Seleccione la pestaña «Sitemaps» en la navegación principal. Aquí, la herramienta ya distingue entre imágenes y mapas de sitio XML regulares.
- Ahora puede usar más opciones de configuración para decidir cómo se debe estructurar su mapa de sitio XML. Finalmente, todo lo que tiene que hacer es guardar el archivo en su computadora.
A través de las páginas «Páginas» en Noindex, con Canonical, se pueden incluir URL y PDF paginados, es decir, estos no se incluyen de forma predeterminada. Con «Última modificación» puede especificar cuándo se modificó por última vez el XML de su mapa del sitio. Con «Prioridad» es posible priorizar entre las URL individuales y con «Cambiar frecuencia» especifica la frecuencia de cambio. En «Imágenes» también es posible determinar si desea crear un mapa de sitio de imagen adicional o si desea combinarlos en el mapa de sitio normal XML.
¿Cómo informar a los motores de búsqueda?
Ha creado su mapa del sitio y se pregunta cómo lo descubrirán Google y compañía. Muy fácilmente, puede ingresar el archivo utilizando las respectivas herramientas para webmasters, como Google Search Console (GSC) (en Rastreo > Sitemaps).
Especialmente en el GSC, se beneficia del hecho de que, después del envío, puede verificar cuántas de las URL contenidas se indexaron realmente. Los problemas de indexación son inmediatamente evidentes para usted. Si hay una gran cantidad de direcciones de Internet incluidas, es recomendable localizar qué páginas están causando problemas y no están indexadas.
Compruebe también si se han indexado más páginas que las contenidas en el mapa del sitio XML. Puede ver la cantidad de páginas indexadas en Google Search Console en Estado de indexación o escribiendo site:sudominio.com en la Búsqueda de Google. Si se indexaron más páginas, es posible que falten páginas relevantes en el XML del mapa del sitio o que se haya indexado contenido incorrecto y duplicados (por ejemplo, debido a URL de parámetros). Los motores de búsqueda también pueden incluir direcciones URL en los resultados de búsqueda que no están incluidas en sus mapas de sitio, por ejemplo, si estas direcciones URL están vinculadas desde dominios externos.
¿Qué tipos de XML de Sitemap existen?
Los mapas de sitio XML vienen en diferentes formas. Por ejemplo, muchos optimizadores de motores de búsqueda distinguen entre mapas de sitio de imágenes, videos o noticias con etiquetas XML especiales además de las listas de URL normales. Las variantes también se tienen en cuenta en Google Search Console. La ventaja es un envío estructurado de las URL individuales, así como la simple verificación del estado de indexación, según el tipo de URL.
Sitemap de imágenes
De acuerdo con las Directrices para webmasters de Google, es útil crear su propio mapa del sitio de imágenes que los robots de los motores de búsqueda puedan usar para obtener más información sobre los archivos de imágenes individuales. La ventaja es que los robots pueden interpretar mejor las imágenes configuradas a través del código JavaScript. Además, al igual que con las otras URL XML del mapa del sitio, puede priorizar qué imágenes considera importantes para el índice del motor de búsqueda.
Sitemap de Video
Con el mapa del sitio de video, también hay una gran ventaja al poder transmitir información sobre archivos de video por separado, que los rastreadores no podrían encontrar sin él. De acuerdo con la ayuda de Search Console, un archivo adicional para videos aumenta la probabilidad de que realmente se indexen. Los videos aparecen en formato de miniatura en la Búsqueda de Google, el webmaster los proporciona él mismo o Google los genera automáticamente. Se incluyen, entre otras cosas, etiquetas para la descripción, la duración y las valoraciones del vídeo.
Sitemap de Noticias
Otra variante, también entre los Google Sitemaps recomendados, es el News Sitemap. Esto es particularmente útil para sitios web que publican regularmente artículos de noticias y quieren posicionarse en los resultados de búsqueda. La principal ventaja es que los rastreadores pueden encontrar artículos más rápido y, por lo tanto, una indexación potencialmente más rápida, lo que es particularmente importante para mantener las noticias actualizadas. Además, es más probable que se indexen más páginas.
Sitemap de Hreflang
Con la etiqueta hreflang, webmasters dejan claro a los motores de búsqueda a qué idioma y a qué país está dirigida la URL respectiva de su sitio web. Se aconseja especialmente a los sitios web grandes e internacionales que regulen el marcado de su idioma de manera estructurada.
Por un lado, el marcado de idioma puede tener lugar a través de la URL respectiva en el código HTML. Por otro lado, también es posible especificar esto de forma centralizada a través del mapa del sitio XML. De esta manera, el mapa del sitio XML también es una valiosa herramienta de SEO cuando se trata de internacionalización.
¿Cuáles son los errores comunes?
Un estudio reciente realizado por Semrush identificó errores en el mapa del sitio XML como una de las mayores fuentes de error en la optimización técnica de motores de búsqueda. Esto incluye un 13,19 % de errores de formato. El 19,34 % no puede encontrar el Sitemap.xml y el 15,91 % no está marcado en el archivo robots.txt.
Otro error común: el 10,92 % de los archivos contienen rutas URL incorrectas. Por lo tanto, los siguientes puntos deberían servir como una lista de verificación con la que puede verificar si su mapa del sitio solo contiene URL que realmente pertenecen a él. Solo si puede responder afirmativamente a estas preguntas, las URL realmente califican para su sitemap.xml.
- ¿Están completas las URL, es decir, incluyen el protocolo completo, es decir, http/https?
- ¿Las URL solo tienen el código de estado 200?
- ¿Meta-Robots y X-Robots-Tag están configurados para indexar o no?
- ¿Hay una etiqueta canónica o x-canónica y, de ser así, se apunta a sí misma?
- ¿La URL no está bloqueada por robots.txt?
Puede usar varias herramientas para verificar la exactitud y validez del XML de su mapa de sitio en la página xml-sitemaps.com, también se le informará de los errores a través de Google Search Console.
Conclusión
El mapa del sitio XML definitivamente debe tenerse en cuenta en la optimización de motores de búsqueda. Esto no solo incluye la creación correcta del mapa del sitio, sino también informar correctamente a los motores de búsqueda sobre el archivo robots.txt y la herramienta para webmasters respectiva, así como la verificación continua de las URL y los posibles problemas de indexación.
Sobre todo, preste atención a los errores comunes antes mencionados durante la implementación, porque el mapa del sitio XML no es una de las mayores fuentes de error en el SEO técnico por nada. Además, el Sitemap XML es solo una recomendación para los rastreadores de los motores de búsqueda. Se siguen dando instrucciones claras a través de la información de meta robots o el archivo robots.txt.
Tabla de contenidos