XML Sitemap: Eine Übersicht
Eine XML Sitemap ist eine Datei im XML-Format, die alle relevanten URLs einer Website auflistet und Suchmaschinen hilft, diese effizient zu indexieren. Sie spielt eine entscheidende Rolle in der Suchmaschinenoptimierung (SEO) und ermöglicht eine gezielte Steuerung des Crawlings.
Was ist eine XML Sitemap?
Eine XML Sitemap ist eine Datei im XML-Format, die speziell für Web-Crawler erstellt wurde. Sie enthält eine Liste aller URLs einer Website, die einen 200er Statuscode (HTTP – „Hypertext Transfer Protocol“) aufweisen. Diese Sitemap kann als Inhaltsverzeichnis betrachtet werden, das Suchmaschinen signalisiert, welche URLs indexiert werden sollen.
Bedeutung für die Suchmaschinenoptimierung
XML Sitemaps sind für die Suchmaschinenoptimierung von großer Bedeutung. Sie ermöglichen Suchmaschinen eine vollständige Erfassung und Indexierung aller relevanten URLs einer Website, einschließlich solcher, die möglicherweise schwer erreichbar sind. Besonders für Websites mit häufigen Änderungen, wie E-Commerce-Shops, ist die regelmäßige Aktualisierung der XML Sitemap entscheidend, um Suchmaschinen aktuelle Informationen bereitzustellen.
Aktualisierung der XML Sitemap
Um den Prozess der Indexierung zu beschleunigen, kann die aktuelle Version der XML Sitemap in der Google Search Console oder in den Bing Webmaster Tools hinterlegt werden. Dies gibt Suchmaschinen wichtige Signale über die Struktur und den Inhalt der Website.
Unterschied zwischen XML und Sitemaps
Der Hauptunterschied zwischen XML Sitemaps und Sitemaps besteht darin, dass XML Sitemaps ausschließlich für Suchmaschinen entwickelt wurden, während Sitemaps für Benutzer gedacht sind. Sitemaps helfen Nutzern, die Struktur einer Website zu verstehen, sind jedoch weniger verbreitet, da moderne Navigationen oft ausreichen.
URLs, die nicht in die XML Sitemap aufgenommen werden sollten
- Statuscode „404 – Nicht gefunden“
- Andere 400er Error-Code-URLs
- 300er Statuscode-URLs
- 500er Error-Code-URLs
- No Request URLs
- Seiten mit „noindex“ Meta-Tags
- Seiten mit geringem Mehrwert, wie Duplikate
- Thin Content URLs
- Passwortgeschützte URLs
