Mit Sitemaps (sitemap.xml) erhält man von den Suchmaschinenbetreibern als Webmaster ein sehr mächtiges Werkzeug. Aktualisierte Seiten können somit auf einfachste Art und Weise an einer einzigen Stelle übermittelt werden und es muss nicht mehr darauf gewartet werden, bis eine Suchmaschine eine aktualiserte oder neue Seite selbst entdeckt.
Das Sitemaps Protokoll wurde in dieser Form von Google entwickelt. Neben den essentiellen Parametern stehen auch optionale zur Verfügung, mit denen es möglich ist die Wichtigkeit oder die Änderungshäufigkeit einer Seite festzulegen. So kann eindeutig festgelegt werden, ob es sich um eine Startseine, eine Kategorie, etc. handelt.
Wie diese Art von Sitemap (sitemap.xml) aufgebaut sein muss, erfährt man auf einer Hilfe-Seite von Google. Außerdem gibt es zusätzliche Informationen auf sitemaps.org. In der heutigen Zeit, wo man vorwiegend auf CMS (Content Management Systeme) wie Drupal (XML Sitemap), TYPO3 (mc_googlesitemap) oder WordPress (Google XML Sitemaps) setzt, wird es selten nötig sein, selbst ein Script zur Generierung von Sitemaps zu erstellen, da es für alle großen Systeme bereits vorgefertigte und sehr brauchbare Module gibt.
Damit diese Technik jeder ohne großen Aufwand nutzen kann, galt es eine einfache Möglichkeit zu finden. Deshalb wurde der Datei robots.txt, die sehr einfach erstellt werden kann, ein neuer Parameter “Sitemap” spendiert. Der grundsätzliche Aufbau einer robots.txt-Datei bleibt unverändert und kann hier nachgelesen werden. An dieser Stelle möchte ich dennoch ein einfaches Beispiel mit dem Parameter “Sitemap” geben:
User-agent: * Disallow: /cgi-bin/ Disallow: /images/ Disallow: /datei.htm Sitemap: http://www.blogix.net/sitemap.xml
Wichtig ist, dass für den Parameter “Sitemap” die vollständige URL inkl. dem Protokoll (z.B. “http://”) angegeben wird. Sitemaps selbst bzw. der Parameter “Sitemap” werden derzeit von Google, Yahoo, Ask und Moreover unterstützt, MSN befindet sich noch in Entwicklung.
Erfahrenen Webmastern würde ich trotz dieses einfachen Verfahrens empfehlen, die Sitemaps über die Tools der Anbieter (Google Webmaster tools bzw. Yahoo! Site Explorer) einzutragen und zu überwachen, um sicherzustellen ob diese korrekt interpretiert werden können (korrektes Format aufweisen), wann diese zuletzt geladen wurden und um weitere Statistiken zu erhalten.
Verwandte Beiträge
- Robots-Exclusion-Standard-Protokoll: robots.txt
- Der gläserne Mensch II
- Wie lange dauert es bis meine Seite auf Google erscheint?
- Marktanteile der Betriebssysteme, Browser und Suchmaschinen
- Backend-Layout von TemplaVoila anpassen
30. March 2008 - 13:04
Nice, dass mit dem Eintrag in der robots.txt war mir neu.. Hab meine Sitemap bisher immer direkt über die WT eingestellt.