Blog für PC & Internet

Die Sitemap, Teil 1 - Grundlagen

(Beitrag vom 21.05.2010)

Eine Sitemap ist eine Notwendigkeit, nicht nur für unübersichtlich verlinkte Webseiten. Durch sie erfährt eine Suchmaschine die Position der einzelnen Unterseiten. Das ist wichtig für ihre Indexierung. Der Webmaster kann sich nur mit ihrer Hife sicher sein, dass eine Suchmaschine die einzelnen Unterseiten überhaupt gesehen hat. Speziell für Google kann die Sitemap noch einige weitere Informationen enthalten. Zudem muss sie in ihrem Aufbau gewissen Anforderungen entsprechen. Im Internet kursieren freie Sitemapgeneratoren, deren Nutzung mehr oder weniger sinnvoll ist. Insbesondere, wenn der Webautor zusätzlich fähig ist per Hand noch einige Änderungen vorzunehmen kann ihre Verwendung sehr nützlich sein.

Hinweis: Auch wenn eine Unterseite in der Sitemap fehlt kann sie dennoch von Google in den Index aufgenommen werden.

technische Anforderungen Sitemap:

Eine Sitemap wird in der Regel als .xml-Datei im Hauptverzeichnis hinterlegt. Sie darf grundsätzlich maximal 50.000 URLs enthalten und sie darf unkomprimiert nicht größer als 10 MByte sein. Eine Sitemap kann auch in einem Unterverzeichnis hinterlegt werden. Sie darf dann aber nur Seiten aus diesem oder in der Hierarchie darunter liegenden Verzeichnissen enthalten. Besteht eine Homepage aus mehr als 50.000 Seiten müssen mehrere Sitemaps angelegt werden. Auf die einzelnen Sitemaps wird dann in der robots.txt verwiesen, oder es wird eine Sitemap-Indexdatei angelegt. Diese Sitemap-Indexdatei darf dann wiederum max. 50.000 Sitemaps enthalten und nicht größer als 10 MByte sein.

Verweis in der robots.txt auf eine Sitemap:

In der robots.txt wird mit folgender Zeile auf eine Sitemap hingewiesen:

Sitemap: http://www.der-pc-anwender.de/links/sitemap-1.xml
Sitemap: http://www.der-pc-anwender.de/links/sitemap-2.xml

Beispiel einer einfachen Sitemap:

<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.der-pc-anwender.de/wallpaper/wallpaper-tiere-1920x1080.htm</loc>
</url>
<url>
<loc>http://www.der-pc-anwender.de/wallpaper/best-of-wallpaper-16x9.htm</loc>
</url>
</urlset>

Das ist die Minimalversion, welche in den meisten Fällen vollkommen ausreichend ist.

Der Webmaster kann in der Sitemap zusätzliche Angaben für eine Suchmaschine hinterlegen. Der Nutzen ist jedoch allgemein umstritten. Man kann auf dieser Weise der SUMA etwas Arbeit abnehmen. Ob man das honoriert bekommt bleibt abzuwarten. Es ist allerdings auch eine der wenigen Möglichkeiten der SUMA überhaupt etwas mitzuteilen. In meiner Arbeit hat sich jedoch gezeigt, dass die permanente Aktualisierung der Sitemap nur mit erheblichem Arbeitsaufwand umzusetzen ist.



Beiträge Thema SEO und Webdesign:

© Copyright by H. Müller