Strukturierte Daten für Websites, Online-Shops und Blogs
Nicht wenige Webmaster verlieren bei der schier riesigen Anzahl an möglichen Auszeichnungen auf http://schema.org/docs/full.html die Lust, irgendetwas mit schema.org zu machen. Das ist schade, bietet dieses Markup doch mehr als nur Bewertungssternchen in den Rich Snippets an. Dieser Artikel liefert Grundlagen zu strukturierten Daten, warum strukturierte Daten für Websitebetreiber wichtig sind. Der Artikel verrät auch, welche Auszeichnungen für Online-Shops, Websites, lokale Unternehmen und Blogs wichtig sind und wie die Umsetzung in der Praxis funktioniert.
Ein Fachartikel von Tilmann Klosa
in Zusammenarbeit mit Markus Mattscheck
-
Was sind strukturierte Daten?
-
Darstellung auf Suchergebnisseiten
-
praktische Umsetzung der Auszeichnungen
-
Übersicht der wichtigsten Auszeichnungen inkl. Gratis-Download
-
Strukturierte Daten und CMS, Shop- oder Blog-Systeme
-
Kritik an schema.org
Was sind strukturierte Daten und warum sind sie wichtig?
Ein Crawler sieht eine Webseite zuallererst als eine chaotische Ansammlung von Daten. Mit HTML-Tags wie <title>, oder früher einmal <keywords>, sollte etwas Ordnung in das Chaos gebracht werden. Aber die Indizierungs-Algorithmen und die Crawler werden immer fortschrittlicher und suchen nach Wegen, das Daten-Chaos besser zu strukturieren. Strukturierte Daten auf Webseiten sind Kennzeichnungen im Quellcode, die ein Element definieren (Text, Bild, Link etc.). Diese Auszeichnungen sind für den Besucher einer Webseite nicht sichtbar. Crawler, zum Beispiel von Suchmaschinen, können diese Auszeichnungen erkennen und wissen, was das Element bedeutet. Damit werden Suchmaschinen bei der Semantik unterstützt und können dem Suchenden relevante Treffer zu einer Suchanfrage liefern. Um
Dennoch gibt es unzählige Websites, denen ein Crawler weniger Aufmerksamkeit schenkt, als anderen Websites. Ein Grund ist die schlechte und unstrukturierte Aufbereitung der Informationen.
Ein abstraktes Beispiel
Um zu erkennen, dass es sich bei dem Begriff „Orange“ um eine Frucht und nicht um eine Farbe oder ein Unternehmen handelt, müssen die Crawler und Algorithmen der Suchmaschinen kontextuelle Informationen hinzuziehen. Wenn ein Crawler diese nicht findet, ist es für ihn sehr schwer zu erkennen, was mit „Orange“ gemeint ist. Mit der richtigen Auszeichnung, ist dem Crawler beim ersten scannen der Webseite klar, dass es zum Beispiel um eine Frucht geht und nicht um das Unternehmen Orange S.A.
Ziel eines Unternehmens, eines Online-Shop- oder Blog-Betreibers sollte es daher sein, Google es einfach zu machen, Bedeutungen von Inhalten einer Webseite zu erkennen. Google wird immer Inhalte bevorzugen, deren Semantik, also die Bedeutung der Inhalte, klar sind. Denn nur so kann Google den Suchenden die relevantesten Treffer präsentieren.
Ein Fallbeispiel
Ein kleiner aber sehr spezialisierter Händler verkauft Hydraulikaggregate verschiedener Hersteller. Der Name des jeweiligen Herstellers wird nur einmal auf der jeweiligen Produktseite genannt, manchmal sogar nur in einem PDF mit Produktinformationen. Der Händler hat insgesamt 3.000 Produkte im Angebot, 10 davon sind von Hersteller A. Ein potentieller Kunde ist nun auf der Suche nach Produkten von Hersteller A. Der Kunde wird über die Suche bei Google & Co. sicherlich fündig, aber leider nicht bei unserem Händler, welcher nur wenige Produkte dieses Herstellers anbietet und nicht gerade weltbekannt ist. Würde der Händler mit der schema.org-Auszeichnung „manufacturer“ arbeiten, stehen die Chancen für dieses Unternehmen, in den Suchergebnissen auf den vorderen Plätzen angezeigt zu werden, ungleich höher.
Das Beispiel ist zwar konstruiert, entspricht aber leider der gängigen Realität. Und das ist schade, weil gerade kleine und mittlere Unternehmen diesen technischen Vorteil für sich nutzen sollten, um sich gegen große Mitbewerber in den Suchmaschinen zu behaupten.
Für die Strukturierung von Daten gibt es mehrere Formate: Mikrodaten, Mikroformate und RDFa. Google selber empfiehlt die Verwendung von Mikrodaten nach schema.org. schema.org ist ein gemeinsames Projekt von Google, Microsoft und Yahoo!. Ziel des Projektes ist es, Informationen auf Webseiten besser zu verstehen, um den Suchenden bessere Suchergebnisse zu liefern.
Darstellung von Rich Snippets auf Suchergebnisseiten
Snippets sind Teile einer Webseite, die Google für die Darstellung auf den Suchergebnisseiten, kurz SERPs genannt, zum jeweiligen Treffer nutzt. Im einfachsten Fall nutzt Google den Titel einer Website, die URL und einen Textauszug. Als Textauszug wird häufig die Meta-Description angezeigt. Passt diese nicht zum gesuchten Begriff, nutzt Google einzelne Passagen aus dem Text der Webseite, die den gesuchten Begriff enthalten oder dazu passen.
Snippet einer Seite aus den Google Webmaster Tools in den Suchergebnisseiten
Diese Darstellung kann Google mit weiteren Informationen anreichern. Dann spricht man von Rich Snippets. Google unterstützt Rich Snippets für folgende Inhaltstypen:
- Personen
- Produkte
- Breadcrumbs
- Ereignisse / Veranstaltungen
- Musik
- Organisationen / Unternehmen
- Rezepte
- Bewertungen
- Erfahrungsberichte
Beispiele zu Rich Snippets
Die Darstellung der Rich Snippets sind für den Suchenden vorteilhaft, da sie mehr Informationen zu diesem Treffer erhält. Auch für den Betreiber der Website hat dies einen großen Vorteil: Der Treffer hebt sich durch die prominente Darstellung von anderen Treffern ab, die nicht mit weiteren Informationen angereichert sind. Die Klickraten auf Treffer mit Rich Snippets sind nachweislich höher.
Auch wenn strukturierte Daten auf einer Webseite vorliegen, ist das keine Garantie, dass Google diese als Rich Snippet in den Suchergebnissen anzeigt. Google wählt sehr gezielt aus, wann ein Snippet mit strukturierten Daten angereichert wird und wann nicht. Hier spielt auch das Verhalten der Nutzer eine große Rolle. Denn warum sollte Google ein auffälliges Snippet präsentieren, wenn zum Beispiel 95 % der Personen, die auf das prominente Suchergebnis geklickt haben sofort wieder zurück zur Suchergebnisseite gekommen sind, um danach ein anderes Suchergebnis auszuwählen. Die Bouncerate hat Einfluss auf das Ranking. Und es ist naheliegend, dass die Bouncerate Einfluss auf die Darstellung des Snippets hat. Zusätzlich verändert Google regelmäßig die Darstellung seiner Suchergebnisseite. Und was heute noch da war, kann morgen schon nicht mehr angezeigt werden und umgekehrt. So geschehen beim Authorship und Video-Thumbnails von selbst gehosteten Videos, die nun nicht mehr in den Suchergebnissen angezeigt werden.
ABER: Auch wenn Google mache Informationen nicht nutzt oder als Rich Snippet dazu abgeschafft hat, heißt das nicht, dass es nicht wichtig ist, diese als strukturierte Daten auf der Webseite anzubieten. Für Google sind das relevante und wichtige Informationen.
Wie funktioniert das Auszeichnen von strukturierten Daten nach schema.org in der Praxis?
Bei der Auszeichnung mit schema.org muss auf bestimmte Tags und deren Einsatz geachtet werden.
Die Tags
Grundsätzlich können alle gängigen HTML-Tags für schema.org verwendet werden, einige haben aber besondere Funktionen:
Wichtige Tags
Tag |
Beschreibung |
---|---|
<div> | Mit diesem Tag wird eine Auszeichnung eingeleitet und beendet. |
<span> | Eine itemprop wird ausgezeichnet, wobei die Darstellung im Browser nicht verändert wird. |
<a> | Ein Link wird ausgezeichnet, dieser ist im Browser sicht- und klickbar. |
<h1> <h2> | Eine Überschrift wird ausgezeichnet. |
<img> | Es folgt ein Bild oder eine Grafik. |
Eher unwichtigere Tags
Tag |
Beschreibung |
---|---|
<link> | Dasselbe wie <a>, nur unsichtbar. Typischerweise wird dieser Tag verwendet, um ein Thema besser auszuzeichnen, in dem man auf eine andere Quelle verweist: <link itemprop="url" href="http://wikipedia.org/meinthema">. |
<meta> | Wenn eine Information ausgezeichnet werden soll, dies aber nicht möglich ist (ein Bild/Video), benutzt man den meta-Tag. |
<time> | Für die Auszeichnung einer Zeitspanne oder einem konkreten Zeitpunkt. |
Der Aufbau einer Auszeichnung
1. Itemscope und itemtype
<div itemscope itemtype="https://schema.org/Event">
Diese Zeile leitet ein neues Element ein. „itemscope“ ist der Code für: „jetzt wird etwas ausgezeichnet“. Mit „itemtype“ wird die Art der Auszeichnung kategorisiert. Der Link geht immer zu einer Kategorie auf schema.org. In unserem Fall ist es eine Veranstaltung.
2. itemprop
<h1 itemprop="name">SEO für Profis</h1>
„Itemprop“ bezeichnet eine property, also eine Eigenschaft des itemtypes. In unserem Fall ein Name, der gleichzeitig die h1 Überschrift ist.
Die zu einem itemtyp zugehörigen itemprops findet man unter der jeweiligen schema.org-URL im itemtype.
Die Spalte „Expected Type“ beinhaltet die itemtypes, die für die jeweilige itemscope zulässig sind:
<div itemscope itemtype="https://schema.org/Event">
Willkommen zu unserer Veranstaltung<h1 itemprop="name">“SEO für Profis“</h1>
Top-Speaker ist heute: <span itemprop="attendee" itemtype="person">Rand Fishkin</div>
In diesem Beispiel ist ein Video mit strukturierten Daten angereichert. Und hier sind alle Informationen als Meta-Angeaben im Quellcode der Website integriert. Das heißt, es werden keine sichtbaren Informationen auf der Seite strukturiert, sondern Informationen im Quellcode hinterlegt:
<meta itemprop="name" content="Weiterbildung mit Bildungsgutschein der Agentur für Arbeit – Erklärvideo" />
<meta itemprop="duration" content="PT1M9S" />
<meta itemprop="thumbnailUrl" content="https://i.ytimg.com/vi/buZw-6Sxyyjg/default.jpg" />
<meta itemprop="contentURL" content="https://www.youtube-nocookie.com/embed/buZw-6Sxyyjg" />
<meta itemprop="uploadDate" content="2020-07-07T15:20:52Z" />
Noch ein weiteres Beispiel für eine Bildauszeichnung. Es handelt sich um ein lokales Geschäft, dessen Logo ausgezeichnet wird:
<div itemscope itemtype=“http://schema.org/LocalBusiness“>
<a itemprop="url" href="http://www.beispiel.de/">Startseite</a>
<img itemprop="logo" src="http://www.beispiel.de/logo.png" />
Auch das Logo einer Marke deren Produkte man verkauft, kann ausgezeichnet werden:
<div itemscope itemtype="https://schema.org/Brand">
<span itemprop="name">Name der Marke die verkauft wird
<a itemprop="logo" href="www.beispiel.de/logo_der_marke.jpg" />
Soll ein ein Mitarbeiter einem Unternehmen zugeordnet werden, geht das ganze so:
<div itemscope itemtype="http://schema.org/Organization">
Unternehmen: <div itemprop="name">Seo Küche</div>
Mitarbeiter: <div itemprop="employee">Tilmann Klosa</div>
Test einer Auszeichnung
Google bietet zum Test von Auszeichnungen ein Tool an. Der Test für Rich-Suchergebnisse kann über die Eingabe einer URL oder des Codes erfolgen. In diesem Beispiel haben wir die Einbindung der strukturierten Daten der Videos auf einer Seite für Weiterbildungsangebote (https://www.wbstraining.de/weiterbildung/) geprüft.
Übersicht zu strukturierten Daten für Shops, Websites, lokale Unternehmen und Blogs
Gratis Download der Übersicht als PDF
-
Übersicht für Online-Shops
-
Übersicht für Unternehmenswebsites
-
Übersicht für lokale Websites
- Übersicht für Blogs
Mit dem Google Test-Tool für strukturierte Daten, kann man die eigenen Auszeichnungen kontrollieren und bei Bedarf nachbessern.
Der Data-Highlighter in den Google Webmaster Tools erledigt zwar im Prinzip dasselbe wie eine Auszeichnung mit schema.org, allerdings schickt der Data Highlighter nur eine Nachricht an Google, welches Element auf einer Seite was bedeuten soll. Das hat zum einen den Nachteil, dass die Auszeichnung nicht im Quellcode hinterlegt ist – die Informationen sind also nicht „hart“ gekennzeichnet. Weiter ist es fraglich, wie ernst Google diese Nachricht nimmt. Ist hingegen der Quellcode mit Auszeichnungen versehen, kommt kein Crawler daran vorbei.
Strukturierte Daten und CMS, Shop- oder Blog-Systeme
Wenn Sie einen neuen Online-Shop, eine neue Website oder ein neues Blog einrichten, dann achten Sie darauf, dass Ihr Content-Management-System strukturierte Daten korrekt nach schema.org auszeichnet. Leider gibt es noch viele CMS, die schema.org-Auszeichnungen nicht oder nur rudimentär unterstützen. Eine nachträgliche und individuelle Anpassung des CMS kann dann sehr kostspielig werden.
Kritik an schema.org
Nicht jeder ist mit schema.org zufrieden. Manche fragen sich, wieso man den relativ leicht verständlichen und weit entwickelten Vorgänger, RDFa, durch ein neues, noch lange nicht so weit entwickeltes schema.org ersetzt.
Das vermutetet Ziel hinter schema.org, nämlich die Grundlage für ein semantisches Web zu legen, macht besonders Journalisten Angst. Der Roboter-Journalismus steht schon jetzt in den Startlöchern. Programme die aus einer vorgegebenen Menge an Informationen, gut lesbare, grammatikalisch richtige Sätze bauen. Crawler die automatisch ins Netz hochgeladene Informationen, egal ob privat oder öffentlich, einlesen und entsprechende Nachrichten schreiben. Klingt aufs Erste nicht nach Qualitätsjournalismus. Aber folgende Nachricht kann vollständig durch öffentliche Informationen aus sozialen Netzwerken, praktisch zeitgleich zum eigentlichen Geschehen, geschrieben werden:
„Studenten in Kairo, Ägypten, haben sich zum Protest auf dem Maidan-Platz versammelt. Die Polizei setzt Wasserwerfer ein. Es kam zu gewaltsamen Aktionen – mehrere Polizisten und Studenten wurden verletzt. Die Studenten halten den Platz weiterhin besetzt.“
Selbstverständlich handelt es sich nicht um eine Analyse oder gar Reportage – die gängigen Informationen aus den großen Nachrichtenagenturen sehen aber nicht viel anders aus.
Fazit
Wurde bei der Einführung von schema.org noch über den Sinn und Zweck diskutiert, hat sich mittlerweile der Pragmatismus durchgesetzt. War 2011 noch nicht sicher, ob sich schema.org durchsetzen werde, haben viele Websites mittlerweile schema.org übernommen. Und ob Roboter-Journalismus oder nicht – der Einsatz der Auszeichnungen führt zu einer strukturierteren Erfassung einer Webseite durch den Crawler. Und das honoriert Google mit Rankings zu relevanten Suchen.
Über den Autor
Tilmann Klosa arbeitet als Onlinemarketing-Berater bei SEO Küche Internet Marketing GmbH und erarbeitet zusammen mit seinen Kollegen Onlinemarketing-Strategien für den Mittelstand.