Spam

Google Analytics Spam

Wer Google Analytics zur Auswertung von Website-Statistiken nutzt, wird hin und wieder enttäuscht sein, dass vermeintlicher Traffic sich als Spam herausstellt. Auffällig wird das meist, wenn in den Website-Zugriffen z.B. unbekannte Hostnamen auftauchen, die keiner Domain oder Subdomain des eigenen Internet-Auftritts entsprechen. Dabei kann auf relativ einfache Art und Weise Spam in Google Analytics erzeugt werden. Ziel dieser Attacken ist in der Regel Traffic für die URLs zu generieren, die als Spam in den Statistiken auftauchen, entweder zur Werbung für eine bestimmte Webseite oder zur Verbreitung von Schadsoftware.

Oberstes Gebot lautet daher zunächst: Spam-Links, die im Google Analytics auftauchen, sollten nicht geklickt werden!

Damit kann schon ein Teil dazu beigetragen werden, dass sich der Aufwand für die Spammer nicht lohnt und keine Schadsoftware, wie Trojaner oder Viren, weiterverbreitet werden. Doch wie entsteht überhaupt Spam in Google Analytics?

Was ist Spam?

Spam war ursprünglich ein Markenname für Dosenfleisch, welches im Zweiten Weltkrieg in Großbritannien eines der wenigen Nahrungsmittel darstellte, das trotz Rationierung ständig verfügbar war. Später wurde dieser Begriff in einer Parodie von Monty Python aufgegriffen und in den Anfangszeiten des Internets im Usenet erstmals in Zusammenhang mit massenhafter Werbung genutzt. Im Kern geht es dabei um Nachrichten und Informationen, die dem Empfänger unerwünscht zugestellt werden und damit als lästig empfunden werden, unabhängig vom Kommunikationskanal.

Neben dem regelmäßigen Spam, der wohl in fast allen E-Mail-Postfächern mal mehr, mal weniger häufig landet, existiert auch eine Form von Spam, die in Logdateien von Webservern auftaucht: der sogenannte Referrer-Spam. Das ist genau die Form von Spam, die auch im Google Analytics regelmäßig für eine Verfälschung der Statistiken sorgt.

Der Referrer stellt einen Verweis da. Die verweisende Seite wird dabei im HTTP-Header bei einem Seitenaufruf übergeben. Diesen kann Google Analytics auswerten und stellt den Referrer in den Statistiken dar, was in der Regel nützlich ist, um herauszufinden, aus welchen Quellen die Website-Besucher stammen. Wenn es sich jedoch um Referrer-Spam handelt, muss nicht immer ein echter Verweis vorliegen. Dabei wird zwischen zwei verschiedenen Formen von Referrer Spam im Google Analytics unterschieden.

Ghost Spam

Oftmals tauchen unbekannte Hostnamen bei der Zielgruppenanalyse in Google Analytics auf. Das lässt sich leicht herausfinden, in dem unter Akquisition > Alle Zugriffe > Channels als primäre Dimension „Quelle“ und als sekundäre Dimension „Hostname“ (unter Verhalten) ausgewählt wird. Befinden sich dort Einträge, die keiner bekannten Subdomain des eigenen Internetauftritts entsprechen und die man über die Google Analytics-ID trackt, handelt es sich um Ghost Spam. Hierbei wird von den Spammern kein echter Verweis generiert, sondern es wird die Eigenschaft des Measurement Protocols genutzt, welches Google Analytics verwendet, um Zugriffe zu zählen. Der Spammer benötigt nur die Tracking ID, um den Zugriff nachzustellen.

Crawler Spam

Daneben gibt es Spam, der von Internet-Bots verursacht wird, die die eigene Webseite direkt aufrufen. Empfohlene Regeln, wie sie beispielsweise in der robots.txt definiert werden, ignorieren diese Crawler einfach. Nützliche Bots, wie z.B. die Crawler von Google, halten sich im Normalfall an diese Regeln.

Spam ausschließen mit dem Tag Manager

Mit dem Google Tag Manager existiert eine einfache Möglichkeit, Referrer Spam aus den Statistiken fernzuhalten. Da die meisten Angriffe anonym geschehen, hilft es meist schon, einen Analytics Key einzurichten, der Zugriffe auf die eigene Webseite definiert. Trotzdem müssen einige Punkte berücksichtigt werden:

(1) Es sollte stets eine Rohdaten-Ansicht im Google Analytics bestehen. Hier werden keine Daten aus Google Analytics ausgeschlossen. Von dieser kann dann eine gefilterte Ansicht abgeleitet werden, in der Filter für Spam, etc. implementiert werden.

Google Analytics Datenansicht

Für jede Property können in Google Analytics mehrere Datenansichten erstellt werden. Eine davon sollte immer eine komplett ungefilterte Ansicht bereitstellen.

(2) Auch Google Analytics selbst hat bereits einen Spam Filter integriert. Dieser schließt allerdings nur Zugriffe von bekannten Bots und Spidern aus. Trotzdem ist es empfehlenswert, diesen Filter in den Einstellungen der Datenansicht aktiv zu setzen:

Google Analytics: Bots und Spider filtern
(3) Um einen Analytics Key anzulegen, muss eine benutzerdefinierte Dimension erstellt werden. Unter der Property in Google Analytics wird dazu „Benutzerdefinierte Dimensionen“ gewählt und eine neue wie folgt angelegt:

Google Analytics Key anlegen
(4) Im Google Tag Manager wird eine benutzerdefinierte Variable „Analytics Key“ angelegt. Darin wird die Index-Nr. aus der benutzerdefinierten Dimension in Google Analytics eingetragen. Diese kann in der Übersicht der Dimensionen in Google Analytics abgelesen werden. Außerdem wird eine Variable mit einem eindeutigen Key im Tag Manager angelegt. Die Zeichenkette kann beliebig gewählt werden, im Idealfall handelt es sich um eine längere Zeichenfolge, bestehend aus Ziffern und Buchstaben.

GA Key Value
(5) Im Tag Manager im Universal Analytics Tag wird eine benutzerdefinierte Dimension mit Index und Dimensionswert angelegt.

Tag Manager Dimension Analytics Key
(6) Zum Schluss muss der Filter im Google Analytics definiert werden. Dabei wird ein benutzerdefinierter Filter angelegt.

Analytics Filter Key
Nun werden nur Zugriffe zugelassen, die den Analytics Key übermitteln. Daher sollte bei jedem Webauftritt, der der Google Analytics ID zugeordnet werden soll, der entsprechende Key übertragen werden.

Spam lässt sich also zumindest etwas begrenzen. Eine Garantie dafür, dass in Zukunft kein Spam mehr auftritt, gibt es aber nicht. Brauchen Sie Hilfe bei der Einrichtung des Google Tag Managers oder Analytics? Dann kontaktieren Sie uns gern.

Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert