Dziś już mamy sporo porad, jak się pozbyć uciążliwego spamu z danych w Google Analytics, ale krótko przybliżę te aktualne i pokażę, jak weryfikować konfigurowane filtry.
SPAM w Analytics możemy podzielić na ten faktyczny – generowany przez ruch botów/crawlerów na stronie i wywoływanie skryptu Analytics, oraz tzw ghost refferal spam, czyli taki, którego nie da się zablokować „fizycznie” na serwerze, bo wykorzystuje błędy samego Analyticsa. Tym ostatnim się dziś zajmiemy.
Stwórz Widoki
Zanim zaczniesz grzebać w konfiguracji Google Analytics, stwórz następujące Widoki: Domyślny, Testowy, Główny. Domyślny niech zawiera dane bez żadnych ingerencji i filtrów, na wszelki wypadek. Testowy, to ten, na którym wprowadzamy zmiany i po weryfikacji danych kopiujemy je do Widoku Głównego, na którym należy pracować i prowadzić analizę danych.
Testowy widok ma o tyle znaczenie, że jeśli zaimplementujesz niewłaściwy filtr, dane zostaną zniekształcone już na zawsze. To nie jest Segment, który modyfikuje wyświetlane dane, lecz filtr, który bezpowrotnie ingeruje w zapisane dane historyczne. Dlatego przez konfiguracją filtra na właściwym Widoku należy się upewnić, że zadziała prawidłowo.
Skonfiguruj Filtry
Filtry ustawiamy na poziomie WIDOKU. Po zalogowaniu do konta Google Analytics, przechodzimy do Administracji -> Widok -> Filtry:
Na temat konfiguracji filtrów można znaleźć parę dobrych artykułów w Sieci, jeśli będzie taka potrzeba, rozwinę temat (piszcie w komentarzach, z czym jest problem). Obowiązkowo polecam lekturę dokumentacji Analytics na temat wyrażeń regularnych która jest częścią dużego rozdziału o filtrach.
Weryfikacja Filtrów
Podczas konfiguracji filtra Widoku można sprawdzić, jak filtr wpływa na dane na podstawie próbki z ostatnich 7 dni. Jak widać na screenie poniżej, często weryfikacja nie daje spodziewanego efektu z uwagi na zbyt małą próbkę danych. W efekcie nie wiemy, czy rzeczywiście jest za mało danych, czy filtr jest niepoprawnie skonfigurowany.
Mały TIP:
Jeśli filtr typu WYKLUCZ lub UWZGLĘDNIJ nie przechodzi weryfikacji, zamień go na przeciwny. Istnieje szansa, że filtr zostanie poprawnie zweryfikowany i będziesz mieć pewność, że nie zawiera błędu np. składniowego. Przed jego zapisaniem, zmień ponownie typ na właściwy!
Podczas „weryfikacji odwrotnej” należy patrzeć na powyższą tabelę również na opak – dane z prawej strony tabeli to te, które nasz docelowy filtr wykasuje z przyszłych danych.
Co z danymi historycznymi?
Słabością filtrów w Analytics jest to, że nie zmieniają one danych historycznych. A filtry z reguły konfigurujemy podczas analizy danych już zapisanych. Tutaj możemy eliminować spam za pomocą odpowiedniej segmentacji ruchu. Tutaj znajdziecie gotowe rozwiązania, które kilkoma kliknięciami można importować do swoich widoków.
Segmenty możemy konfigurować również na poziomie Widoku, importując gotowe rozwiązania z Galerii:
Segmentami można się bawić bezkarnie, ponieważ nie wpływają one na same dane historyczne, a zmieniają tylko ich sposób wyświetlania. Źle skonfigurowane filtry zaburzą nam dane na wieki, segmenty – nie.
Mały Tip:
Na ten moment skuteczne są dwa filtry:
Filtr języka
\s[^\s]*\s|.{15,}|\.|,
Filtr hosta w Analytics w 2019 roku
ten prosty zabieg eliminuje sporą część problemów z zanieczyszczaniem danych wpadających do raportów Analyticsa:
Definiujemy filtr Niestandardowy, który uwzględnia ruch tylko z naszego hosta (z naszej domeny). W większości przypadków to nadal działa poprawnie.
Dziś znaleziony na kilku kontach „nowy” ghost referral: #-#.insider.pro. Oprócz niego są jeszcze:
datract|hacĸer|ɢoogl|responsive\-test|dogsrun|tkpass|free\-video|keywords\-monitoring|pr\-cy\.ru|fix\-website|checkpagerank|seo\-2\-0\.|platezhka|timer4web|share\-buttons|99seo|3\-letter
Jeśli macie aktywny filtr Uwzględnij -> Nazwa hosta -> moja nazwa hosta, spam nie powinien się pojawić.