SPAM w Analytics i Filtr Hosta – szybkie tipy

analytics-caly-ruch-ze-spamem

Dziś już mamy sporo porad, jak się pozbyć uciążliwego spamu z danych w Google Analytics, ale krótko przybliżę te aktualne i pokażę, jak weryfikować konfigurowane filtry.

SPAM w Analytics możemy podzielić na ten faktyczny – generowany przez ruch botów/crawlerów na stronie i wywoływanie skryptu Analytics, oraz tzw ghost refferal spam, czyli taki, którego nie da się zablokować „fizycznie” na serwerze, bo wykorzystuje błędy samego Analyticsa. Tym ostatnim się dziś zajmiemy.


Stwórz Widoki

Zanim zaczniesz grzebać w konfiguracji Google Analytics, stwórz następujące Widoki: Domyślny, Testowy, Główny. Domyślny niech zawiera dane bez żadnych ingerencji i filtrów, na wszelki wypadek. Testowy, to ten, na którym wprowadzamy zmiany i po weryfikacji danych kopiujemy je do Widoku Głównego, na którym należy pracować i prowadzić analizę danych.

analytics widoki

Testowy widok ma o tyle znaczenie, że jeśli zaimplementujesz niewłaściwy filtr, dane zostaną zniekształcone już na zawsze. To nie jest Segment, który modyfikuje wyświetlane dane, lecz filtr, który bezpowrotnie ingeruje w zapisane dane historyczne. Dlatego przez konfiguracją filtra na właściwym Widoku należy się upewnić, że zadziała prawidłowo.

 

Skonfiguruj Filtry

Filtry ustawiamy na poziomie WIDOKU. Po zalogowaniu do konta Google Analytics, przechodzimy do Administracji -> Widok -> Filtry:

Google Analytics Konfiguracja Filtrów

Na temat konfiguracji filtrów można znaleźć parę dobrych artykułów w Sieci, jeśli będzie taka potrzeba, rozwinę temat (piszcie w komentarzach, z czym jest problem). Obowiązkowo polecam lekturę dokumentacji Analytics na temat wyrażeń regularnych która jest częścią dużego rozdziału o filtrach.

 

Weryfikacja Filtrów

Podczas konfiguracji filtra Widoku można sprawdzić, jak filtr wpływa na dane na podstawie próbki z ostatnich 7 dni. Jak widać na screenie poniżej, często weryfikacja nie daje spodziewanego efektu z uwagi na zbyt małą próbkę danych. W efekcie nie wiemy, czy rzeczywiście jest za mało danych, czy filtr jest niepoprawnie skonfigurowany.

nieudana próba weryfikacji filtrów

Mały TIP:

Jeśli filtr typu WYKLUCZ lub UWZGLĘDNIJ nie przechodzi weryfikacji, zamień go na przeciwny. Istnieje szansa, że filtr zostanie poprawnie zweryfikowany i będziesz mieć pewność, że nie zawiera błędu np. składniowego. Przed jego zapisaniem, zmień ponownie typ na właściwy!

udana weryfikacja filtra

Podczas „weryfikacji odwrotnej” należy patrzeć na powyższą tabelę również na opak – dane z prawej strony tabeli to te, które nasz docelowy filtr wykasuje z przyszłych danych.

 

Co z danymi historycznymi?

Słabością filtrów w Analytics jest to, że nie zmieniają one danych historycznych. A filtry z reguły konfigurujemy podczas analizy danych już zapisanych. Tutaj możemy eliminować spam za pomocą odpowiedniej segmentacji ruchu. Tutaj znajdziecie gotowe rozwiązania, które kilkoma kliknięciami można importować do swoich widoków.

Segmenty możemy konfigurować również na poziomie Widoku, importując gotowe rozwiązania z Galerii:

analytics-konfiguracja-segmentu

Segmentami można się bawić bezkarnie, ponieważ nie wpływają one na same dane historyczne, a zmieniają tylko ich sposób wyświetlania. Źle skonfigurowane filtry zaburzą nam dane na wieki, segmenty – nie.

Mały Tip:

Na ten moment skuteczne są dwa filtry:

Filtr języka

analyticsfiltrjezyka

\s[^\s]*\s|.{15,}|\.|,

 

Filtr hosta w Analytics w 2019 roku

ten prosty zabieg eliminuje sporą część problemów z zanieczyszczaniem danych wpadających do raportów Analyticsa:

Konfiguracja filtra hosta w panelu Google Analytics

 

 

 

 

Definiujemy filtr Niestandardowy, który uwzględnia ruch tylko z naszego hosta (z naszej domeny). W większości przypadków to nadal działa poprawnie.

 


 

Dziś znaleziony na kilku kontach „nowy” ghost referral: #-#.insider.pro. Oprócz niego są jeszcze:

datract|hacĸer|ɢoogl|responsive\-test|dogsrun|tkpass|free\-video|keywords\-monitoring|pr\-cy\.ru|fix\-website|checkpagerank|seo\-2\-0\.|platezhka|timer4web|share\-buttons|99seo|3\-letter

Jeśli macie aktywny filtr Uwzględnij -> Nazwa hosta -> moja nazwa hosta, spam nie powinien się pojawić.

Google Znów Zabiera Nam DANE!!!

Analytics slowa kluczowe z GSC

Google Search Console 999 slow kluczowych

Szok i niedowierzanie. Postępujące zabory wobec prześladowanych Webmasterów nie mają końca. Jeszcze w czerwcu Mariusz Kołacz ostrzegał, że Google może się do tego posunąć i ostatecznie obciąć listę słów kluczowych w Analityce Wyszukiwania w Google Search Console. Stare raporty zawierające pełną listę słów kluczowych były dostępne do wczoraj. Dziś mamy już tylko 999 pierwszych słów kluczowych, na które wyświetla się nasza strona w wynikach wyszukiwania. [ ’ ]

Czytaj dalej „Google Znów Zabiera Nam DANE!!!”

Kliknięcia w AdWords a sesje w Analytics – skąd takie różnice?

Google Analytics ostatni miesiąc

Reklamodawcy analizujący ruch z kampanii reklamowych mogą zauważyć pewne rozbieżności między wskazaniami AdWords a raportami Google Analytics. Pojawiają się pytania dotyczące różnic między kliknięciami a sesjami. Chciałbym dziś przytoczyć kilka przyczyn różnic w raportach AdWords i Analytics, zaczynając od najbardziej banalnych.

Czytaj dalej „Kliknięcia w AdWords a sesje w Analytics – skąd takie różnice?”

Not provided rośnie

Wzrost not providedW 2011 roku Google wprowadziło do Google Analytics oraz do naszych słowników nowy termin – Not Provided. Pod tym terminem kryją się słowa kluczowe, z których zalogowani użytkownicy Google (oraz ci korzystający z bezpiecznego protokołu https:// w wyszukiwarce) weszli na naszą stronę. Z miesiąca na miesiąc odsetek not provided rośnie, a co za tym idzie, coraz mniej wiemy o słowach kluczowych, z których przyszli nasi odbiorcy. Czytaj dalej „Not provided rośnie”

Tajemnicze wejścia z Batonyterenye

Przykładowy ruch generowany z lokalizacji BatonyterenyePrzeglądając statystyki Google Analytics nader często trafiałem na odwiedziny z węgierskiej mieściny Batonyterenye. Ruch jest na poziomie kilku, kilkunastu procent, czyli na tyle wysoki, że od czasu do czasu rzuca się w oczy. Pierwszy raz zauważyłem tę loklaizację przy śledzeniu statystyk w czasie rzeczywistym. Wtedy obstawiałem, że to jakieś proxy lub autorski bocik. Dzisiaj o zagadce przypomniał mi Krzysztof Tosik na G+

Czytaj dalej „Tajemnicze wejścia z Batonyterenye”

Google Analytics – luty 2012

Dziś w nocy (20 marca 2012) otrzymałem newsletter w języku polskim, w którym opisane zostały zmiany wprowadzone w lutym w Google Analytics. Zanim przejdę do meritum dzisiejszego wpisu, streszczę w kilku zdaniach jego treść.

Pojawiła się możliwość szybkiego stworzenia raportu niestandardowego na bazie raportu standardowego.  W wielu przypadkach raport standardowy Analytics wystarcza, ale zdarzało mi się już tworzyć od podstaw swój raport tylko po to, aby dodać jedną czy dwie kolumny. Teraz to jest możliwe po kliknięciu dostosuj pod  tytułem raportu.

W pomocy podano, że funkcja jest dostępna dla każdego raportu standardowego zawierającego kartę Eksplorator. Mam co do tego wątpliwości, ale i tak najczęściej stosuję raporty niestandardowe do filtrowania i zestawiania podstawowych danych.

Istotną aktualizacją w Google Analytics jest zmiana sposobu podawania pozycji linku do witryny w zakładce Optymalizacja witryn pod kątem wyszukiwarek (SEO) -> Zapytania. Nie jest to bowiem średnia z wszystkich zapytań, tylko najwyższa pozycja. Niektóre witryny mogły w ostatnich miesiącach  „piąć się w górę” bez wyraźnych przyczyn, ale to może być efekt tej aktualizacji GA….

Wszystko fajnie, tylko powyższa aktualizacja miała miejsce 25 stycznia 2012 roku. Cieszę się z otrzymanego newslettera, bo widać, że „coś się dzieje”, ale obawiam się, że informacje na temat możliwości dzielenia się raportami niestandardowymi, udostępnianie pulpitu Analyticsa  w nowy i bardzo łatwy sposób znajdą się w wakacyjnym wydaniu newslettera.

 

Not Provided i co dalej?

Dokładnie tydzień temu zaczęło się coś dziać niedobrego ze statystykami. W Google Analytics skokowo wzrósł udział wyrażenia (not provided) w miejscu, gdzie normalnie wyświetla się słowo kluczowe, z którego nastąpiły wejścia. Wejścia oznaczone (not provided) dotyczyły tylko niewielkiej liczby użytkowników zalogowanych na koncie Google. Wejścia niezalogowanych z wyników wyszukiwania nadal powinny być oznaczane prawidłowym słowem kluczowym.

Dziś mogę przytoczyć kilka screenów, jak wygląda procentowy udział nieokreślonych słów kluczowych, z których nastąpiło przejście z wyszukiwarki na stronę. Średnio nie wygląda to najgorzej, ale niektóre witryny mają ponad 50% nieokreślonych wejść i to już jest problem.

not provided dla tego bloga – statystyki z ostatniego tygodnia, 47,95% to oznaczony long tail, 28,77% (not provided)

 

Statystyki dla wizytówki firmowej z branży IT, gdzie not provided sięga 55%!!!

 

Co ciekawe, statystyki dotyczące innych branż wyglądają tylko trochę lepiej:

Statystyki dla małej stronki z branży biżuteryjnej, stosunkowo młoda domena, not provided ponad 9%
Statystyki dla wizytówki firmowej z branży ogrodniczej, zaledwie 6% not provided, ale rośnie

 

Statystyki dość sporej kancelarii prawnej, z dużym ruchem – (not provided) ponad 14% i rośnie

 

Obawiam się, że powyższe skoki mają bezpośredni związek z wprowadzeniem szyfrowania SSL zapytań wprowadzanych przez zalogowanych użytkowników Google. W zeszłym tygodniu szyfrowanie wprowadzono również na domenach lokalnych Google (źródło informacji: http://insidesearch.blogspot.com/2012/03/bringing-more-secure-search-around.html). Testuję właśnie różne schematy zachowań użytkownika i mam wrażenie, że nie zawsze wylogowanie z konta powoduje przełączenie protokołu z https na http. Jakieś spostrzeżenia?