C’est devenu une vraie galère pour les utilisateurs de Google Analytics et si vous n’êtes pas encore au courant, regardez de plus près vos statistiques pour voir les dégâts.
Qu’est-ce que le Referer Spam ?
Le « Referer Spam » est tout simplement des visites ajoutées à vos statistiques, sur Google Analytics, sans que ce soit réellement des visites. C’est à dire que personne n’a visité votre site, mais vous avez tout de même des visites.
Les visites semblent provenir de certains sites. Mais quand vous allez voir ces sites (et c’est un peu le but aussi…), aucun lien vers le votre.
En fait, il s’agit essentiellement de sites russes comme « 4webmasters.org », « trafficmonetizer.org » ou encore « webmonetizer.net« .
Il utilisent une faille de Google Analytics et rien ne semble pouvoir les arrêter.
Et quel est le problème ?
Il y a plusieurs problèmes. Le premier étant que vos données statistiques se retrouvent faussées, surtout si vous avez peu de trafic.
Le fait que vos données soient faussées peu entraîner de mauvaises prises de décisions concernant l’engagement de vos utilisateurs. Si vous avez un site de e-commerce, vous pouvez être amener à prendre des décisions qui peuvent vous faire perdre beaucoup de clients potentiels.
Et le but de ceux qui font ça alors ?! Et il est double (au moins), comme indiqué précédemment, vous allez sans doute visiter les sites en question et peut-être devenir client (le comble !).
Il y a également certains sites qui affichent leur référents et c’est surtout cela qui est visé : obtenir des backlinks.
Comment arrêter le Referer Spam ?
C’est là que ça devient coton car les méthodes « standards » ne fonctionnent pas. En effet, si vous utilisez un classique .htaccess avec interdiction à certains référents, cela ne fonctionnera pas. Les visites ne se faisant pas sur votre site, mais directement sur le code Google Analytics.
Alors, il reste la solution de placer un filtre dans Google Analytics directement.
Le but va être de n’autoriser que vos hôtes. Et pour cela, il faut d’abord voir la liste de vos hôtes. Pour cela, cliquez d’abord, dans la colonne de gauche, sur « Audience », puis « Technologie » et enfin « Réseau ». Puis, juste sous le graphique, sur « Nom d’hôte ».
Cette liste doit contenir votre propre nom de domaine, plus d’autres qui peuvent avoir leur importance. À vous de jugez. Si vous pensez que d’autres nom de domaines peuvent être important, notez-les.
Ici, par exemple, j’ai « lorem.game-on-net.com » qui est important car il s’agit de l’ancien nom de domaine utilisé pour mon site et j’ai mis une redirection 301 dessus.
Cliquez ensuite, tout en haut, sur « Admin ».
Puis, sur « Filtres » dans la vue que vous utilisez. Et enfin, sur « Nouveau filtre ».
Vous allez devoir donner un nom à votre filtre.
C’est un filtre « personnalisé » de type « inclure ». Le champ de filtrage est « Nom d’hôte ».
Et c’est là que vous allez indiquer vos noms de domaines. Pour reprendre l’exemple de www.faut-texte.com, voilà ce que j’ai ajouté :
www\.faux-texte\.com|faux-texte\.com|lorem\.game-on-net\.com
Il y a donc 3 domaines : le principale avec « www » au début, le même sans les « www » et, enfin, la redirection 301 de l’ancien nom de domaine.
Il ne vous reste plus qu’à valider après avoir lancer une vérification, au cas où.
Les résultats ne seront pas immédiats car ce ne sera que les prochaines données qui seront prises en compte.
Il vous faudra donc attendre le lendemain pour voir les premiers résultats.
Du coup, si vous vous trompez dans le filtre, vous perdrez les informations : soyez très attentif !
Conclusion
Mais pourquoi Google ne s’occupe pas lui-même de bloquer ces sites spammeurs ? Je ne sais pas, mais toujours est-il que, en ce qui me concerne, Google Analytics était devenu inutilisable sans cette solution.
Désormais, j’ai des chiffres un peu plus justes. Il reste quelques spammeurs qui ne fonctionnent pas avec ce système et que je peux donc supprimer facilement dans un .htaccess :
RewriteEngine on RewriteCond %{HTTP_REFERER} best-seo-offer\.com [NC,OR] RewriteCond %{HTTP_REFERER} buttons-for-your-website\.com [NC,OR] RewriteCond %{HTTP_REFERER} trafficmonetize\.org [NC,OR] RewriteRule .* - [F]
Attention, cette dernière solution n’est pas pérenne malheureusement. Donc, si vous gérez plusieurs sites, notez quelque part que vous avez mis en place cette redirection.
Salut,
En utilisant cette méthode, tu effaces le nombre de visites renvoyé par de bons référents non ?
Personnellement, j’utilise l’exclusion des sites référents dans Propriété => Informations de suivi => Liste d’exclusion des sites référents.
Ainsi je peux suivre la liste de référents dans les stats et supprimer directement ceux qui spam.
Je fais actuellement un autre test, celui d’intégrer google analytic dans PHP plutôt qu’avec le code de suivi en JS.
Il y a des avantages et des inconvénients à ce que j’en ai lu. L’avantage certain, c’est que pas de spam puisque le code n’est pas connu. Mais j’ai testé uniquement sur un nouveau domaine, il faudrait voir si cela fonctionne sur un ancien. Un autre avantage semble être la vitesse. Je le trouve beaucoup plus rapide que le JS.
Par contre j’ai lu qu’on perdait des options dans les statistiques. Mais pour mon usage, je n’ai pas vu de différence.
Attention, ce n’est pas les « référents » que je supprime, mais les « hôtes » invalides. Donc non, sauf si j’oublie d’indiquer la liste des hôtes valides.
Utiliser une liste de référents invalides oblige à la mettre à jour régulièrement et, crois moi, il y a paquet de sites qui s’amusent à faire du spam referer !
Mettre Google Analytics en Php ne changera rien, sauf à masquer les ID éventuellement. Mais s’ils sont pris au hasard, ça ne sert à rien. Il faudrait une clef masquée, mais il faudrait aussi annuler, dans ce cas, les accès via JS.
D’ailleurs, je ne savais pas que l’on pouvais utiliser GA en Php. Faut que je regarde, merci.
Salut,
Je sais que ça fait tard, mais c’est les vacances hein 😉
D’après ce que j’ai pu retrouver, c’est juste l’envoie de certaines stats vers GA depuis PHP. Pas moyen de remettre la main sur l’article ou j’avais lu cette histoire d’intégration complète d’analytic en php. J’aurai du sauvegarder ça 🙁
En attendant j’ai testé ta méthode et ça marche nickel 😉 Les stats sont redevenus propres avec le temps. Les filtres n’ont pas été rétroactif chez moi. Chez toi aussi ?
Merci pour l’astuce 😉
Non, ce n’est pas rétroactif. Du coup, si tu supprime ce filtre, tu ne retrouves pas les infos rétroactivement non plus.
Donc, à manipuler avec prudence tout de même.
Serait-ce la solution que je cherche en vain depuis des mois ? Ca y ressemble. En tous les cas, je confirme que la « liste d’exclusion de sites référents » (dans informations de suivi) fonctionne très mal: il y a toujours de nouveaux sites, et ceux déjà renseignés ne sont pas toujours correctement filtrés. Merci.