Données brutes de Google Analytics

Statistiques de Google Analytics et Search Console : pas fiables !

5
(2)

Depuis presque un an que je fais du référencement SEO de manière intensive au quotidien, j’en suis venu à m’équiper d’outils SEO, et la matière première de ces outils, c’est la donnée chiffrée, la statistique brute, sans laquelle aucune stratégie de référencement n’est possible.

Or il se trouve qu’un simple comparatif entre les données fournies, pour les mêmes pages du même site web, aux mêmes dates, par Google Analytics d’une part, et Google Search Console d’autre part, montre tout simplement qu’on essaye de faire de la science exacte avec de la donnée frelatée.

Non, les statistiques de Google Analytics et Google Search Console ne sont pas fiables du tout !

Utilisateur de Semrush et Ahrefs et Ubersuggest, j’ai déjà remarqué que pour les mêmes mots-clés, ces outils ne donnent ni les mêmes volumes de recherche, ni les mêmes « DA », Domain Authority, autorité de domaine.

On peut imputer ces différences à des divergences dans la manière de construire les données, l’autorité de domaine n’étant pas calculée sur les mêmes bases par Ahrefs et Semrush qui tentent tout d’eux de donner une valeur approchante d’une donnée stratégique que Google nous cache sciemment derrière le secret industriel sur lequel il a basé sa fortune.

Soit, s’agissant de données calculées, on peut comprendre qu’elles puissent manquer de fiabilité, et s’en accommoder.

Mais s’agissant des données brutes ? Google et Google sont-ils d’accord entre eux ?

J’ai voulu en avoir le cœur net.

Voici ce que je viens de faire.

J’ai isolé les statistiques d’une des pages d’un de mes sites Internet.

J’ai réglé la durée sur les mêmes dates, du 1er mars 2022 au 1er avril 2022.

J’ai filtré la vue d’Analytics avec une dimension secondaire Source / Support pour ne voir que le trafic organique depuis Google.

Et là, surprise : selon Google Analytics et selon Google Search Console, je n’obtiens pas du tout les mêmes chiffres totaux représentant le nombre de clics depuis le moteur de recherche Google.

Google Analytics affabule

Selon Google Analytics, ma page a reçu 54 clics :

Données brutes de Google Analytics
Données brutes de Google Analytics

Google Search Console délire sec

Selon Google Search Console, ma page a reçu 96 clics :

Données brutes de Google Search Console
Données brutes de Google Search Console

96 clics, auxquels il faut rajouter 2 clics depuis Google Images.

98, c’est pas loin de 2 fois plus que 54. Soit une marge d’erreur démentielle d’environ 90%.

Si on observe les « données » de plus près, on observe que du 4 au 8 mars, ma page n’a reçu aucun trafic d’après Analytics, alors que la Search Console dit qu’elle a reçu 3, puis 2, puis 1, puis 6, puis 1 clic.

De même, Analytics dit que le pic le plus haut était le 24 mars avec 8 clics, tandis que Search Console dit qu’il n’y a pas eu de pic ce jour-là, avec 6 clics.

Bref, même en termes de données brutes, Google n’arrive pas à s’accorder avec lui-même, et moi, je ne sais plus quoi penser : lequel dit vrai ? l’un ? l’autre ? aucun des deux ?

Ubersuggest raconte n’importe quoi

Qu’à cela ne tienne, j’ai cherché à vérifier si d’autres outils pouvaient confirmer les données de l’une ou l’autre des facettes de Google.

J’ai donc demandé son avis à Ubersuggest, et sa réponse n’a fait qu’ajouter à la confusion.

Car selon Ubersuggest, en mars, ma page a récolté 17 clics. Soit un quart de la donnée d’Analytics et un sixième de la donnée de Search Console.

Statistiques selon Ubersuggest
Statistiques selon Ubersuggest

Ahrefs fume du crack

Je cherche ma page dans Ahrefs, en mode URL / organic search, et voilà le résultat :

Mon trafic organique selon Ahrefs
Mon trafic organique selon Ahrefs

Ahrefs est très bizarre concernant les stats de trafic. Il ne permet aucune sélection date à date, et les chiffres qu’il donne quand on survole la courbe de trafic à une date donnée ne sont pas, contrairement à ce qu’on pourrait croire, les chiffres du trafic de ce jour, mais la moyenne mensuelle des 30 jours passés, à ce jour.

Du moins, c’est ce que j’ai cru comprendre.

Donc quand je survole la date du 1er avril, il dit que ma page a été vue 35 fois à partir d’un moteur de recherche dans le mois précédent. (Il ne dit donc pas qu’elle a été vue 35 fois ce jour-là !)

Il est donc assez loin des deux chiffres de Google, de 54 et 98.

Comment est-ce qu’il calcule ses stats ? Ahrefs nous l’explique

We calculate the organic traffic of each keyword at the respective ranking position of the target website/URL by multiplying the estimated search volume of the keyword and the unique CTR of the target website/URL’s position in a SERP.

C’est à dire : « On calcule le trafic organique de chaque mot-clé à la position respective de chaque url cible en multipliant le volume de recherche estimé du mot-clé et le taux de clic de la position de l’url dans la SERP ».

En d’autres termes : ils font un calcul sur plusieurs données très approximatives.

En d’autres termes : il faut garder à l’esprit qu’on ne peut pas du tout se fier aux stats de trafic d’Ahrefs, et de tous les outils qui prétendent reconstituer des données qu’ils n’ont jamais mesurées.

On peut conclure qu’il ne fournissent qu’une vague approximation qui ne peut servir qu’à avoir un ordre de grandeur.

On recommence ! Deuxième test

Masochiste au dernier degré, je décide de recommencer le test – j’adore qu’on me mente.

Je redemande à tous mes faux amis :

Combien mon site entier a-t-il reçu de clics depuis les moteurs de recherche, en mars ?

Google Analytics : 751

Google Search Console : 226 (web) + 5 (images) = 231

Ubersuggest : 43

Ahrefs : 43

Là, c’est encore plus du grand n’importe quoi.

La différence entre les chiffres d’Ahrefs et Ubersuggest et ceux d’Analytics est de 1 à 17,5 !!! 

On sait qu’Ubersuggest et Ahrefs ne sont tout simplement pas qualifiés pour savoir ; ils ne collectent pas mes données comme le fait Google.

Mais j’ai vraiment du mal à expliquer que deux services du même Google puissent afficher des données allant du simple au triple.

Pourquoi ces divergences de données ?

Je ne peux partager avec vous aucune explication sûre et certaine du pourquoi et du comment de ces données qui divergent de manière déconcertante.

Est-ce qu’Analytics compte plusieurs visites, si on recharge une même page, alors que Search Console ne compte que le clic d’origine ? N’empêche, j’ai du mal à croire que chaque visiteur recharge la page 2 fois en moyenne pendant 1 mois.

J’ai pensé que c’était peut-être mes propres visites qui entraînaient la divergence mais c’est impossible, car mes chiffres issus d’Analytics ne sont pas ceux des visites en général, puisque j’ai filtré uniquement les visites depuis Google, censées correspondre aux données de Search Console.

Un article d’Olivier Duffez sur WebRankInfo a traité le même problème et donne les explications suivantes :

  • Google Search Console ne tiendrait pas compte de certaines données : ni des requêtes rares ni des requêtes contenant des données personnelles, cela peut donc expliquer une partie de la divergence, et reviendrait à dire qu’Analytics est une source plus fiable
  • Google Search Console nettoierait les pages en doublon et les visites de robots (et pas Analytics ??) – ce qui signifierait que ses chiffres sont plus fiables que ceux d’Analytics, ce qui contredit le point précédent
  • la définition du concept de mot-clé par ces deux outils varierait, Analytics mélangeant les mots-clés organiques et les mots-clés de Google Ads (mais dans mon cas je n’utilisais pas Google Ads), et Search Console zappant les mots-clés inférieurs à un certain seuil, non-précisé (on est bien avancés du coup)
  • la désactivation de Javascript ou le blocage des cookies par certains utilisateurs expliquerait que des données ne soient pas captées par Analytics alors qu’elles le sont par GSC (du coup si cet effet était important, les données devrait être l’inverse de ce qu’elles sont : Analytics devrait donner des chiffres inférieurs à ceux de la Search Console, or moi je constate le contraire)

Bilan : un ramassis d’explications contradictoires, contenant des facteurs incalculables (taux de refus des cookies, taux de désactivation Javascript, nombre et volume des mots-clés rares négligés par GSC).

Un autre article, de Soleil digital, explique que GCS et Analytics ne mesurent pas les mêmes choses, la Search Console se basant sur une analyse des logs. On y découvre qu’on ne sait pas ce que fait Google quand un même utilisateur au cours d’une même session clique plusieurs fois sur un même résultat de la SERP.

En réalité donc, je ne sais juste plus quoi faire de ces chiffres. Aucun des fournisseurs de données (sauf Ahrefs) n’explique clairement comment il les enregistre ni quels peuvent être les biais et les facteurs d’erreurs.

Une fois de plus Google, faisant mine de fournir de l’information gratuite, ne fait que nous perdre dans le brouillard de son opacité habituelle.

Néanmoins, quelle source faut-il privilégier, entre Analytics et Search Console ? Je dirais, sans pouvoir le prouver, que GSC est plus fiable par nature, car elle capte la donnée au niveau du moteur de recherche de Google.

De la difficulté de faire du référencement SEO scientifiquement

La base de ce qui est à mes yeux la bonne approche du SEO, c’est d’adopter une démarche expérimentale et purement empirique, basée sur les données, et pas sur les croyances, les convictions, les impressions, bref, tout le fatras de la subjectivité.

Cela évite d’adhérer aux multiples mythes du SEO – un gourou qui répète ce qu’a dit un autre gourou commentant les mensonges et les demi-vérités de John Mueller, Matt Cutts et Larry Page qui cherchaient à nous éclairer sur tout ce qu’ils ont à cacher pour faire tourner leur machine à cash.

On voit qu’une telle approche, scientifique, humble, et noble, se fait massacrer par l’indélicatesse du roi Google, pas foutu de nous filer des données fiables.

Du coup :

  • est-ce que ma stratégie SEO a marché ?
  • est-ce que ma petite modif on-page ou on-site m’a fait gagner du trafic ?

Aucune idée. Aucun moyen 100% sûr de le savoir.

Il reste des indicateurs qui ne mentent pas, je pense par exemple au suivi des positions sur Google : si la position monte, on peut supposer que c’est la stratégie ou la modif qui fonctionnent, même si cela reste impossible à prouver, car une hausse comme une baisse du trafic ou des positions peuvent tout autant s’expliquer par des changements…

  • dans l’algorithme de Google (plus de 500 modifications d’algorithme tous les ans, parait-il, soit quasiment 2 par jour, et en cachette)
  • dans le comportement des utilisateurs (car soudain il y a covid, panique et confinement, ou soudain il y a guerre en Ukraine, soudain une vague de froid puis une météo estivale)
  • dans les contenus de la concurrence (2 sites en rade et je gagne 2 places les doigts dans le nez, 3 concurrents sous coke et je perds 3 places sans rien faire)

Conclusion

Décidément en référencement SEO il faut rester humble, conscient qu’on sait fort peu de choses, qu’on ne peut presque rien tester ni savoir de sûr.

Comme disait le référenceur Socrate : la seule chose sûre c’est qu’on ne sert rien.

Bémol de cette conclusion : si on prétend quand même mesurer quoi que ce soit, alors il est impératif de piloter sa stratégie avec un outil et un seul, pour conserver un impact présumé égal de tous ses différents biais.

Si mon trafic double dans GSC, ou double dans Analytics, alors je peux peut-être conclure qu’il a vraiment doublé, ou à peu près. 

Ou pas.

Qu'avez-vous pensé de cet article ?

Cliquez sur une étoile pour donner votre avis

Avis moyen 5 / 5. Nombre d'avis donnés 2

Soyez le premier à donner votre avis

Ouvrir les commentaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Besoin d’un hébergeur ?

Convivial, sympa, fiable, et pas cher,
O2Switch me semble être la meilleure offre actuellement sur le marché français.
C’est pourquoi j’y héberge tous mes sites.

Panier
Retour haut de page