Google, un algorithme à couches
Vous vous demandez comment fonctionne Google ? Comment peut-il sembler connaître la réponse à toutes les questions que vous vous posez ? C'est dû à son algorithme complexe, sous forme de couches.
Ce système de règles à plusieurs niveaux permet à Google de renvoyer les résultats de recherche les plus pertinents possibles. C'est ce qui rend le SEO si complexe : pousser certains curseurs aura des effets directs et indirects à différents niveaux, rendant les actions plus difficiles à tracker si on ne sait pas précisément ce que l'on fait.
Superposition des couches d'algorithme
L'algorithme du moteur de recherche Google s'est complexifié avec le temps. Au fur et à mesure que ses concepteurs déployaient des mises à jour, il a acquis de nouvelles fonctions.
Des filtres ont été déployés pour trier les résultats de recherche en fonction de leur qualité et pas seulement en fonction du nombre d'occurrences d'un terme donné. D'autres traitent les résultats de mauvaise qualité. D'autres utilisent le traitement du langage naturel.
Il en résulte que les recherches Google d'aujourd'hui sont basées sur une approche en couches, avec différents facteurs pondérés à chaque couche.
Couche de base
La couche de base des algorithmes de Google prend en compte le nombre d'apparitions d'un terme donné sur le web, ainsi que la qualité des sites internet où ces occurrences sont trouvées. Cette couche examine également le "texte d'ancrage" associé aux liens vers un site web donné. L'ancre de lien est le texte visible et cliquable d'un lien hypertexte. Il fournit généralement une brève description de la page à laquelle le lien renvoie.
Exemple
Si vous recherchez "histoire du monde", par exemple, les algorithmes de Google vont analyser des milliards de documents et de sites web pour trouver les pages contenant ces termes. Ils examinent également le texte d'ancrage associé aux liens vers ces pages. Sur la base de cette analyse, Google générera une liste de résultats qu'il juge pertinents par rapport à votre requête.
Couche structurelle
La couche suivante des algorithmes de Google examine la structure du site web lui-même. Cette couche, connue sous le nom de Page Rank, doit son nom à l'un des cofondateurs de Google, Larry Page. Elle prend en compte le fait que certains sites web sont plus "populaires" que d'autres.
Un site internet est considéré comme populaire si de nombreux liens pointent vers lui depuis d'autres sites. La logique derrière cela est que si de nombreux sites web renvoient à une page donnée, cette page doit être intéressante.
Cette couche examine également la qualité des sites web qui renvoient à une page donnée. Un lien provenant d'un site web de haute qualité aura ainsi plus de valeur qu'un lien provenant d'un site de faible qualité.
Couche de pertinence
La dernière couche des algorithmes de Google examine le contenu réel de chaque page web pour déterminer sa pertinence par rapport à une requête donnée. Cette couche examine des facteurs tels que l'utilisation de synonymes et de termes connexes, le NLP (natural language processing), la structure Hn de la page et la qualité générale du contenu.
C'est à ce niveau qu'intervient le système d'intelligence artificielle de Google, RankBrain, qui a fait l'objet de nombreuses actualités ces derniers temps avec l'essor du GPT 3 et 4 d'Open AI. RankBrain est conçu pour aider Google à interpréter des requêtes qu'il n'a jamais vues auparavant. Pour ce faire, il examine le comportement de clic de l'internaute.
Exemple d'auto-apprentissage
Si, par exemple, une personne cherche "Quelle est la capitale de la France ?" et clique sur le premier résultat, Google interprète cela comme un signe que le résultat était pertinent. Si l'utilisateur clique sur le deuxième résultat et revient ensuite au premier, Google interprète cela comme un signe que le deuxième résultat était moins pertinent.
Au fil du temps, RankBrain apprend quels sont les résultats les plus susceptibles d'être cliqués pour une requête donnée, et ajuste les résultats de recherche en conséquence.
Des résultats pertinents
Cette approche en couches des résultats de recherche garantit que les utilisateurs voient toujours les résultats les plus pertinents pour leurs requêtes, que ces résultats proviennent de sites web établis ou de sites tout nouveaux.
Les filtres correctifs de l'algorithme de Google
Google utilise également un certain nombre de filtres correcteurs pour s'assurer que ses algorithmes fonctionnent comme prévu.
Algorithme Google et filtres : 2 catégories principales
Les filtres de contenu : Ces filtres examinent la qualité du contenu d'une page web donnée. Si une page est jugée de trop faible qualité, elle subira un déclassement, voire une suppression pure et simple des résultats de recherche.
Les filtres de liens : Ces filtres examinent la qualité des liens pointant vers une page web donnée. Si une page est liée à de nombreux sites de mauvaise qualité, elle sera déclassée.
Ces correctifs aident Google à éliminer le contenu de mauvaise qualité et à éviter qu'il n'apparaisse dans les résultats de recherche.
Comment Google s'assure que tous les sites sont jugés de la même façon ?
Il faut garder en tête que les mises à jour de Google interviennent dans un contexte de continuité du service et d'adaptation à l'existant. C'est à dire qu'il faut à la fois mettre en place de nouveaux critères, pour les futurs sites qui démarreront sur la toile après la mise à jour, mais aussi "filtrer" tous les sites qui sont déjà en ligne par rapport à ces nouveaux critères. Certaines mises à jour ont donc un effet rétroactif.
Google met régulièrement à jour ses algorithmes, à la fois pour continuer à fournir les meilleurs résultats possibles aux utilisateurs, et pour empêcher les webmasters de trop "jouer" avec le système.
C'est quoi le problème avec les mises à jour des algorithmes Google ?
Il existe plusieurs types de mises à jour Google, que l'on peut classer en 3 catégories :
- Core update : mise à jour du noyau dur de l'algorithme. Modification importante de l'algorithme de Google qui peut avoir un impact sur de nombreuses requêtes. Ces mises à jour sont conçues pour améliorer l'ensemble des résultats de recherche en les rendant plus pertinents et plus utiles.
- Mise à jour générale : modification moins importante, qui n'est pas aussi visible qu'une mise à jour Core Update, mais qui peut avoir un impact sur un plus grand nombre de requêtes.
- Mise à jour de filtre : ce type de mise à jour cible un type de contenu spécifique, comme le contenu de faible qualité (Panda) ou les liens non naturels (Penguin).
Google utilise de petits noms pour désigner ses mises à jour d'algorithmes, parfois des animaux comme Penguin, Panda, Pigeon ou encore Hummingbird.
Est-ce que Google annonce toujours ses mises à jour ?
Oh que non ! Google est une société commerciale, elle n'est pas obligée d'annoncer en détail toutes ses mises à jour.
D'abord parce qu'il y en a très souvent (des modifications mineures, par exemple). Mais surtout, si elle le faisait, les webmasters trouveraient rapidement des moyens de contourner les nouvelles règles.
Il arrive que Google annonce une mise à jour à l'avance, mais ce n'est pas la norme, et il s'agit en général d'une information capitale comme l'introduction des critères EAT par exemple. Dans tous les cas, le moteur de recherche ne divulgue jamais les composants de ses mises à jour, cela n'a donc rien à voir avec les patch des dev blogs de jeu vidéo, par exemple.
La meilleure façon de rester informé est de suivre les blogs qui couvrent l'actualité de Google et les mises à jour des algorithmes.
Correction d'une faille
Les mises à jour correctrices rétroactives peuvent avoir un impact négatif sur les sites web qui jouent leur SEO sur une faille de l'algorithme.
Elles peuvent très bien fonctionner pour le moment, mais vous n'êtes pas à l'abri d'en perdre tout le bénéfice demain !
La sanction la plus courante est le déclassement Google, ce qui se traduit par une chute de trafic et une perte immédiate de chiffre d'affaire pour le site internet concerné. Dans le pire des cas, c'est la désindexation pure et simple : vous disparaissez de Google du jour au lendemain.
Un risque à assumer pour son site internet
Il faut savoir que récupérer d'une sanction Google est presque impossible : le site web incriminé va conserver une étiquette de mauvais élève et ne performera plus jamais comme avant.
Si vous engagez votre money site dans cette voie, vous engagez votre business, votre source de revenus et vos employés dans une situation qui risque de vous coûter très cher.
Faites donc attention à ne pas mettre tous vos œufs dans le même panier : si la visibilité Google est votre seule source de trafic, évitez de jouer avec ses limites.
Que sont les Google Updates ?
Une Google Update ou mise à jour de l'algorithme de Google sont des changements officiels apportés par le moteur de recherche à son propre système.
Ces mises à jour ont pour but d'améliorer la qualité des résultats proposés aux utilisateurs, et donc la fiabilité du moteur de recherche. Elles permettent aussi d'apporter une réponse aux tentatives de détournement du système par les référenceurs. Voici une liste non exhaustive de mises à jour Google.
L'algorithme historique du moteur de recherche Google : le Pagerank
Le PageRank (de Larry Page) est un algorithme développé par Google, qui a été à la base de son succès pendant plusieurs années.
Cet algorithme Google attribuait une « note » à chaque page web en fonction du nombre et de la qualité des liens pointant vers cette page.
Plus une page était « linkée » par d'autres pages de qualité, plus son PageRank était élevé. Les pages les mieux notées par le PR étaient affichées en première position dans les résultats de recherche.
Cet algorithme a été mis à jour plusieurs fois depuis sa création, notamment pour lutter contre les tentatives de manipulation des résultats par les référenceurs. Devant les abus, Google a décidé de dissimuler la donnée "PageRank" aux utilisateurs. Mais elle existe toujours et elle est toujours prise en compte, bien que pondérée.
Pour une meilleure compréhension des requêtes : Colibri /Hummingbird
Google Colibri est destiné à mieux comprendre les requêtes complexes des utilisateurs.
Avec cette mise à jour, Google a pour objectif d'améliorer la pertinence des pages de résultats proposées. Pour cela, l'algorithme analyse le sens des mots dans les requêtes, et non plus seulement leurs occurrences.
En complément de l'algorithme Hummingbird : Rankbrain
RankBrain est un algorithme d'apprentissage automatique qui utilise une intelligence artificielle pour mieux comprendre les requêtes des utilisateurs et fournir des résultats plus pertinents.
Cette mise à jour de Google vise à améliorer encore la pertinence des pages affichées dans les résultats de recherche.
Pour une bonne qualité de contenus : Google Phantom
La mise à jour Google Phantom a pour but de lutter contre les contenus de mauvaise qualité. Pour ce faire, Google analyse la qualité globale du contenu des pages web, et déclasse les pages dont le contenu est faiblard ou dupliqué.
L'objectif principal de cette mise à jour de Google est d'améliorer l'expérience utilisateur en ne proposant que du contenu de qualité.
Contenus de faible qualité : Panda
La mise à jour Google Panda est une conséquence directe de la mise à jour Phantom. Cette mise à jour est destinée à lutter plus efficacement contre les contenus de mauvaise qualité.
Pour ce faire, Google analyse plus en détail le contenu des pages web, et attribue un score à chaque page. Les pages ayant le score le plus bas sont déclassées dans les résultats de recherche.
Les réseaux de liens : Pingouin / Penguin
Le rôle de l'algorithme Pingouin de Google est de détecter les sites qui utilisent des techniques de netlinking « black hat SEO » comme le spamdexing afin d'améliorer le positionnement d'une page web dans les résultats des moteurs de recherche.
En d'autres termes, ceux qui trichent pour obtenir des résultats !
BERT
Cet algorithme auto-apprenant est l'un des premiers modèles à utiliser le traitement automatisé du langage naturel (NLP).
MUM -multitask unified model
Cet algorithme d'apprentissage automatique en cours d'entraînement analyse le comportement des utilisateurs sur un site web afin de mieux comprendre leurs besoins.
Référencement du nom de domaine : Google EMD (Exact Match Domain)
La mise à jour Google EMD a pour but de lutter contre l'abus de noms de domaine incluant des mots clés (exact match domains).
En effet, certains webmasters choisissaient leur nom de domaine en fonction des principaux mots clés qu'ils souhaitent cibler. Cette technique était largement utilisée pour améliorer la visibilité d'un site web dans les résultats de recherche. Cette pratique est désormais surveillée par Google.
Optimisation mobile : Mobile Friendly / Mobilegeddon
La mise à jour "Mobile Friendly" de Google vise à améliorer la visibilité des pages adaptées aux mobiles dans les résultats de recherche.
Pour ce faire, Google analyse la façon dont une page web s'affiche sur un appareil mobile et attribue le label "Mobile Friendly" aux pages qui sont correctement optimisées. Les pages qui ne sont pas optimisées pour les appareils mobiles sont déclassées dans les résultats de recherche.
Cette mise à jour a été surnommée "Mobilegeddon" par la communauté des référenceurs.
Certificat de sécurité : Google HTTPS
La mise à jour HTTPS de Google vise à améliorer la visibilité des pages qui utilisent le protocole HTTPS dans les résultats de recherche.
Pour ce faire, Google donne un petit coup de pouce au classement aux pages qui utilisent le protocole HTTPS. Cette mise à jour a pour but d'encourager les webmasters à passer leurs sites Web au protocole HTTPS pour plus de sécurité.
Localisation : Possum
Cette mise à jour vise à améliorer la visibilité des résultats locaux dans les résultats de recherche.
Pour ce faire, Google prend en compte la localisation physique de l'utilisateur lors de l'affichage des résultats.
Cette mise à jour permet également aux entreprises ayant plusieurs sites d'apparaître plus souvent dans les résultats de recherche.
Des résultats coordonnés avec la localisation : Pigeon
La mise à jour Pigeon de Google vise à améliorer la compréhension des requêtes localisées des utilisateurs, et donc la pertinence des résultats de recherche.
Traitement du spam : Payday Loan
La mise à jour de Google Payday Loan s'inscrit dans le cadre de la lutte contre le spam dans les résultats de recherche.
Cette mise à jour vise les sites web qui utilisent des techniques agressives pour améliorer leur visibilité dans les résultats de recherche pour certains mots clés.
Système d'indexation : Caffeine
La mise à jour Caffeine de Google est un système d'indexation conçu pour améliorer la vitesse et la précision des résultats de recherche. Cette mise à jour permet à Google d'indexer davantage de pages web et de le faire plus rapidement.
Lutte contre les excès de publicité : Top Heavy
La mise à jour Google Top Heavy vise à amenuiser la visibilité des pages contenant trop de publicités dans les résultats de recherche. Pour ce faire, Google attribue un score plus faible aux pages contenant trop de publicités au-dessus du bas de l'écran (above the fold).
Cette mise à jour vise à encourager les webmasters à utiliser une quantité plus modérée de publicités sur leurs pages.
Lutte contre la violation des droits d'auteur et le téléchargement illégal : Pirate
La mise à jour Google Pirate vise les sites web qui proposent des téléchargements illégaux de matériel protégé par le droit d'auteur.
Pour ce faire, Google rétrograde la visibilité de ces sites dans les résultats de recherche.
Cette mise à jour vise à décourager les webmasters de proposer des téléchargements illégaux sur leur site.
Fred
Cette mise à jour vise les sites web qui utilisent des techniques de référencement clandestin, telles que le bourrage de mots clés et l'achat de liens. L'objectif de cette mise à jour est de réduire la visibilité de ces sites dans le moteur de recherche.
Google EAT
Cette mise à jour signifie "Expertise, Authoritativeness, and Trustworthiness".
L'objectif de cette core update Google EAT est d'améliorer la qualité des résultats de recherche en favorisant les sites web qui sont considérés comme des experts sur leur sujet. Elle met en avant l'importance des signaux web essentiels pour l'algorithme Google, et donc, pour le SEO.
YMYL
Cette mise à jour signifie "Your Money or Your Life" (votre argent ou votre vie).
L'objectif de cette mise à jour YMYL de Google est d'améliorer la qualité des résultats de recherche pour les requêtes qui pourraient avoir un impact sur la vie ou les finances des utilisateurs.
Pour ce faire, Google privilégie les sites web qu'il considère comme fiables et dignes de confiance. Cette mise à jour met donc l'accent sur les signaux E-A-T.
Cette core update vise les sites web dont le contenu est douteux ou dangereux pour la santé, tels que les vendeurs de médicaments, de produits de soin et de services financiers.
Conclusion -en route pour le module 2
Ceci conclut notre module 1 consacré au référencement et à l'algorithme de Google. Comme vous pouvez le constater, l'algorithme de Google a évolué constamment et continue de changer pour fournir aux utilisateurs les meilleurs résultats possibles.
Mieux comprendre le fonctionnement de l'algorithme Google permet de choisir sa stratégie SEO en connaissance de cause. Cela aide aussi à comprendre pourquoi les mises à jour Google semblent tant redoutées par les référenceurs.
Afin de garder une longueur d'avance, il est important de se tenir au courant des dernières mises à jour et tendances. Mais si vous avez misé sur une stratégie de référencement naturel pour votre SEO, vous ne subirez pas les mises à jour majeures de Google comme certains sites, qui jouent sur des points de règle restés flous.
Le module 2 abordera ensuite la structure du site web et ses optimisations, en commençant par expliquer le concept de jus de lien.