Make this article seo compatible,Let there be subheadings for the article, be in french, create at least 700 words
Dans une vidéo de Google Search Central, Gary Illyes de Google a expliqué une partie de l’indexation de pages Web qui implique la sélection de canoniques, expliquant ce qu’un canonique signifie pour Google, une explication miniature des signaux de page Web, il mentionne la pièce maîtresse d’une page et explique ce qu’elle fait avec les doublons qui implique une nouvelle façon de les penser.
Qu’est-ce qu’une page Web canonique ?
Il existe plusieurs façons de considérer ce que signifie canonique, le point de vue de l’éditeur et du référencement de notre côté du champ de recherche et ce que signifie canonique du côté de Google.
Les éditeurs identifient ce qu’ils considèrent comme la page Web « originale » et la conception des référenceurs canoniques consiste à choisir la version « la plus solide » d’une page Web à des fins de classement.
La canonisation pour Google est une chose totalement différente de ce que pensent les éditeurs et les référenceurs, il est donc bon de l’entendre de la part d’un Googleur comme Gary Illyes.
La documentation officielle de Google sur la canonisation utilise le mot déduplication pour faire référence au processus de choix d’une canonique et répertorie cinq raisons typiques pour lesquelles un site peut avoir des pages en double.
Cinq raisons pour les pages en double
- « Variantes de région : par exemple, un contenu pour les États-Unis et le Royaume-Uni, accessible depuis des URL différentes, mais essentiellement le même contenu dans la même langue.
- Variantes d’appareil : par exemple, une page avec à la fois une version mobile et une version de bureau
- Variantes de protocole : par exemple, les versions HTTP et HTTPS d’un site
- Fonctions du site : par exemple, les résultats des fonctions de tri et de filtrage d’une page de catégorie
- Variantes accidentelles : par exemple, la version démo du site est accidentellement laissée accessible aux robots”
Les canoniques peuvent être considérées de trois manières différentes et il existe au moins cinq raisons pour lesquelles les pages sont en double.
Gary décrit une autre façon de penser aux canoniques.
Les signaux sont utilisés pour choisir les canoniques
Ilyes partage une autre définition d’un canonique, cette fois du point de vue de l’indexation, et parle des signaux utilisés pour sélectionner les canoniques.
Gary explique :
« Google détermine si la page est un doublon d’une autre page déjà connue et quelle version doit être conservée dans l’index, la version canonique.
Mais dans ce contexte, la version canonique est la page d’un groupe de pages en double qui représente le mieux le groupe en fonction des signaux que nous avons collectés sur chaque version.
Gary s’arrête pour expliquer le clustering en double, puis revient à parler des signaux peu de temps après.
Il a continué:
« Pour la plupart, seules les pages canoniques apparaissent dans les résultats de recherche. Mais comment savoir quelle page est canonique ?
Ainsi, une fois que Google aura le contenu de votre page, ou plus précisément le contenu principal ou la pièce maîtresse d’une page, il le regroupera avec une ou plusieurs pages présentant un contenu similaire, le cas échéant. Il s’agit d’un clustering en double.
Je veux juste m’arrêter ici pour noter que Gary fait référence au contenu principal comme à la « pièce maîtresse d’une page », ce qui est intéressant car il existe un concept introduit par Martin Splitt de Google appelé l’annotation centrale. Il n’a pas vraiment expliqué ce qu’est l’annotation de la pièce maîtresse, mais ce morceau partagé par Gary est utile.
Ce qui suit est la partie de la vidéo dans laquelle Gary parle de ce que sont réellement les signaux.
Illyes explique ce que sont les « signaux » :
« Ensuite, il compare une poignée de signaux qu’il a déjà calculés pour chaque page afin de sélectionner une version canonique.
Les signaux sont des informations que le moteur de recherche collecte sur les pages et les sites Web et qui sont utilisées pour un traitement ultérieur.
Certains signaux sont très simples, comme les annotations HTML du propriétaire du site comme rel= »canonical », tandis que d’autres, comme l’importance d’une page individuelle sur Internet, sont moins simples.
Les clusters en double ont un canonique
Gary explique ensuite qu’une page est choisie pour représenter le canonique pour chaque groupe de pages en double dans les résultats de recherche. Chaque groupe de doublons a un canonique.
Il continue:
« Chacun des clusters en double aura une seule version du contenu sélectionné comme canonique.
Cette version représentera le contenu dans les résultats de recherche pour toutes les autres versions.
Les autres versions du cluster deviennent des versions alternatives qui peuvent être servies dans différents contextes, par exemple si l’utilisateur recherche une page très spécifique du cluster.
Versions alternatives de pages Web
Cette dernière partie est vraiment intéressante et il est important de la prendre en compte car elle peut être utile pour pouvoir classer plusieurs variantes d’un mot-clé, en particulier pour les pages Web de commerce électronique.
Parfois, le système de gestion de contenu (CMS) crée des pages Web en double pour tenir compte des variations d’un produit, telles que la taille ou la couleur d’un produit, ce qui peut alors avoir un impact sur la description. Ces variantes peuvent être choisies par Google pour être classées dans les résultats de recherche lorsque cette page de variante correspond plus étroitement à une requête de recherche.
Il est important d’y penser car il pourrait être tentant de rediriger les pages Web des variantes noindex pour les maintenir en dehors de l’index de recherche par crainte du problème (inexistant) de cannibalisation des mots clés. L’ajout d’un noindex aux pages qui sont des variantes d’une page peut se retourner contre vous, car il existe des scénarios dans lesquels ces pages variantes sont les meilleures à classer pour une requête de recherche plus nuancée contenant des couleurs, des tailles ou des numéros de version différents de ceux de la page canonique.
Principaux points à retenir sur les canoniques (et plus) à retenir
Il y a beaucoup d’informations contenues dans la discussion de Gary sur les canoniques, y compris quelques sujets secondaires sur le contenu principal.
Voici sept points à retenir :
- Le contenu principal est appelé la pièce maîtresse
- Google calcule une « poignée de signaux » pour chaque page découverte.
- Les signaux sont des données qui sont utilisées pour un « traitement ultérieur » après la découverte de pages Web.
- Certains signaux sont sous le contrôle de l’éditeur, comme les indices (et vraisemblablement les directives). L’indice mentionné par Illyes est l’attribut de lien rel=canonical.
- D’autres signaux échappent au contrôle de l’éditeur, comme l’importance de la page dans le contexte d’Internet.
- Certaines pages en double peuvent servir de versions alternatives
- Les versions alternatives des pages Web peuvent toujours être classées et sont utiles à Google (et à l’éditeur) à des fins de classement.
Regardez l’épisode de Search Central sur l’indexation :
Comment la recherche Google indexe les pages
Image sélectionnée de la vidéo Google/modifiée par l’auteur