dmoz Qu’est-ce qu’une page canonique ? - Dmoz.fr | Actualité insolite
Aller au contenu

Qu’est-ce qu’une page canonique ?

Pour Google une page canonique correspond à la version préférée d’une ensemble de pages qui contient un contenu similaire.

Si nous prenons l’exemple d’un site commercial qui a plusieurs pages répertoriant la même gamme de produits, les utilisateurs pouvant choisir de trier les produits par ordre de prix ou par ordre alphabétique, Google ne pouvant indexer toutes les pages similaires, il serait conseillé dans ce cas de définir une page canonique, afin d'optimiser son référencement Internet. Par contre, si vous définissez aucune page canonique, Google le fera à votre place, mais rien n'indique qu'il fera le meilleur choix pour votre entreprise. Donc il est préférable d'indiquer à Google la meilleur page qui sera le mieux adaptée pour répondre aux besoins de l'internaute.

Les doublons (duplicate contents)

Détecter les doublons, c’est-à-dire les pages web à contenus identiques ou quasiment identiques fait partie des tâches d’un moteur de recherche. En effet, quand un internaute fait une recherche, il ne souhaite pas obtenir plusieurs fois le même résultat. Les moteurs de recherche se doivent donc de n’afficher qu’une seule fois un contenu dans les résultats. C'est pour cette raison qu'il est très important de définir une page canonique.

Différentes techniques existent pour mesurer la similarité de pages web. Dans le contexte de l’URL canonique, nous nous intéressons seulement au cas où la similarité est totale : si exactement le même contenu est détecté à plusieurs adresses différentes, un moteur de recherche comme Google l’affichera une seule fois en mentionnant seulement l’adresse qu’il considérera être l’URL canonique.

Exemple de doublons:

http://www.example.com/produit.php?item=poisson_suedois&trackingid=1234567&sort=alpha&sessionid=5678asfasdfasfd

Google sachant que ces pages présentent le même contenu, indexera qu’une seule version pour ses résultats de recherche.

Comment puis-je définir une URL canonique ?

Vous pouvez définir une URL canonique de deux manières :

Ajoutez un lien rel= »canonical » à la section <head> de la version non canonique de chaque page HTML.Pour spécifier un lien canonique vers la page http://www.example.com/produit.php?item=poisson_suedois, créez un élément<link> tel qu’illustré ci-dessous :
<link rel= »canonical » href= »http://www.example.com/produit.php?item=poisson_suedois »/>
Copiez ce lien dans la section <head> de toutes les versions non canoniques de la page, telles que http://www.example.com/produit.php?item=poisson_suedois&sort=prix.

Si vous publiez du contenu sur les deux pages http://www.example.com/product.php?item=swedish-fish et https://www.example.com/product.php?item=swedish-fish, vous pouvez définir la version canonique de la page. Créez l’élément<link> :

<link rel= »canonical » href= »http://www.example.com/produit.php?item=poisson_suedois »/>
Ajoutez ce lien dans la section <head> de la page .

Indiquez la version canonique d’une URL en répondant à l’aide de l’en-tête HTTP Link rel= »canonical » Le fait d’ajouter rel= »canonical » à la section head d’une page est utile pour du contenu HTML, mais pas pour des PDF et autrestypes de fichiers indexés par la Recherche sur le Web Google. Dans ces cas-là, vous pouvez indiquer une URL canonique en répondant à l’aide de l’en-tête HTTP Link rel= »canonical », comme suit (notez que pour utiliser cette option, vous devez pouvoir configurer votre serveur) :
Link: <http://www.example.com/téléchargements/fiche_technique.pdf>; rel= »canonical »
Pour le moment, Google n’accepte ces éléments d’en-tête « Link » que pour la Recherche sur le Web Google.

-