Le poids des balises pour le positionnement

Mais qu'elle est donc le poids attribué à un mot clé par Google lorsque celui-ci est inséré dans une balise, un attribut, voir directement l'url ? C'est bien une question qui revient tous les jours dans la bouche de nombreux webmasters et experts SEO. Pour trouver une réponse, le plus simple était donc de les tester toutes et c'est ce qui est fait depuis maintenant 3 ans via le Koxi'Lab.

Inutile de vous dire que, comme pour tout test SEO si rigoureux soit-il, il ne dégage pas la vérité ultime, seul Google connait son algorithme (et encore, parfois, j'ai des doutes...) mais des résultats pouvant être interprétés et des tendances dégagées.

Vous n'aurez pas ici l'intégralité de ceux-ci, mais une mise en lumière sur de nombreuses croyances qui sont à bannir définitivement de tout travail d'optimisation.


La mise en place du test

Pour mener à bien cette expérience, il a fallu, vous vous en doutez, réaliser ce test sous couvert d’anonymat total afin d'éviter tout risque de parasitage des résultats. Voici donc le déroulement du test.

  • Déterminer un mot clé inconnu de Google.
    Je ne le donnerais pas, vu que ce test continu.
  • Utiliser un nom de domaine neuf.
    Afin d'éviter, en cas de pénalisation, d'impliquer site.
  • Créer une page spécifique pour chaque balises et attributs testés.
    Chaque page est structurellement identique, contenant l'ensemble des éléments testés, un texte unique de forme et de taille identique.
  • Faire indexer l'ensemble des pages sans en favoriser une plus qu'une autre.

Une fois tout ce petit monde mis en ligne, un script maison, hébergé sur un serveur différent, parse les résultats de Google sur la requête du mot clé utilisé afin de trouver les pages qui ressortent et leur classement dans les SERPs.

Indexation des pages

Rien n'a été fait pour booster la prise en compte des 70 pages du test. Aucun sitemap n'a été envoyé via les GWT, seule une page liait l'ensemble des pages et un unique lien, caché sauf pour Google (merci le cloacking) permettait d'y accéder. Les premières pages apparurent dans les SERPs au bout de 21 jours. Elle concernait les balise h2, big et l'attribut alt de la balise img.

Si toutes les pages furent ensuite indexées par Google, toutes ne ressortaient pas dans les SERPs sur la requête concernant le mot clé mystère... Leur nombre fit le yo-yo durant les 2 premières années avec une moyenne comprise entre 46 et 56 pages. Depuis environ 12 mois, le nombre de pages ressortant que le mot clé choisi c'est stabilisée autour des 56.

Ok, ça vous fait une belle jambe, tout ça... Mais quelle sont donc les résultats ?

Les 5 balises ayant le plus de poids en SEO

Ah, ahhhh... Vous croyez tout de même pas que j'allais vous offrir tout sur un plateau. Eh non. Le résultat complet de ce test fera l'objet d'un article complet sur le site du Koxi'Lab... lorsque celui-ci sera ouvert. :-))

Le top 5 au 21 juin 2012 est le suivant :

  1. title
  2. h1
  3. URI
  4. u
  5. h3

Vous remarquerez qu'il n'y a pas de surprise pour les 2 premiers. Voilà des années que l'on dit que la balise title d'une page est extrêmement importante et que le titre de premier niveau H1 aussi.

Comme on pouvait s'y attendre avec les derniers test sur le poids des mots clés dans les URL, le nom du fichier arrive en 3e, ce qui confirme une fois de plus que GG a bien, depuis quelques mois mis plus de valeur sur l'url qu'il n'en faisait avant.

Vient en 4e position la balise u. Bon, ne vous jetez pas pour autant sur vos site pour changer toute vos optimisation strong en u. Celui-ci n'obtient ce rang que depuis 28 jours.

Et vous allez me dire... mais pourquoi une h3, elle est où la h2 ? Et je vous répondrais... Qu'est-ce que j'en sais moi ? En fait, elle arrive juste derrière, mais chute, on ne parle ici que des 5 premiers. ;-) Bref, la h2 et la H3 ne sont pas loin des pôles positions et démontrent bien leur relative importance.

Voilà, c'est juste pour vous informer de l’existence de ce test dont les résultats complets arriveront sous peu. Toujours est-il que je ne peux m’empêcher de vous parler des balises b et strong, si prisés des experts SEO en herbes.

Depuis que l'intégralité des pages ont été indexées par Google, la balise b n'a jamais été mieux classée que 20e alors que la la balise strong fut toujours derrière la 22e place. Et aussi étonnant que cela peut l'être, la balise b a presque toujours été mieux classée que sa concurrente, la strong. Eviter maintenant de vous prendre la tête avec ces balises pour tenter d'optimiser un mot clé pour Google.

Maj du 22/10/12

Petit retour sur le poids des balise avec une indication de taille si elle se confirme.

Fin septembre, Matt Cutts avait taper dans la fourmilière du monde SEO en pointant du doigt les EMD (Exact Match Domain), indiquant que, désormais, Google chercherait à minimiser l'influence de ceux-ci dans les positionnements des sites et de leurs pages. Après des années à avoir laissé libre court à la sur-optimisation des noms de domaines, Google envoyait enfin un message clair aux aficionados des ndd à mots clés. Déployé uniquement pour les anglophone et concernant selon les dires de Matt Cutts uniquement 0.6% des requêtes, il n'y a eu aucune communication à l'heure actuel de sont extension au reste des pays... Serait-ce pour bientôt ?

Depuis le 26 septembre, le classement du test de position des balises HTML est en pleine effervescence. Ca monte, ça descend, ça disparait, ça réapparait. Il semble donc que la version 20 de Panda change de manière importe la façon dont Google prend en compte les éléments HTML. Et Matt Cutts n'a semble t-il pas tout dit. Oui, les EMD seraient impactés au US, mais il semble que les URI le soit tout autant et cette fois pour le monde entier.

Depuis le 13 octobre, le classement concernant la page du test sur le poids du nom du fichier dans le référencement et le positionnement a drastiquement été chamboulé. La page a tout simplement disparue des résultats du test. En d'autre terme, elle ne ressort plus sur le mot clé ciblé.

Google aurait-il décidé de ne plus prendre en compte les mots clé dans les URI et là, c'est un gros pavé dans la marre qui vient de tomber.

Quoiqu'il en soit, GG à clairement modifier sa manière de prendre en compte les balises. Si l'URI disparait, les balise h2, p et, étonnamment, i gagnent des places pour intégrer le nouveau top 5.

Le top 5 au 22 octobre 2012 est donc le suivant :

  1. title (stable)
  2. h1 (stable)
  3. h2 (+3)
  4. p (+4)
  5. i (+11)

Avez-vous ressentie quelque chose de votre coté ?

Maj du 02/08/13

Le top 5 au 2 août 2013 est donc le suivant :

  1. title
  2. h1
  3. URI
  4. u
  5. h3

Retour au positionnement de juin 2012.


Vos avis

N'oubliez pas de noter l'article. ;-)

Message
Expéditeur et validation
J'ajouterais évidement un lien vers les résultats finaux dés que l'article sera réalisé. ;-)
Bonjour Rod,

Tout d'abord merci pour ce test (vivement les résultats définitifs ^^). Je suis surpris que sur ton test la balise u soit plus forte que la balise b, comme quoi il est bon de faire soit même ses tests quelques fois :)
Merci pour cet avant-goût :)

Le nom du fichier correspond à l'attribut alt ?

Amusant en effet de voir la balise H3 avant la H2 :)
Si je ne m'abuse, Google Panda jouait un rôle dans les noms de domaines et les noms de fichiers. Les mots-clés n'étaient censés plus avoir de poids (même si je maintenais tout de même ce travail d'optimisation), alors je trouve le résultat étonnant.

Le plus surprenant reste la balise <u> totalement obsolète qui fait plus que me choquer ici, tout comme un h3 présent semble-t-il devant un h2.

Bravo pour l'étude, mais j'avoue que je ne prendrais pas tout au pied de la lettre, malgré tout...
@Emmanuel
Non, le nom du fichier, c'est ... le nom du fichier dans l'url, genre www.exemple.com/nomfichier.html

@Mathieu C.
Pour ta remarque su Panda et les URL, il n'est pas admis que Panda supprime tout poids des URL.
Ici, le test exclue, évidement, toute sur-optimisation, empêchant certainement toute pénalité de ce type.
Pour la H2, elle est en 6e position depuis seulement quelques mois... Avant c'était le fond de l'abysse, comme quoi.
"Leur nombre fit le yo-yo durant les 2 premières années", waw faut de la persévérance pour un test de si longue durée ! ;)
Concernant l'histoire du b et strong, c'est étonnant !

Merci pour ce test, et vivement les résultats finaux ;)
Il serait intéressant de voir si le nom d'un fichier est vraiment important en rapport au titre de la page.
En gros, si le nom de la page en question ( ici poids-balise-seo-109.html ) peut à lui seul signifier à google un mot clé, ou alors, pas du tout.
Il est pas contre curieux de voir que la balise <b> ou <strong> n'a aucune importance, ou alors si peu.
Étonnant la balise <u> car coté ergonomie, le soulignement n'est-il pas plutôt réservé au liens ?
Et pour une emphase, il faudrait préférer <b> à <strong> ?
Et quid de <em> ?
@David
En effet, ce test ne montre qu'une tendance, un classement ordonné, il n'a pas pour vocation de donner des coefficients chiffrés du poids pris en compte par Google.

Si le nom du fichier arrive en p3, c'est que le mots clé est bien pris en compte et bien classé. Cela ne veut pas dire que sont poids soit énorme. GG pouvant attribuer un poids n à la balise title, mais un poids n/100 à la seconde, ici le h1...
Dés lors que penser des autres ? Négligeable ?

@Afi
Pour les autres balises, faudra attendre le résultat complet du test disponible dans... un temps prochain. ;-)
Merci pour ces infos Rod. J'ai plusieurs question sur la méthode :
- Comment sont construits les liens vers les pages : < a>Page</ a> ou < a>$URL</ a> ? Dans le second cas, la page testant le nom de fichier serait avantagée car elle aurait un BL optimisé.
- De même, comment s'assurer que le "jus" envoyé aux 70 pages est identique ? Ne serait-ce que l'ordre d'affichage des liens joue un rôle de ce point d evue là.
La question est en effet très bonne et mérite, il est vrai, une petite explication.

Il existait un unique fichier contenant un lien pour chaque page (un genre de plan, de site)
On pourrait se dire alors que la page x dont le keyword et dans l'url pourrait, à défaut des autres, recevoir un petit bonus en "jus".
En fait, je ne pense pas que cela soit réellement flagrant en terme de bonus pour le positionnement, pour 3 raisons.
  1. L'unique page liant toutes les pages du texte n'a aucun popularité, et donc, dans l'absolu, aucun "jus" à envoyer.

  2. Lors d'un autre test sur le poids des liens, j'ai mis en évidence qu'une ancre ne permet peut-être plus de bonifier la page réceptrice. Tout du moins, en interne.
    Une petite révolution dans le sculpting interne des url.

  3. Le "plan de site" n'a existé que le temps pour GG de découvrir chaque page. Il a ensuite été supprimé, Il n'y a donc plus d'envoi de jus.


Pour ta seconde remarque, même réponse que mon petit 3. Plus de page "plan de site", donc, pas de raison ne bonifier l'une ou l'autre par rapport à un possible classement.
Merci pour ces réponses. Bien vu pour la méthode. Les résultats et surtout l'évolution des résultats me paraît donc vraiment intéressant à suivre :)
Sympa comme test ! J'ai hâte de voir les résultats définitifs ;)
C'est normal que la balise u soit aussi bien placée. u = underline (soulignement) et c est un critère de google pour accentuer le poids des liens et des mots importants.

il ne faut pas utiliser la balise b, même si elle est mieux classée, et ce pour des raisons d'accèssibilité. La balise strong met un emphase quand la page est lue avec un lecteur d'ecran, ce qui n est pas le cas de la balise b qui est une balise de présentation.

Quand au titre h3, c est du au fait que beaucoup de sites sont construits avec des CMS. Les titres des modules (donc des differentes zones du site) sont par défaut, dans des balises h3 et non h2.C est ce qui doit faire que labalise H3 as un poids supérieur à la balise h2.
Pas mal ce test qui est en plus réalisé sur le long terme ! Je suis aussi pressé de voir les résultats définitif.
J'attends les résultats complets avec impatience.

Aurais tu une date approximative de la publication complète des résultats ?

Pour la h3, je suis assez surpris qu'elle est plus de poids que la h2. Vais je devoir changer toutes mes H2 ? ^^

Je ferais un tests sur ces balises quand j'aurais le temps :)
Merci pour ce petit retour sur test :

Je viens de faire un petit test sur 23 balises. J'ai créé 23 pages toutes nommées pareils. Sur le site j'ai une structure de type : page d'accueil -> renvoi vers page listant les 23 autres pages avec dans l'ancre du lien le mot clé visé. Chacune des pages contient un texte de 100 lignes. Dans ce texte j'ai varié les balises encadrant mon mot clé. Après une semaine de mise en ligne voici les résultats "étonnants" :

balises -> positions :

  1. h2 -> 1

  2. mark -> 2

  3. h1 -> 3 avec erreur xhtml

  4. h1 -> 4 sans erreur xhtml

  5. li -> 5

  6. cite -> 6

  7. dt -> 7

  8. em -> 8

  9. h5 -> 9

  10. a -> 10 pointe sur sa propre page sans balise -> 11



les autres pages ne sont pas encore indéxées.

début du test : 27 juin
fin : inconnu

chaque page reçoit le même jus

qu'en pensez vous ?
Merci pour votre test qui dure. Serait il possible de voir les evolutions sur un tableau (ou graphique) afin de comprendre (peut etre) un peut plus les mises à jour de google ?
@Olier
Je dirais que le test est trop jeune pour apporter une réponse intéressante.
Il faut patienter pour que l'ensemble des pages du test soient indexé et que l'on trouve un minimum de stabilité.

Toujours est-il que deux valent mieux qu'un.

@Bluemoon
Cet article n'est qu'une présentation du test et de quelques résultats.
L'intégralité du test et de ses résultats sera mis en ligne ultérieurement sur un site dédié à ces expériences SEO.
Bravo pour la patience d'avoir mis en place un tel test... Le problème je trouve c'est de trouver un équilibre entre "stabilisation des résultats" et "le dernier filtre qui est sorti entre temps"...

A l'époque où je faisais de la chimie, on utilisait des matrices dans les expériences pour déterminer le poids des différents facteurs dans une réaction. Utilises-tu ce type de calcul pour établir l'influence des différents facteurs dans l'algorithme?
Et la balise strong (b) ?
Je suis un peu perplexe sur le poids de la balise <u>. De plus, elle peut engendrer de la confusion : en général ce sont les liens qui sont soulignés. Lors des mises à jours de l'algorithme, ne devrait-on pas s'attendre à des pénalités sur ce type de balise ?
Le test est sympa :)
Bon, ca me chamboule un peu tout cette histoire d'url qui ne serait plus pris (ou moins) en compte. Ca veut dire que l'url rewriting serait moins optimal qu'avant ?

Ca fait quelques jours que mon site ressent un faible baisse, c'est peut etre a cause de ca...
Ce qu'il faut savoir c'est que GG augmente régulièrement les facteurs qui permettent de positionner un site, et donc, obligatoirement, certains "ancêtres" voient leur "poids" diminuer.
Ajoute à cela le fait que GG sait parfaitement indexer et positionner des URLs non rewriter et on voit donc que le "poids" des URLs dans le positionnement d'une page diminue.

Mais ce n'est pas pour cela qu'il faut oublier l'url rewriting.
C'est toujours un plus pour le référencement et le confort de l'internaute.