françois palaci
ergonome

Un billet de la rubrique « Tendances » de mon ancien blog

Sauter le menu secondaire
accueilblogalternatives électroniques › google, spam et sémantique

Google, spam et sémantique

Si vous ne suivez pas les blogs de Sébastien Billard, Olivier Duffez, Laurent Jouanneau ou encore Molly E. Holzschlag, vous êtes tout de même certainement au courant de l'annonce faite par Google il y a deux jours : les liens dont la balise <a> contiennent l'attribut rel="nofollow" n'auront aucun impact positif sur le positionnement des pages vers lesquelles ils pointent.

Une bonne partie de la blogosphère a relayé l'information et s'interroge sur l'efficacité réelle de la méthode pour lutter contre le spam dont sont victimes certains blogs ; les discussions vont bon train sur les forums dédiés au référencement, comme WebRankInfo.

Je ne suis pas sûr qu'une telle utilisation de l'attribut rel soit tout à fait correcte sur le plan de la sémantique HTML. En effet, la définition de l'attribut rel dans l'élément a des spécifications HTML 4.01 du W3C indique que cet attribut décrit la relation partant du document courant vers l'ancre spécifiée par l'attribut href. L'idée est de fournir une information supplémentaire : la relation qui relie le document de destination au document d'origine du lien. En indiquant rel="nofollow", il me semble qu'on va dans la direction opposée : on casse la relation de sens entre les deux documents liés. S'il y a des maniaques de la sémantique dans mes lecteurs, je serais curieux de connaître leur point de vue sur la question.

Bref, je suis assez d'accord avec Laurent qui titre ce matin un billet On vit une époque formidable et le signe par :

Google va convaincre la blogosphère d'adapter ses liens de manière à lui éviter d'avoir à les prendre en compte.

Reste à voir la réaction des spammers...

Commentaires

1. Le 20 janvier 2005, 11:41 par Gromka

Sans être un maníaque de la sémantique je crois que si le "rel" il exprime les relations entre des documents, il n'a pas sens définir une relation de non-relation. Je ne sais pas si je m'explique...

Une non-relation est égale à un no-lien

2. Le 20 janvier 2005, 12:18 par François Palaci

Bonjour Gromka,

Je ne suis pas sûr de bien te comprendre. As-tu voulu dire qu'écrire rel="nofollow" revient à indiquer une relation de non-relation ?

Si c'est bien ça je partage ton avis. Sinon, je t'invite à lire la réponse que j'ai faite il y a quelques minutes sur le blog de Sébastien.

3. Le 20 janvier 2005, 12:26 par sebastien billard

Une relation négative (nofollow) reste une relation, puisque on se positionne par rapport à la source liée. Une non relation ne serait elle pas plutot comme l'évoque gromka l'absence de lien ?

4. Le 20 janvier 2005, 13:13 par François Palaci

Je sens que ça va tourner au dialogue de sourd LOL

C'est moi qui ne suis pas assez clair. Dès qu'il y a lien, que l'attribut rel soit utilisé ou non, il y a une relation d'établie entre deux ressources. C'est une évidence. Mais cette relation ne nous indique rien sur sa nature...

Maintenant revenons à l'attribut "rel". Pour essayer de mieux me faire comprendre, prenons une valeur assez commune pour cet attribut. Sur ce site, j'utilise par exemple dans l'en-tête des pages <link rel="author" href="http://palaci.fr/francois" />. Le fait qu'il s'agisse de la balise <link> est sans incidence puisque les types de lien sont les mêmes que pour la balise <a>.

  • Dans le cas du rel="author", la relation est claire : je suis sur une page et le lien mène vers une page qui traite de l'auteur ;
  • dans le cas du rel="alternate", je suis sur une page et le lien mène vers une version alternative de cette page ;
  • dans le cas du rel="copyright", je suis sur une page et le lien mène vers la page traitant des droits de copie ;
  • mais dans le cas d'un rel="nofollow", je suis sur une page et le lien mène... où ???

Si la réponse est : "vers une page sans aucune relation", j'aurais plutôt vu un rel=""...

Voilà, j'espère que je vais réussir à me faire comprendre. Ce n'est pas gagné mais je ne peux pas faire mieux...

5. Le 20 janvier 2005, 14:38 par sebastien billard

La signification serait je pense "je suis sur une page et le lien mène vers une page du commentateur que je ne cautionne pas", Google assimilant des liens à des votes. Un vote blanc en quelques sorte.

6. Le 20 janvier 2005, 17:59 par François Palaci

Oui... Je vois l'idée.

Il y a quand même plus de chemin à faire pour aller de nofollow à "commentateur que je ne cautionne pas" que de copyright à "droits de copie". Je dirais même que sans connaître à priori la signification de ce rel="nofollow", il doit être bien difficile de la deviner...

Sur ce, je vais aller jeter un nouveau coup d'œil sur Blog & Blues où les échanges ont l'air animés.

7. Le 20 janvier 2005, 18:03 par Laurent Denis

En cela (la définition donnée par Sébastien dans le commentaire ci-dessus) , ce n'est pas idiot. Sauf que personne, à part Google, n'a jamais dit que la présence d'un lien dans un document Web était en soit un jugement sur la valeur de la ressource visée. Je n'ai aucun moyen de citer une ressource pour dire "à ce sujet, c'est hors-sujet", ou "à ce sujet, c'est très pertinent", ou "ça se rapporte formellement à ce sujet, sans plus".

S'il faut introduire ce type de méta-données :
- est-ce à google de l'imposer ?
- blanc (follow) ou noir (no follow), est-ce la solution la plus appropriée ? Ne peut-on définir une échelle plus pertinente ?

8. Le 20 janvier 2005, 18:43 par François Palaci

Je me demande aussi quel intérêt il peut y avoir à citer une ressource pour dire "à ce sujet, c'est hors sujet". Si c'est hors sujet, pourquoi citer la ressource ? Et pourquoi cette ressource en particulier et pas une autre, tout aussi hors sujet ?

Dans le cas des commentaires qui présentent un caractère de spam, est-ce qu'il n'est pas plus correct (et plus agréable, en définitive, pour le lecteur) de les supprimer purement et simplement ?

L'idée d'introduire des métadonnées pour indiquer le degré de pertinence d'une ressource liée me plaît bien. Mais pour que ce soit intéressant, il faut que le vocabulaire soit universel (donc pas imposé par Google) et suffisamment riche (donc plus évolué que le couple manichéen "follow/nofollow").

9. Le 21 janvier 2005, 18:29 par Gromka

Je partage ton avis, François

ps: je dois répéter les nouvelles expressions en français que j'apprends ;)

10. Le 23 janvier 2005, 09:33 par Laurent Denis

A la réflexion, il me semble que Google et ses partenaires auraient dû, pour réosudre un problème aussi spécique que le besoin des moteurs de recherche de se débarasser de l'indexation de liens ne répondant pas à leur modèle, recourir à un moyen aux conséquences et aux enjeux beaucoup moins "lourds".

Dans quelle mesure une class="no_page-ranck" ou une class="untrusted" n'aurait-elle pas été plus appropriée ?

11. Le 23 janvier 2005, 12:45 par yanhl

les classes définissent l'apparence du site, pas le contenu au sens "document" (je manque de vocabulaire pour être précis).
il aurait de toute façon été nécessaire de modifier le code HTML pour ajouter cette note destinée aux moteurs, donc l'impact pour les webmestres et équivalent.

12. Le 26 janvier 2005, 10:53 par Sky

nofollow = n'importe quoi.
C'est une solution de facilité imaginer par les moteurs, et, j'ai en lus l'iumpression que ca va ce retourner contre eux mais bon. Comme dit olivier dufez, google base son algo sur les BL non? Logique, ou est la logique de tout ça? Puis, c'est au webmaster de faire le ménage je crois moi.

La discussion continue ailleurs

1. Le 20 janvier 2005, 11:04 par Referencement, Design et Cie

nofollow et standards

Suite au billet de Francois Palaci sur la validité sémantique de l'attribut nofollow (voir mon autre post sur le sujet) je suis allé jeter un oeil sur les spécifications HTML qui précisent à propos de l'attribut "rel" : "Authors may wish to...

2. Le 20 janvier 2005, 11:32 par Mercredi

Rel = nofollow

Les liens dotés de l'attribut nofollow ne seront plus suivis par Google.

3. Le 21 janvier 2005, 03:37 par ZERO SECONDE - Carnet de note de Martin Lessard

No Follow

Ce que je remarque c'est que rel=nofollow deviendra de facto un moyen de pointer sans approuver ce que l'on pointe. [...]

4. Le 22 janvier 2005, 16:06 par ThaNerd

Spam-Bots : les moteurs réagissent

Voici l'article le plus long que j'aie jamais posté dans ce blog. Trois des moteurs de recherche les plus importants, Yahoo, MSN et Google se sont mis d'accord pour établir une technique pour éviter le spam de commentaires et le spam de référants. Les ...

5. Le 1 février 2005, 14:22 par Alternatives Electroniques

Spam dans les trackbacks

Je ne sais pas si le phénomène est à relier aux récentes mesures prises par Google et consorts pour lutter contre le spam dans les commentaires des blogs mais mon journal web est victime depuis ce matin d'une série de trackbacks...

Informations sur ce billet

Pour me contacter

+ 33 (0)6 87 04 27 66 ou par mail

mentions légales | accessibilité | plan du site