Wikipedia passe tous ses liens externes en nofollow
Afin de lutter contre le spam, Wikipedia vient d’ajouter l’attribut rel="nofollow" sur tous ses liens externes. C’est du moins ce qu’annonce Google Blogoscoped, et un simple coup d’oeil sur une page de l’encyclopédie communautaire permet de s’en assurer.
rel=”nofollow” ?
La croissance des blogs depuis 2002 a entraîné une nouvelle pratique dont nombre d’entre vous ont certainement été victimes : le spam de commentaires. Des robots viennent déposer un commentaire contenant des mots clés précis et pointant vers leur URL sur votre blog afin de faire monter leur page rank Google.
La situation est très rapidement devenue incontrôlable, et les causes en sont multiples :
- Le peu d’outils de blogging différents, qui permet de créer peu de versions des scripts de spam.
- La quantité de blogs et de wiki sur lesquels il est possible de publier des commentaires et des pages sans authentification (et même avec, ça ne change pas grand chose, particulièrement sur les wiki).
- L’absence – à l’époque – de solutions de lutte contre le spam efficaces.
Il a donc fallu rapidement trouver une solution, sous peine de voir tout le système du pagerank s’écrouler sur lui-même. C’est le microformat rel="nofollow". La présence de l’attribut “nofollow” dans un lien indique aux outils de recherche que ceux-ci ne doivent en aucun cas suivre le lien donné dans leur récolte. Ce lien externe n’est dont pas pris en compte dans l’indexation de la cible, et les spammeurs en sont pour leurs frais.
La mort du page rank ?
Le pagerank d’un site se base non seulement sur la quantité de liens externes pointant vers lui, mais également sur le pagerank des pages liant ce site. Il y a donc un certain principe de réciprocité : un site fortement lié agira fortement sur le pagerank des sites qu’il met en lien.
En appliquant l’attribut rel="nofollow", Wikipedia vient de casser ce principe de manière inquiétante : l’encyclopédie en ligne possède en effet un très fort pagerank, et chacune de ses pages (23 millions selon Google) est également très bien cotée au point d’apparaître dans les 10 premiers résultats d’à peu près n’importe quelle recherche sensée (je précise pour les petits plaisantins qui chercheraient des choses absurdes ou n’existant pas dans le seul but de me contredire). Elle récupère donc tout le bénéfice de ses liens entrants, sans toutefois rendre la pareille à ceux qui la lient. Et vue l’importance du site, on est en droits de craindre
- Que ce genre de pratique devienne systématique sur toutes les grosses publications.
- Que le page rank finisse par perdre complètement sa valeur suite à la sortie de la boucle des sites les mieux cotés.
Les Microformats, plus ça va, moins j'y crois
Je ne croyais pas l’écrire un jour, et c’est un peu triste à admettre, mais plus ça va, et moins j’ai foi dans le futur des Microformats.
Designed for humans first and machines second
Certainement vraie il y a un an, cette assertion fondamentale se contredit constamment aujourd’hui. Les Microformats sont de moins en moins faciles à lire par l’être humain, et la présence de générateurs de Microformats à tous les étages en est un indice plus que probant de cette complexification.
microformats are a set of simple, open data formats
Je ne conteste pas cette notion d’ouverture, au contraire. Pour la simplicité, c’est autre chose, et je réfère désormais constamment au wiki pour inclure des microformats sortant du peloton hcard / hcalendar / rel-tag dans une page web.
built upon existing and widely adopted standards
Là non plus, rien à dire, dès lors que l’on considère le XHTML comme un standard de fait, et non de principe, c’est à dire qu’il est véritablement adopté par la majorité et non simplement standard déclaré.
Le problème des Microformats est un problème de croissance, à tous les niveaux.
Les Microformats ont été créés dans le but de résoudre des problèmes simples de manière simple. La communauté grandissant, chacun apportait un problème de plus en plus complexe à résoudre, oubliant ce principe de base.
Lors d’une présentation chez Mandriva, je déclarais que malgré sa dénomination de Microformat, hResume était en fait un Macroformat : bien que l’on puisse le déclarer seul, il n’existe que par la présence d’autres microformats en son sein. On se retrouve alors avec un Microformat contenu dans une page entière, et à la clé une soupe de balises infâme, même pour moi. D’après vous, pourquoi je n’ai toujours pas remis mon CV version web à jour ?
Il ne faut cependant pas oublier l’objectif premier des Microformats : faciliter la collecte de données sémantiques sur le web à des fins d’exploitation – entre autres – marketing, principalement sur des media comme la musique, les images ou les vidéos sur lesquels les outils de recherche ne peuvent pas faire d’analyse. En cela, ils ont permis une avancée très intéressante, mais je crois qu’ils ont très largement dépassé leur propre nature, et ils risquent aujourd’hui d’imploser sous leur propre poids. Je ne cesse nullement de m’intéresser aux Microformats, mais je ne les considère cependant plus comme la panacée universelle : je vais simplement me pencher sur d’autres pistes de recherche afin de résoudre mes problématiques plus complexes.
Microformats et réseaux sociaux au septième Barcamp Paris
Je rentre juste du septième Barcamp Paris, qui se tenait dans les gigantesques locaux de Google à deux pas de l’Opéra. Ambiance Google oblige, nous avons pu profiter de leur frigo, du fauteuil massant et des poufs Google.
Au programme, un atelier de présentation des possibilités de l’API Google Map, co animé par son auteur. Au bout du compte reste une grande question : et après, on fait quoi ? Un Pacman sur Google Map ?

Ah non, en fait, ça existe déjà.
J’ai ensuite animé une session sur les Microformats axée sur leur utilisation dans le cadre de l’ajout de valeur aux données issues des réseaux sociaux, particulièrement dans le domaine professionnel. Les slides sont disponibles sous forme de présentation S5 publiée sous Créative Commons.
Et les photos de la journée se trouvent sur mon compte Flickr.
Review Me, chasseur de blogs pour publicitaires pressés
Text Links Ads, la régie publicitaire à laquelle j’ai confié ce site vient de lancer Review Me, une régie publicitaire dédiée aux blogs.
Le principe est simple. Des annonceurs contactent des blogueurs inscrits sur le site et leur proposent de réaliser un billet sur leur produit. Si le blogueur accepte, il a 48 heures pour pondre son article et la régie le rémunère de la somme convenue à l’avance.
Le concept n’a rien de bien nouveau, et devrait faire hurler nombre de journalistes qui reprochent aux blogueurs de ne pas être soumis au même code de déontologie qu’eux. On peut le voir comme quelque chose de profondément malhonnête et injuste, en argumentant que seuls les blogueurs influents profiteront de ce système sans jamais l’admettre. Sauf que… la politique maison stipule bien que :
You must disclose that the post is a paid post in some way. Here are some ideas: “Sponsored Post:”, “The following is a paid review:” “Advertisement:”.
Ce billet est d’ailleurs sponsorisé par… Reviewme.
Je pense surtout que cela va permettre à des blogueurs qui ont su fédérer une forte audience de se voir récompensés de leurs efforts honnêtement et sans avoir à couvrir leur site de disgracieuses bannières. Sans compter que cela pourrait bien booster quelque peu hreview.
Et puisqu’on parle de Microformats, je vous rappelle que je parlerai demain de l’utilisation des microformats pour augmenter la valeur des données publiées sur les réseaux sociaux au septième Barcamp Paris.
O'Reilly édite le premier livre sur les Microformats
O Reilly a publié hier Using Microformats, dans la collection O’Reilly Shortcuts. Écrit par Brian Suda, il fait 56 pages, et son acquisition vous coûtera 9.99$.
Microformats et publication de CV au Barcamp Paris 4
Jamais deux sans trois, je présentais donc les Microformats pour la troisième fois d’affilée au mini Barcamp qui avait lieu ce samedi dans les locaux de Mandriva, au 43 rue d’Aboukir dans le second arrondissement de Paris (lecteur, un Microformat se cache dans cette phrase, sauras tu le retrouver ?)
Head, un éditeur de Microformats pour Flock
Flock, un fork de Firefox qui se présente à juste titre comme le premier navigateur social ne prends pas encore nativement en charge les Microformats.
BarCamp Paris 4 samedi 16 septembre
Comme annoncé un peu plus tôt, je serai bien au quatrième BarCamp Paris qui se tiendra samedi 16 septembre à partir de 14 heures dans les locaux de Mandriva au 43 rue d’Aboukir, dans le deuxième arrondissement de Paris.
Questions / réponses sur les Microformats
Entre mon intervention hier à la troisième édition du BarCamp Paris et ce matin sur le canal de discussion #openweb, j’ai du répondre un certain nombre de questions à propos des Microformats. Je les ai rassemblées ici, et elles tiendront lieu de compte-rendu de l’atelier Microformats.
BarCamp Paris 3
J’étais hier au troisième BarCamp à Paris, dans le cadre plus important du BarCamp Earth, une initiative lancée à l’occasion du premier anniversaire du BarCamp. Nous y avons gaiement devisé Microformats, coworking, Crowdsourcing et financement des projets libres et open source.








Passionné d'informatique depuis l'âge de six ans, je travaille en tant que responsable qualité chez blueKiwi Software, éditeur spécialiste des outils collaboratifs en entreprise. Ma double formation en sciences politiques et en informatique me permet de porter un regard particulier sur les problématiques abordées par mon poste.