Pourquoi Google n'indexera plus vos flux RSS
Fêtes de fin d’année ou anglophobie rampante obligent, l’annonce par Google du retrait des flux RSS de son index principal n’a pas fait beaucoup de bruit dans la blogosphère francophone. Elle ne manque pourtant pas d’importance, et sans un malheureux effet collatéral, je serais d’accord à 100% avec les raisons invoquées par Bogdan Stănescu.
Les flux RSS déprécient l’expérience utilisateur
Les flux RSS ne sont pas faits pour être vus du grand public, et en tout cas pas d’un navigateur. Au risque de détruire bien des illusions, le RSS ne sera jamais un outil grand public, parce que l’agrégation est avant tout un outil de veille, et que la veille est une activité principalement professionnelle.
Quand j’effectue une recherche, je m’attends avant tout à trouver une informations, mais pas n’importe comment. Je m’attends à un minimum de mise en forme que l’on ne trouve pas dans les flux XML, ou en tout cas très rarement. Parmi les manques principaux, citons l’absence de navigation, mais également d’identité. Le flux RSS délivre une information brute adaptée au traitement logiciel, le web une information mise en forme et adaptée au visiteur.
Les flux RSS augmentent les chances de trouver des contenus redondants
Là aussi, c’est tout à fait vrai. Les outils de publication ont tendance à créer des flux pour absolument tout et n’importe quoi. Catégories, billets avec commentaires, archives, flux principal, tags, flux datés… il m’est difficile d’établir là une liste exhaustive. Le risque de se retrouver avec du contenu dupliqué est particulièrement important, et pénalisant aussi bien pour les éditeurs au niveau des outils de recherche que pour les visiteurs qui tombent parfois plusieurs fois sur un même contenu pour une recherche donnée. Le phénomène se produit d’ailleurs également avec l’archivage des listes de discussion. Et pour les éditeurs, il est particulièrement difficile de réaliser qu’on a du contenu dupliqué dans tous les sens, et de s’en débarrasser sans recourir à des méthodes expéditives comme des noindex sur des parties entières du site. J’en ai fait l’expérience, et j’en bave encore pour m’en sortir totalement.
Malheureusement…
Malheureusement, nombreux sont les flux survivant à des sites ayant fermé depuis longtemps et proposant des users stories particulièrement pratiques pour se dépêtrer d’une situation inextricable. Bogdan Stănescu en a d’ailleurs bien conscience, lorsqu’il dit
We’re aware that there are a few non-podcast feeds out there with no associated HTML pages, and thus removing these feeds for now from the search results might be less than ideal.
La raison a cela est simple : nombreux sont les blogs ayant délégué la gestion de leur flux à un tiers – souvent Feedburner – et le flux publié survit donc à l’original, ce qui est souvent bien pratique quand on cherche quelque-chose de particulier. Cela a été mon cas à de nombreuses reprises, et, bien qu’ils soient toujours disponibles via iGoogle ou Google Reader, j’avoue que la disparition des flux de l’index principal de Google va créer un vrai manque dans la recherche d’informations techniques.

Commentaires
Trackbacks
Les trackbacks sont fermés pour cause de spam.

Passionné d'informatique depuis l'âge de six ans, je travaille en tant que responsable qualité chez blueKiwi Software, éditeur spécialiste des outils collaboratifs en entreprise. Ma double formation en sciences politiques et en informatique me permet de porter un regard particulier sur les problématiques abordées par mon poste.
bruno bichet about 7 hours later:
Personnellement je ne suis jamais tombé sur un flux rss en effectuant une recherche sur Google. Comme je ne pense pas être le seul dans ce cas, il n’y a rien d’étonnant à ce que personne n’en parle dans la blogosphère francophone.
Ton billet est intéressant, mais la vérité est sûrement ailleurs ^^
La veille n’est pas uniquement à vocation professionnelle, il y a tous les passionnés qui peuvent y trouver un intérêt.