La persistance des URLs est encore un sujet d’actualité

février 8th, 2010 · 5 Comments ·

Guardian

Le Guardian fait partie de ces journaux qui ont fait le parie de ne pas seulement suivre les tendances mais d’innover. Martin Belam, “information architect”, déclarait dernièrement que le Guardian participait activement à la diffusion de ses données à travers le web. Création d’APIs, publications dans le LinkedData, l’ouverture au web est totale. Je ne reviendrais pas sur les bénéfices de structurer et promouvoir ses données, mais je vous invite quand même à jeter un oeil aux applications et mashups utilisant les données du Guardian.

Mais il y a un autre bénéfice qui m’avait échappé jusqu’à maintenant: la persistance des URLs. Intégrer le LinkedData et promouvoir ses données ne peut se faire  sans une politique rigoureuse de persistance des URLs. Ainsi si vous voulez garder la trace d’un article, d’une photo ou d’une vidéo, je vous invite à réfléchir sur la persistance de l’URL que vous allez sauvegarder dans vos marques-pages ou dans pearltrees. Le Guardian et le New York Times sont sans doute les plus engagés dans la persistance de leurs URLs, lemonde.fr beaucoup moins…

Quels sont pour vous les sites de confiance et ceux à éviter en ce qui concerne la persistance des URLs ?

Tags: Uncategorized


5 responses so far ↓

  • Hello Nicolas,
    Je ne pas certain de bien saisir tout le problème…

    Quand tu parles de lemonde.fr, les URLs sont toujours valables il me semble; ce n’est que l’accès public gratuit qui cesse au bout de x jours, non ?
    Ça renvoie vers la page d’abonnement/de login mais une fois identifié on retombe sur la bonne page.

    N’importe quel webmaster digne de ce nom s’assure de la persistance de ses URLs il me semble sinon il perd du trafic.

    Ça me paraît tellement naturel que j’ai l’impression d’être réellement à côté de la plaque :s

    À la limite je pourrais comprendre si l’on parlait d’URNs plutôt que d’URLs mais, encore une fois, ma très faible connaissance du sujet ne m’autorise qu’à te demander plus d’explications…

  • Salut Romain,

    Evidemment les URLs d’un site ne changent pas tous les jours mais quand tu regardes sur une période de temps plus long (genre 5 ans), tu te rends compte que beaucoup de sites ont perdu des URLs dans le passage d’une version à une autre.

    Le LinkedData crée au final un couplage plus important que les liens classiques que tu peux trouver aujourd’hui sur une page web. Si tu casses un lien, tu perds un peu de PageRank, ca se ratrape du PageRank. Par contre si tu casses des URLs dans le LinkedData tu empêches la syncro d’autres services, voir même provoquer leur indisponibilité.

    En donnant plus d’importances aux liens (dans un web de données liées), on s’assure de leur perennitée.

    Pour lemonde.fr, en plus des articles qui deviennent payant j’avais croisé des URLs qui n’étaient plus valide, je retrouve plus :( Sinon je suis tombé sur cet présentation qui explique que c’est le code du site qui drive l’URL finale… Je trouve ça étrange.

  • Ok donc il s’agit plus de données que de pages web; donc plus d’URI/URNs que d’URI/URLs (j’essaie de bien cerner les différences entre ces machins…)

    Je plussoie sur les URLs de lemonde; le sous-domaine “abonnes” est très pénible quand tu lis un article étant abonné et que tu veux le partager :-/

    J’avoue ne pas avoir trop cherché à savoir où se situe LeMonde dans le LinkedData…
    J’avance néanmoins l’hypothèse que s’ils se donnent moins de peine que le Guardian dans la persistance des URLs c’est peut-être tout simplement parce que le LinkedData n’est pas (encore) leur terrain de jeu favori.

    Pour l’instant, il leur suffit que leurs données soient correctement liées à leurs sites web.

    Quand ils arrêteront de créer de la rareté artificielle (accès restreint aux abonnés par ex) dans l’économie de l’abondance, les URI/URNs de leurs données deviendront d’un seul coup plus importantes et donc plus pérennes.

    Je suis encore à côté de la plaque ou…? :)

  • (ah et ton blog avance d’1h :p)

  • Tout bon ! :) C’est en tout cas le point de vu de ce petit billet. Arf le blogue avance d’une heure… Je pensais pourtant être hebergé en France :)

Leave a Comment