posted on février 8th, 2010 ·

Le Guardian fait partie de ces journaux qui ont fait le parie de ne pas seulement suivre les tendances mais d’innover. Martin Belam, “information architect”, déclarait dernièrement que le Guardian participait activement à la diffusion de ses données à travers le web. Création d’APIs, publications dans le LinkedData, l’ouverture au web est totale. Je ne reviendrais pas sur les bénéfices de structurer et promouvoir ses données, mais je vous invite quand même à jeter un oeil aux applications et mashups utilisant les données du Guardian.
Mais il y a un autre bénéfice qui m’avait échappé jusqu’à maintenant: la persistance des URLs. Intégrer le LinkedData et promouvoir ses données ne peut se faire sans une politique rigoureuse de persistance des URLs. Ainsi si vous voulez garder la trace d’un article, d’une photo ou d’une vidéo, je vous invite à réfléchir sur la persistance de l’URL que vous allez sauvegarder dans vos marques-pages ou dans pearltrees. Le Guardian et le New York Times sont sans doute les plus engagés dans la persistance de leurs URLs, lemonde.fr beaucoup moins…
Quels sont pour vous les sites de confiance et ceux à éviter en ce qui concerne la persistance des URLs ?
Catégories: Uncategorized
posted on janvier 18th, 2010 ·
Vous êtes l’entier propriétaire des données que vous produisez sur pearltrees. A tout moment, vous pouvez récupérer votre organisation du web dans un format standard qu’est le RDF. Cet opération s’effectue dans les settings de votre compte pearltrees, vous pouvez y télécharger un fichier RDF, le stocker sur votre ordinateur ou le re-publier sur votre site. RDF est un merveilleux format pour partager des données sur le web, et il est donc très facile de le réutiliser pour obtenir des informations sur votre compte.
Dans les examples ci-dessous j’ai décidé d’explorer un peu plus le contenu de mon compte cyno.tv. La toute première étape est de mettre en ligne ses données téléchargées sur pearltrees:
ex: http://nicolas.cynober.fr/pearltrees_export_cyno.tv.rdf
Ensuite il vous suffit d’écrire des requêtes comme pour une base de données classique. Un bon moyen est d’utiliser le language SPARQL. Cela peut être fait en ligne grâce à des outils comme SPARQLer.
Voici quelques requêtes effectuées sur l’export de mon compte cyno.tv:
La liste de toutes mes perles avec leurs URLs
PREFIX pt: <http://www.pearltrees.com/rdf/0.1/>
PREFIX owl: <http://www.w3.org/2002/07/owl#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX dc: <http://purl.org/dc/elements/1.1/>
SELECT ?title ?url
FROM <http://nicolas.cynober.fr/pearltrees_export_cyno.tv.rdf>
WHERE {
?pearl rdf:type pt:pearl;
dc:title ?title;
owl:sameAs ?url;
pt:parentTree ?tree
}
ORDER BY DESC (?tree)
Résultat, un tableau de 133 urls.
La répartition de mes vidéos entre Youtube, Dailymotion et Vimeo
PREFIX pt: <http://www.pearltrees.com/rdf/0.1/>
PREFIX owl: <http://www.w3.org/2002/07/owl#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
SELECT COUNT(?url) COUNT(?url2) COUNT(?url3)
FROM <http://nicolas.cynober.fr/pearltrees_export_cyno.tv.rdf>
WHERE {
{
?pearl rdf:type pt:pearl;
owl:sameAs ?url.
FILTER regex(str(?url), "youtube", "i")
}
UNION {
?pearl2 rdf:type pt:pearl;
owl:sameAs ?url2.
FILTER regex(str(?url2), "dailymotion", "i")
}
UNION {
?pearl3 rdf:type pt:pearl;
owl:sameAs ?url3.
FILTER regex(str(?url3), "vimeo", "i")
}
}
Résultat, youtube: 57, dailymotion: 57, vimeo: 4.
Les perles communes avec la teo.tv
Teo a lui aussi mis en ligne son export RDF. Je peux maintenant comparer sa webTV avec la mienne.
PREFIX pt: <http://www.pearltrees.com/rdf/0.1/>
PREFIX owl: <http://www.w3.org/2002/07/owl#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX dc: <http://purl.org/dc/elements/1.1/>
PREFIX data: <http://nicolas.cynober.fr/pearltrees_export_>
SELECT ?cyno_title ?teo_title ?url
FROM NAMED <http://nicolas.cynober.fr/pearltrees_export_cyno.tv.rdf>
FROM NAMED <http://nicolas.cynober.fr/pearltrees_export_teo.tv.rdf>
WHERE {
GRAPH data:cyno.tv.rdf {
?pearl rdf:type pt:pearl;
dc:title ?cyno_title;
owl:sameAs ?url.
}.
GRAPH data:teo.tv.rdf {
?pearl2 rdf:type pt:pearl;
dc:title ?teo_title;
owl:sameAs ?url.
}
}
Résultat, 3 perles en commun.
Catégories: Uncategorized
posted on janvier 11th, 2010 ·
Avec les bases de données du LinkedData, les innovations de Reuters ou le journalisme de données façon New York Times, beaucoup de monde commence à s’intéresser à ce que le web des données peut apporter à son business. Dans ce cadre, consultants et professionnels du web sémantique commencent à émerger… A leut tête: Talis, leader incontestés dans le domaine. L’intégration de la BBC dans le LinkedData: Talis. Le très prométeur data.gov anglais: Talis. Le premier média sur le web sémantique: Talis. Méconnu du grand publique cette société est aujourd’hui au coeur des innovations liées au web des données.
Au delà du développement de solutions pour leurs clients, Talis a développé un vértiable écosystème. Créateur de l’Open Data Commons, un équivalent de la licence Public Domain, Talis favorise la réutilisation des données. Avec le projet Data Incubator, Talis met à disposition une plateforme facilitant le développer de solutions basées sur des données liées: on y retrouve entre autre Yahoo et la NASA. Avec le podcast mensuel du Semantic Web Gang, Talis favorise depuis 2 ans la diffusion de la connaissance sur le sujet.
Pour vous donner une petite idée de ce que réalise Talis, je vous invite à regarder cette vidéo qui présente étape par étape la création d’un mashup entre les données du Guardian et de la BBC:
Catégories: Uncategorized