Libérons les données !

posted on avril 28th, 2008 ·

Il me parait tous les jours plus clair que nos amis les données veulent partir en vacance. Ce besoin de voyage est d’autant plus fort que le coût d’un trajet numérique Boston / Bangalore tend vers zéro. Et puis après tout, n’est ce pas dans notre nature de partager, copier, diffuser l’information ? Nous sommes des primates, nous apprenons par mimétisme. Et dans un monde hautement interconnecté et numérique, où il n’a jamais été aussi simple d’apprendre et de partager, notre nature reprend le dessus.

Je crois profondément que nous sommes à l’aube d’une ère nouvelle. De grands scientifiques, des philosophes, des politiques, parfois même des journalistes comparent l’avènement du web à l’imprimerie. Et quand on se penche sur les implications de l’invention de l’imprimerie sur nos sociétés, on peut se poser la question suivante: vers quelle révolution allons-nous ? Je ne me lancerais pas dans des prospectives douteuses, mais les transformations auront lieux à tous les niveaux. Touchant profondément l’économie, les business modèles de secteurs entiers (ça a déjà commencé), mais aussi la nature même de nos sociétés et le fonctionnement des états. Sur internet il n’existe plus aucune frontières, aucunes, car les données sont tous les jours de plus en plus libres. Libres d’être crées, envoyées, modifiées et copiées.

Malheureusement (heureusement?), la vitesse de ces changements dépasse beaucoup de monde. Et oui le web est jeune, le web grandit vite, ça mange à cet âge là ! 18 ans, le web a encore très peu de poiles au menton mais compte bien faire parler de lui. Chaque nouvelle révolution technologique est systémique et générationnelle, et c’est là ou je veux en venir. Le web va bientôt atteindre sa 20ème année et commence à prendre en maturité. Les moins de 18 ans, « la génération web2.0 » comme j’aime les appeler, rentrera dans quelques années sur le marché du travail. Comme le disait Carlos Diaz, « les entreprises et la société vont devoir s’adapter car leurs modes de communication et leur vision du monde est bien loin des vieux modèles ».

Le monde change vite, trop vite. Il suffit de se pencher sur les derniers événements de la blogosphère pour s’en rendre compte avec des procès contre des bloggeurs et des plateformes d’information et même des menaces contre de simples commentateurs. La palme revient aux pressions des lobbies Américains sur le gouvernement Suédois pour faire fermer des réseaux de Peer-to-Peer. La vielle économie sent une menace arriver sans bien la comprendre.

Et dans tout ça. La nouvelle version du web est en préparation. Crée directement par l’inventeur de génie du World Wide Web: Tim Berners Lee. Via le W3C, Berners Lee, perfectionne ce nouveau moyen de partager des données de manière universelle entre des sites webs. Pour enfin accomplir la vision qu’il a eu en 1990, et reprise dans sa définition du GGG, une base de données mondiale de connaissances. Le web 3.0 sera sémantique ou ne sera pas.

Pour compléter cet article j’ai republié cet excellent reportage:


La discussion est ouverte.

→ 7 CommentsCatégories: blueKiwi · Data Portability · Entreprise 2.0 · Vidéo · W3C · Web 2.0 · Web 3.0 · Web Sémantique

Screencast #4: TrueKnowledge, le moteur de questions

posted on avril 25th, 2008 ·



 
TrueKnowledge n’est pas vraiment un moteur de recherche à proprement parlé mais plutôt un moteur de questions. Les requêtes s’effectuent avec un « ? » à la fin de vos phrases. Exemple: Quelle est la capitale du Guatemala?. Le service utilise pour l’instant deux sources de données principales. Wikipedia (ou dbpedia?) ainsi que leur propre base de données sémantique. Je trouve pour l’instant le service bien réalisé et j’espère que leur base de données de connaissances va vite grossir pour pouvoir effectuer des requêtes plus compliquées dans la longue traine.

TrueKnowledge est sur un segment de la recherche en ligne et s’attaque directement à Google. Du moins à un type bien précis de recherches. Il ne s’agit pas ici d’améliorer la visualisation de la recherche, de faire de l’esthétique avec de la 3D, mais belle et bien de travailler sur la qualité des résultats.

Encore un service web sémantique à surveiller de près !

→ 1 CommentCatégories: DBpedia · Google · Vidéo · Web Sémantique

Hardware 2.0

posted on avril 23rd, 2008 ·

Voila une nouvelle facette du 2.0 que je viens de découvrir: le hardware. Même avec des lentilles de contacte, rasé de prêt et ayant passé une année à l’ESCP, le geek revient toujours. J’ai décidé de vous en faire profiter (quelle chance…).
Le web 2.0 a changé radicalement les proportions de la toile. Plus de sites, plus de blogs, plus de participatif, plus d’échange, tout simplement plus de trafic. Et gérer 10 ou 20 visiteurs sur votre site internet n’a pas les mêmes implications que 10.000.000 ou 20.000.000.

Le grand champion qui a tout de suite compris cet enjeu technique est Google puisque son réseau de 1 million de machines est un véritable avantage concurrentiel. De même Amazon avec EC2 et S3, révolutionne le monde de l’hébergement. On voit même apparaitre des solutions OpenSource de clustering fonctionnant sur le « computing grid » d’Amazon.

En parlant d’OpenSource, la majorité des gros sites internet utilisent des solutions gratuites OpenSource. La combinaison LAMP (Linux + Apache + MySQL + PHP) est toujours aussi efficace et supporte très bien la montée en charge de sites comme Flickr, Wikipedia ou encore Digg. Il y a différentes façons de faire de l’OpenSource, et ces entreprises ont fait le choix de communiquer sur leur architecture afin d’améliorer le socle technologique sur lequel ils reposent. (Vous me suivez ?) Ils améliorent les langages qu’ils utilisent via la communauté. Vous trouverez donc sans problème des présentations et des livres traitant le sujet.

Autre point intéressant concernant ces architectures obèses. C’est qu’elles ne supportent pas bien le changement. Pour gérer des millions de requêtes vous devez créer une architecture hardware spécifique à votre application.

  1. Je crée ma start-up 2.0
  2. J’ajoute quelques fonctionnalités
  3. Je deviens connu
  4. C’est la merde, mon site devient lent, mes machines suivent pas le rythme
  5. Je scale / optimise mon architecture
  6. On touche plus à rien, on rajoute des serveurs tous les jours, chaque modification fonctionnelle engendre de gros travaux hardware.

Et cela peut expliquer beaucoup de choses:

J’espère que ce billet de geek vous a fait plaisir 😉

→ 9 CommentsCatégories: Amazon · Facebook · Google · Hardware · Web 2.0