Archives de Tag: Tim Berners-Lee

Le web sémantique ou le futur du Web

MAIS, AU FAIT, QU’EST-CE QUE LE WEB SEMANTIQUE ?

512px-W3C_Semantic_Web_Logo.svg

DU W3C…

L’expression « Web sémantique » a été utilisée la première fois en 1994 par Tim Berners-Lee, l’inventeur du World Wide Web et directeur du World Wide Web Consortium (« W3C »), qui supervise le développement des technologies communes du Web sémantique.

En 1999, Tim Berners-Lee a exprimé la vision du Web sémantique comme suit :

« J’ai fait un rêve pour le Web [dans lequel les ordinateurs] deviennent capables d’analyser toutes les données sur le Web — le contenu, liens, et les transactions entre les personnes et les ordinateurs. Un « Web Sémantique », qui devrait rendre cela possible, n’a pas encore émergé, mais quand ce sera fait, les mécanismes plan-plan d’échange, de bureaucratie et de nos vies quotidiennes seront traités par des machines dialoguant avec d’autres machines. Les « agents intelligents » qu’on nous promet depuis longtemps vont enfin se concrétiser. » Weaving the Web

Il montre alors en quoi les liens hypertextes ou, plus précisément, la façon dont on met en relation les documents sur le Web est trop limitée pour permettre aux machines de relier automatiquement les données contenues sur le Web à la réalité.
Il présentera le Web sémantique comme une sorte d’extension du Web des documents, qui constitue une base de données à l’échelle mondiale, afin que toutes les machines puissent mieux lier les données du Web. Cette feuille de route se matérialise par une représentation graphique, le «layer cake», qui montre l’agencement des différentes briques technologiques du Web sémantique.

Le "Layer cake" de Tim Berners-Lee

Le « Layer cake » de Tim Berners-Lee

D’un web orienté « document », nous évoluons donc vers un web qui a du « sens ». Ou, autrement dit : structurer de l’information pour créer informatiquement du sens qui serait compréhensible par les machines.

Le Web sémantique ferait en sorte que les outils utilisés par l’utilisateur ne puissent plus juste les afficher, mais automatiser les requêtes, et intégrer et réutiliser les données au travers d’applications diverses. Le but est de transformer la masse ingérable des pages Web en un gigantesque index hiérarchisé.

En 2006, un groupe de travail du W3C crée un nouveau langage standard du web : SPARQL (prononcé « sparkle », en anglais « étincelle »). Ce standard, considéré comme l’une des technologies clés du web sémantique, permet de relier entre elles les informations qui jusque-là étaient traitées séparément. Le fonctionnement du web sémantique intègre donc au web actuel la possibilité d’agréger plusieurs données liées entre elles : soit « sémantiquement », soit par des attributs qui les déterminent.

En faisant une requête sur un moteur proposant de la recherche en langage naturel, vous l’interrogerez comme vous parlez, et il transformera cette demande en langage compréhensible et cohérent pour la machine. Les informations ne seraient plus simplement stockées mais « comprises » par les ordinateurs afin d’apporter à l’utilisateur ce qu’il cherche vraiment.

Du gigantesque catalogue qu’il est aujourd’hui, le Web pourrait ainsi se transformer en un guide intelligent, capable d’apporter des réponses complètes et immédiates à des requêtes en langage naturel, et de favoriser le développement de nouvelles formes d’intelligence collective.

D’ailleurs, les technologies servant à l’analyse sémantique sont directement issues de la recherche en Intelligence Artificielle, avec :

  • Le Text Mining : Comprendre le sens des phrases (en dépassant les limites du mot clef) en triant ce qui est pertinent de ce qui ne l’est pas.
  • Le Data Mining : Classifier des documents, les regrouper par affinités, les hiérarchiser.

(Source : L’E-Réputation à l’heure de la surcharge informationnelle, par Eglantine Schimtt)

Si tout cela reste encore quelque peu obscur pour vous, je vous conseille cette excellente vidéo (en anglais) qui présente très bien le Web sémantique dans ses grandes lignes :

…EN PASSANT PAR LE WEB DES DONNEES…

Pour parvenir à l’émergence de nouvelles connaissances en s’appuyant sur les celles déjà présentes sur Internet, on constate donc que le Web sémantique met en œuvre le Web des données qui consiste à lier et structurer l’information sur Internet pour accéder simplement à la connaissance qu’elle contient déjà.

Le Web des données, ou Linked Data, est complémentaire du Web sémantique dans son but de publier des données structurées sur le Web, non pas sous la forme de silos de données isolés les uns des autres, mais en les reliant entre elles pour constituer un réseau global d’informations.

Voici une autre excellente vidéo (et en français !) présentant très clairement le Web des données et ses atouts, tant pour les utilisateurs que pour les fournisseurs de données :

L’application des technologies du Web sémantique a été longtemps limitée au domaine de la recherche. Une adoption plus large, par exemple dans le monde de l’entreprise, était nécessaire pour faire de la vision du Web sémantique une réalité.

C’est ainsi qu’après Powerset de Microsoft ou Antidot Finder Suite, projet du CNRS, dess moteurs de recherche sémantique destinés au monde de l’entreprise ont vu le jour : NGLbAse, SYNOMIA (utilisé par EDF, AXA…), Sinequa CS (utilisé par Gaz de France) et WolframAlpha.

Evolution du graphe des données liées de 2007 à 2010

Evolution du graphe des données liées de 2007 à 2010

Le lancement de l’initiative « Linking Open Data » par le W3C en 2006 avait pour objectifs :

  • de promouvoir une vision du Web comme une base de données globale,
  • et de relier les données sur le Web de la même façon que l’hypertexte permet de relier des documents (les pages Web).

Les quatre grands principes du Web de données sont :

  • nommer les ressources avec des URI ;
  • utiliser des URI http (ou URI déréférençables) de façon à ce qu’on puisse utiliser ces URI pour accéder à des informations sur les ressources ;
  • lorsqu’on déréférence une URI, renvoyer des informations utiles grâce à RDF et SPARQL ;
  • se relier avec d’autres URI pour créer un réseau de liens.

(Source : BnF)

Le respect de ces quatre grands principes permet de relier les différents jeux de données accessibles en ligne, et de parcourir les données de façon transparente et globale.

Ainsi, le Web de données contribue à réaliser l’un des objectifs initiaux du Web sémantique : sortir les données des silos pour qu’elles puissent être plus facilement exploitées par des machines.

« Web sémantique » est parfois utilisé comme synonyme de « Web 3.0 », bien que la définition de chaque expression varie, selon les avis et points de vue de chacun.

Je terminerai par une autre citation de Tim Berners-Lee qui, lui, décrit le Web sémantique comme une composante du Web 3.0 :

«  Les gens continuent à demander ce qu’est le Web 3.0. Je suppose que lorsque vous aurez une superposition de dessins vectoriels — toute en vagues et en plis brumeux — décrivant le Web 2.0, et accès à un Web sémantique intégré dans cet immense espace de données, vous aurez accès à une incroyable ressource de données.  »

— A ‘more revolutionary’ Web, 2006, Victoria Shannon

Tagué , , , , , ,