Le web sémantique ou le futur du Web

MAIS, AU FAIT, QU’EST-CE QUE LE WEB SEMANTIQUE ?

512px-W3C_Semantic_Web_Logo.svg

DU W3C…

L’expression « Web sémantique » a été utilisée la première fois en 1994 par Tim Berners-Lee, l’inventeur du World Wide Web et directeur du World Wide Web Consortium (« W3C »), qui supervise le développement des technologies communes du Web sémantique.

En 1999, Tim Berners-Lee a exprimé la vision du Web sémantique comme suit :

« J’ai fait un rêve pour le Web [dans lequel les ordinateurs] deviennent capables d’analyser toutes les données sur le Web — le contenu, liens, et les transactions entre les personnes et les ordinateurs. Un « Web Sémantique », qui devrait rendre cela possible, n’a pas encore émergé, mais quand ce sera fait, les mécanismes plan-plan d’échange, de bureaucratie et de nos vies quotidiennes seront traités par des machines dialoguant avec d’autres machines. Les « agents intelligents » qu’on nous promet depuis longtemps vont enfin se concrétiser. » Weaving the Web

Il montre alors en quoi les liens hypertextes ou, plus précisément, la façon dont on met en relation les documents sur le Web est trop limitée pour permettre aux machines de relier automatiquement les données contenues sur le Web à la réalité.
Il présentera le Web sémantique comme une sorte d’extension du Web des documents, qui constitue une base de données à l’échelle mondiale, afin que toutes les machines puissent mieux lier les données du Web. Cette feuille de route se matérialise par une représentation graphique, le «layer cake», qui montre l’agencement des différentes briques technologiques du Web sémantique.

Le "Layer cake" de Tim Berners-Lee

Le « Layer cake » de Tim Berners-Lee

D’un web orienté « document », nous évoluons donc vers un web qui a du « sens ». Ou, autrement dit : structurer de l’information pour créer informatiquement du sens qui serait compréhensible par les machines.

Le Web sémantique ferait en sorte que les outils utilisés par l’utilisateur ne puissent plus juste les afficher, mais automatiser les requêtes, et intégrer et réutiliser les données au travers d’applications diverses. Le but est de transformer la masse ingérable des pages Web en un gigantesque index hiérarchisé.

En 2006, un groupe de travail du W3C crée un nouveau langage standard du web : SPARQL (prononcé « sparkle », en anglais « étincelle »). Ce standard, considéré comme l’une des technologies clés du web sémantique, permet de relier entre elles les informations qui jusque-là étaient traitées séparément. Le fonctionnement du web sémantique intègre donc au web actuel la possibilité d’agréger plusieurs données liées entre elles : soit « sémantiquement », soit par des attributs qui les déterminent.

En faisant une requête sur un moteur proposant de la recherche en langage naturel, vous l’interrogerez comme vous parlez, et il transformera cette demande en langage compréhensible et cohérent pour la machine. Les informations ne seraient plus simplement stockées mais « comprises » par les ordinateurs afin d’apporter à l’utilisateur ce qu’il cherche vraiment.

Du gigantesque catalogue qu’il est aujourd’hui, le Web pourrait ainsi se transformer en un guide intelligent, capable d’apporter des réponses complètes et immédiates à des requêtes en langage naturel, et de favoriser le développement de nouvelles formes d’intelligence collective.

D’ailleurs, les technologies servant à l’analyse sémantique sont directement issues de la recherche en Intelligence Artificielle, avec :

  • Le Text Mining : Comprendre le sens des phrases (en dépassant les limites du mot clef) en triant ce qui est pertinent de ce qui ne l’est pas.
  • Le Data Mining : Classifier des documents, les regrouper par affinités, les hiérarchiser.

(Source : L’E-Réputation à l’heure de la surcharge informationnelle, par Eglantine Schimtt)

Si tout cela reste encore quelque peu obscur pour vous, je vous conseille cette excellente vidéo (en anglais) qui présente très bien le Web sémantique dans ses grandes lignes :

…EN PASSANT PAR LE WEB DES DONNEES…

Pour parvenir à l’émergence de nouvelles connaissances en s’appuyant sur les celles déjà présentes sur Internet, on constate donc que le Web sémantique met en œuvre le Web des données qui consiste à lier et structurer l’information sur Internet pour accéder simplement à la connaissance qu’elle contient déjà.

Le Web des données, ou Linked Data, est complémentaire du Web sémantique dans son but de publier des données structurées sur le Web, non pas sous la forme de silos de données isolés les uns des autres, mais en les reliant entre elles pour constituer un réseau global d’informations.

Voici une autre excellente vidéo (et en français !) présentant très clairement le Web des données et ses atouts, tant pour les utilisateurs que pour les fournisseurs de données :

L’application des technologies du Web sémantique a été longtemps limitée au domaine de la recherche. Une adoption plus large, par exemple dans le monde de l’entreprise, était nécessaire pour faire de la vision du Web sémantique une réalité.

C’est ainsi qu’après Powerset de Microsoft ou Antidot Finder Suite, projet du CNRS, dess moteurs de recherche sémantique destinés au monde de l’entreprise ont vu le jour : NGLbAse, SYNOMIA (utilisé par EDF, AXA…), Sinequa CS (utilisé par Gaz de France) et WolframAlpha.

Evolution du graphe des données liées de 2007 à 2010

Evolution du graphe des données liées de 2007 à 2010

Le lancement de l’initiative « Linking Open Data » par le W3C en 2006 avait pour objectifs :

  • de promouvoir une vision du Web comme une base de données globale,
  • et de relier les données sur le Web de la même façon que l’hypertexte permet de relier des documents (les pages Web).

Les quatre grands principes du Web de données sont :

  • nommer les ressources avec des URI ;
  • utiliser des URI http (ou URI déréférençables) de façon à ce qu’on puisse utiliser ces URI pour accéder à des informations sur les ressources ;
  • lorsqu’on déréférence une URI, renvoyer des informations utiles grâce à RDF et SPARQL ;
  • se relier avec d’autres URI pour créer un réseau de liens.

(Source : BnF)

Le respect de ces quatre grands principes permet de relier les différents jeux de données accessibles en ligne, et de parcourir les données de façon transparente et globale.

Ainsi, le Web de données contribue à réaliser l’un des objectifs initiaux du Web sémantique : sortir les données des silos pour qu’elles puissent être plus facilement exploitées par des machines.

« Web sémantique » est parfois utilisé comme synonyme de « Web 3.0 », bien que la définition de chaque expression varie, selon les avis et points de vue de chacun.

Je terminerai par une autre citation de Tim Berners-Lee qui, lui, décrit le Web sémantique comme une composante du Web 3.0 :

«  Les gens continuent à demander ce qu’est le Web 3.0. Je suppose que lorsque vous aurez une superposition de dessins vectoriels — toute en vagues et en plis brumeux — décrivant le Web 2.0, et accès à un Web sémantique intégré dans cet immense espace de données, vous aurez accès à une incroyable ressource de données.  »

— A ‘more revolutionary’ Web, 2006, Victoria Shannon

Tagué , , , , , ,

12 réflexions sur “Le web sémantique ou le futur du Web

  1. Synomia dit :

    N’hésitez pas à consulter les autres applications web de la technologie d’analyse sémantique sur le site de synomia.fr !

  2. Pierre Col dit :

    Une précision : Antidot Finder Suite n’est pas « un projet du CNRS », mais une solution logicielle conçue et développée par Antidot, un éditeur de logiciels indépendant qui existe depuis 1999 et a adopté les technologies du web sémantique depuis de nombreuses années. Vous trouverez plus d’information sur Antidot et ses solutions en visitant notre site web http://www.antidot.net

    Pour autant, on peut ajouter qu’Antidot Finder Suite a été utilisé dans le cadre du projet ISIDORE, du CNRS, et vous pouvez en voir le résultat ici : http://www.rechercheisidore.fr

  3. Bonjour Angela, merci pour cet article qui pose un cadre très clair sur l’enjeu du web sémantique. Il me vient deux réflexions :
    La première porte sur la confusion permanente entre savoir et connaissance. La connaissance signifie « Naître avec » et le savoir n’est qu’une matière froide. Ce qui signifie que nombre de personnes fantasment sur l’accès à la connaissance grâce au web sémantique mais oublie que le cheminement d’un savoir faire la connaissance passe par un ensemble de processus cognitifs complexes. En ce sens, j’affirme qu’on se trompe si l’on pense que le web sémantique sera l’accès à la connaissance, ce sera peut être une facilité pour accéder à des informations éparses mais nullement le chemin vers une Humanité plus consciente et éclairée. Au contraire, je dirais que nous allons vers une délégation aux machines d’un patrimoine qui réside dans notre intelligence collective, qui se transmet par des relations, des échanges et le sens de la critique.
    Ce qui m’amène à ma 2ème réflexion : qui produit les algorithmes qui interprètent les données? la pensée humaine et la pensée associative nous est commune mais notre perception du temps, de l’espace et des autres change en fonction de notre culture et de notre environnement. Les initiatives que tu évoques sont fortement marquées par une pensée rationaliste occidentale. Ce qui induit que nous pouvons vite dériver vers une uniformisation de la pensée et donc un appauvrissement global. J’ai la chance de pratiquer les arts martiaux (le Kung Fu) et leur diffusion se fait de manière élective, mais non élitiste. C’est à travers un schéma de transmission oral et pratique que l’on découvre la richesse de la pensée et surtout des émotions. Ainsi, il existe des précis de médecine chinoise qui décrivent clairement les différentes composantes de l’énergie et des interdépendances complexes qui régissent notre corps. Mais au delà du savoir, c’est à travers l’expérimentation et la sensualité (la perception des sens et l’intégration du savoir par l’expérience) que chacun fait son chemin et naît avec cette philosophie qui combine bouddhisme et taoïsme. Bref chacun son chemin, selon son rapport au monde et aux autres. Tu auras compris que ce que je défends c’est un progrès intelligent, intelligible et qui libère la créativité mais aussi qui autorise à faire un chemin, non d’être contraint par une interprétation.
    Cela me fait penser à une déviance démiurgique ! quelle est notre place dans le Monde et comment transmet on le savoir, la mesure et la prise de distance ? On veut s’ériger en dieux car nous pensons contrôler le savoir et tout ce qui en découle. Le Progrès doit donc être vu avec la compréhension de ses impacts. Trop d’intérêts économiques et potentiellement de contrôle de la pensée sont tapis dans ces initiatives. Où se situe le hasard et l’errance dans ces projets ? le risque ultime est clairement décrit par les auteurs d’anticipation du milieu du 20ème. Nous nous rapprochons doucement de 1984, 451° Farenheit, ou encore d’Orange Mécanique. Regardons toujours qui se cachent derrière ces projets et surtout leur financement et posons nous la question si nous vivrons TOUS mieux grâce à cette évolution technologique. L’Histoire sait faire le tri ! et contrôler les modes d’accès au Savoir signifie brider la Connaissance… un lent déclin vers le fascisme.
    Pessimiste? non juste volontairement critique car nous n’est jamais complètement beau !

    Merci pour ce très bon article

  4. […] Le web sémantique ou le futur du Web « un blog, des blogs […]

  5. […] MAIS, AU FAIT, QU’EST-CE QUE LE WEB SEMANTIQUE ? DU W3C… L’expression « Web sémantique » a été utilisée la première fois en 1994 par Tim Berners-Lee, l’inventeur du World Wi…  […]

  6. […] MAIS, AU FAIT, QU’EST-CE QUE LE WEB SEMANTIQUE ? DU W3C… L’expression « Web sémantique » a été utilisée la première fois en 1994 par Tim Berners-Lee, l’inventeur du World Wi…  […]

  7. […] MAIS, AU FAIT, QU’EST-CE QUE LE WEB SEMANTIQUE ? DU W3C… L’expression « Web sémantique » a été utilisée la première fois en 1994 par Tim Berners-Lee, l’inventeur du World Wi…  […]

  8. […] MAIS, AU FAIT, QU’EST-CE QUE LE WEB SEMANTIQUE ? DU W3C… L’expression « Web sémantique » a été utilisée la première fois en 1994 par Tim Berners-Lee, l’inventeur du World Wi…  […]

  9. […] MAIS, AU FAIT, QU'EST-CE QUE LE WEB SEMANTIQUE ? DU W3C… L'expression « Web sémantique » a été utilisée la première fois en 1994 par Tim Berners-Lee, l'inventeur du World Wide Web et directeur du…  […]

  10. […] Le web sémantique ou le futur du Web « un blog, des blogs […]

  11. […] du temps répondre qu'à deux questions: "Quelles sont les pages contenant le terme X ? " Le web sémantique ou le futur du Web | un blog, des blogs. L’expression « Web sémantique » a été utilisée la première fois en 1994 par Tim […]

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :