Archives de Tag: Web sémantique

Le premier moteur de recherche sémantique de personnes a un nom : Yatedo

Double bonne nouvelle : le Web sémantique connait une avancée majeure et ce, grâce à une start-up qui est…française !

Yatedo est le premier (et le seul) moteur de recherche sémantique de personnes.

Avec mon précédent article, Le Web sémantique ou le futur du Web, vous avez pu vous familiariser avec le Web sémantique, découvrir son histoire, son émergence, son évolution et ses atouts.

Ici, vous allez découvrir comment Yatedo a lui-même émergé et évolué parallèlement aux travaux et aux recommandations du W3C

En 2007, deux étudiants d’Epitech, Amyne Berrada et Saad Zniber planchent sur un travail de fin d’année et s’intéressent à la recherche de personnes.

En effet, comme un grand nombre d’entre nous, Amyne et Saad ont voulu retrouver des amis ou des connaissances datant du Collège ou du Lycée et depuis perdus de vue. Avec l’émergence de nombreux réseaux sociaux, ils se rendent compte à quel point il est long et fastidieux de devoir rechercher une seule et unique personne dans chaque réseau social, ou de devoir cliquer sur chaque lien proposé par un moteur de recherche classique.

Ils listent alors les nombreux freins que possède la recherche de personnes :

  • Le manque de cohérence entre les résultats malmène l’internaute sur la toile.
  • Les homonymes ne sont pas distingués.
  • Aucune possibilité de prévisualiser le contenu des liens trouvés sans avoir à cliquer dessus.
  • Aucun contrôle des contenus en ligne depuis le moteur de recherche.
  • Le moteur de recherche se contente de trouver les mots recherchés sans les comprendre.
  • Les photos et les vidéos sont sous-représentées.
  • L’orthographe de la personne doit être exacte sous peine d’un résultat erroné.

(Source : Blog de Yatedo)

En bref, les freins créés par un Web de données non-liées et non-sémantique, repérés par le World Wide Web quelques années auparavant…

Les deux amis travaillent donc selon les recommandations du W3C et ce, peut-être même sans le savoir !

Ils se disent rapidement qu’il est dommage, qu’avec toutes ces données, il n’existe aucun outil qui puisse centraliser les informations d’une personne. Le défi est lancé : cet outil, ils vont le créer !

Au fur et à mesure que leur travail avance, les deux amis réalisent que la recherche de personnes va plus loin qu’une simple envie de retrouver un ancien ami ou collègue, et que leur outil peut avoir des utilisations beaucoup plus intéressantes et importantes pour la personne elle-même. En effet, l’émergence et l’évolution des réseaux sociaux jouant sur l’empreinte numérique que chacun laisse sur le Net, nos deux étudiants se rendent compte à quel point il est primordial de toujours avoir une excellente visibilité sur le Net pour mieux se valoriser, en particulier auprès de ses futurs employeurs.

Ces problèmes ainsi listés leur donne une idée : pourquoi pas un moteur de recherche dont les résultats ne seraient que des personnes ? Ainsi un outil permettant à l’internaute de trouver rapidement une personne à partir de n’importe quelle information tout en maîtrisant son identité numérique fait son chemin.

Au terme d’un travail sans relâche pendant plus de 2 ans, ces deux passionnés mettent au point un moteur de recherche qui utilise la technologie sémantique, capable de comprendre le contenu de chaque page ainsi que l’écriture phonétique, tout en prenant soin de distinguer les homonymes. Ils mettent au point un outil qui extrait les informations relatives aux personnes, qui sont par la suite structurées dans un seul et unique profil global qui reflète l’ensemble de la présence de la personne sur Internet.

En choisissant de présenter les résultats de recherche sous la forme de cartes d’identité numériques, Amyne et Saad trouvent la solution qui permet aux internautes de visualiser leur présence en ligne sur une seule page et d’en prendre le contrôle pour mieux organiser leurs contenus publics.

C’est ainsi qu’en 2009, Yatedo, le premier moteur de recherches sémantique de personnes, voit le jour.
yatedo-screenshot2
Vous pouvez en voir une présentation de l’époque dans un article paru sur le blog Descary.com
Le succès est immédiat et fulgurant : en 3 mois, le site atteint 1 million de visiteurs uniques !
Yatedo s’est donc rapidement développé grâce à une levée de fonds d’1,2 million d’euros et avec l’aide de Denis Jacquet, Président de l’association  « Parrainer la Croissance« , et maintenant également PDG de Yatedo.
Début 2012, le site du magazine Challenges classera même Yatedo dans les 100 start-up où investir et le journal L’Entreprise fera un portrait de Saad Zniber dans sa rubrique « Innovation et Créativité » parmi d’autres « 10gital natives et entrepreneurs« 
Yatedo vous permet donc de retrouver n’importe qui avec n’importe quel type de mots clefs :
  • recherche simple
  • recherche phonétique
  • recherche par connaissance
  • recherche par entreprise
  • recherche par école
  • recherche locale
  • recherche par emploi
  • recherche par film…

Et encore d’autres possibilités sont envisageables !

Exemple de recherche phonétique
Exemple de recherche phonétique
De plus, grâce à Yatedo, vous pouvez gérer votre e-réputation et améliorer votre visibilité simultanément grâce à la possibilité de modifier le contenu de votre profil Yatedo. (C’est ici)

De quoi est composé un profil Yatedo ?

Voici les  catégories d’informations que vous pouvez sur un profil Yatedo :

  • Une présentation synthétisée de la personne
  • Une biographie
  • Un résumé général de la personne
  • Ses informations de contacts et de profils sociaux
  • Son expérience professionnelle
  • Ses compétences techniques
  • Son parcours scolaires
  • Ses blogs et sites
  • Les sites web qui parlent de cette personne
  • Ses photos et ses vidéos publiques
Exemple d'un profil Yatedo

Exemple d’un profil Yatedo

Et, tout en structurant les données des personnes, Yatedo aide les internautes à se connecter entre eux, grâce à la visualisation d’un graph social (les fameux graph chers au Linked Data…)
Exemple d'un GRAPH social

Exemple d’un GRAPH social

En utilisant la technologie sémantique et en entrant de plein pieds dans le Web des données, Yatedo peut-être considéré comme un outil 3.0, étant un pionnier en la matière de recherche sémantique qui constituera, c’est certain, l’ensemble du web de demain.

(Je vous invite à lire cet article paru sur Winmacsofts qui montre bien à quel point la recherche sémantique via Yatedo est plus puissante et pertinente qu’une recherche classique.)
yatedo_screen2
Aujourd’hui, Yatedo c’est une équipe de 10 personnes, plus de 4 millions de visiteurs uniques et, depuis aujourd’hui, en prime, une appli Iphone, qui sera bientôt disponible également sous Androïd.
Si vous souhaitez en savoir plus, rechercher précisément une personne, prendre le contrôle de votre profil Yatedo et gérer votre identité numérique, je vous invite à consulter :

 

Publicités
Tagué , , , , , ,

Le web sémantique ou le futur du Web

MAIS, AU FAIT, QU’EST-CE QUE LE WEB SEMANTIQUE ?

512px-W3C_Semantic_Web_Logo.svg

DU W3C…

L’expression « Web sémantique » a été utilisée la première fois en 1994 par Tim Berners-Lee, l’inventeur du World Wide Web et directeur du World Wide Web Consortium (« W3C »), qui supervise le développement des technologies communes du Web sémantique.

En 1999, Tim Berners-Lee a exprimé la vision du Web sémantique comme suit :

« J’ai fait un rêve pour le Web [dans lequel les ordinateurs] deviennent capables d’analyser toutes les données sur le Web — le contenu, liens, et les transactions entre les personnes et les ordinateurs. Un « Web Sémantique », qui devrait rendre cela possible, n’a pas encore émergé, mais quand ce sera fait, les mécanismes plan-plan d’échange, de bureaucratie et de nos vies quotidiennes seront traités par des machines dialoguant avec d’autres machines. Les « agents intelligents » qu’on nous promet depuis longtemps vont enfin se concrétiser. » Weaving the Web

Il montre alors en quoi les liens hypertextes ou, plus précisément, la façon dont on met en relation les documents sur le Web est trop limitée pour permettre aux machines de relier automatiquement les données contenues sur le Web à la réalité.
Il présentera le Web sémantique comme une sorte d’extension du Web des documents, qui constitue une base de données à l’échelle mondiale, afin que toutes les machines puissent mieux lier les données du Web. Cette feuille de route se matérialise par une représentation graphique, le «layer cake», qui montre l’agencement des différentes briques technologiques du Web sémantique.

Le "Layer cake" de Tim Berners-Lee

Le « Layer cake » de Tim Berners-Lee

D’un web orienté « document », nous évoluons donc vers un web qui a du « sens ». Ou, autrement dit : structurer de l’information pour créer informatiquement du sens qui serait compréhensible par les machines.

Le Web sémantique ferait en sorte que les outils utilisés par l’utilisateur ne puissent plus juste les afficher, mais automatiser les requêtes, et intégrer et réutiliser les données au travers d’applications diverses. Le but est de transformer la masse ingérable des pages Web en un gigantesque index hiérarchisé.

En 2006, un groupe de travail du W3C crée un nouveau langage standard du web : SPARQL (prononcé « sparkle », en anglais « étincelle »). Ce standard, considéré comme l’une des technologies clés du web sémantique, permet de relier entre elles les informations qui jusque-là étaient traitées séparément. Le fonctionnement du web sémantique intègre donc au web actuel la possibilité d’agréger plusieurs données liées entre elles : soit « sémantiquement », soit par des attributs qui les déterminent.

En faisant une requête sur un moteur proposant de la recherche en langage naturel, vous l’interrogerez comme vous parlez, et il transformera cette demande en langage compréhensible et cohérent pour la machine. Les informations ne seraient plus simplement stockées mais « comprises » par les ordinateurs afin d’apporter à l’utilisateur ce qu’il cherche vraiment.

Du gigantesque catalogue qu’il est aujourd’hui, le Web pourrait ainsi se transformer en un guide intelligent, capable d’apporter des réponses complètes et immédiates à des requêtes en langage naturel, et de favoriser le développement de nouvelles formes d’intelligence collective.

D’ailleurs, les technologies servant à l’analyse sémantique sont directement issues de la recherche en Intelligence Artificielle, avec :

  • Le Text Mining : Comprendre le sens des phrases (en dépassant les limites du mot clef) en triant ce qui est pertinent de ce qui ne l’est pas.
  • Le Data Mining : Classifier des documents, les regrouper par affinités, les hiérarchiser.

(Source : L’E-Réputation à l’heure de la surcharge informationnelle, par Eglantine Schimtt)

Si tout cela reste encore quelque peu obscur pour vous, je vous conseille cette excellente vidéo (en anglais) qui présente très bien le Web sémantique dans ses grandes lignes :

…EN PASSANT PAR LE WEB DES DONNEES…

Pour parvenir à l’émergence de nouvelles connaissances en s’appuyant sur les celles déjà présentes sur Internet, on constate donc que le Web sémantique met en œuvre le Web des données qui consiste à lier et structurer l’information sur Internet pour accéder simplement à la connaissance qu’elle contient déjà.

Le Web des données, ou Linked Data, est complémentaire du Web sémantique dans son but de publier des données structurées sur le Web, non pas sous la forme de silos de données isolés les uns des autres, mais en les reliant entre elles pour constituer un réseau global d’informations.

Voici une autre excellente vidéo (et en français !) présentant très clairement le Web des données et ses atouts, tant pour les utilisateurs que pour les fournisseurs de données :

L’application des technologies du Web sémantique a été longtemps limitée au domaine de la recherche. Une adoption plus large, par exemple dans le monde de l’entreprise, était nécessaire pour faire de la vision du Web sémantique une réalité.

C’est ainsi qu’après Powerset de Microsoft ou Antidot Finder Suite, projet du CNRS, dess moteurs de recherche sémantique destinés au monde de l’entreprise ont vu le jour : NGLbAse, SYNOMIA (utilisé par EDF, AXA…), Sinequa CS (utilisé par Gaz de France) et WolframAlpha.

Evolution du graphe des données liées de 2007 à 2010

Evolution du graphe des données liées de 2007 à 2010

Le lancement de l’initiative « Linking Open Data » par le W3C en 2006 avait pour objectifs :

  • de promouvoir une vision du Web comme une base de données globale,
  • et de relier les données sur le Web de la même façon que l’hypertexte permet de relier des documents (les pages Web).

Les quatre grands principes du Web de données sont :

  • nommer les ressources avec des URI ;
  • utiliser des URI http (ou URI déréférençables) de façon à ce qu’on puisse utiliser ces URI pour accéder à des informations sur les ressources ;
  • lorsqu’on déréférence une URI, renvoyer des informations utiles grâce à RDF et SPARQL ;
  • se relier avec d’autres URI pour créer un réseau de liens.

(Source : BnF)

Le respect de ces quatre grands principes permet de relier les différents jeux de données accessibles en ligne, et de parcourir les données de façon transparente et globale.

Ainsi, le Web de données contribue à réaliser l’un des objectifs initiaux du Web sémantique : sortir les données des silos pour qu’elles puissent être plus facilement exploitées par des machines.

« Web sémantique » est parfois utilisé comme synonyme de « Web 3.0 », bien que la définition de chaque expression varie, selon les avis et points de vue de chacun.

Je terminerai par une autre citation de Tim Berners-Lee qui, lui, décrit le Web sémantique comme une composante du Web 3.0 :

«  Les gens continuent à demander ce qu’est le Web 3.0. Je suppose que lorsque vous aurez une superposition de dessins vectoriels — toute en vagues et en plis brumeux — décrivant le Web 2.0, et accès à un Web sémantique intégré dans cet immense espace de données, vous aurez accès à une incroyable ressource de données.  »

— A ‘more revolutionary’ Web, 2006, Victoria Shannon

Tagué , , , , , ,