En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d’intérêts.FERMER  x
Pour en savoir plus et paramétrer les cookies...

Le web intelligent prend forme

Pour réaliser ce rêve aussi ancien que la Toile elle-même, la sémantique cherche à poser une couche de signification sur les données. Ces données sont ouvertes, exposées puis liées entre elles grâce aux Linked Data, une technologie aussi importante que l'invention du World Wide Web.

laisser un avis
Actuellement, quand nous utilisons un moteur de recherche, celui-ci ne comprend pas notre requête. Il trouve les pages où apparaissent les mots-clés cités dans notre demande mais ne nous garantit pas qu'elles y répondent vraiment. Le web sémantique se veut intelligent, une idée aussi ancienne que la Toile elle-même. Il serait capable de comprendre nos requêtes en langage naturel, d'interpréter leur contexte, de nous retourner des résultats appropriés et de nous proposer des contenus relatifs à cette requête. Pour certains, le web intelligent serait capable, tel un assistant personnel, d'organiser notre vie. A la question « où puis-je déjeuner ? », il pourrait, en fonction de vos goûts gastronomiques, de vos habitudes et de l'endroit où vous vous trouvez, vous proposer le restaurant le plus approprié.
Pour l'heure, ce web intelligent est loin d'être une réalité, même si certains moteurs de recherche commencent à mettre en œuvre des techniques sémantiques. Ces dernières permettent aux ordinateurs de dialoguer entre eux sans intervention humaine. Pour ce faire, l'idée est de rajouter aux données brutes du web une couche de signification, des métadonnées contextuelles que les ordinateurs seraient capables d'interpréter.

L'enjeu des métadonnées déclaratives

Certaines métadonnées de type implicite sont déjà en œuvre. Les algorithmes Page Rank et Trust Rank, de Google, exploitent des métadonnées concernant la structure du web (le nombre de liens pointant vers une page, indicateur de réputation de cette page). Et le moteur de recherche Bing, de Microsoft, commence à interpréter et à contextualiser les requêtes en langage naturel grâce à la technologie Powerset. Mais le vrai projet du web sémantique est de s'attaquer aux métadonnées de type déclaratives. Son principe : attacher à chaque mot important d'un texte une balise indiquant le contexte (à quel vocabulaire il appartient) et de structurer cette information. Techniquement, le langage XML fournit la grammaire compréhensible par les ordinateurs, la couche RDF (Resources Description Framework) décrit les métadonnées et les annotations des données, le langage OWL (Web Ontology Language) décrit les descriptions et ajoute des contraintes logiques qualifiantes. Selon Tim Berners-Lee, inventeur du World Wide Web, le web sémantique – dont il est l'apôtre – aura une collection d'informations appelées ontologies (des fichiers qui définissent les relations entre un groupe de termes).

Du web de l'hypertexte à celui des données

Le web sémantique a longtemps souffert de la pauvreté de son environnement de développement (langages, outils, normes, compétences…). Mais il s'étoffe progressivement. Le W3C (World Wide Web Consortium) a récemment proposé une nouvelle version de la technologie de requête SPARQL, ou encore la nouvelle spécification POWDER pour certifier la qualité des sites web. Pour autant, l'écosystème (technologies, applications, acteurs, besoins) est encore loin d'avoir atteint la masse critique nécessaire à son décollage.
Il ne suffit pas de mettre des données sur le web, il faut aussi créer des liens entre elles, afin que ce web (dit des données) puisse être exploré par une personne ou une machine. Avec les Linked Data (données liées), un sous-projet du Semantic Web au sein du W3C, vous pouvez trouver à partir d'une donnée celles qui sont en relation avec elle. A l'instar du web hypertexte, celui des données est construit avec les documents du web. Dans le cas de l'hypertexte, les liens sont des relations entre des documents écrits en HTML. Pour les données, les liens sont entre des objets décrits par RDF et identifiés par des URI (Uniform Resource Identifier ou identifiant uniforme de ressources).

Données liées dans le projet DBpedia-spawned LOD cloud du groupe Linling Open Data [source: Chris Bizer, http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/LinkingOpenData#dbpedia-lod-cloud]

Pour Tim Berners-Lee, cette technologie des données liées est un changement aussi important que l'invention du World Wide Web lui-même. Il en fait sa croisade et invite les gouvernements et les individus à ouvrir leurs données et à les exposer sur le web. Pour cela, il énonce quatre principes de base : utiliser des URI (au lieu des URL) pour identifier ce que vous voulez rendre disponible sur le web comme ressources de données ; se servir des adresses HTTP pour permettre de les localiser et d'accéder à leurs contenus ; fournir des informations utiles sur la ressource (URI) quand on la consulte ; y inclure des liens vers d'autres URI en rapport avec la ressource consultée de façon à améliorer la découverte d'informations utiles. Grâce aux Linked Data, on découvre des données, on en obtient la description et on peut les réutiliser entre elles. Un concept qui est aux données ce que le World Wide Web fut aux documents des années 1990.

Le web à venir par Tim Berners-Lee - Conférence TED février 2009

Il y a 20 ans, Tim Berners-Lee inventait le World Wide Web. Pour son nouveau projet, il construit un web des données, libres et liées, qui pourrait faire aux nombres ce que le web a fait pour les mots, les photos et les vidéos: libérons nos données et redéfinissons la manière dont nous les utilisons [Sous-titres en français disponibles, cliquez sur View subtitles. Source : www.ted.com].

 

IEML, la langue de l'intelligence collective

L'exploitation “ intelligente ” des données présentes sur le web est aujourd'hui très limitée. Dans des corpus relativement homogènes, tel Wikipedia, on ne voit pas comment générer des liens automatiques entre des documents sur les mêmes sujets.
IEML (Information Economy Meta Language) apporte une réponse sous forme d'un métalangage, d'un système d'adressage sémantique des documents numériques, un système symbolique pour faire accéder l'intelligence collective humaine à la conscience réflexive. Cette langue formelle, qui donne la possibilité d'exprimer les données, les théories et les modèles des diverses sciences de l'homme, peut être traitée par les ordinateurs.
Ce métalanguage jette un pont entre les langues naturelles, les cultures, les disciplines et les domaines de compétences, un pont entre les humains et les ordinateurs. Le projet IEML est conduit par le laboratoire d'intelligence collective et la chaire de recherche du Canada en intelligence collective (www.ieml.org)

[Source: Pierre Levy, créateur d'IEML]

Liens

Portail officiel du W3C sur le web sémantique :
http://www.w3.org/2001/sw/

WebSemantique.org, communauté francophone
http://websemantique.org/

ReadWriteWeb France :
Innovation sur le web : le web des données

envoyer
par mail
imprimer
l'article


@01Business_fr sur
à lire aussi
SUR LES MÊMES THÈMES
Que nous prépare le Web 3.0 ?
Des concepts aux technologies, le web 3.0 en un clin d'œil
« Le Web 3.0 devra s'adapter pour être opérationnel en entreprise »
Proxem lance un moteur de recherche sémantique
Spécialiste de la gestion de contenus multimédias, Perfect Memory lève 600 K€
Euriware certifié Gold Partner de Temis
Pôle emploi choisit les moteurs de recherche sémantique d’Accenture et de TextKernel
[Best of blogs 2012] La vie après Jobs/Ville 2.0/SSII et CIR/Recherche et sémantique/Intranet pas mort !
SemWeb.Pro : le web sémantique démontre son utilité en entreprise
Semweb.pro : la France bien positionnée sur le web sémantique
L'Europe se dote de son moteur sémantique : Fise
10 innovations qui changent l'entreprise
Vers la généralisation d'un web omniprésent
La longue route vers l'humanité 2.0
Yauba, le moteur qui préserve votre anonymat
Cegid diffuse Office 365 auprès de ses clients PME
IBM propose une version cloud de Watson aux entreprises
Jamespot accompagne les clients d’Human Connect vers de nouvelles aventures
Alfresco lève 45 millions de dollars