Actualités Emploi Start-up Avis d'expert Vidéos Indicateurs Distribution Telecharger Pro Livres blancs

Les microformats donnent du sens aux pages web

Ces formats transforment les pages web en bases de données structurées. L'indexation devient ainsi plus riche et plus pertinente.
envoyer
par mail
imprimer
l'article
partager sur Viadeo
partager sur Facebook
partager sur LinkedIn
partager sur Scoopeo
partager sur Technorati
partager sur Digg
partager sur Delicious
partager sur Google
partager sur Myspace
partager sur Yahoo!

“ Une approche du web sémantique pragmatique et simple à mettre en œuvre. ” C'est ainsi que François Goube, PDG du moteur de recherche Jobijoba.com, qualifie les microformats. De son côté, Bill Gates affirmait il y a un an : “ Nous avons besoin des microformats. ” Leur mise en place ne requiert aucune modification de l'infrastructure web existante. Et cela plaît. Tout le contraire de l'approche RDF (Resource Description Framework), jamais adoptée alors que sa création remonte à 1999.

Techniquement, les microformats se présentent sous la forme de valeurs standardisées de l'attribut Class des éléments

ou , que l'on retrouve dans des fichiers HTML ou XHTML. Ils précisent le contenu de ces éléments en indiquant formellement la présence d'un type de données structurées : adresse, événement, CV, produit, etc. Les coordonnées d'une personne peuvent ainsi être décrites à l'aide du micro-format hCard (qui s'inspire du standard international vCard). Il existe plusieurs granularités de microformats, capables de s'imbriquer les uns dans les autres. C'est ainsi que hReview emprunte à hCard, hCalendar, et Reltag. Google et Yahoo expérimentent depuis quelque temps cette méthode, inscrite dans la mouvance du web 2.0. Ces moteurs de recherche comptent sur elle pour doper leur pertinence.

De vraies interactions entre les pages

Les spécialistes des navigateurs, Microsoft, et la fondation Mozilla suivent le mouvement. “ Firefox 3 détectera automatiquement les structures de données des microformats, et fournira une interface adaptée pour aider l'utilisateur à interagir avec ces données ”, dit Tristan Nitot, responsable de Mozilla Europe. Les microformats se servent de la page HTML comme d'une enveloppe pour transporter des objets fortement typés vers un logiciel : gestionnaire d'agenda, de contacts, etc. Ils facilitent l'échange de données structurées entre une entreprise et ses clients, ou entre un service en ligne et ses utilisateurs. “ En transférant les microformats aux applications sachant les interpréter, le navigateur établit un pont entre le web et le poste de travail. Il propose de vraies interactions, et ne se contente plus d'afficher une page ”, note Tristan Nitot. En attendant Firefox3 et Internet Explorer 8, le plug in Operator permet déjà de manipuler ces objets depuis le navigateur de Mozilla.

Les entreprises se montrent intéressées. La SNCF étudie les microformats pour doper l'ergonomie et l'interactivité de son site web en proposant, par exemple, d'ajouter un trajet en train dans son agenda Outlook ou dans Google Calendar. Les banques suivent aussi le sujet de près. “ L'ajout d'une carte de visite hCard permet au visiteur de récupérer en un seul clic, et directement dans son carnet d'adresses, toutes les données sur la fiche signalétique d'une entreprise ou d'une personne ”, note Christophe Ducamp, chef de projet communication interactive à la Caisse d'épargne et responsable du site Microformateurs.org. Dans un autre registre, l'agenda collaboratif Upcoming.org s'appuie sur hCalendar pour recenser les manifestations (conférences, expositions, concerts, etc.) d'une zone géographique et à une date données. On peut aussi citer le réseau social Linkedin, qui expose 9 millions de CV encodés à l'aide du microformat hResume, et le site Flickr, qui propose 5 millions de photos géocodées par ses utilisateurs à l'aide du microformat Geo.

Depuis juin 2006, la base de données locale de Yahoo recense plus de 15 millions d'entreprises et d'événements locaux à l'aide de hCard et hCalendar. Elle permet même aux utilisateurs d'attribuer une note au service rendu par l'entreprise à l'aide de hReview. Le moteur Technorati Kitchen recherche des objets (personnes, événements, revues de produits…) sur le web en ne s'appuyant que sur les microformats les plus courants. Et Jobijoba.com propose des moteurs verticaux (emploi, immobilier) basés sur les microformats.

Pour tous ces outils, “ cette couche sémantique change fondamentalement la vision du web, qui n'est plus un grand livre composé de textes, mais une importante base de données composée d'objets ”, résume Jérémy Chatard, directeur technique de la SSII Breek. La structure de ces objets étant normalisée, le moteur sait avec certitude qu'il indexe une carte de visite, un événement, un produit, etc. “ Indexer une page web revient à insérer des objets typés dans une base de données. Il est bien plus facile de fournir un résultat de qualité à l'internaute ”, confirme Tantek Çelik, directeur technique de Technorati.

450 millions de pages sont déjà concernées

Dès que les entreprises adopteront en masse les microformats, de nombreuses applications seront possibles. C'est bien parti. Selon Ben West d'Alexa, un service mesurant la popularité des sites, environ 450 millions de pages web incorporent des microformats. Les Google, Yahoo et Microsoft pourront constituer des sites de recherche d'emploi ou des catalogues de produits à partir de simples pages HTML.

Plus original, les microformats peuvent aussi s'associer à RSS, canal standard pour pousser des données d'un site à l'autre. Développer des applications évoluées reposant sur une architecture événementielle devient alors possible. François Goube, de Jobijoba.com, imagine ainsi dans le domaine de l'emploi “ une alerte se déclenchant dès qu'un nouveau CV encodé à l'aide de hResume apparaît sur le web ”.

Quels domaines d'application ?

Recherche et comparaison
Les moteurs s'appuient sur le microformat hReview pour effectuer des recherches sur des produits et services et des comparaisons multicritères (prix, par exemple).

Gestion de contacts
hCard permet d'ajouter les coordonnées d'une personne à son carnet d'adresses. Avec ce microformat, les moteurs de recherche voient le web comme une immense annuaire.

Gestion d'agenda
Avec hCalendar, l'ajout d'un événement dans un agenda personnel s'opère en un clic. Un moteur de recherche peut agréger les rendez-vous selon le lieu, la date, l'heure, etc.

Gestion de CV
hResume expose un parcours professionnel en s'appuyant sur hCalendar et hCard, et sur des tags.

Géolocalisation
Indique la position GPS dans un format exploitable par la plupart des moteurs de cartographie.

Des pages web “ intelligentes ”

agrandir la photo

Une autre navigation
Firefox 3 et Internet Explorer 8 proposeront des fonctions liées aux microformats. Dans cet exemple, l'internaute peut, en un clic, ajouter l'adresse d'une personne à son carnet d'adresses Outlook.

Ils n'affectent pas l'affichage
Le navigateur affiche les informations comme il le fait pour n'importe quelle page web, sans que les microformats apparaissent.

Des attributs de sens
L'auteur insère dans les balises

et de sa page HTML des attributs indiquant aux moteurs de recherche et aux navigateurs le sens des informations qui s'affichent à l'écran. Ici, les éléments d'une adresse encodée à l'aide du microformat hCard.

Une indexation en fonction de données

agrandir la photo

1. Ajout de microformats
L'entreprise ajoute des microformats dans les pages de son site web. Chacun d'eux (nom, adresse, etc.) possède un schéma de données standardisé par la communauté Microformats.org.

2. Indexation par le moteur de recherche
Le moteur parcourt le code HTML à la recherche d'un attribut Class, indiquant la présence de microformats. Il indexe la page en fonction des données structurées qu'il rencontre (nom, adresse, description de produits, CV, etc.), et non d'un calcul de densité des mots-clés.

3. Recherche multicritère
L'internaute précise le type d'informations recherchées : noms, adresses, etc. Le moteur traduit la recherche en une requête SQL. Il parcourt son index en utilisant les différents critères, et propose alors une liste de personnes, de produits, d'événements, etc. La plupart des résultats peuvent être utilisés au sein d'un logiciel client : carnet d'adresses Outlook, agenda Google Calendar, système de favoris en ligne Del.icio.us, cartographie Yahoo Maps, etc.

Témoignage : Corinne Brunel (VSC Technologies - groupe Voyages-sncf.com) : “ visualiser son trajet en train sur une carte établie automatiquement par Google ”

“ Nous suivons de très près les aspects sémantiques du web 3.0, et nous commençons à structurer nos données en conséquence. Deux technologies ont retenu notre attention : RDF, et les microformats tels hCard et hCalendar. Ils ouvrent de nouveaux modes d'interaction. On imagine les utilisateurs du site Voyages-sncf.com visualisant leur trajet sur une carte de Google ou Yahoo, établie en fonction des points de départ et d'arrivée. Les coordonnées seraient encodées à l'aide du microformat Geo. Rien n'empêche non plus d'exporter le billet de train et les détails du trajet sous la forme d'un événement dans Outlook ou dans Google Calendar. La normalisation de la description d'un produit ou d'un service via hReview facilitera la construction d'une gigantesque boutique en ligne, constituée des fiches produits de chaque vendeur. Ce qui permettra de composer, via le navigateur de l'internaute, un panier commun, payable en une fois ! ”

Avis d'expert : Tantek Çelik, directeur technologique de Technorati

Spécialiste de la recherche en temps réel sur les flux RSS et les blogs.

“ Les microformats seront adoptés massivement ”
“ Ils sont très faciles à mettre en œuvre. Quelques attributs HTML suffisent à ajouter une couche sémantique aux pages déjà publiées. Nul besoin, donc, d'être un développeur chevronné. Ils nous permettent à nous, numéro un mondial de la recherche en temps réel, d'améliorer la qualité de nos résultats, car ils standardisent les types de contenus les plus fréquemment publiés sur le web. ”

“ Des résultats plus pertinents qu'avec un moteur classique ”
“ La recherche s'appuie sur des données structurées et sémantiques. Pour l'internaute, les microformats fiabilisent et accélèrent l'accès à l'information. Pour l'entreprise, ils lui assurent que les données qu'elles exposent – une adresse, une fiche produit, ou un CV – seront bien interprétées par les moteurs de recherche. Notre moteur Technorati Kitchen permet, par exemple, de rechercher un contact, un événement, ou un produit en ne se basant que sur les microformats hCard, hCalendar, hReview, Reltag, etc. ”

publicité
à lire aussi
SUR LES MÊMES THÈMES
Dect résistera-t-il à la voix sur Wi-Fi ?
Renforcer les contrôles d'accès aux SI
Michèle Hyron (Atos Origin) : “ nous prévoyons 200 000 heures de tests pour parer à l'imprévu ”
“ Ces DSI frileux qui vont dans le mur ”
“ Oui à un antivirus gratuit intégré à Windows ”…
Guillaume Gorge (SFR) : “ nous voulions éviter au maximum les développements spécifiques ”
La RATP remet sa GRH sur les rails
Le journal de l'année 2008
“ Les ingénieurs ne sont pas austères, ils sont artistes ”
Bruno Ménard (Cigref, Sanofi-Aventis) : “ le terreau de la création de valeur est l'excellence opérationnelle ”
Les DSI de l'année 2008
Cloud Computing : quelques services, beaucoup de promesses
Laissez-vous tenter par les mashups
“ Mais où sont les services de la 4G ? ”
Samuel Hurtrel (AG2R) : “ nos services bénéficient d'une boucle haut débit Paris-Lille-Chartres ”
Comment l'Europe peut reconquérir son logiciel
Le recrutement sous surveillance en 2009
La gestion de contenu interagit enfin avec le SI
La location, un remède à la crise ?
01Informatique
01 INFORMATIQUE
L'hebdo de référence des décideurs informatiques.
Micro Hebdo
MICRO HEBDO
L'hebdo qui vous simplifie la micro
et Internet.
L'Ordinateur Individuel
L'ORDINATEUR INDIVIDUEL
Le mensuel informatique qui vous informe et vous conseille.
Tous droits réservés © 1999 - 2009 Internext - 01net.