01net Pro Entreprise informatique
Actualités gestion et logiciel informatique professionnel
Offre et recherche Emploi informatique internet
Salon conférences inofrmatique IT ebusiness 01
Le Cloud Computing
Vidéos reportage entreprise acteur informatique
Retrouvez tous les services 01Net dédiés aux professionnels !
Télécharger logiciels Pro et progiciels
Livres blancs e-commerce informatique et nouvelles technologies
Retrouvez l'ensemble des dossiers de la rédaction 01net Entreprise
Les synthèses des bonnes pratiques sur les sujets IT du moment
Rencontres 01
Club 01 DSI
Webcast
Qui sommes-nous ?
Contacts

Les microformats donnent du sens aux pages web

Ces formats transforment les pages web en bases de données structurées. L'indexation devient ainsi plus riche et plus pertinente.

' Une approche du web sémantique pragmatique et simple à mettre en ?"uvre. ' C'est ainsi que François Goube, PDG du moteur de recherche Jobijoba.com, qualifie les microformats. De son côté, Bill Gates affirmait il y a un an : ' Nous avons besoin des microformats. ' Leur mise en place ne requiert aucune modification de l'infrastructure web existante. Et cela plaît. Tout le contraire de l'approche RDF (Resource Description Framework), jamais adoptée alors que sa création remonte à 1999.

Techniquement, les microformats se présentent sous la forme de valeurs standardisées de l'attribut Class des éléments <div> ou <span>, que l'on retrouve dans des fichiers HTML ou XHTML. Ils précisent le contenu de ces éléments en indiquant formellement la présence d'un type de données structurées : adresse, événement, CV, produit, etc. Les coordonnées d'une personne peuvent ainsi être décrites à l'aide du micro-format hCard (qui s'inspire du standard international vCard). Il existe plusieurs granularités de microformats, capables de s'imbriquer les uns dans les autres. C'est ainsi que hReview emprunte à hCard, hCalendar, et Reltag. Google et Yahoo expérimentent depuis quelque temps cette méthode, inscrite dans la mouvance du web 2.0. Ces moteurs de recherche comptent sur elle pour doper leur pertinence.

De vraies interactions entre les pages

Les spécialistes des navigateurs, Microsoft, et la fondation Mozilla suivent le mouvement. ' Firefox 3 détectera automatiquement les structures de données des microformats, et fournira une interface adaptée pour aider l'utilisateur à interagir avec ces données ', dit Tristan Nitot, responsable de Mozilla Europe. Les microformats se servent de la page HTML comme d'une enveloppe pour transporter des objets fortement typés vers un logiciel : gestionnaire d'agenda, de contacts, etc. Ils facilitent l'échange de données structurées entre une entreprise et ses clients, ou entre un service en ligne et ses utilisateurs. ' En transférant les microformats aux applications sachant les interpréter, le navigateur établit un pont entre le web et le poste de travail. Il propose de vraies interactions, et ne se contente plus d'afficher une page ', note Tristan Nitot. En attendant Firefox3 et Internet Explorer 8, le plug in Operator permet déjà de manipuler ces objets depuis le navigateur de Mozilla.
Les entreprises se montrent intéressées. La SNCF étudie les microformats pour doper l'ergonomie et l'interactivité de son site web en proposant, par exemple, d'ajouter un trajet en train dans son agenda Outlook ou dans Google Calendar. Les banques suivent aussi le sujet de près. ' L'ajout d'une carte de visite hCard permet au visiteur de récupérer en un seul clic, et directement dans son carnet d'adresses, toutes les données sur la fiche signalétique d'une entreprise ou d'une personne ', note Christophe Ducamp, chef de projet communication interactive à la Caisse d'épargne et responsable du site Microformateurs.org. Dans un autre registre, l'agenda collaboratif Upcoming.org s'appuie sur hCalendar pour recenser les manifestations (conférences, expositions, concerts, etc.) d'une zone géographique et à une date données. On peut aussi citer le réseau social Linkedin, qui expose 9 millions de CV encodés à l'aide du microformat hResume, et le site Flickr, qui propose 5 millions de photos géocodées par ses utilisateurs à l'aide du microformat Geo.
Depuis juin 2006, la base de données locale de Yahoo recense plus de 15 millions d'entreprises et d'événements locaux à l'aide de hCard et hCalendar. Elle permet même aux utilisateurs d'attribuer une note au service rendu par l'entreprise à l'aide de hReview. Le moteur Technorati Kitchen recherche des objets (personnes, événements, revues de produits...) sur le web en ne s'appuyant que sur les microformats les plus courants. Et Jobijoba.com propose des moteurs verticaux (emploi, immobilier) basés sur les microformats.
Pour tous ces outils, ' cette couche sémantique change fondamentalement la vision du web, qui n'est plus un grand livre composé de textes, mais une importante base de données composée d'objets ', résume Jérémy Chatard, directeur technique de la SSII Breek. La structure de ces objets étant normalisée, le moteur sait avec certitude qu'il indexe une carte de visite, un événement, un produit, etc. ' Indexer une page web revient à insérer des objets typés dans une base de données. Il est bien plus facile de fournir un résultat de qualité à l'internaute ', confirme Tantek Çelik, directeur technique de Technorati.

450 millions de pages sont déjà concernées

Dès que les entreprises adopteront en masse les microformats, de nombreuses applications seront possibles. C'est bien parti. Selon Ben West d'Alexa, un service mesurant la popularité des sites, environ 450 millions de pages web incorporent des microformats. Les Google, Yahoo et Microsoft pourront constituer des sites de recherche d'emploi ou des catalogues de produits à partir de simples pages HTML.
Plus original, les microformats peuvent aussi s'associer à RSS, canal standard pour pousser des données d'un site à l'autre. Développer des applications évoluées reposant sur une architecture événementielle devient alors possible. François Goube, de Jobijoba.com, imagine ainsi dans le domaine de l'emploi ' une alerte se déclenchant dès qu'un nouveau CV encodé à l'aide de hResume apparaît sur le web '.

Quels domaines d'application ?

Recherche et comparaison
Les moteurs s'appuient sur le microformat hReview pour effectuer des recherches sur des produits et services et des comparaisons multicritères (prix, par exemple).

Gestion de contacts
hCard permet d'ajouter les coordonnées d'une personne à son carnet d'adresses. Avec ce microformat, les moteurs de recherche voient le web comme une immense annuaire.

Gestion d'agenda
Avec hCalendar, l'ajout d'un événement dans un agenda personnel s'opère en un clic. Un moteur de recherche peut agréger les rendez-vous selon le lieu, la date, l'heure, etc.

Gestion de CV
hResume expose un parcours professionnel en s'appuyant sur hCalendar et hCard, et sur des tags.

Géolocalisation
Indique la position GPS dans un format exploitable par la plupart des moteurs de cartographie.

Des pages web ' intelligentes '

agrandir la photo

Une autre navigation
Firefox 3 et Internet Explorer 8 proposeront des fonctions liées aux microformats. Dans cet exemple, l'internaute peut, en un clic, ajouter l'adresse d'une personne à son carnet d'adresses Outlook.

Ils n'affectent pas l'affichage
Le navigateur affiche les informations comme il le fait pour n'importe quelle page web, sans que les microformats apparaissent.

Des attributs de sens
L'auteur insère dans les balises <div> et <span> de sa page HTML des attributs indiquant aux moteurs de recherche et aux navigateurs le sens des informations qui s'affichent à l'écran. Ici, les éléments d'une adresse encodée à l'aide du microformat hCard.

Une indexation en fonction de données

agrandir la photo

1. Ajout de microformats
L'entreprise ajoute des microformats dans les pages de son site web. Chacun d'eux (nom, adresse, etc.) possède un schéma de données standardisé par la communauté Microformats.org.

2. Indexation par le moteur de recherche
Le moteur parcourt le code HTML à la recherche d'un attribut Class, indiquant la présence de microformats. Il indexe la page en fonction des données structurées qu'il rencontre (nom, adresse, description de produits, CV, etc.), et non d'un calcul de densité des mots-clés.

3. Recherche multicritère
L'internaute précise le type d'informations recherchées : noms, adresses, etc. Le moteur traduit la recherche en une requête SQL. Il parcourt son index en utilisant les différents critères, et propose alors une liste de personnes, de produits, d'événements, etc. La plupart des résultats peuvent être utilisés au sein d'un logiciel client : carnet d'adresses Outlook, agenda Google Calendar, système de favoris en ligne Del.icio.us, cartographie Yahoo Maps, etc.

Témoignage : Corinne Brunel (VSC Technologies - groupe Voyages-sncf.com) : ' visualiser son trajet en train sur une carte établie automatiquement par Google '

' Nous suivons de très près les aspects sémantiques du web 3.0, et nous commençons à structurer nos données en conséquence. Deux technologies ont retenu notre attention : RDF, et les microformats tels hCard et hCalendar. Ils ouvrent de nouveaux modes d'interaction. On imagine les utilisateurs du site Voyages-sncf.com visualisant leur trajet sur une carte de Google ou Yahoo, établie en fonction des points de départ et d'arrivée. Les coordonnées seraient encodées à l'aide du microformat Geo. Rien n'empêche non plus d'exporter le billet de train et les détails du trajet sous la forme d'un événement dans Outlook ou dans Google Calendar. La normalisation de la description d'un produit ou d'un service via hReview facilitera la construction d'une gigantesque boutique en ligne, constituée des fiches produits de chaque vendeur. Ce qui permettra de composer, via le navigateur de l'internaute, un panier commun, payable en une fois ! '

Avis d'expert : Tantek Çelik, directeur technologique de Technorati

Spécialiste de la recherche en temps réel sur les flux RSS et les blogs.

' Les microformats seront adoptés massivement '
' Ils sont très faciles à mettre en ?"uvre. Quelques attributs HTML suffisent à ajouter une couche sémantique aux pages déjà publiées. Nul besoin, donc, d'être un développeur chevronné. Ils nous permettent à nous, numéro un mondial de la recherche en temps réel, d'améliorer la qualité de nos résultats, car ils standardisent les types de contenus les plus fréquemment publiés sur le web. '

' Des résultats plus pertinents qu'avec un moteur classique '
' La recherche s'appuie sur des données structurées et sémantiques. Pour l'internaute, les microformats fiabilisent et accélèrent l'accès à l'information. Pour l'entreprise, ils lui assurent que les données quelles exposent ?" une adresse, une fiche produit, ou un CV ?" seront bien interprétées par les moteurs de recherche. Notre moteur Technorati Kitchen permet, par exemple, de rechercher un contact, un événement, ou un produit en ne se basant que sur les microformats hCard, hCalendar, hReview, Reltag, etc. '

envoyer
par mail
imprimer
l'article