Les microformats donnent du sens aux pages web
Ces formats transforment les pages web en bases de données structurées. L'indexation devient ainsi plus riche et plus pertinente.
Techniquement, les microformats se présentent sous la forme de valeurs standardisées de l'attribut Class des éléments <div> ou <span>, que l'on retrouve dans des fichiers HTML ou XHTML. Ils précisent le contenu de ces éléments en indiquant formellement la présence d'un type de données structurées : adresse, événement, CV, produit, etc. Les coordonnées d'une personne peuvent ainsi être décrites à l'aide du micro-format hCard (qui s'inspire du standard international vCard). Il existe plusieurs granularités de microformats, capables de s'imbriquer les uns dans les autres. C'est ainsi que hReview emprunte à hCard, hCalendar, et Reltag. Google et Yahoo expérimentent depuis quelque temps cette méthode, inscrite dans la mouvance du web 2.0. Ces moteurs de recherche comptent sur elle pour doper leur pertinence.
De vraies interactions entre les pages
450 millions de pages sont déjà concernées
Quels domaines d'application ?
Recherche et comparaison
Les moteurs s'appuient sur le microformat hReview pour effectuer des recherches sur des produits et services et des comparaisons multicritères (prix, par exemple).
Gestion de contacts
hCard permet d'ajouter les coordonnées d'une personne à son carnet d'adresses. Avec ce microformat, les moteurs de recherche voient le web comme une immense annuaire.
Gestion d'agenda
Avec hCalendar, l'ajout d'un événement dans un agenda personnel s'opère en un clic. Un moteur de recherche peut agréger les rendez-vous selon le lieu, la date, l'heure, etc.
Gestion de CV
hResume expose un parcours professionnel en s'appuyant sur hCalendar et hCard, et sur des tags.
Géolocalisation
Indique la position GPS dans un format exploitable par la plupart des moteurs de cartographie.
Des pages web ' intelligentes '
Une autre navigation
Firefox 3 et Internet Explorer 8 proposeront des fonctions liées aux microformats. Dans cet exemple, l'internaute peut, en un clic, ajouter l'adresse d'une personne à son carnet d'adresses Outlook.
Ils n'affectent pas l'affichage
Le navigateur affiche les informations comme il le fait pour n'importe quelle page web, sans que les microformats apparaissent.
Des attributs de sens
L'auteur insère dans les balises <div> et <span> de sa page HTML des attributs indiquant aux moteurs de recherche et aux navigateurs le sens des informations qui s'affichent à l'écran. Ici, les éléments d'une adresse
encodée à l'aide du microformat hCard.
Une indexation en fonction de données
1. Ajout de microformats
L'entreprise ajoute des microformats dans les pages de son site web. Chacun d'eux (nom, adresse, etc.) possède un schéma de données standardisé par la communauté Microformats.org.
2. Indexation par le moteur de recherche
Le moteur parcourt le code HTML à la recherche d'un attribut Class, indiquant la présence de microformats. Il indexe la page en fonction des données structurées qu'il rencontre (nom, adresse, description de produits, CV, etc.), et
non d'un calcul de densité des mots-clés.
3. Recherche multicritère
L'internaute précise le type d'informations recherchées : noms, adresses, etc. Le moteur traduit la recherche en une requête SQL. Il parcourt son index en utilisant les différents critères, et propose alors une liste de
personnes, de produits, d'événements, etc. La plupart des résultats peuvent être utilisés au sein d'un logiciel client : carnet d'adresses Outlook, agenda Google Calendar, système de favoris en ligne Del.icio.us, cartographie Yahoo Maps,
etc.
Témoignage : Corinne Brunel (VSC Technologies - groupe Voyages-sncf.com) : ' visualiser son trajet en train sur une carte établie automatiquement par Google '
' Nous suivons de très près les aspects sémantiques du web 3.0, et nous commençons à structurer nos données en conséquence. Deux technologies ont retenu notre attention : RDF, et les microformats tels hCard et hCalendar. Ils ouvrent de nouveaux modes d'interaction. On imagine les utilisateurs du site Voyages-sncf.com visualisant leur trajet sur une carte de Google ou Yahoo, établie en fonction des points de départ et d'arrivée. Les coordonnées seraient encodées à l'aide du microformat Geo. Rien n'empêche non plus d'exporter le billet de train et les détails du trajet sous la forme d'un événement dans Outlook ou dans Google Calendar. La normalisation de la description d'un produit ou d'un service via hReview facilitera la construction d'une gigantesque boutique en ligne, constituée des fiches produits de chaque vendeur. Ce qui permettra de composer, via le navigateur de l'internaute, un panier commun, payable en une fois ! '
Avis d'expert : Tantek Çelik, directeur technologique de Technorati
Spécialiste de la recherche en temps réel sur les flux RSS et les blogs.
' Les microformats seront adoptés massivement '
' Ils sont très faciles à mettre en ?"uvre. Quelques attributs HTML suffisent à ajouter une couche sémantique aux pages déjà publiées. Nul besoin, donc, d'être un développeur chevronné. Ils nous permettent à nous,
numéro un mondial de la recherche en temps réel, d'améliorer la qualité de nos résultats, car ils standardisent les types de contenus les plus fréquemment publiés sur le web. '
' Des résultats plus pertinents qu'avec un moteur classique '
' La recherche s'appuie sur des données structurées et sémantiques. Pour l'internaute, les microformats fiabilisent et accélèrent l'accès à l'information. Pour l'entreprise, ils lui assurent que les données quelles
exposent ?" une adresse, une fiche produit, ou un CV ?" seront bien interprétées par les moteurs de recherche. Notre moteur Technorati Kitchen permet, par exemple, de rechercher un contact, un événement, ou un produit en ne se basant que
sur les microformats hCard, hCalendar, hReview, Reltag, etc. '

par mail

l'article

nos newsletters
Abonnez-vous à Micro Hebdo : 4,90 €/mois
Abonnez-vous à l'Ordinateur Individuel : 3 €/mois
Abonnez-vous à la version digitale
Abonnez-vous à 01Business et Technologies : 19 €/mois











agrandir la photo