01net Pro Entreprise informatique
Actualités gestion et logiciel informatique professionnel
Offre et recherche Emploi informatique internet
Salon conférences inofrmatique IT ebusiness 01
Le Cloud Computing
Vidéos reportage entreprise acteur informatique
Retrouvez tous les services 01Net dédiés aux professionnels !
Télécharger logiciels Pro et progiciels
Livres blancs e-commerce informatique et nouvelles technologies
Retrouvez l'ensemble des dossiers de la rédaction 01net Entreprise
Les synthèses des bonnes pratiques sur les sujets IT du moment
Agenda
Applications web et logiciels
Développement
FAI-Télécoms
Marché
Matériel
Sécurité
SSII
Système d'exploitation

Les robots de Google à l’assaut d’AJAX

Google lance une proposition à la communauté Web pour améliorer le référencement des pages utilisant de l'AJAX, quasiment invisibles pour ses robots jusqu'à présent.

laisser un avis
Pour le référencement d'un site Web, il n'y a pas que le Flash qui pose problème. Les robots de Google n'apprécient pas non plus le JavaScript et donc pas l'AJAX (Asynchronous JavaScript and XML).
Une aubaine pour certains, comme l'explique Jean-Michel De Sousa, expert en référencement chez Sartepenso : « Certains spammers utilisent ce défaut pour rendre invisibles certaines parties de sites » et donc faire passer un site pour ce qu'il n'est pas.
Mais un casse-tête pour la plupart, comme le précise Olivier Duffez, consultant chez Webrankexpert. « Je déconseille fortement l'utilisation d'AJAX sur les parties qui génèrent du contenu. Il doit être réservé aux couches qui améliorent l'expérience utilisateurs. » Et de poursuivre : « Le code JavaScript est pris en compte par Google tant qu'il est assez simple, notamment lorsqu'il contient des liens vers des pages Web. Mais il devient vite inaccessible aux robots des moteurs de recherche. »

Un changement de la syntaxe des URLs

Pour rendre AJAX visible par ses robots, Google, sur l'un de ses blogs officiels, fait une proposition technique ouverte à la communauté du Web  : en l'occurence, changer la syntaxe de certaines URL. Et notamment celles utilisant l'ancre « # ». Celle-ci est traditionnellement utilisée par les webmasters pour indiquer un paragraphe précis d'une page Web, lors de la création d'un sommaire, notamment. Mais elle est aussi utilisé pour le passage de certains paramètres dans des fonctions JavaScript, et les robots du moteur de recherche ont du mal à les interpréter.
Google propose d'ajouter le signe « ! » en complément du caractère « # », pour les pages Web qui contiennent du code AJAX  Au moment de l'exploration des sites, les robots de Google remplaceraient le « ! » dans les URL par un tag _escaped_fragment_.
Ce tag serait une façon d'indiquer au serveur Web du site visité qu'il est interrogé par un robot d'indexation et qu'il doit, dans ce cas, envoyer du code HTML en lieu et place du JavaScript. Lors d'une requête effectuée par un utilisateur standard (qui ne contiendrait pas ce tag), le serveur continuerait à retourner la page originale, le code JavaScript étant exécuté côté client par le navigateur de l'utilisateur. Les serveurs des moteurs de recherche pourraient eux-mêmes se charger de l’exécution du JavaScript, mais Google n’envisage pas cette option, la qualifiant de trop gourmande en temps de calcul, et défavorable aux petits moteurs de recherche.
Si cette proposition était acceptée, il faudrait donc rajouter des points d'exclamation à certaines URL des sites et faire en sorte que les serveurs puissent interpréter le paramètre _escaped_fragment_.

Le référencement, un art subtil

« A l'inverse, il faudra aussi se méfier des parties de sites qui jusqu'ici étaient invisibles par défaut et qui seraient indexées dans le futur, comme la gestion des paniers sur les sites marchands. Par exemple, en utilisant le code JavaScript dans des fichiers .js et en indiquant dans le fichier robot.txt de ne pas crawler les fichiers », explique Olivier Duffez.
Pour l'instant, les sites web confrontés au problème choisissent de générer des pages HTML en doublon pour l'indexation ou de réserver le code JavaScript aux parties du site qui n'ont pas besoin d'être référencées. Ce que confirme Elie Auvray, PDG de Jahia. « Les interfaces d'édition et de gestion repose sur AjAX. Mais lorsque l'on passe en mode consultation, Jahia envoie au navigateur du visiteur de l'HTML tout à fait classique. Même lorsque la page générée présente de l'interaction, comme la possibilité de poster un commentaire. »
envoyer
par mail
imprimer
l'article
6 AVIS SUR CET ARTICLE
Répondre
 

Avis sur «Les robots de Google à l’assaut d’AJAX»

 

Mouai

de HIPe , posté le 08 octobre 2009 à 18h27
Dans 99% des cas il n'y a aucun intérêt à référencer la partie AJAX d'un site, c'est même plutôt mieux qu'elle ne soit pas référencée... En général l'AJAX est utilisé dans des formulaires ou des parties qui sont mises à jour en permanence et donc qui n'auraient aucun sens à être référencé (Google bot serait à peine passé que le contenu aurait déjà changé)...
alerter le modérateur


Oui exact...

de seb__2411 , posté le 08 octobre 2009 à 21h46
Le pire serait de trop encourager les developpeur a faire des sites 100% Ajax.

Hors actuellement, Google encourage plutot les dev à faire des sites standardisé et au contenu accessible ( exit Flash et Javscript ). Et c'est pas plus mal.
alerter le modérateur


Ajax pivot central

de reportagemoto.fr , posté le 08 octobre 2009 à 23h22
Google pense à ce que pourront être les sites HTML du futur dont l'ajax sera le pivot central. Le rechargement complet de page lors de la navigation c'est bon pour les sites à papa.
alerter le modérateur


Pas encore...

de seb__2411 , posté le 09 octobre 2009 à 13h29
Les sites tout en Ajax c'est bien pour faire joujou. Mais d'un point de vue technique et pro, c'est suicidaire.

Il reste encore beaucoup de travail à faire pour pouvoir offrir des sites Ajax de qualité et qui soient aussi efficace que les sites standards.
alerter le modérateur


Quid des navigateurs qui n'exécutent pas le javascript

de Loutre666 , posté le 09 octobre 2009 à 17h57
Le code flash et javascript sur un site risque de n'être même pas exécuté par le navigateur du visiteur.

Il faut donc faire très attention à ne pas mettre son menu uniquement dispo en flash ou javascript (et donc ajax) car sinon il est impossible d'y naviguer.

Les navigateurs qui ne gèrent pas le flash ou le javascript sont quand même assez courant, pour des questions techniques (iPhone safari) ou de sécurité (config entreprise)...
alerter le modérateur


Oui

de seb__2411 , posté le 09 octobre 2009 à 21h18
C'est la règle : du html pour le contenu.
alerter le modérateur

   
 
à lire aussi
SUR LES MÊMES THÈMES
Rachat de Motorola Mobility par Google : c'est fait !
Concurrence : l'Europe exige des réponses de Google
Google va pouvoir finaliser son rachat de Motorola
Knowledge Graph : Google fait un pas vers le Web sémantique
Google remet le Nexus au coeur d'Android
Chrome 19 passe en version finale
Découvrez les fonctions du nouveau Google+
L'appli Google+ pour iOS repensée de A à Z
Google+ : utilisez les styles pour vos publications
Apple et son iOS font main basse sur les revenus du jeu mobile
La moitié des accès aux sites Web se fait par Google
Créer son thème pour Chrome
Twitter et Google font des fêtes à tout casser
Cube : jouez dans Google Maps !
Easter eggs : StarCraft attaque Google
Samsung fabriquerait le prochain Nexus de Google
Google cherche des partenaires pour sa future Google Car
Découvrez Google Drive en images
Google Drive, quand la rumeur devient réalité