Les robots de Google à l’assaut d’AJAX
Google lance une proposition à la communauté Web pour améliorer le référencement des pages utilisant de l'AJAX, quasiment invisibles pour ses robots jusqu'à présent.
Pour le référencement d'un site Web, il n'y a pas que le Flash qui pose problème. Les robots de Google n'apprécient pas non plus le JavaScript et donc pas l'AJAX (Asynchronous JavaScript and XML).
Une aubaine pour certains, comme l'explique Jean-Michel De Sousa, expert en référencement chez Sartepenso : « Certains spammers utilisent ce défaut pour rendre invisibles certaines parties de sites » et donc faire passer un site pour ce qu'il n'est pas.
Mais un casse-tête pour la plupart, comme le précise Olivier Duffez, consultant chez Webrankexpert. « Je déconseille fortement l'utilisation d'AJAX sur les parties qui génèrent du contenu. Il doit être réservé aux couches qui améliorent l'expérience utilisateurs. » Et de poursuivre : « Le code JavaScript est pris en compte par Google tant qu'il est assez simple, notamment lorsqu'il contient des liens vers des pages Web. Mais il devient vite inaccessible aux robots des moteurs de recherche. »
Un changement de la syntaxe des URLs
Pour rendre AJAX visible par ses robots, Google, sur l'un de ses blogs officiels, fait une proposition technique ouverte à la communauté du Web : en l'occurence, changer la syntaxe de certaines URL. Et notamment celles utilisant l'ancre « # ». Celle-ci est traditionnellement utilisée par les webmasters pour indiquer un paragraphe précis d'une page Web, lors de la création d'un sommaire, notamment. Mais elle est aussi utilisé pour le passage de certains paramètres dans des fonctions JavaScript, et les robots du moteur de recherche ont du mal à les interpréter.
Google propose d'ajouter le signe « ! » en complément du caractère « # », pour les pages Web qui contiennent du code AJAX Au moment de l'exploration des sites, les robots de Google remplaceraient le « ! » dans les URL par un tag _escaped_fragment_.
Ce tag serait une façon d'indiquer au serveur Web du site visité qu'il est interrogé par un robot d'indexation et qu'il doit, dans ce cas, envoyer du code HTML en lieu et place du JavaScript. Lors d'une requête effectuée par un utilisateur standard (qui ne contiendrait pas ce tag), le serveur continuerait à retourner la page originale, le code JavaScript étant exécuté côté client par le navigateur de l'utilisateur. Les serveurs des moteurs de recherche pourraient eux-mêmes se charger de l’exécution du JavaScript, mais Google n’envisage pas cette option, la qualifiant de trop gourmande en temps de calcul, et défavorable aux petits moteurs de recherche.
Si cette proposition était acceptée, il faudrait donc rajouter des points d'exclamation à certaines URL des sites et faire en sorte que les serveurs puissent interpréter le paramètre _escaped_fragment_.
Le référencement, un art subtil
« A l'inverse, il faudra aussi se méfier des parties de sites qui jusqu'ici étaient invisibles par défaut et qui seraient indexées dans le futur, comme la gestion des paniers sur les sites marchands. Par exemple, en utilisant le code JavaScript dans des fichiers .js et en indiquant dans le fichier robot.txt de ne pas crawler les fichiers », explique Olivier Duffez.
Pour l'instant, les sites web confrontés au problème choisissent de générer des pages HTML en doublon pour l'indexation ou de réserver le code JavaScript aux parties du site qui n'ont pas besoin d'être référencées. Ce que confirme Elie Auvray, PDG de Jahia. « Les interfaces d'édition et de gestion repose sur AjAX. Mais lorsque l'on passe en mode consultation, Jahia envoie au navigateur du visiteur de l'HTML tout à fait classique. Même lorsque la page générée présente de l'interaction, comme la possibilité de poster un commentaire. »
Mouai
de
HIPe
, posté le 08 octobre 2009 à 18h27
Dans 99% des cas il n'y a aucun intérêt à référencer la partie AJAX d'un site, c'est même plutôt mieux qu'elle ne soit pas référencée... En général l'AJAX est utilisé dans des formulaires ou des parties qui sont mises à jour en permanence et donc qui n'auraient aucun sens à être référencé (Google bot serait à peine passé que le contenu aurait déjà changé)...
Oui exact...
de
seb__2411
, posté le 08 octobre 2009 à 21h46
Le pire serait de trop encourager les developpeur a faire des sites 100% Ajax.
Hors actuellement, Google encourage plutot les dev à faire des sites standardisé et au contenu accessible ( exit Flash et Javscript ). Et c'est pas plus mal.
Hors actuellement, Google encourage plutot les dev à faire des sites standardisé et au contenu accessible ( exit Flash et Javscript ). Et c'est pas plus mal.
Ajax pivot central
de
reportagemoto.fr
, posté le 08 octobre 2009 à 23h22
Google pense à ce que pourront être les sites HTML du futur dont l'ajax sera le pivot central. Le rechargement complet de page lors de la navigation c'est bon pour les sites à papa.
Pas encore...
de
seb__2411
, posté le 09 octobre 2009 à 13h29
Les sites tout en Ajax c'est bien pour faire joujou. Mais d'un point de vue technique et pro, c'est suicidaire.
Il reste encore beaucoup de travail à faire pour pouvoir offrir des sites Ajax de qualité et qui soient aussi efficace que les sites standards.
Il reste encore beaucoup de travail à faire pour pouvoir offrir des sites Ajax de qualité et qui soient aussi efficace que les sites standards.
Quid des navigateurs qui n'exécutent pas le javascript
de
Loutre666
, posté le 09 octobre 2009 à 17h57
Le code flash et javascript sur un site risque de n'être même pas exécuté par le navigateur du visiteur.
Il faut donc faire très attention à ne pas mettre son menu uniquement dispo en flash ou javascript (et donc ajax) car sinon il est impossible d'y naviguer.
Les navigateurs qui ne gèrent pas le flash ou le javascript sont quand même assez courant, pour des questions techniques (iPhone safari) ou de sécurité (config entreprise)...
Il faut donc faire très attention à ne pas mettre son menu uniquement dispo en flash ou javascript (et donc ajax) car sinon il est impossible d'y naviguer.
Les navigateurs qui ne gèrent pas le flash ou le javascript sont quand même assez courant, pour des questions techniques (iPhone safari) ou de sécurité (config entreprise)...
Oui
de
seb__2411
, posté le 09 octobre 2009 à 21h18
C'est la règle : du html pour le contenu.
à lire aussi
SUR LES MÊMES THÈMES 


nos newsletters
Abonnez-vous à Micro Hebdo : 4,90 €/mois
Abonnez-vous à l'Ordinateur Individuel : 3 €/mois
Abonnez-vous à la version digitale
Abonnez-vous à 01Business et Technologies : 19 €/mois

















alerter le modérateur