Par , le 10 novembre 2011

Google n’est plus aveugle, juste mal voyant

SEO | 7

Aujourd’hui, il ne suffit plus de dire: « utilise ta barre Web Developper, désactive les CSS, les Javascripts et les images  » et tu « verras » ton site comme le voit Google. C’est légèrement plus compliqué que cela. Pour mieux circonscrire le web, et notamment toute la partie web « invisible », les progrès de Googlebot vont galopants. Et à ce jeu là, pour un référenceur, Google n’est (plus) (s)on ami. Du moins pour celui qui souhaite s’amuser à manipuler le flux de Pagerank en interne. Dans l’intérêt des utilisateurs, bien entendu…

Sculpter son PR : quelles possibilités aujourd’hui ?

Le Flash

Google a annoncé à plusieurs reprises qu’il était capable de décompiler les fichiers Flash, même appelés via un script JS, et d’en extraire le contenu et les liens. Reste la solution de bloquer ces fichiers via robots.txt, mais derrière le discours officiel «our crawl agent, the ever-friendly Googlebot, always adheres to robots.txt», Big Brother Google fait un peu ce qu’il veut. Jetez un oeil à vos logs et vous verrez. Mieux vaut par exemple assurer ses arrières avec un header 403. Conclusion : sculpter via Flash, en théorie, oui, mais dans la pratique, c’est assez lourd.

Le Javascript

Des découvertes récentes dans le monde du SEO doublées d’annonces officielles de Google conduisent à penser qu’il faudra user de méthodes complexes à l’avenir pour cacher à Google des liens générés via javascript. Tout d’abord, comme l’avait remarqué Jambonbuzz il y a quelques semaines, Google suit et indexe tout ce qu’il trouve dans le code source qui puisse ressembler à un lien. Et là où il est vraiment fort (et paradoxalement très bête), c’est qu’il suit même des liens relatifs insérés dans des scripts alors qu’ils proviennent de ses propres outils. Je m’explique : en utilisant l’outil de testing A/B Website Optimizer pour l’un de nos clients, nous nous sommes aperçus via le monitoring de Google Webmaster Tools que Google avait remonté une 404 du type nomdedomaine.com/siteopt.js?v=. Autrement dit, Google fouille dans les scripts internes, à la recherche de tout ce qui peut ressembler à un lien, peu importe de quoi il s’agit. Là où cela devient réellement problématique, en termes de Pagerank Sculpting, c’est quand le lien, par exemple contenu dans un attribut (rel, title, etc.) d’une balise transformée en a href au chargement d’une fonction JS, apparait directement dans le code source. Google va-t-il suivre ce lien même s’il n’est pas dans un a href, et surtout, va-t-il le comptabiliser dans le calcul du PR interne ? Autrement dit lui donner du « jus » ? Difficile de le savoir. Pourtant, on peut se fier à certains indices. En regardant dans Webmaster Tools le nombre de liens internes reçus par chaque page du site, il est possible de vérifier si la structure interne telle que vue par Google est cohérente avec le sculpting mis en place.

Liens internes dans Webmaster Tools

Encore une fois, rien n’est sûr, et je pense pas faire partie des plus paranos en disant que la communication de Google au travers de cet outil ne reflète peut-être pas fidèlement ce qui se passe dans les entrailles du moteur.

Comme Google suit également les événements onclick, la solution qui paraît la plus « sûre » à l’heure actuelle est d’encrypter le lien, en utilisant un framework jquery et en s’inspirant par exemple de la solution proposée récemment par Slow Lab. Le lien n’apparaît ainsi jamais dans le code source ou dans le script (donc Google ne peut pas le parser), mais il est reconstitué par le navigateur.

Pour terminer sur le javascript, évoquons le dernier billet officiel paru à ce sujet sur le blog officiel de Google. Le moteur américain nous donne l’exemple d’une div de contenu chargée en AJAX via la méthode POST. Même s’il s’agit d’un POST, Google est capable de requêter la ressource et d’en extraire le contenu. Pour autant l’ingénieur Google qui a rédigé le billet reste assez évasif sur ce qui se passe après : « we may also incorporate the contents« . Il semblerait que Google s’en serve essentiellement pour améliorer la preview dans les SERPs, mais {pas forcément|seulement dans certains cas} pour l’indexation. Pour ce qui est du traitement des liens à l’intérieur des contenus AJAX accessibles via cette méthode, difficile de dire avec certitude, donc, s’ils seront comptabilisés. Et comme Google semble avoir une logique différente pour ce qui est des aperçus instantanés et du crawl/indexation, la section Instant Preview du labo Webmaster Tools ne donne pas de réponses satisfaisante.

Instant Preview

Le CSS

Là, vous allez dire que je délire. En effet, je ne vois pas comment on peut pas cacher des liens via les styles CSS. Dans tous les cas, le CSS ne sera qu’un enrobage de ce qui se trouve dans le code HTML. Pour autant, cela ne veut pas dire qu’on ne peut pas duper Google. En utilisant la propriété css content (merci Sam de m’en avoir parlé) combinée aux pseudos éléments before et after, il est possible d’injecter du texte sans que celui-ci n’apparaisse dans le flux HTML.

.maclasse:after {content:"W3C says : text or images only"
}

Texte qui ne sera donc pas crawlé par Google. Donc pas indexé. CQFD. Par exemple ce qui suit . Le seul hic, c’est que, si on insère des balises a href dans ce « content », celles-ci ne seront pas interprétées. Logique. Donc aucun intérêt pour le PR sculpting. Et pour les petits malins qui voudraient se servir du Javascript, pas possible non plus : comme le texte n’apparait pas dans le source, impossible de le manipuler. Pas à ma connaissance du moins. 🙁 Fausse piste donc. Néanmoins, si certains ont d’autres idées, n’hésitez pas à partager en commentaires…

Comment vérifier l’efficacité d’un PR sculpting ?

Voici quelques indicateurs à surveiller et outils à utiliser pour s’assurer que Google crawle bien votre site selon le schéma de netlinking interne que vous avez établi :

  • Consultez régulièrement vos logs. Les pages les plus souvent crawlées sont, selon toute logique, celles qui, en internes, ont été les plus favorisées en termes de diffusion de pagerank (certes, cette analyse est légèrement biaisée avec l’apport des backlinks externes). Il est également important d’étudier les commandes HTTP. Si un POST apparait, Googlebot a peut-être essayé d’accéder à une ressource que vous ne souhaitiez pas qu’il voit ;
  • Vérifiez la version en cache de vos pages (version en texte seul de préférence) ;
  • Si un bloc de contenu + liens est sensé rester invisible par Google, effectuez une recherche d’une portion de ce contenu dans Google entre guillemets. Vous saurez si ce contenu a été indexé ou non et donc si les liens sont susceptibles d’avoir transmis du PR ;
  • Vérifiez que ce que Google vous donne comme chiffres dans la section « liens internes » de Webmaster Tools est cohérent avec l’action de sculpting que vous avez mise en place.

Pour terminer et aller plus loin sur ce sujet, je vous recommande la lecture de l’article de Search Engine Watch, Cloaking : a guide from Google, dans lequel Frank Watson fait un parallèle intéressant entre l’intransigeance de Google sur le cloaking, sous quelque forme qu’il soit, et dans le même temps, la manipulation dont il fait preuve sur les résultats de recherche au travers de la personnalisation notamment.

Partager l'article :

7 commentaires
  • Excellent ton article.

  • Je n’ai pas testé récemment, mais les map area (zones réactives) étaient une solution opaque à Google.

  • Le lien étant visible dans la balise area, je pense que Google peut le suivre, au vu des derniers constats que je relate ici. Mais cela mérite en effet un test. Merci Laurent !

  • Merci pour le backlink vers Slow Lab 😉
    Google est malvoyant mais il a toute une équipe de médecins qui travaillent à plein temps en vue de le soigner. Si jamais l’œil de Sauron vous voit et que ce n’est pas joli joli, alors il faut s’être aménagé une porte de sortie pour rapidement revenir dans les clous.
    A vous de voir donc si le jeu en vaut la chandelle.

  • […] Pagerank sculpting Google : quoi de neuf ? Comment mettre en place un Pagerank sculpting et savoir s'il est efficace ? Quelques pistes de réflexion… (RT @ABrisset: #Pagerank Sculpting : quoi de de neuf ? Source: http://www.siliconsalad.com […]

  • Pas de quoi ! 🙂

    Exactement, c’est en permanence le jeu du chat et de la souris. Peût-être que Google finira par sanctionner, c’est lui qui fixe les règles du jeu. Mais si on y regarde de plus près, on ne cache finalement au moteur aucune page ou aucun contenu, c’est simplement la quantité de liens qui est manipulée. A l’époque où les webmasters utilisaient le nofollow pour jouer avec le PR, les sites n’ont pas été pénalisés. C’est à la source que le problème a été corrigé.

    Pour ma part, je reste convaincu de l’intérêt du PR sculpting. Bien entendu, il faut le combiner avec un « siloing » efficace pour en voir les effets. Mais c’est un autre débat…

  • il serait interessant de faire un test avec un lien en nofollow pour voir si google l’indexe ou pas. Comme il suit un presque tout, il est probable qu’il le fasse ?


Vous souhaitez réagir ?

En soumettant ce commentaire vous donnez à Silicon Salad le droit de citer vos propos ainsi que votre nom/site. Tous commentaires dégradants ou hors-sujet peuvent-être supprimés par décision de l’auteur. Votre e-mail, ne sert qu’à des fins d’authentification, il ne peut-être ni partagé ni diffusé.
Vous pouvez commenter avec la syntaxe Markdown. En savoir plus

Article précédent
Risotto au chorizo