Il y a quelques mois, je faisais un petit état de l’art sur les techniques de PageRank Sculpting. La SEO rockstar Laurent Bourrelly me faisait alors judicieusement remarquer en commentaire que les liens en map area n’étaient (d’après ses dernières constatations) pas suivis par Google. Ce qui m’a donc donné l’idée du test suivant : Google est-il capable d’indexer une page uniquement linkée depuis une map area ?

Le protocole de test

Les conditions de mises en place du test ont été les suivantes :

  • création d’une page A : cette page contient un paragraphe de contenu, une balise title, une balise meta description et surtout une image avec un lien en map area vers la page B ressemblant à ceci

<area href="page-b.html" coords="37,394,27,344,22,285,25,227,37,205,14,198,7,167,14,144,17,122,10,108,24,96,40,99,72,121,91,108,109,116,117,172,115,193,117,230,124,244,164,242,171,207,181,177,190,150,188,122,201,96,238,58,271,56,286,61,311,94,317,113,327,120,331,150,339,175,344,190,366,196,382,210,397,210,396,396" shape="poly">

  • création d’une page B : cette page B contient un paragraphe de contenu, une balise title et une balise meta description
  • mise en ligne des fichiers sur un serveur de test : les pages sont mises en ligne le 9 juillet 2012 sur un domaine test qui était jusqu’ alors bloqué par robots.txt. J’ai donc supprimé la directive disallow du fichier robots.txt pour permettre le crawl de mes pages
  • ping de la page A après la mise en ligne
  • ajout d’un lien discret depuis un domaine trusté vers la page A pour « forcer » l’indexation
  • pour préserver la neutralité du test, la page B n’a jamais été consultée depuis quelconque navigateur

Les résultats

Le premier robot à venir crawler la page A n’a pas été GoogleBot mais Alexa… 🙂

Googlebot lui est venu crawler la page A le 12 juillet, suivi de près par son robot Google Image.

66.249.66.232 ***.************.*** - [12/Jul/2012:23:17:49 +0200] "GET /****_****/page-a.html HTTP/1.1" 200 1001 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

Quelques jours après, la page A est apparue dans les SERPs avec uniquement le title et aucun snippet (cela étant sûrement dû aux anciennes directives du robots.txt).

Après une semaine, la page A ressortait dans les SERPs avec title + meta description sur une requête « info: ».

Le 26 juillet, GoogleBot est venu crawler la page B sans pour autant demander la page A (il était passé pour la dernière fois sur la page A le 23 juillet).

66.249.66.232 ***.************.*** - [26/Jul/2012:16:04:50 +0200] "GET /****_****/page-b.html HTTP/1.1" 200 614 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

Deux jours plus tard la page B ressortait dans l’index de Google sur une commande « info: ».

Conclusion

Aucun doute donc, les liens en map area sont bien suivis par Google. Difficile de dire quelle « valeur » leur donne Google mais utiliser ce type de liens semble être inutile pour rendre opaque l’indexation d’une page. Cela rejoint les remarques de plusieurs SEO concernant le comportement de Google qui consiste désormais à suivre tout ce qui peut ressembler à une URL relative ou absolue dans le code HTML…