Bonjour à tous, un petit billet que j’avais envie d’écrire depuis un petit moment.
La raison est simple, tout le monde dit à peu près tout et son contraire sur ce sujet.
Du coup j’avais envie de donner mon avis sur le véritable intérêt d’un sitemap.xml et redorer un peu son blason.
Le plan de site: un remède miracle pour le SEO ?

Un problème d’indexation
Je vous arrête tout de suite, si vous pensez que la mise en place d’un ou plusieurs fichiers sitemaps sera la solution ultime à tous vos problèmes d’indexation et de positionnement, vous avez tout faut.
Attention, j’enfonce une porte ouverte: si votre site internet possède une structure et un maillage interne, l’utilisation du sitemap est rendue obsolète.
En réalité, je ne suis que partiellement en accord avec cette affirmation. Oui il faut une structure correcte, oui il faut un maillage interne efficace mais oui il se peut que tôt ou tard un site connaisse des problèmes d’indexation.
Et c’est là que devient intéressante l’utilisation de ce fichier.
Indirectement un meilleur taux d’indexation des pages de votre site sera bénéfique pour votre référencement. Plus de pages dans l’index de Google = plus de portes d’entrées possibles pour l’internaute.
Sitemap.xml: le microscope de l’indexation
Si selon moi l’ajout d’un sitemap seul ne changera pas fondamentalement la chose sur votre indexation, il est un formidable outil pour détecter les problèmes.
Si vous avez un petit site, un seul fichier fera l’affaire. Un rapide coup d’oeil dans l’outil Google pour les webmaster et vous verrez vite si un problème est présent.
Seulement voila, dans notre métier nous sommes plus souvent confronter à des sites comportant des milliers voire des millions de pages. Et là, c’est nettement moins facile à analyser sauf à posséder un bel outil comme on a pu en voir dans la formation de Jean-Benoit Moingt.
Ce que je recommande toujours à mes clients, c’est la mise en place de plusieurs sitemaps.xml mais de manière organisée et logique.
Faites en sorte de créer des fichiers qui soient parlant pour vous et votre site. Par exemple on peut imaginer la mise en place d’un fichier par catégorie de produits.
Selon la typologie de votre site il faudra adapter, mais de manière globale faite un fichier par zone de site (sous conditions de ne pas dépasser la taille maximale du fichier).
Pourquoi ? Et bien car le jour ou vous faites une refonte, ou vous ajoutez une nouvelle rubrique ou tout autre raison, vous pourrez voir en un clin d’oeil si les pages d’un fichier connaissent des problèmes d’indexation.
Si tous vos sitemaps sont entre 90 et 100% d’indexation mais qu’à côté il y en a un qui n’a que 30% de ses pages dans l’index, la recherche du problème sera plus aisée.

Plusieurs sitemaps sur un même site
Un cas concret:
Pour un client nous avions mis en place ce procédé depuis plusieurs mois. Le taux d’indexation avoisinait les 100% pour toutes les parties du site. Comme cela arrive parfois, le client a apporté des modifications « mineures » sur son site, et là un fichier est sorti du lot. Son nombre d’urls continuait de grandir mais le % d’indexation diminuait. Il s’est avéré que le client avait fait sauter les liens menant à cette sous catégorie. Google n’avait presque aucun moyen de voir les nouvelles URLs créées.
L’utilisation de ces sitemaps logiques nous a permis de déceler la source du problème très rapidement.
De même, vous pouvez créer de toute pièce un fichier des URLs qui ne sont pas indexées. Soumettez le dans GWT, faites des liens vers ces pages et surveillez comment Google réagit.
Si vous ou vos clients n’ont pas les moyens d’avoir des outils de suivi d’indexation, je vous recommande de tester cette technique. C’est relativement rapide et très pratique au quotidien.
Donc OUI le fichier sitemap.xml est utile pour l’indexation et le référencement d’un site. Mais NON sa simple présence n’est pas suffisante.
(note pour plus tard: ne pas commencer un article en disant « petit billet » je crois que je ne sais plus faire ^^ )
Super idée le classement des sitemaps par section de site pour voir arriver les problèmes.
Effectivement, l’idée de faire plusieurs sitemaps suivant les sections est une idée judicieuse pour résoudre les problèmes d’indexation. Puis bien entendu, bien plus qu’un simple soucis d’indexation, les sitemaps permettent une amélioration du référencement. Toutefois, il faut également que le site internet soit structuré, et que son maillage interne soit solide. L’un va de paire avec l’autre.
Cela peut être aussi un moyen indirect de détecter un Panda. Si l’un de ces sitemaps logiques n’est pas indexé du tout ou faiblement, il y a des chances que le contenu de ces pages soit en cause.
Je te donne une astuce au passage.
Tu mets toutes les urls que tu ne veux pas indexer dans un fichier sitemap spécifique. Tu l’importes et tu regardes si ça s’indexe. Si des pages s’indexent, c’est que tu as foiré quelque part !
J’ai l’habitude de mixer le sitemap avec un maillage interne fort et ça fonctionne bien pour mes sites. Google doit pouvoir trouver toutes les pages pertinentes facilement.
J’aime bien afficher des liens vers des articles au hasard dans la sidebar.
Il m’arrive de faire plusieurs fichiers sitemaps.xml pour des catégories de produits que ce soit saisonnier ou non afin de vérifier justement l’indexation et aussi comme le dit Victor un fichu bestio Pandi Panda. Le truc est de trouver l’utilité du sitemap comme tu le fais si bien 😉
Par contre pas mal ton astuce Jêrome, je n’y avais pas pensé pour les urls qu’on ne souhaite pas indexer. Merki de l’astuce !!
Je dévoile une info tirée de ma propre expérience du fichier Sitemap : pour les sites à forte autorité et donc bien trustés, le sitemap est le seul moyen d’inclure de nouvelles pages. Voici pourquoi :
J’avais créé de nouvelles pages sur mon site, et mis le maillage interne à jour.
J’ai attendu une semaine qu’elles soient indexées. Rien.
J’ai attendu 15 jours. Pas mieux.
(Alors que le site est crawlé régulièrement)
J’ai alors fait des liens externes vers ces nouvelles pages, via des blogs comme celui-ci (c’est à dire avec de nouveaux contenus réguliers), sur de nouveaux articles. Rien.
Deux mois après, les nouvelles pages ne sont toujours pas indexées !
Je décide alors de mettre le sitemap à jour.
Et là, dans la journée, toutes les nouvelles pages (une dizaine) sont indexées d’un coup.
Alors, peut-être qu’il s’agit d’une coïncidence. Mais je pense plutôt qu’avec toutes les histoires de NSEO et autres trucs louches, Google attend une déclaration du propriétaire du site avant d’indexer. Qu’en pensez-vous ? En tous cas, c’est une preuve supplémentaire de son utilité 🙂
Effectivement pour un petit billet, c’est loupé… Mais par contre c’est instructif. Je n’avais jamais pensé à séparer les le sitemap en différentes catégories ! et en plus comme le dis Victor ça peut aider pour Panda !
J’ai appris pas mal de choses, en effet je ne savais pas que l’on pouvait avoir plusieurs fichiers sitemap, du coup c’est vrai que les problèmes d’indexations seront plus faciles à repérés.
@thierry : merci également du conseil, je vais de ce pas regarder ça 🙂
Je suis tout à fait d’accord avec toi quant à l’utilisation du Sitemap, je ne suis pas un pro en ce qui concerne son utilisation. Je n’ai pas eu l’occasion de beaucoup l’utiliser pour le moment, par contre je me suis renseigné sur le sujet auprès de beaucoup de référenceurs. Ce qui est ressorti en général c’est que le sitemap permet d’être indexé plus rapidement par le moteur de recherche, mais il ne joue pas sur les positions sur les expressions (ce que je trouve tout à fait normal), il n’est donc pas forcément nécessaire à mettre en place lorsque le maillage interne de son site internet est bien organisé.
Mais je n’avais pas encore pensé à l’utiliser pour détecter les erreurs d’indexations, c’est une très bonne idée qui va surement me pousser à mettre en place un sitemap.
Merci pour tes informations.