Sommaire du billet
Le microcosme d’un site web est un objet en perpétuel mouvement.
Sans même que vous le sachiez et sans aucune intervention de votre part il peut quand même évoluer. Vous n’êtes jamais à l’abri d’un personne sympathique qui vous ferait un lien par exemple.
Parmi les évolutions fréquentes, je constate l’apparition d’erreurs 404. Je vais vous donner ma vision des choses sur comment les traiter. Et surtout je pourrai renvoyer à cette page chaque fois qu’on me posera la question.
Les causes fréquentes d’une 404
Selon la typologie du site (blog, ecommerce, site vitrine…), les causes peuvent varier mais restes très souvent communes à savoir:
- la suppression pure et simple de la page (mauvaise manip, refonte de site, produit épuisé…)
- un changement d’URL pour x raison mais en conservant l’ancien maillage interne.
- lien interne ou externe vers une mauvaise url
Voila en gros les grands cas que l’on rencontre fréquemment.
Comment les détecter ?
De manière presque passive je dirais, il suffit d’inscrire son site à la search console de Google.
Elles seront remontées automatiquement dans la section: Exploration -> Erreurs d’exploration -> Introuvable. Là vous avez la liste des Urls renvoyant un code erreur 404 (Not found). En faisant un clic sur chacune vous accédez à d’autres informations comme la date de découverte ou encore les pages internes ou externes faisant un lien vers cette url en 404.
Seul problème c’est le décalage entre ce qui est remonté dans la Search console et la réalité. Du coup je vous conseille vivement d’utiliser un crawler qui remonte les Status code. Vous pouvez aussi utiliser les logs si vous êtes à l’aise avec eux.
En clair, je vous recommande de coupler la search console avec une autre solution comme: Xenu, botify, Oncrawl… et Screaming frog. La raison est simple, avec un crawler à la demande vous pourrez avoir une réponse immédiate sur les codes retours de vos pages.
Je suis un adepte de screaming frog. Pour déceler vos 404 à causalité interne il suffit de renseigner la racine de votre site et de lancer le crawl. Rendez-vous ensuite dans l’onglet « Response Codes ». Vous aurez ainsi toutes les 404 présentes sur votre site.
Pourquoi corriger les erreurs (404, 410, 301, 302) sur son site ?
Premièrement pour l’utilisateur. Qui n’a jamais pesté parmi vous en arrivant sur une page 404, avec une phrase sympathique du genre: « pfff même pas foutu d’avoir un site qui propre et qui fonctionne « . Le visiteur devient de plus en plus dur et cher à acquérir, alors si le 1er signal qu’il reçoit en arrivant sur votre site c’est une 404, bonjour les dégâts au niveau fidélisation ou conversion.
Pour les robots des moteurs de recherche. Chaque site a un budget crawl d’alloué, donc si vous grillez vos cartouches en lui faisant visiter des pages d’erreurs, niveau optimisation on a connu mieux. Personnellement je préfère garder mon budget crawl pour les nouvelles pages, les contenus mis à jour… J’ai déjà observé une baisse du crawl sur un site ayant connu une forte augmentation de 404.
Identification et suppression des erreurs: la procédure
- 1ère étape: A ce stade vous avez déjà lancé le crawl avec screaming frog et vous avez donc la liste de toutes les erreurs présentes sur votre site (code 4XX et 3XX).
- 2ème étape: on corrige le maillage interne. En effet, dans la majorité des cas il est strictement inutile et contreproductif de faire des liens vers des pages d’erreur. 2 manières de procéder avec SF. Bulk export -> response Codes -> ensuite vous choisissez client error ou redirection. Vous aurez la liste de toutes les pages qui pointent vers vos pages en erreur. 2ème méthode dans votre onglet Response Codes, vous cliquez sur une url en erreur et tout en bas vous avez un onglet inlinks. Là aussi vous avez toutes les pages qui pointent vers vos erreurs.
Je vous recommande de faire le grand ménage pour toutes les erreurs 4XX mais aussi 3XX. Je suis parfois un peu trop Mr Propre, mais j’aime pas les choses inutiles qui trainent. Pensez aussi à checker votre sitemap bien souvent on retrouve listé les pages en erreur.
Après ces opérations vous avez un site clean de toute erreur interne. Mais des 404 peuvent être créées par des sites extérieurs, souvenez-vous l’histoire de la personne sympa qui vous fait un lien et qui foire l’url ou que la page a disparu depuis.
Pour l’identification direction la search console puis exploration -> erreurs d’exploration et enfin introuvables. Cliquez ensuite sur une url en 404. Dans la fenêtre qui s’ouvre cliquez à présent sur « référencée sur » Vous avez une liste non exhaustive des liens internes et externes vers cette 404. Laissez de côté les internes, on les a traité juste avant et intéressez-vous aux liens provenant des autres sources.
Là plusieurs cas se présentent:
- l’url de votre page a changé: contactez les webmasters pour leur demander sympathiquement de mettre à jour. Si pas possible alors redir 301 si la page reçoit du jus si non on peut laisser en 404 ou 410
- La page a carrément disparu (produits ou articles obsolètes): si la page avait du jus on redirige si non idem ci-dessus.
Rendez la mauvaise expérience agréable
C’est un peu comme dans la vraie vie, quand un truc nous arrive mieux vaut essayer d’en rire plutôt que de pester contre. Et bien là, vous pouvez faire la même chose pour votre visiteur en rendant votre page 404 agréable. (oui je suis un mauvais élève)
Il faut pour cela personnaliser votre page d’erreur 404. Commencez pas la déclarer dans votre fichier .htaccess en la redirigeant comme suit ErrorDocument 404
Cela aura pour effet de rediriger vers cette page un internaute qui tomberait sur une 404 not found sur votre site.
Vient ensuite le moment de peaufiner votre page 404.php et pour moi il y a des critères incontournables:
- 1er message expliquer à l’internaute que malheureusement la page qu’il désirait n’existe pas ou plus. Il saura ainsi pourquoi il arrive sur cette page.
- Permettre au visiteur de se réorienter en lui proposant de retourner sur la page d’accueil, la page catégorie, en proposant des produits similaires et / ou un moteur de recherche pour qu’il trouve ce qu’il souhaite.
- Enfin et surtout mettez votre 404 personnalisée à l’image de votre site / entreprise. Soyez créatif, inventif c’est là que vous pouvez-vous lâcher pour rendre agréable une expérience à la base désagréable.
Je vous recommande de jeter un oeil sur ce site de 404 personnalisées, il y a vraiment de très bonne choses 🙂
Et une page bien sympa qui peut vite vous faire perdre du temps 🙂
J’adore le jeu du lemmings en page 404 ! 😉
Tout à fait.
J’y ajouterai aussi au passage la récupération de certains BL en transformant la 404 en 301 !
Utile aussi : la personnalisation des 404 qui affiche le signalement des enfants disparus (cf notfound.org)