effi404checker

Correction des erreurs HTTP 404

Mon logiciel gratuit effi404checker est un outil permettant de faciliter la gestion des redirections des pages en erreur HTTP 404. Son principe consiste à utiliser la reconnaissance par similarité des mots contenus dans les URL, pour retrouver les meilleures pages potentielles pour opérer les redirections (avec un certain nombre de paramètres possibles), tout en gérant celles déjà redirigées afin d’éviter les doublons.

L’objectif étant de limiter le nombre d’erreurs que les moteurs de recherche, et en particulier Google, pourraient rencontrer sur vos sites, et éviter les mauvais signaux susceptibles d’impacter votre référencement. 

Autre usage intéressant de l’outil : générer en masse les redirections à réaliser lors d’une refonte, d’une migration ou d’une fusion de sites internet (grâce à l’import possible des URL à rediriger depuis un sitemap.xml)

Impact des erreurs HTTP 404 sur votre référencement

Avant de présenter l’outil effi404checker, il convient de revoir un peu ce qu’est une erreur HTTP 404. Ce type d’erreur est typiquement renvoyée par le serveur lorsque la page demandée n’existe pas. Il existe plusieurs causes possibles à ce fait :

  • La page a effectivement été supprimée (ce qui ne devrait pas arriver si l’on gère convenablement son contenu… au pire elle devrait systématiquement être redirigée vers une page équivalente)
  • La page a momentanément été inaccessible (plantage, hack, etc.)
  • Un lien a été fait de manière erronée ou vers une URL inexistante (lien pouvant provenir de votre propre site, suite à une erreur de paramétrage par exemple, ou depuis des sites extérieurs)

Si avoir des erreurs HTTP 404 sur un site n’est pas pénalisant en soi pour le référencement, les moteurs, et Google en particulier, attachent une certaine importance à la qualité des sites qu’ils indexent. Si vous avez un nombre trop important d’erreurs HTTP 404 sur votre site, ce sera un mauvais signal renvoyé à Google (UX et crawling moteur mis en difficulté) ce qui pourrait impacter négativement votre référencement. De fait, il est d’usage de corriger régulièrement les erreurs 404.

Je vous invite d’ailleurs à découvrir les explications (en anglais) de Matt Cutts, qui explique comment sont gérées ces erreurs, et explique notamment quelles sont les différences entre erreurs 404 et 410 (page définitivement supprimée)

Aux origines de l’outil

j’ai eu l’idée de développer effi404checker les premiers jours où j’ai repris en charge 3 boutiques en ligne Prestashop, qui avaient au fil des mois et des années, subit moult changements et dont des centaines (parfois des milliers !) d’URL apparaissaient en erreur dans Google Search Console : il m’était techniquement impossible de gérer ces centaines d’erreurs manuellement, il fallait que je trouve une solution : c’est de là que j’ai eu l’idée d’effi404checker.

Au final, après maintenant un an et demi d’utilisation (oui j’ai beaucoup de petits outils persos 😉 ) et d’améliorations successives, le gain de temps est simplement énorme, si vous avez par exemple à gérer des modifications de sites mal réalisées (cas typique : une migration de boutique en ligne !) sans compter l’impact autrement plus positif obtenu grâce à la recherche par similarité intégrée sur la qualité des redirections, le tout automatisé comme il se doit 🙂

Je passe l’outil une fois tous les 15 jours à trois semaines environ sur mes différents sites, ce qui permet de ne jamais avoir plus de quelques pages en erreur, lorsque cela arrive : un confort appréciable !

Fonctionnalités

  • Utilisation du sitemap comme référence afin de garantir l’existence des pages de destination
  • Prise en charge des sitemap index NOUVEAU
  • Import des URL en erreur en masse
  • Import des URL depuis des sitemaps (utile en cas de migration / refonte / fusion de sites) NOUVEAU
  • Analyse par similarité des URL source et destination finement paramétrable (2 algorithmes pondérables librement, définition de vos propres stopwords)
  • Possibilité de gérer au cas par cas chaque redirection (manuellement ou avec assistant recherche)
  • Gestion spécifique des CMS WordPress et Prestashop avec redirection possible vers les pages de recherche
  • Choix des codes de redirection en cas de score de similarité insuffisant (HTTP 301, 302, 303, 410)
  • Test systématique (réponse HTTP) des URL de destination
  • Gestion du .htaccess avec éditeur en coloration syntaxique et préservation des historiques (redirections déjà effectuées)

Le contrôle de similarité, appliqué sur les slugs d’URL, s’appuie sur le mariage de l’algorithme de Kuhn-Munkres (qui permet de comparer les mots les plus semblables par pairs, d’une chaîne à l’autre) avec l’algorithme de Levenshtein, utilisé pour la comparaison mot à mot. Le second algorithme utilisé est celui des n-grams (n-uplets de mots consécutifs identiques), le tout est bien entendu librement paramétrable et pondérable.

Captures d’écran et vidéos

Les images parlent bien mieux que les phrases : voici en images, les principales fonctionnalités de mon logiciel de gestion des erreurs 404. L’ergonomie est améliorable, cela fera peut-être l’objet d’une future version !

Interface utilisateur simple avec mise en surbrillance des URL non traitées
Interface utilisateur simple avec mise en surbrillance des URL non traitées
Editeur de fichier .htaccess avec coloration syntaxique
Editeur de fichier .htaccess avec coloration syntaxique
Une gestion des stopwords totalement personnalisable
Une gestion des stopwords totalement personnalisable
Import en masse des URL en erreur (ici collées depuis Google Seach Console)
Import en masse des URL en erreur (ici collées depuis Google Seach Console)
Un menu contextuel facilitant l'accès aux tâches courantes
Un menu contextuel facilitant l’accès aux tâches courantes
Mise à jour de votre fichier .htaccess automatique et sans doublons !
Mise à jour de votre fichier .htaccess automatique et sans doublons !
Outil de recherche manuelle des redirections avec moteur de recherche intégré
Outil de recherche manuelle des redirections avec moteur de recherche intégré
Un paramétrage complet du logiciel (ici avec les préférences spécifiques à Prestashop)
Un paramétrage complet du logiciel (ici avec les préférences spécifiques à Prestashop)
Possibilité de choisir librement les URL de redirection
Possibilité de choisir librement les URL de redirection

Et voici une vidéo explicative sur l’utilisation dans le cadre d’une correction des erreurs HTTP 404 :

Limites fonctionnelles

Je n’ai pour le moment pas inclus de gestion de projet à proprement parler ; vous pouvez cependant reprendre les fichier .htaccess de vos sites et les rééditer facilement (en prenant soin de en pas modifier l’ajout réalisé par effi404checker bien entendu) : c’est l’objectif même de l’outil ! Une prochaine version intégrera peut-être la prise en charge automatique en FTP…

En matière de performances :

  • Le logiciel utilise le parallélisme pour la mesure de similarité (gain de performances de 40% par rapport à une version non multithreads) mais je n’ai pas fait de chasse aux perfs non plus
  • Testé sans problème sur un site avec +800 pages en erreur 404 et un sitemap contenant +4500 URL
  • Lors de l’import d’URL via un sitemap.xml, le logiciel peut mettre un peu de temps (gros sitemaps), pas d’inquiétude !

Caractéristiques techniques

Le logiciel est actuellement dans une version stable totalement fonctionnelle, mais potentiellement non exempte de petits bugs en principe non bloquants. La diffusion est faite sous forme de fichier d’installation Windows MSI. Si vous rencontrez des difficultés, merci de m’en faire part ici : aucun support ne sera assuré en privé !

  • Développé en VB.Net 2013 avec les composants DevExpress (ce qui explique la lourdeur du fichier d’installation… Mais quel confort ensuite !)
  • Aucun besoin de base de données
  • Ne fonctionne que sous Windows (XP au supérieurs) ou simulateur Windows (en principe ne doit pas poser de problèmes)
  • Nécessite le .Net Framework 4.5.1, installable via le setup
  • Pas de support technique (le prix de la gratuité !)

Téléchargement

Le fichier disponible en téléchargement ci-dessous est garanti sans virus ni malwares, et est destiné à fonctionner en environnement Windows.

Téléchargement gratuit logiciel de content spinning

Pour en savoir plus sur la gestion des erreurs 404

Retrouvez tous les détails de chaque mise à jour d’effi404checker, les articles techniques sur la gestion des erreurs HTTP, la refonte de sites internet et la gestion des redirections de manière générale.

Interface utilisateur simple avec mise en surbrillance des URL non traitées

effi404checker : nouvelle version 1.1

Première mise à jour de mon petit outil d’aide à la redirection automatique par recherche de similarité (utile pour les erreurs HTTP 404), à savoir…
Lire la suite

Découvrir tous mes outils SEO

risus Praesent dolor. elit. diam Donec leo Retour haut de page