Une soft 404 (ou « fausse 404 ») désigne une page qui présente un contenu d’erreur à l’utilisateur mais renvoie un code de statut HTTP 200 (succès) au serveur. Cette incohérence entre le contenu affiché et le code technique perturbe Googlebot et nuit à l’indexation de votre site.
Différence entre 404 et soft 404
Pour comprendre le problème, comparons les deux situations :
| Caractéristique | Vraie 404 | Soft 404 |
|---|
| Code HTTP renvoyé | 404 Not Found | 200 OK |
| Contenu affiché | Page d’erreur | Page d’erreur ou contenu vide |
| Interprétation Google | Page inexistante, à désindexer | Page valide… mais vide ou inutile |
| Impact SEO | Clair : la page sort de l’index | Confusion : gaspillage de crawl budget |
Quand un serveur renvoie un code 200, il indique à Google que la page existe et fonctionne correctement. Mais si le contenu de cette page dit « Produit introuvable » ou affiche une page quasi vide, Google détecte l’incohérence et la signale comme soft 404 dans la Google Search Console.
Causes courantes des soft 404
Plusieurs situations techniques génèrent des soft 404 :
Pages produits épuisés ou supprimés
Un produit n’est plus disponible, mais la page reste accessible avec un message « Ce produit n’existe plus » tout en renvoyant un code 200. C’est le cas le plus fréquent sur les sites e-commerce.
Recherche interne sans résultat
L’utilisateur effectue une recherche qui ne renvoie aucun résultat. La page affiche « Aucun résultat trouvé » mais le serveur répond 200 car techniquement, la page de recherche fonctionne.
Pages avec contenu minimal
Une page existe mais contient très peu de contenu : quelques mots, un titre sans corps de texte, ou uniquement des éléments de navigation. Google peut la considérer comme soft 404 même si elle ne dit pas explicitement « erreur ».
Redirection de toutes les erreurs vers l’accueil
Certains sites redirigent automatiquement toutes les URLs inexistantes vers la page d’accueil avec un code 200 ou 302. Google détecte que l’URL demandée n’a rien à voir avec le contenu affiché.
Pages dynamiques mal configurées
Une page produit ou article générée dynamiquement affiche un template vide quand l’ID demandé n’existe pas en base de données, mais renvoie quand même un code 200.
Mauvaise gestion des paramètres d’URL
Une URL avec des paramètres invalides (?id=99999 pour un produit inexistant) charge le template de page mais sans contenu, avec un code 200.
Google utilise des algorithmes d’analyse de contenu pour détecter les soft 404. Même si votre page ne dit pas « Erreur 404 », un contenu trop pauvre ou un message du type « Aucun article dans cette catégorie » peut être interprété comme soft 404.
Impact des soft 404 sur le SEO
Les soft 404 causent plusieurs problèmes pour votre référencement :
Gaspillage du crawl budget
Googlebot visite ces pages en pensant qu’elles contiennent du contenu valide. Chaque visite consomme du crawl budget qui aurait pu servir à explorer vos pages importantes. Sur un site avec des milliers de soft 404, l’impact devient significatif.
Pollution de l’index
Avant que Google ne détecte la soft 404, la page peut être indexée. Elle apparaît alors dans les résultats de recherche et déçoit les utilisateurs qui cliquent dessus pour trouver une page vide ou une erreur.
Dilution des signaux SEO
Si des liens internes ou externes pointent vers des soft 404, le link juice est gaspillé vers des pages sans valeur au lieu d’être distribué vers vos contenus importants.
Signal de qualité négatif
Un grand nombre de soft 404 peut indiquer à Google un problème de qualité globale du site : contenu obsolète, mauvaise maintenance technique, expérience utilisateur dégradée.
Comment détecter les soft 404
Plusieurs méthodes permettent d’identifier ces erreurs sur votre site :
Google Search Console
Le rapport « Pages » dans la section « Indexation » liste les URLs détectées comme soft 404. Google les classe dans la catégorie « Exclues » avec la raison « Soft 404 ». C’est la source la plus fiable car elle montre exactement ce que Google détecte.
Crawl avec Screaming Frog
Configurez Screaming Frog pour détecter les pages avec un code 200 mais contenant certains mots-clés (« introuvable », « n’existe plus », « aucun résultat »). Cela révèle les soft 404 potentielles avant que Google ne les signale.
Analyse des logs serveur
Croisez les logs de crawl de Googlebot avec les codes de réponse. Identifiez les URLs crawlées fréquemment qui renvoient un 200 mais ne génèrent aucun trafic organique : elles peuvent être des soft 404 non encore détectées.
Test manuel
Pour vérifier une URL spécifique, utilisez l’outil d’inspection d’URL dans la Search Console. Il indique si Google considère la page comme une soft 404 et montre le contenu tel qu’il est vu par Googlebot.
Comment corriger les soft 404
La solution dépend de la nature de la page concernée :
La page n’a plus lieu d’exister
Configurez votre serveur pour renvoyer un vrai code 404 ou, mieux, un code 410 (Gone) qui indique une suppression définitive. Google désindexera la page plus rapidement.
# PHP : renvoyer un code 404
http_response_code(404);
include('page-404.php');
exit;
# PHP : renvoyer un code 410
http_response_code(410);
echo "Cette page a été définitivement supprimée.";
exit;
Une alternative pertinente existe
Mettez en place une redirection 301 vers la page la plus pertinente : catégorie parente, produit similaire, ou article connexe. Évitez de rediriger vers la page d’accueil sauf si c’est vraiment la meilleure alternative.
Le contenu peut être enrichi
Si la page a une raison d’exister mais manque de contenu, enrichissez-la. Une page de catégorie vide peut afficher des produits similaires, des suggestions ou un texte explicatif substantiel.
Pages de recherche sans résultat
Pour les pages de recherche interne sans résultat, deux approches :
- Bloquer l’indexation via la balise
noindex (la page reste accessible mais n’entre pas dans l’index)
- Bloquer le crawl de
/recherche/ ou ?s= dans le robots.txt
Produits épuisés temporairement
Si le produit reviendra en stock, gardez la page active avec un contenu utile (description, alternatives, formulaire d’alerte). Si l’arrêt est définitif, redirigez vers un produit de remplacement ou la catégorie.
Prévenir les soft 404
Mieux vaut prévenir que guérir. Adoptez ces bonnes pratiques :
- Testez vos templates : vérifiez que vos pages produit/article renvoient bien une 404 quand l’élément n’existe pas en base
- Ne redirigez pas tout vers l’accueil : créez une vraie page 404 personnalisée qui renvoie le bon code HTTP
- Surveillez la Search Console : consultez régulièrement le rapport d’indexation pour détecter les nouvelles soft 404
- Gérez le cycle de vie des contenus : prévoyez dès la conception ce qui se passe quand un contenu est supprimé
- Limitez les pages à faible contenu : évitez de créer des pages de tags ou catégories vides qui seront détectées comme soft 404