Vous n'êtes pas identifié(e).
Bonjour tout le monde,
Je me retrouve confronté à un souci que je vais essayer d'expliquer de manière claire, car au final le problème est pénible à expliquer.
J'ai un site (environ 120k pages) qui s'appuie sur une API pour avoir un catalogue (prenons l'exemple des pokémons).
Les pages de mes pokémons n'existent pas vraiment elles sont générées par mon CMS en Laravel à la volée (Si je vais dans Pages->Tortank elle n'existe pas).
Le site ranke bien, les visites sont là, mais voilà j'ai un souci de 404.
Dans la Search console j'ai un gros volume de 404 (+10k) lié à un crawl de google bot sur des URL qui n'existent pas (multilingue) par exemple :
FR : www.pokestars.com/fr/pokemon/eau/force/nomdupokemon - Ici tout va bien MAIS...
en anglais l'URL devrait être : www.pokestars.com/en/pokemon/water/force/pokemonname alors que dans la GSC j'ai des URL type : www.pokestars.com/en/pokemon/eau/force/nomdupokemon qui forcément renvoient des 404 car ces URL sont inaccessibles.
Dans mon sitemap, ces URL n'existent pas, tout est OK de mon côté mais je ne comprends pas comment cela est possible.
Vraiment avez-vous une idée, car ça commence à me rendre fou !
J'ai pris cet exemple car je ne souhaite pas dévoiler le site ni la thématique, j'espère que vous ne m'en voudrez pas !
1000 mercis à qui voudra bien m'aider !
Personne n'échappe à son tarif, pas même moi.
🔴 Hors ligne
Spontanément j'aurais envie de te dire de suivre ces pistes :
- Vérifier tes balises hreflang :
- Contrôler qu'il n'y ait pas de directive bloquantes dans ton robots.txt (pas lié directement mais ça mange pas de pain de contrôler) :
- Contrôler les logs système
- Contrôler tes BL
En attendant tu peux mettre en place des redirection 301, ça ne règlera pas le problème en amont mais ça évitera les 404 :
🔴 Hors ligne
D'accord avec @Sogliath, surtout pour les hreflang, c'est un classique.
Aussi, contrôler :
- balise canonical => peut-être que la version EN a une canonical erronée (très fréquent aussi ça)
- règle de ré-écriture d'URLs pour la version EN
- menu pour switcher les langues => selon la techno, le module... Y a franchement tout et n'importe quoi possible comme bug. Ton menu vers l'EN fait peut-être un lien vers la page version EN, avec des paramètres / redirections / réécritures...
- que tu aies un seul sitemap, et pas un doublon généré à la volé justement
Dernière piste : tu as fait un crawl intégral du site ?
Vérifie qu'il n'y ait pas un lien relatif qui perturbe tout.
Comme tes URLs sont générées à la volée (là on n'a pas tout le détail de comment c'est développé... donc j'émets des hypothèses) peut-être qu'un seul mauvais lien interne crée une version dupliquée "FR" sur une base "EN".
Ça peut paraître capillotracté, mais j'ai déjà vu un truc similaire.
Dernière modification par Daman (2024-05-15 07:31:07)
🔴 Hors ligne
Merci pour ton retour @Sogliath.
Je vais regarder cela. Pour ce qui est de contrôler les logs systèmes, tu parles des logs serveurs ? Si oui, tu passes par quels outils pour cela, car le fichier brut est dur à digérer !
Log File Analyser de Screaming Frog ?
Spontanément j'aurais envie de te dire de suivre ces pistes :
- Vérifier tes balises hreflang :
<link rel="alternate" href="http://www.pokestars.com/en/pokemon/water/force/pokemonname" hreflang="en" />
<link rel="alternate" href="http://www.pokestars.com/fr/pokemon/eau/force/nomdupokemon" hreflang="fr" />- Contrôler qu'il n'y ait pas de directive bloquantes dans ton robots.txt (pas lié directement mais ça mange pas de pain de contrôler) :
User-agent: *
Disallow: /fr/pokemon/eau/force/nomdupokemon
Disallow: /en/pokemon/eau/force/nomdupokemon- Contrôler les logs système
- Contrôler tes BL
En attendant tu peux mettre en place des redirection 301, ça ne règlera pas le problème en amont mais ça évitera les 404 :
Route::get('/en/pokemon/eau/force/nomdupokemon', function() {
return redirect('/en/pokemon/water/force/pokemonname', 301);
});
Personne n'échappe à son tarif, pas même moi.
🔴 Hors ligne
Hello @Daman, merci pour ton retour !
Je regarde aussi !
D'accord avec @Sogliath, surtout pour les hreflang, c'est un classique.
Aussi, contrôler :
- balise canonical => peut-être que la version EN a une canonical erronée (très fréquent aussi ça)
- règle de ré-écriture d'URLs pour la version EN
- menu pour switcher les langues => selon la techno, le module... Y a franchement tout et n'importe quoi possible comme bug. Ton menu vers l'EN fait peut-être un lien vers la page version EN, avec des paramètres / redirections / réécritures...
- que tu aies un seul sitemap, et pas un doublon généré à la volé justementDernière piste : tu as fait un crawl intégral du site ?
Vérifie qu'il n'y ait pas un lien relatif qui perturbe tout.
Comme tes URLs sont générées à la volée (là on n'a pas tout le détail de comment c'est développé... donc j'émets des hypothèses) peut-être qu'un seul mauvais lien interne crée une version dupliquée "FR" sur une base "EN".
Ça peut paraître capillotracté, mais j'ai déjà vu un truc similaire.
Personne n'échappe à son tarif, pas même moi.
🔴 Hors ligne
Bon, visiblement tout est ok de ce que j'ai pu en voir, il semblerait que google garde en cache mes urls (celles avant que je fasse toutes les modifs).
Du coup avez-vous une solution pour lui dire de "vider son cache" ?
Merci
Personne n'échappe à son tarif, pas même moi.
🔴 Hors ligne
Remove cached URLs with Google Search Console : https://www.conductor.com/academy/googl … ed-content
🔴 Hors ligne
Merci pour le lien, je viens de faire la demande sur une langue à faible trafic, car je dois bien avouer que j'ai un peu la goutte au front ! ^^
Personne n'échappe à son tarif, pas même moi.
🔴 Hors ligne