Page 1 sur 1
Crawl budget et sites à très grande échelle : vos stratégies pour les millions de pages ?
par hacker.r
Publié : mer. mai 07, 2025 4:35 am
Hello la commu ! On a un site avec 3M+ pages indexables (catalogue + contenu généré). Google ne crawl que 5% du site mensuellement, malgré un sitemap optimisé. Qui a déjà géré ce genre de volume ? Est-ce qu’il vaut mieux prioriser certaines sections ou forcer le crawl via d’autres méthodes ?
Re: Crawl budget et sites à très grande échelle : vos stratégies pour les millions de pages ?
par nathan75
Publié : mer. mai 07, 2025 6:35 am
J’ai eu le cas sur un comparateur. La solution : hiérarchie ultra-rigoureuse + internal linking massif depuis les pages « hubs ». On a aussi implémenté un pré-rendering côté serveur pour les pages peu visitées. Résultat : crawl budget x4 en 6 mois. PS : vérifie tes logs, souvent Googlebot passe trop de temps sur des pages inutiles.
Re: Crawl budget et sites à très grande échelle : vos stratégies pour les millions de pages ?
par tom34
Publié : mer. mai 07, 2025 10:35 am
Totalement d’accord avec @33. Ajoutez des balises canoniques bien placées aussi. Par contre, attention au pré-rendering : on a eu des soucis de cloaking involontaire l’an dernier. Autre tip : utilisez la Search Console pour soumettre les URLs prioritaires quotidiennement (API possible).
Re: Crawl budget et sites à très grande échelle : vos stratégies pour les millions de pages ?
par hacker.r
Publié : mer. mai 07, 2025 6:35 pm
Merci pour les retours ! @33, tu parles de quel outil pour le pré-rendering ? Prerender.io ? Et pour le internal linking, vous utilisez des outils pour automatiser ou tout manuel ?
Re: Crawl budget et sites à très grande échelle : vos stratégies pour les millions de pages ?
par nathan75
Publié : jeu. mai 08, 2025 12:35 am
On utilise un système custom en Node.js pour le pré-rendering (plus flexible). Pour les liens, mix des deux : scripts Python qui génèrent des suggestions de liens contextuels + validation manuelle. C’est un investissement initial mais ça scale ensuite !
Re: Crawl budget et sites à très grande échelle : vos stratégies pour les millions de pages ?
par growthhacker_du_75
Publié : jeu. mai 08, 2025 10:35 am
Petit + : as-tu vérifié la vitesse de ton serveur ? Sur des gros sites, un TTFB >1s peut tuer ton crawl budget. Passer sur du edge computing (ex: Cloudflare Workers) a changé la donne pour nous.