Page 1 sur 1
Quelle stratégie pour scaler un scraping sans se faire bloquer ?
par hugo_du_31
Publié : jeu. oct. 03, 2024 4:22 am
Bonjour, je dois scraper un site web avec plusieurs milliers de pages, mais je me fais bloquer rapidement. Quelles techniques utilisez-vous pour éviter ça ? J’ai déjà essayé de varier les IPs avec des proxies.
Re: Quelle stratégie pour scaler un scraping sans se faire bloquer ?
par ambre33
Publié : jeu. oct. 03, 2024 5:22 am
Salut, j’utilise des proxies rotatifs comme ceux de Bright Data, et je configure un délai aléatoire entre les requêtes. Ça limite pas mal les blocages.
Re: Quelle stratégie pour scaler un scraping sans se faire bloquer ?
par hacker1967
Publié : jeu. oct. 03, 2024 7:22 am
Moi, j’ajoute aussi des headers HTTP réalistes pour simuler un vrai navigateur. Des outils comme Fiddler ou Postman peuvent aider à capturer les headers d’une requête normale.
Re: Quelle stratégie pour scaler un scraping sans se faire bloquer ?
par lou1971
Publié : jeu. oct. 03, 2024 8:22 am
Attention, même avec des proxies et des headers, certains sites détectent les patterns de scraping. Si possible, essaie de répartir la charge sur plusieurs jours pour limiter les risques.
Re: Quelle stratégie pour scaler un scraping sans se faire bloquer ?
par hugo_du_31
Publié : jeu. oct. 03, 2024 10:22 am
Merci pour vos conseils ! Je vais tester avec des proxies rotatifs et ajouter des headers réalistes pour voir si ça passe mieux.