Page 1 sur 1

Quelle stratégie pour scaler un scraping sans se faire bloquer ?

par hugo_du_31
Publié : jeu. oct. 03, 2024 4:22 am
Bonjour, je dois scraper un site web avec plusieurs milliers de pages, mais je me fais bloquer rapidement. Quelles techniques utilisez-vous pour éviter ça ? J’ai déjà essayé de varier les IPs avec des proxies.

Re: Quelle stratégie pour scaler un scraping sans se faire bloquer ?

par ambre33
Publié : jeu. oct. 03, 2024 5:22 am
Salut, j’utilise des proxies rotatifs comme ceux de Bright Data, et je configure un délai aléatoire entre les requêtes. Ça limite pas mal les blocages.

Re: Quelle stratégie pour scaler un scraping sans se faire bloquer ?

par hacker1967
Publié : jeu. oct. 03, 2024 7:22 am
Moi, j’ajoute aussi des headers HTTP réalistes pour simuler un vrai navigateur. Des outils comme Fiddler ou Postman peuvent aider à capturer les headers d’une requête normale.

Re: Quelle stratégie pour scaler un scraping sans se faire bloquer ?

par lou1971
Publié : jeu. oct. 03, 2024 8:22 am
Attention, même avec des proxies et des headers, certains sites détectent les patterns de scraping. Si possible, essaie de répartir la charge sur plusieurs jours pour limiter les risques.

Re: Quelle stratégie pour scaler un scraping sans se faire bloquer ?

par hugo_du_31
Publié : jeu. oct. 03, 2024 10:22 am
Merci pour vos conseils ! Je vais tester avec des proxies rotatifs et ajouter des headers réalistes pour voir si ça passe mieux.