Page 1 sur 1
Scraping de sites e-commerce : comment éviter les CAPTCHAs ?
par zoe13
Publié : sam. nov. 02, 2024 5:00 pm
Je scrape des sites e-commerce pour suivre les prix, mais je me retrouve souvent bloqué par des CAPTCHAs. Comment vous gérez ça ?
Re: Scraping de sites e-commerce : comment éviter les CAPTCHAs ?
par hugo_du_31
Publié : sam. nov. 02, 2024 6:00 pm
Utilise des proxies rotatifs de qualité. J’ai eu de bons résultats avec Oxylabs, même si c’est un peu cher. Ça réduit énormément les CAPTCHAs.
Re: Scraping de sites e-commerce : comment éviter les CAPTCHAs ?
par hustler_du_69
Publié : sam. nov. 02, 2024 8:00 pm
Je rajoute une simulation de comportement humain avec Selenium. Par exemple, je fais des pauses aléatoires entre les requêtes et je simule des mouvements de souris.
Re: Scraping de sites e-commerce : comment éviter les CAPTCHAs ?
par zoe13
Publié : sam. nov. 02, 2024 11:00 pm
Merci pour les tips ! Je vais tester Selenium avec des pauses. Pour les proxies, je vais voir si je peux trouver une option moins chère.
Re: Scraping de sites e-commerce : comment éviter les CAPTCHAs ?
par lucas
Publié : dim. nov. 03, 2024 12:00 am
Attention, certains sites détectent Selenium. Si tu veux éviter ça, utilise Puppeteer avec des extensions pour masquer l’automation.