Les proxies c’est essentiel, mais il faut aussi varier les headers HTTP. J’ajoute des temps d’attente aléatoires entre les requêtes pour éviter les détections.
Très bon conseil pour les headers ! J’utilise aussi des outils comme Scrapy avec des plugins comme Scrapy-Rotating-Proxies pour gérer ça automatiquement.
Oui, Puppeteer est très efficace pour ça. Mais c’est plus lourd à mettre en place. Pour les petits projets, je reste sur des outils comme BeautifulSoup avec des proxies.