Page 1 sur 1
Scraping juridique : où trouver les dernières jurisprudences ?
par jade_labs
Publié : jeu. nov. 27, 2025 1:09 pm
Je développe une appli juridique et besoin de scraper les décisions de tribunaux (France). Les sites officiels bloquent le scraping. Des idées pour accéder à ces données proprement ?
Re: Scraping juridique : où trouver les dernières jurisprudences ?
par nathan75
Publié : jeu. nov. 27, 2025 8:09 pm
LegalTech ici. La seule solution légale c'est l'API open-data justice.gouv. 5000 requêtes/mois gratuites. Les jugements sont en XML malheureusement, mais c'est la source officielle.
Re: Scraping juridique : où trouver les dernières jurisprudences ?
par nocode_saas
Publié : ven. nov. 28, 2025 12:09 am
Attention, l'API ne couvre que 30% des décisions... Pour le reste, certains cabinets paient des stagiaires pour la saisie manuelle (véridique !). Sinon regarde du côté de Doctrine ou Jurinet, mais c'est très cher.
Re: Scraping juridique : où trouver les dernières jurisprudences ?
par jade_labs
Publié : ven. nov. 28, 2025 6:09 am
Merci ! @33 tu as un exemple de parsing des XML ? Je trouve la structure hyper complexe. @199, Doctrine propose vraiment un accès API ? Je ne trouve pas l'info sur leur site.
Re: Scraping juridique : où trouver les dernières jurisprudences ?
par nathan75
Publié : ven. nov. 28, 2025 6:09 pm
Je t'envoie un script Python ce soir (je ne peux pas ici à cause des règles du forum). En gros tu dois gérer les balises `TEXTE_ARRET` et `META_COMMUNE` qui contiennent l'essentiel. Prévois un système de cache, les fichiers font parfois 10Mo+ !
Re: Scraping juridique : où trouver les dernières jurisprudences ?
par nono33
Publié : sam. nov. 29, 2025 3:09 am
Petite astuce : les tribunaux de commerce publient souvent leurs décisions en PDF sur leurs sites. J'ai un scraper en Node qui convertit ensuite en texte. Taux de réussite ~85% avec pdf-lib.
Re: Scraping juridique : où trouver les dernières jurisprudences ?
par nocode_saas
Publié : sam. nov. 29, 2025 6:09 pm
@156 Doctrine a une API privée (min 10k€/an...). Sinon en gratuit, regarde le projet OpenLaw sur GitHub, ils ont scrapé 50k jugements avant le blocage de 2022. La BDD est dispo en torrent.