Pyllica : un outil de récupération automatisée de données sur gallica.bnf.fr

« … Ayant besoin pour un projet d’un vaste corpus de revues numérisées sur Gallica, j’ai retroussé mes manches pour revoir le code original de Pyllica et proposer quelques outils supplémentaires, permettant par exemple de récupérer directement les images en haute qualité ou les pdf de n’importe quel document. Pierre-Carl Langlais a accepté de fusionner cette nouvelle version à Pyllica; elle est à présent disponible sur la page github du projet, où les étapes d’installation et les modalités d’utilisation des différents outils qui composent Pyllica sont exposées.  Je reprends ci-dessous ces éléments en rajoutant quelques images et explications (…) »

source > prelia.hypotheses, Julien SCHUH, 10 décembre 2015

Accueil