16.02.2024
Corpus et données : comment utiliser les données ouvertes de Wikimedia
« Chaque mois, plus de 250 000 internautes améliorent les projets Wikimedia. Cette gigantesque œuvre de diffusion des connaissances met à disposition du plus grand nombre des millions d’articles encyclopédiques via Wikipedia, des millions de définitions lexicographiques via Wiktionnaire, des dizaines de millions de médias via Wikimedia Commons, des milliers d’ouvrages anciens via Wikisource et une très grande base de données factuelles via Wikidata. Ces contenus sont proposés en anglais, français, espagnol mais également dans des langues moins présentes sur Internet. Enfin, tous ces contenus sont librement réutilisables. Ces trois caractéristiques – un corpus très riche, multilingue et librement réutilisable – font de ces données ouvertes un matériau de premier choix pour les chercheurs.
Ce cours est une introduction aux outils pour la recherche en lien avec les projets Wikimedia. (…) »
source > callisto-formation.fr, Pierre-Yves Beaudouin, Urfist de Bordeaux, février 2024