Corpus automatiques des Tweets en « Humanités Numériques » et en « Digital Literacies »

« Nous présentons des corpus Twitter XML et TEI quotidiens correspondant à des extractions et analyses automatiques de twitter sur la base de mots-clés afin d’illustrer les moyens d’outils de veille informative aisément déployables pour tous types de sujets. Dans le cas « Humanités numériques », on remarque assez rapidement sur la frise chronologique que les emplois du mot suivent le calendrier académique, avec de fortes accalmies les week-ends; mais aussi que les discours institutionnels les utilisent le plus souvent; enfin que des acteurs de pays émergents sont en train d’occuper cet espace politique et de culture.

(…) Le but de cette collecte est avant tout de montrer les potentialités du développement des usages des bases de données XML qui permettent aux chercheurs de s’affranchir des machines à cliquer dont ils ne maîtrisent pas les fonctionnements, de souligner la puissance d’une veille automatique basée sur des critères linguistiques et enfin, de montrer le développement progressif de l’implantation des « humanités numériques » dans le débat politique et social actuel. Il s’agit donc d’une double visée, à la fois de recherche et technologique. (…) »