Journée DARIAH-FR : Construire des vocabulaires à l’échelle de l’Europe Référentiels, thésaurus et ontologies pour les humanités numériques – Paris, 27 novembre 2013

 » Le nombre de places étant limité, merci de vous inscrire, en cliquant ici.

DARIAH (Digital Research Infrastructure for the Arts and Humanities) fait naturellement figurer au premier plan de ses objectifs la création de liens entre des ressources en ligne et l’établissement d’échanges interdisciplinaires1De facto, la multiplicité des langues européennes pose une question à la fois fondamentale et on ne peut plus pratique : comment organiser les connaissances, au sein d’une discipline et entre les disciplines ?

Cette journée se propose d’étudier les solutions adoptées par différentes communautés (contributeurs ou partenaires de DARIAH, institutions culturelles, etc.). Le matériau de cette réflexion sera fourni par des projets ayant mis en place des plateformes ou des instruments de recherche d’information.

Les référentiels – au sens de thésaurus ou d’ontologies – et les vocabulaires forment le socle sur lequel se construit l’interopérabilité entre des données issues de domaines connexes ou non. Leur qualité, c’est-à-dire leur complétude et leur mode de structuration, conditionne la performance et l’efficience des instruments, manuels ou automatiques, qui sont proposés aux chercheurs pour identifier une information pertinente.

Le « Web de données », ou « Web sémantique », est précisément un dispositif visant à structurer et à échanger des données. Son principe est de représenter les liens entre les données en éliminant toute ambiguïté, afin de permettre leur traitement par des machines. Le modèle repose sur l’usage de « triplets » qui associent une valeur à un objet ou expriment des relations entre des objets2. On désigne chacun des objets grâce à un Uniform Resource Identifier (URI)3 et, puisque les relations doivent être exprimées d’une manière normalisée, le vocabulaire prend le plus souvent la forme d’une « ontologie », elle-même accessible par un URI. Ce modèle de représentation, associé aux technologies décrites plus haut, est le Resource Description Framework (RDF) (…)

Lors de cette journée, les intervenants présenteront leur expérience pratique pour donner des éléments de réponse à deux questions :

– Comment créer ces vocabulaires et à quelles difficultés se trouve-t-on confronté ?

– Comment utiliser de tels référentiels pour enrichir automatiquement ses données ?

Les questions ou les témoignages des participants, en particulier à la fin de la journée, aideront à montrer clairement ce que ces technologies apportent aux pratiques de recherche.

Interviendront lors de cette journée Rodolphe Bailly (Cité de la Musique), Isabelle Donze (LESC), Thibault Grouas (DGLFLF), Lorna Hugues (National Library of Wales, Projet Nedimah), Alexandre Monnin (Paris I, Inria, CNAM & IRI), Yann Nicolas (ABES).

Notes
1. « Improve research opportunities and outcomes through linking distributed digital source materials of many kinds », « Exchange knowledge, expertise, methodologies and practices across domains and disciplines ». Voir le site de DARIAH (www.dariah.eu).
2. Par exemple, « une personne | a pour mail | prenom@nom_personne.name » (valeur) et « une personne | connaît | une autre personne » (relation).
3. Un URL, comme http://fr.dbpedia.org/, est un URI.

Pour en savoir plus

Comité d’organisation
Aurélien Berra (Université Paris-Ouest-Nanterre-La Défense & EHESS), Nadine Dardenne (Huma-Num), Sophie David (Huma-Num), Nicolas Larrousse (Huma-Num), Jean-Luc Minel (Modyco, Université Paris-Ouest-Nanterre-La Défense)

Télécharger le programme provisoire «