JATS (Journal Article Tag Suite) pour les articles de revues

« La norme américaine JATS (Journal Article Tag Suite) ANSI/NISO Z39.96:2012 est un vocabulaire XML composé d’un ensemble de métadonnées XML. Ce vocabulaire permet de représenter la structure et pour partie le contenu d’un article de revue, ainsi que d’autres types de matériaux que l’on trouve traditionnellement dans les revues comme les lettres, les éditoriaux ou les revues d’ouvrages (…)

Il faut noter que cette version 3.0 constitue une évolution majeure par rapport à la version précédente, non compatible par ailleurs avec les versions précédentes. La v4 est en projet (2014) (…)

La philosophie de JATS était au départ la production et l’archivage – pas nécessairement la diffusion. Un vocabulaire un brin fermé sur lui-même, optimisant la production en back-office tout en offrant des fonctionnalités éditoriales de premier niveau : formats de publication et structuration éditoriale « classique ».

JATS est bien proposé sous plusieurs encodages : DTD, RELAX NG, et W3C Schema. Mais et le web de données ? et RDF ?

Pour permettre cette ouverture sur le web, des alignements entre JATS et RDF ont été réalisés en partant de SPAR (Semantic Publishing and Referencing Ontologies) (SPAR sur LOV), une suite de 8 modules (ontologies) pour créer des métadonnées RDF pour tous les aspects de publications et de référencement de contenus.

L’alignement effectué en JATS et RDF ne porte que sur les aspects bibliographiques et certaines parties dites annexes d’un article de revue, mais il montre tout de même et de façon précise les possibilités et les difficultés pour sortir JATS de son isolement et valoriser grâce à une sémantique à la fois ouverte (réutilisation de vocabulaires standardisés) et précise (distinction plus fine entre la sémantique de la structure et de la rhétorique des articles) ces traitements.

Toutefois je m’inquiète lorsque, sur un vocabulaire qui porte avant tout sur des contenus (des articles), on ne regarde que la partie bibliographique ! J’espère que ce travaille ne s’arrêtera pas en si bon chemin. D’autant que la modélisation fait par JATS de l’objet « article » est pertinente, et qu’un alignement avec DoCO (DoCO sur LOV), le vocabulaire de SPAR portant sur les contenus, semble réalisable et intéressante pour renforcer la modélisation du contenu scientifique, modélisation structurée assez finement dans DoCO comme le montre la figure suivante.

DOCO-SPAR

DoCO, the Document Components Ontology

Bien sûr, la centrale de PubMed (PMC) est très convoitée. Et la vision « production/archives/diffusion », indispensable, n’est plus suffisante pour répondre aux usages en ne se limitant pas aux usages éditoriaux traditionnels (i.e. diffusion en epub ou pour mobile), mais en offrant des possibilités de ré-exploitation plus fine à partir des traitements opérés à la source. D’autres applications (prototypes) voient le jour, en lien avec des ontologies spécialisées du secteur (ici biomédecine) qui montrent la puissance des technologies du Web sur ces fonds spécialisés.

Mais comment réutiliser le balisage JATS ? »