Les tweets archivés : une manne pour la recherche

« On parle désormais de Social TV, chaque émission de radio s’adresse aussi aux auditeurs via son compte Twitter ou une … Continuer la lecture de « Les tweets archivés : une manne pour la recherche »

Copyright Clearance Center Broadens Access to Full-Text Semantic Search with New RightFind® XML for Mining Features

« Copyright Clearance Center, Inc. (CCC), a global leader in content management, copyright licensing, discovery and delivery solutions, today announced enhancements … Continuer la lecture de « Copyright Clearance Center Broadens Access to Full-Text Semantic Search with New RightFind® XML for Mining Features »

ISTEX : Entraînement du modèle fulltext de Grobid par l’équipe R&D

« À l’heure de rédaction de ce billet de blog, la plateforme ISTEX met à disposition plus de 18 millions de … Continuer la lecture de « ISTEX : Entraînement du modèle fulltext de Grobid par l’équipe R&D »

Persée ouvre son triplestore : data.persee.fr et renforce son inscription dans l’environnement des données liées

« Afin de répondre aux usages actuels des communautés scientifiques et d’aller encore plus loin dans l’exploitation et la réutilisation des … Continuer la lecture de « Persée ouvre son triplestore : data.persee.fr et renforce son inscription dans l’environnement des données liées »

Gargantext, un état de l’art collaboratif en quelques minutes

« La réalisation d’un état de l’art devient une étape à la fois scientifique, collaborative et ludique, grâce à la plateforme … Continuer la lecture de « Gargantext, un état de l’art collaboratif en quelques minutes »

Approches innovantes pour la presse ancienne numérisée : fouille et visualisation de données

« Cet article décrit comment une technique innovante de reconnaissance de mise en page (OLR, optical layout recognition) appliquée lors d’un … Continuer la lecture de « Approches innovantes pour la presse ancienne numérisée : fouille et visualisation de données »

Retour d’expérience: aide à la constitution d’un corpus bibliographique sur les études africaines

« Entre l’été 2014 et l’automne 2015, la BU a collaboré avec un groupe de chercheurs réalisant un livre blanc sur … Continuer la lecture de « Retour d’expérience: aide à la constitution d’un corpus bibliographique sur les études africaines »

OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [4] – Dispositif CERCLES dans le cadre de BACON

« [Lire le billet qui introduit cette série « OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? »] … Continuer la lecture de « OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [4] – Dispositif CERCLES dans le cadre de BACON »

OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [3] – Cas pratique

[Lire le billet qui introduit cette série « OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? »] … Continuer la lecture de « OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [3] – Cas pratique »

OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [2] – Un outil : OpenRefine

« [Lire le billet qui introduit cette série « OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? »] … Continuer la lecture de « OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [2] – Un outil : OpenRefine »

OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [1] – Introduction

« Cette série de billets exposera la méthode d’évaluation appliquée aux fichiers KBART, transmis à l’Abes par les éditeurs francophones ayant … Continuer la lecture de « OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [1] – Introduction »

CERCLES : retour d’expérience du SCD de l’Université de Picardie Jules Verne sur le corpus CAIRN

« (…) Nouvelle adjointe à la gestion de la bibliothèque numérique dans mon établissement, et chargée du signalement des e-books, je … Continuer la lecture de « CERCLES : retour d’expérience du SCD de l’Université de Picardie Jules Verne sur le corpus CAIRN »

Exploiter/visualiser/explorer un corpus issu de l’OAI-PMH grâce au duo OpenRefine/Palladio

« D’une requête OAI à une exploitation des données par l’intermédiaire d’un outils d’infoviz (en passant par du nettoyage de données, … Continuer la lecture de « Exploiter/visualiser/explorer un corpus issu de l’OAI-PMH grâce au duo OpenRefine/Palladio »

Des établissements Sudoc partenaires de Gallica

« La BnF a réalisé une série de vidéos consacrée à la coopération numérique « l’Aventure de la numérisation – les … Continuer la lecture de « Des établissements Sudoc partenaires de Gallica »

ISTEX – Appel à propositions « chantiers thématiques d’usage »

« ISTEX – Initiative d’excellence en Information scientifique et technique –  lance un appel à propositions auprès des équipes de recherche … Continuer la lecture de « ISTEX – Appel à propositions « chantiers thématiques d’usage » »

Exploration de corpus, outils et pratiques

 » Dans le cadre du consortium corpus écrits (Huma-num), le groupe de travail « Exploration de corpus » a mis en ligne … Continuer la lecture de « Exploration de corpus, outils et pratiques »

Enrichissement mutualisé de corpus : entrez dans le « CERCLES » !

« … L’objectif de cette expérimentation est simple : tester une structure d’encadrement souple et facile à mettre en place, autant … Continuer la lecture de « Enrichissement mutualisé de corpus : entrez dans le « CERCLES » ! »

Isidore speaks english, sino también español et toujours en français

« … Isidore peut désormais moissonner des corpus et bases de données en langue anglaise, espagnole et française et proposer des enrichissements … Continuer la lecture de « Isidore speaks english, sino también español et toujours en français »

sms4science : sms FOR science – Un corpus international pour l’étude des SMS – UMR5267 PRAXILING

« La communication par SMS est devenue en quelques années un véritable phénomène de société. De nombreuses études scientifiques (dans les … Continuer la lecture de « sms4science : sms FOR science – Un corpus international pour l’étude des SMS – UMR5267 PRAXILING »

R.TeMiS : création et analyse de corpus de textes sous R

 » Fonctionnalités générales R.TeMiS (R Text Mining Solution) est un environnement graphique de travail sous R permettant de créer, manipuler et … Continuer la lecture de « R.TeMiS : création et analyse de corpus de textes sous R »

Thèse de François-Régis Chaumartin « Antelope, une plate-forme de TAL permettant d’extraire les sens du texte : théorie et applications de l’interface syntaxe-sémantique »

 » Créer rapidement un analyseur sémantique dédié à une tâche particulière n’est pas une tâche aisée. En effet, composants d’analyse et … Continuer la lecture de « Thèse de François-Régis Chaumartin « Antelope, une plate-forme de TAL permettant d’extraire les sens du texte : théorie et applications de l’interface syntaxe-sémantique » »