Towards Learning from User Feedback for Ontology-basedInformation Extraction (.pdf)

« (…) To automate the evolution of ontologies, we developed ConTrOn- Continuously Trained Ontology – that automatically extracts information from data … Continuer la lecture de « Towards Learning from User Feedback for Ontology-basedInformation Extraction (.pdf) »

#VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining

« Dans le cadre du projet Visa TM du Comité pour la Science Ouverte, un « Visa TM Day » sera organisé … Continuer la lecture de « #VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining »

SEMANTiCS 2019 « The Power of AI and Knowledge Graphs », Sept. 09-12, 2019 , Karlsruhe (Germany) [programme]

« SEMANTiCS conference is the leading European conference on Semantic Technologies and AI. Researchers, industry experts and business leaders can develop … Continuer la lecture de « SEMANTiCS 2019 « The Power of AI and Knowledge Graphs », Sept. 09-12, 2019 , Karlsruhe (Germany) [programme] »

Atelier – Du parchemin à la fouille de données. Nouveaux outils pour la création, la formalisation et l’analyse des corpus médiévaux – 28-30 octobre 2019 – Campus Condorcet (Paris)

« (…) L’objectif de cet atelier sera d’offrir une première initiation à des outils informatiques de création, de formalisation et d’analyse … Continuer la lecture de « Atelier – Du parchemin à la fouille de données. Nouveaux outils pour la création, la formalisation et l’analyse des corpus médiévaux – 28-30 octobre 2019 – Campus Condorcet (Paris) »

Application of Natural Language Processing Algorithms to the Task of Automatic Classification of Russian Scientific Texts

« This work is devoted to the study of applicability of modern methods of machine learning to the task of automatic … Continuer la lecture de « Application of Natural Language Processing Algorithms to the Task of Automatic Classification of Russian Scientific Texts »

VIANA: Visual Interactive Annotation of Argumentation

« (…) In this paper, we present a visual analytics system that augments the manual annotation process by automatically suggesting which … Continuer la lecture de « VIANA: Visual Interactive Annotation of Argumentation »

Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 4 – 8, 2019 – Anchorage, Alaska – USA

« The annual ACM SIGKDD Conference is the premier international forum for data mining researchers and practitioners from academia, industry, and … Continuer la lecture de « Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 4 – 8, 2019 – Anchorage, Alaska – USA »

NaCTeM announced as the winners of NLP challenge on scholarly discourse and summarisation

« A team of researchers from NaCTeM group were recently announced as the winners of an NLP challenge. Dr. Chrysoula Zerva, … Continuer la lecture de « NaCTeM announced as the winners of NLP challenge on scholarly discourse and summarisation »

Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse]

« (…) Cette thèse étudie différentes stratégies en recherche d’information et en fouille de données textuelles (amélioration du triage de documents … Continuer la lecture de « Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse] »

A Hybrid Information Extraction Approach Exploiting Structured Data Within a Text Mining Process

« Many data sets encompass structured data fields with embedded free text fields. The text fields allow customers and workers to … Continuer la lecture de « A Hybrid Information Extraction Approach Exploiting Structured Data Within a Text Mining Process »

Stéphanie Challita. « Inferring Models from Cloud APIs and Reasoning over Them: A Tooled and Formal Approach » [PhD thesis]

« In recent years, multi-cloud computing which aims to combine different offerings ormigrate applications between different cloud providers, has become a … Continuer la lecture de « Stéphanie Challita. « Inferring Models from Cloud APIs and Reasoning over Them: A Tooled and Formal Approach » [PhD thesis] »

EGC 2019 – 19ème conférence francophone sur l’Extraction et la Gestion des Connaissances – 21 au 25 janvier 2019 – Metz [actes de conférence]

« (…) La conférence Extraction et Gestion de Connaissances (EGC) est le rendez-vous annuel de chercheurs et praticiens travaillant dans les … Continuer la lecture de « EGC 2019 – 19ème conférence francophone sur l’Extraction et la Gestion des Connaissances – 21 au 25 janvier 2019 – Metz [actes de conférence] »

HathiTrust Research Center Extends Non-Consumptive Research Tools to Copyrighted Materials: Expanding Research through Fair Use

« HathiTrust has reached a tremendous milestone in the history of HathiTrust and the HathiTrust Research Center’s services. Since 2011, HTRC … Continuer la lecture de « HathiTrust Research Center Extends Non-Consumptive Research Tools to Copyrighted Materials: Expanding Research through Fair Use »

Emmanuel Le Roy Ladurie, précurseur du data mining ?

« En affirmant dès la fin des années 1960 que « les historiens seront programmeurs ou ne seront plus »1, Emmanuel … Continuer la lecture de « Emmanuel Le Roy Ladurie, précurseur du data mining ? »

Méthodologie pour identifier les terrains d’étude dans des corpus scientifiques

« Le projet interdisciplinaire TERRE-ISTEX a pour objectif d’identifier l’évolution des fronts de recherche en relation avec les territoires d’études, les … Continuer la lecture de « Méthodologie pour identifier les terrains d’étude dans des corpus scientifiques »

Armel Fotsoh Tawaofaing. « Recherche d’entités nommées complexes sur le web : propositions pour l’extraction et pour le calcul de similarité » [thèse]

« Les récents développements des nouvelles technologies de l’information et de la communication font du Web une véritable mine d’information. Cependant, … Continuer la lecture de « Armel Fotsoh Tawaofaing. « Recherche d’entités nommées complexes sur le web : propositions pour l’extraction et pour le calcul de similarité » [thèse] »

Extraction et Gestion des Connaissances, EGC’2018 [actes de conférence]

« La sélection d’articles publiés dans le présent recueil constitue les actes de la 18e édition de la conférence (EGC 2018) … Continuer la lecture de « Extraction et Gestion des Connaissances, EGC’2018 [actes de conférence] »

Le petit laboratoire sémantique : expérimentation à la BM de Fresnes

« Dans une démarche d’expérimentation, le petit laboratoire sémantique, développé en interne à la bibliothèque municipale de Fresnes, vise à explorer … Continuer la lecture de « Le petit laboratoire sémantique : expérimentation à la BM de Fresnes »

Grégory Smits. « Personnalisation et enrichissement des méthodes d’accès aux données »

« La transformation de données en connaissances constitue une tâche cruciale au cœur de nombreuses activités professionnelles. Deux principales stratégies peuvent … Continuer la lecture de « Grégory Smits. « Personnalisation et enrichissement des méthodes d’accès aux données » »

Annotation et analyse syntaxique de corpus hétérogènes [podcast]

« Comment doter le français médiéval (IXe-XVe siècles) d’une chaîne d’annotation automatique en syntaxe de dépendances ? Par Mathilde Regnault, doctorante … Continuer la lecture de « Annotation et analyse syntaxique de corpus hétérogènes [podcast] »

Releasing 1.8 million open access publications from publisher systems for text and data mining

« Text and data mining offers an opportunity to improve the way we access and analyse the outputs of academic research. … Continuer la lecture de « Releasing 1.8 million open access publications from publisher systems for text and data mining »

Text Data Mining from the Author’s Perspective: Whose Text, Whose Mining, and to Whose Benefit?

« Given the many technical, social, and policy shifts in access to scholarly content since the early days of text data … Continuer la lecture de « Text Data Mining from the Author’s Perspective: Whose Text, Whose Mining, and to Whose Benefit? »

The articles of SciELO journals on the European Commission Open Science platforms

« From March 2018 the articles published by SciELO journals will integrate and enjoy the features offered by two important development … Continuer la lecture de « The articles of SciELO journals on the European Commission Open Science platforms »

OpenMinTed : une plateforme d’outils informatiques pour extraire et exploiter les informations de la littérature scientifique

« L’équipe Bibliome-MaIAGE et la Délégation Information Scientifique et Technique (DIST) de l’Inra contribuent au projet européen d’infrastructure OpenMinTeD dont l’objectif … Continuer la lecture de « OpenMinTed : une plateforme d’outils informatiques pour extraire et exploiter les informations de la littérature scientifique »

revue RIDoWS / Recherche d’Information, Document, Web sémantique / dans la collection OpenScience d’ISTE

« Recherche d’information, document et web sémantique est un point de rencontre pour ces communautés scientifiques ou industrielles qui s’intéressent à … Continuer la lecture de « revue RIDoWS / Recherche d’Information, Document, Web sémantique / dans la collection OpenScience d’ISTE »

TDM STORIES: A Text & Data Miner Talks About Analysing The Recent Past

« Federico Nanni is a researcher who uses TDM to build collections of materials from large archives which can be used … Continuer la lecture de « TDM STORIES: A Text & Data Miner Talks About Analysing The Recent Past »

KEY CONCEPTS AND AREAS IN TDM EXPLAINED – PART 6: DEEP LEARNING

« It’s time for our final episode of this series of ‘Key concepts and areas in TDM explained’. This time Robert … Continuer la lecture de « KEY CONCEPTS AND AREAS IN TDM EXPLAINED – PART 6: DEEP LEARNING »

Key concepts and areas in TDM explained – Part 5: Knowledge Discovery

« Knowledge discovery is the process of discovering new information. In text and data mining this happens for example by finding … Continuer la lecture de « Key concepts and areas in TDM explained – Part 5: Knowledge Discovery »

Étiquetage thématique automatisé de corpus par représentation sémantique

« Dans les corpus de textes scientifiques, certains articles issus de communautés de chercheurs différentes peuvent ne pas être décrits par … Continuer la lecture de « Étiquetage thématique automatisé de corpus par représentation sémantique »

Prototype expérimental pour l’exploration de corpus audiovisuels et textuels

« Paroles, Images et Textes des Savoirs (P.I.T.S) est une plateforme d’extraction automatique de métadonnées et d’exploration innovante des contenus audiovisuels. … Continuer la lecture de « Prototype expérimental pour l’exploration de corpus audiovisuels et textuels »

Identifying and Improving Dataset References in Social Sciences Full Texts

« Scientific full text papers are usually stored in separate places than their underlying research datasets. Authors typically make references to … Continuer la lecture de « Identifying and Improving Dataset References in Social Sciences Full Texts »

Thèse de François-Régis Chaumartin « Antelope, une plate-forme de TAL permettant d’extraire les sens du texte : théorie et applications de l’interface syntaxe-sémantique »

 » Créer rapidement un analyseur sémantique dédié à une tâche particulière n’est pas une tâche aisée. En effet, composants d’analyse et … Continuer la lecture de « Thèse de François-Régis Chaumartin « Antelope, une plate-forme de TAL permettant d’extraire les sens du texte : théorie et applications de l’interface syntaxe-sémantique » »

Thèse de Charles Teissèdre « Analyse sémantique automatique des adverbiaux de localisation temporelle : application à la recherche d’information et à l’acquisition de connaissances »

« Cette thèse concerne la question de l’accès aux textes numériques, en particulier de l’accès à leur  » contenu informationnel « , … Continuer la lecture de « Thèse de Charles Teissèdre « Analyse sémantique automatique des adverbiaux de localisation temporelle : application à la recherche d’information et à l’acquisition de connaissances » »

Discours de presse et veille stratégique d’événements. Approche textométrique et extraction d’informations pour la fouille de textes – Thèse de Erin Macmurray

« Ce travail a pour objet l’étude de deux méthodes de fouille automatique de textes, l’extraction d’informations et la textométrie, toutes … Continuer la lecture de « Discours de presse et veille stratégique d’événements. Approche textométrique et extraction d’informations pour la fouille de textes – Thèse de Erin Macmurray »