07.07.2023
Mot-clé : Extraction d'information
30.06.2023
Webinaire « Découverte du TDM »
« Ce webinaire présente le TDM et ses enjeux. Vous découvrirez les objectifs et méthodes, les aspects éthiques et juridiques, et…27.06.2023
Istex pour le TAL et le TDM
« La conférence CORIA-TALN se tenait du 5 au 9 juin à Paris. Istex était à l’honneur dans diverses présentations montrant…05.06.2023
Actes de l’Atelier sur l’Analyse et la Recherche de Textes Scientifiques, CORIA-TALN 2023 – 5 juin 2023 Paris (France) (.pdf)
« (…) L’atelier sur l’Analyse et la Recherche de Textes Scientifiques (ARTS) 3, qui se déroule le 5 juin 2023 pendant…12.05.2023
Webinaire « Découverte du TDM » jeudi 8 juin 10h30 à 12h30
« Vous avez entendu parler du TDM (Text et data Mining) mais vous vous interrogez sur les principes et le fonctionnement,…20.01.2023
Extraction et Gestion des Connaissances, EGC’2023
« La sélection d’articles publiés dans le présent recueil constitue les actes de la 23e édition de la conférence francophone sur…21.10.2022
#ISTEX10ans | #Istex de ses origines à aujourd’hui ! (vidéo)
« Avec à ce jour (18/10/22) plus de 27 millions de documents, le projet Istex est devenu en 10 ans le…22.07.2022
ANF TDM 2022 – Exploration documentaire et extraction d’information 3-5 oct. 2022 Paris (France)
« (…) Cette formation s’adresse aux chercheurs et chercheuses, doctorant(e)s et ingénieur(e)s d’appui à la recherche qui souhaitent se former aux…10.05.2022
Atelier pratique sur l’usage des ressources ISTEX – 2 juin 2022, Toulouse
« Pour faciliter la prise en main des services et des outils de constitution, de visualisation et d’exploration d’un corpus thématique,…18.02.2022
Guillaume Cabanac, traqueur de fake science
« »Corrosif nucléique » pour « acide nucléique ». « Conscience contrefaite » à la place de « intelligence artificielle »… Ce sont les expressions « torturées » que Guillaume…07.01.2022
Nature’s 10 : Guillaume Cabanac parmi les 10 personnalités qui ont marqué la science en 2021
« Publiée par la prestigieuse revue scientifique Nature depuis 2011, la liste Nature’s 10 met en avant chaque année 10 scientifiques…03.12.2021
Bastien Latard. « Scientific search engines : From the categorization to the information retrieval » [thèse]
« L’abondance des données issues d’Internet est telle que les utilisateurs du web peinent à trouver des données pertinentes à leur…25.05.2021
Covid-on-the-Web: Graphe de Connaissances et Services pour faire Progresser la Recherche sur la COVID-19
« Le projet Covid-on-the-Web permet aux chercheurs d’accéder à la littérature relative à la famille des coronavirus, de l’interroger et d’en…10.05.2021
Dix ans avec CAHIER: des corpus d’auteurs pour les humanités à leur exploitation numérique
« Ce document réunit les résumés des communications acceptées pour la conférence finale du consortium CAHIER. Les participants ont été invités…15.04.2021
Advances in Information Retrieval – 43rd European Conference on IR Research, ECIR 2021 Virtual Event, March 28–April 1, 2021 [proceedings]
« ECIR 2021, the 43rd edition of the annual BCS-IRSG European Conference on Information Retrieval, initially planned…08.04.2021
A Prospective Comparison of Evidence Synthesis Search Strategies Developed With and Without Text-Mining Tools
« (…) In an era of explosive growth in biomedical evidence, improving systematic review (SR) search…22.03.2021
Actes de l’atelier DAHLIA (DigitAl Humanities and cuLtural herItAge: data and knowledge management and analysis) en conjonction avec la conférence EGC – 26 janvier 2021 (.pdf)
« L’atelier DAHLIA, à sa troisième édition, est organisé par le groupe de travail DAHLIA qui est soutenu par l’Association EGC…22.12.2020
Clément Dalloux . « Fouille de texte et extraction d’informations dans les données cliniques » [thèse]
« Avec la mise en place d’entrepôts de données cliniques, de plus en plus de données de santé sont disponibles pour…08.01.2020
Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d’été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus)
« L’UMR Thalim en collaboration avec l’UMR LATTICE et la TGIR HUMANUM du 28 juin au 4 juillet 2020 dans le…08.01.2020
The SmartSHARK Ecosystem for Software Repository Mining
« Software repository mining is the foundation for many empirical software engineering studies. The collection and analysis of detailed data can…09.12.2019
Towards Learning from User Feedback for Ontology-basedInformation Extraction (.pdf)
« (…) To automate the evolution of ontologies, we developed ConTrOn- Continuously Trained Ontology – that automatically extracts information from data…25.09.2019
#VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining
« Dans le cadre du projet Visa TM du Comité pour la Science Ouverte, un « Visa TM Day » sera organisé…22.08.2019
SEMANTiCS 2019 « The Power of AI and Knowledge Graphs », Sept. 09-12, 2019 , Karlsruhe (Germany) [programme]
« SEMANTiCS conference is the leading European conference on Semantic Technologies and AI. Researchers, industry experts and business leaders can develop…20.08.2019
Atelier – Du parchemin à la fouille de données. Nouveaux outils pour la création, la formalisation et l’analyse des corpus médiévaux – 28-30 octobre 2019 – Campus Condorcet (Paris)
« (…) L’objectif de cet atelier sera d’offrir une première initiation à des outils informatiques de création, de formalisation et d’analyse…13.08.2019
Application of Natural Language Processing Algorithms to the Task of Automatic Classification of Russian Scientific Texts
« This work is devoted to the study of applicability of modern methods of machine learning to the task of automatic…13.08.2019
VIANA: Visual Interactive Annotation of Argumentation
« (…) In this paper, we present a visual analytics system that augments the manual annotation process by automatically suggesting which…08.08.2019
Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 4 – 8, 2019 – Anchorage, Alaska – USA
« The annual ACM SIGKDD Conference is the premier international forum for data mining researchers and practitioners from academia, industry, and…07.08.2019
NaCTeM announced as the winners of NLP challenge on scholarly discourse and summarisation
« A team of researchers from NaCTeM group were recently announced as the winners of an NLP challenge. Dr. Chrysoula Zerva,…03.06.2019
Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse]
« (…) Cette thèse étudie différentes stratégies en recherche d’information et en fouille de données textuelles (amélioration du triage de documents…10.04.2019
A Hybrid Information Extraction Approach Exploiting Structured Data Within a Text Mining Process
« Many data sets encompass structured data fields with embedded free text fields. The text fields allow customers and workers to…15.02.2019
Stéphanie Challita. « Inferring Models from Cloud APIs and Reasoning over Them: A Tooled and Formal Approach » [PhD thesis]
« In recent years, multi-cloud computing which aims to combine different offerings ormigrate applications between different cloud providers, has become a…hal.inria.fr, Stéphanie Challita, Software Engineering [cs.SE]. Universite Lille 1, 2018. English.
25.01.2019
EGC 2019 – 19ème conférence francophone sur l’Extraction et la Gestion des Connaissances – 21 au 25 janvier 2019 – Metz [actes de conférence]
« (…) La conférence Extraction et Gestion de Connaissances (EGC) est le rendez-vous annuel de chercheurs et praticiens travaillant dans les…editions-rnti.fr, Revue des Nouvelles Technologies de l'Information vol.RNTI-E-35, 2019
21.09.2018
HathiTrust Research Center Extends Non-Consumptive Research Tools to Copyrighted Materials: Expanding Research through Fair Use
« HathiTrust has reached a tremendous milestone in the history of HathiTrust and the HathiTrust Research Center’s services. Since 2011, HTRC…17.09.2018
Emmanuel Le Roy Ladurie, précurseur du data mining ?
« En affirmant dès la fin des années 1960 que « les historiens seront programmeurs ou ne seront plus »…20.08.2018
Méthodologie pour identifier les terrains d’étude dans des corpus scientifiques
« Le projet interdisciplinaire TERRE-ISTEX a pour objectif d’identifier l’évolution des fronts de recherche en relation avec les territoires d’études, les…14.05.2018
New Named-Entity Recognition (NER) Toolchain and Demo
« The Semantic Lab has launched a demo of the Named-Entity Recognition (NER) toolchain developed by Prof. Matt Miller, which is…07.05.2018
Armel Fotsoh Tawaofaing. « Recherche d’entités nommées complexes sur le web : propositions pour l’extraction et pour le calcul de similarité » [thèse]
« Les récents développements des nouvelles technologies de l’information et de la communication font du Web une véritable mine d’information. Cependant,…02.05.2018
Abstract Mining
« We have developed an application that will take a « MEDLINE » output from the PubMed database and allows the user to…19.04.2018
Extraction et Gestion des Connaissances, EGC’2018 [actes de conférence]
« La sélection d’articles publiés dans le présent recueil constitue les actes de la 18e édition de la conférence (EGC 2018)…editions-rnti.fr, Revue des Nouvelles Technologies de l'Information vol.RNTI-E-34, 2018
13.04.2018
Le petit laboratoire sémantique : expérimentation à la BM de Fresnes
« Dans une démarche d’expérimentation, le petit laboratoire sémantique, développé en interne à la bibliothèque municipale de Fresnes,…28.03.2018
Grégory Smits. « Personnalisation et enrichissement des méthodes d’accès aux données »
« La transformation de données en connaissances constitue une tâche cruciale au cœur de nombreuses activités professionnelles. Deux principales stratégies peuvent…hal-centralesupelec.archives-ouvertes.fr, Grégory Smits, Université Rennes 1, 2018. 〈tel-01739707〉
23.03.2018
Annotation et analyse syntaxique de corpus hétérogènes [podcast]
« Comment doter le français médiéval (IXe-XVe siècles) d’une chaîne d’annotation automatique en syntaxe de dépendances ? Par Mathilde Regnault, doctorante…23.03.2018
Releasing 1.8 million open access publications from publisher systems for text and data mining
« Text and data mining offers an opportunity to improve the way we access and analyse the outputs of academic research.blogs.lse.ac.uk, Petr Knoth, Nancy Pontika, Lucas Anastasiou, 22 mars 2018
15.03.2018
Text Data Mining from the Author’s Perspective: Whose Text, Whose Mining, and to Whose Benefit?
« Given the many technical, social, and policy shifts in access to scholarly content since the early days of text data…arxiv.org, Christine L. Borgman, 12 mars 2018, arXiv:1803.04552
12.03.2018
The articles of SciELO journals on the European Commission Open Science platforms
« From March 2018 the articles published by SciELO journals will integrate and enjoy the features offered by two important development…blog.scielo.org, Abel L. Packer, Gustavo Fonseca, 9 mars 2018
06.03.2018
OpenMinTed : une plateforme d’outils informatiques pour extraire et exploiter les informations de la littérature scientifique
« L’équipe Bibliome-MaIAGE et la Délégation Information Scientifique et Technique (DIST) de l’Inra contribuent au projet européen d’infrastructure OpenMinTeD dont l’objectif…09.02.2018
revue RIDoWS / Recherche d’Information, Document, Web sémantique / dans la collection OpenScience d’ISTE
« Recherche d’information, document et web sémantique est un point de rencontre pour ces communautés scientifiques ou industrielles qui s’intéressent à…www.openscience.fr, Rédacteur en chef, Vincent Claveau, 2017-2018
02.02.2018
TDM STORIES: A Text & Data Miner Talks About Analysing The Recent Past
« Federico Nanni is a researcher who uses TDM to build collections of materials from large archives which can be used…31.01.2018
KEY CONCEPTS AND AREAS IN TDM EXPLAINED – PART 6: DEEP LEARNING
« It’s time for our final episode of this series of ‘Key concepts and areas in TDM explained’. This time Robert…16.01.2018
Key concepts and areas in TDM explained – Part 5: Knowledge Discovery
« Knowledge discovery is the process of discovering new information. In text and data mining this happens for example by finding…18.12.2017
Étiquetage thématique automatisé de corpus par représentation sémantique
« Dans les corpus de textes scientifiques, certains articles issus de communautés de chercheurs différentes peuvent ne pas être décrits par…14.12.2017
Prototype expérimental pour l’exploration de corpus audiovisuels et textuels
« Paroles, Images et Textes des Savoirs (P.I.T.S) est une plateforme d’extraction automatique de métadonnées et d’exploration innovante des contenus audiovisuels.11.03.2016
Identifying and Improving Dataset References in Social Sciences Full Texts
« Scientific full text papers are usually stored in separate places than their underlying research datasets. Authors typically make…arxiv, Behnam Ghavimi, Philipp Mayr, Sahar Vahdati, Christoph Lange, 6 mars 2016
26.03.2013
Thèse de François-Régis Chaumartin « Antelope, une plate-forme de TAL permettant d’extraire les sens du texte : théorie et applications de l’interface syntaxe-sémantique »
» Créer rapidement un analyseur sémantique dédié à une tâche particulière n’est pas une tâche aisée. En effet, composants…18.12.2012
Thèse de Charles Teissèdre « Analyse sémantique automatique des adverbiaux de localisation temporelle : application à la recherche d’information et à l’acquisition de connaissances »
« Cette thèse concerne la question de l’accès aux textes numériques, en particulier de l’accès à leur » contenu…16.10.2012