Mot-clé : extraction-dinformation

17.11.2025

3e journée d’étude ARDoISE »Découvrir, fouiller, partager des données de recherche : quels apports et limites de l’IA ? » | 26 janvier 2026, Maison des sciences humaines et sociales en Bretagne (MSHB), Rennes

« Le traitement de données au moyen de techniques relevant de l’apprentissage profond est à la fois plus ancien et plus…

ardoise.sciencesconf.org

Continuer la lecture

17.11.2025

Introduction au TDM

« Ce support permet de présenter le TDM à des non spécialistes. La présentation dure 1h avec des démonstrations et propose…

cnrs.hal.science

Continuer la lecture

24.06.2025

ISTEX TDM Factory : la fouille de textes à portée de main

« Découvrez la nouvelle interface de TDM Factory (https://tdm-factory.services.istex.fr) qui transforme vos données en connaissances (…) »…

istex.fr/

Continuer la lecture

13.06.2025

Un tutoriel pour maîtriser Istex Search de A à Z

« Le 25 avril 2024, nous vous annoncions la mise en ligne d’Istex Search, notre nouvelle application…

istex.fr

Continuer la lecture

25.04.2025

ANF TDM 2024 | Nouvelles vidéos sur l’exploration documentaire

« Chaque année, le CNRS et INRAE organisent l’action nationale de formation dédiée à l’exploration documentaire et l’extraction d’informations (ANF TDM).

science-ouverte.cnrs.fr

Continuer la lecture

02.04.2025

EGC (Extraction et Gestion des Connaissances) 2025 – du 27 au 31 janvier, Strasbourg [actes de conférence]

« (…) La sélection d’articles publiés dans le présent recueil constitue les actes des 25e Journées Internationales Francophones sur l’Extraction et…

editions-rnti.fr

Continuer la lecture

05.02.2025

Retour sur TextMine 2025

« Le 28 janvier dernier, lors de la conférence EGC à Strasbourg, l’atelier TextMine a rassemblé plus de 40 participants autour…

inist.fr

Continuer la lecture

13.01.2025

EGC (Extraction et Gestion des Connaissances) 2025 – du 27 au 31 janvier à Strasbourg

« La conférence Extraction et Gestion des Connaissances (EGC) est un événement annuel réunissant des chercheurs et praticiens de disciplines relevant…

egc

Continuer la lecture

25.11.2024

Renouvellement des adhésions aux services de l’infrastructure Istex !

« La campagne d’adhésion pour la période 2025-2027 est désormais lancée, selon des conditions similaires au dispositif précédent. Les établissements…

istex.fr

Continuer la lecture

07.07.2023

ANF TDM 2023 | Exploration documentaire et extraction d’informations – 12-13 oct. 2023 Villejuif (France)

« (…) Cette formation nationale invite les communautés scientifiques à exploiter les techniques numériques de la recherche d’information et à développer…

anf-tdm

Continuer la lecture

30.06.2023

Webinaire « Découverte du TDM »

« Ce webinaire présente le TDM et ses enjeux. Vous découvrirez les objectifs et méthodes, les aspects éthiques et juridiques, et…

canal-u.tv/chaines/inist-cnrs

Continuer la lecture

27.06.2023

Istex pour le TAL et le TDM

« La conférence CORIA-TALN se tenait du 5 au 9 juin à Paris. Istex était à l’honneur dans diverses présentations montrant…

inist.fr/nos-actualites

Continuer la lecture

05.06.2023

Actes de l’Atelier sur l’Analyse et la Recherche de Textes Scientifiques, CORIA-TALN 2023 – 5 juin 2023 Paris (France) (.pdf)

« (…) L’atelier sur l’Analyse et la Recherche de Textes Scientifiques (ARTS) 3, qui se déroule le 5 juin 2023 pendant…

arts2023.sciencesconf.org

Continuer la lecture

12.05.2023

Webinaire « Découverte du TDM » jeudi 8 juin 10h30 à 12h30

« Vous avez entendu parler du TDM (Text et data Mining) mais vous vous interrogez sur les principes et le fonctionnement,…

objectif-tdm.inist.fr

Continuer la lecture

20.01.2023

Extraction et Gestion des Connaissances, EGC’2023

« La sélection d’articles publiés dans le présent recueil constitue les actes de la 23e édition de la conférence francophone sur…

editions-rnti.fr

Continuer la lecture

21.10.2022

#ISTEX10ans | #Istex de ses origines à aujourd’hui ! (vidéo)

« Avec à ce jour (18/10/22) plus de 27 millions de documents, le projet Istex est devenu en 10 ans le…

youtube.com, Inist-CNRS

Continuer la lecture

22.07.2022

ANF TDM 2022 – Exploration documentaire et extraction d’information 3-5 oct. 2022 Paris (France)

« (…) Cette formation s’adresse aux chercheurs et chercheuses, doctorant(e)s et ingénieur(e)s d’appui à la recherche qui souhaitent se former aux…

anf-tdm-2022

Continuer la lecture

10.05.2022

Atelier pratique sur l’usage des ressources ISTEX – 2 juin 2022, Toulouse

« Pour faciliter la prise en main des services et des outils de constitution, de visualisation et d’exploration d’un corpus thématique,…

inist.fr

Continuer la lecture

18.02.2022

Guillaume Cabanac, traqueur de fake science

« »Corrosif nucléique » pour « acide nucléique ». « Conscience contrefaite » à la place de « intelligence artificielle »… Ce sont les expressions « torturées » que Guillaume…

lejournal.cnrs.fr

Continuer la lecture

07.01.2022

Nature’s 10 : Guillaume Cabanac parmi les 10 personnalités qui ont marqué la science en 2021

« Publiée par la prestigieuse revue scientifique Nature depuis 2011, la liste Nature’s 10 met en avant chaque année 10 scientifiques…

univ-tlse3.fr

Continuer la lecture

03.12.2021

Bastien Latard. « Scientific search engines : From the categorization to the information retrieval » [thèse]

« L’abondance des données issues d’Internet est telle que les utilisateurs du web peinent à trouver des données pertinentes à leur…

tel.archives-ouvertes.fr

Continuer la lecture

25.05.2021

Covid-on-the-Web: Graphe de Connaissances et Services pour faire Progresser la Recherche sur la COVID-19

« Le projet Covid-on-the-Web permet aux chercheurs d’accéder à la littérature relative à la famille des coronavirus, de l’interroger et d’en…

https://hal.archives-ouvertes.fr/hal-03230741

Continuer la lecture

10.05.2021

Dix ans avec CAHIER: des corpus d’auteurs pour les humanités à leur exploitation numérique

« Ce document réunit les résumés des communications acceptées pour la conférence finale du consortium CAHIER. Les participants ont été invités…

hal.archives-ouvertes.fr

Continuer la lecture

15.04.2021

Advances in Information Retrieval – 43rd European Conference on IR Research, ECIR 2021 Virtual Event, March 28–April 1, 2021 [proceedings]

« ECIR 2021, the 43rd edition of the annual BCS-IRSG European Conference on Information Retrieval, initially planned…

ecir2021.eu

Continuer la lecture

08.04.2021

A Prospective Comparison of Evidence Synthesis Search Strategies Developed With and Without Text-Mining Tools

« (…) In an era of explosive growth in biomedical evidence, improving systematic review (SR) search…

ncbi.nlm.nih.gov

Continuer la lecture

22.03.2021

Actes de l’atelier DAHLIA (DigitAl Humanities and cuLtural herItAge: data and knowledge management and analysis) en conjonction avec la conférence EGC – 26 janvier 2021 (.pdf)

« L’atelier DAHLIA, à sa troisième édition, est organisé par le groupe de travail DAHLIA qui est soutenu par l’Association EGC…

dahlia.egc.asso.fr

Continuer la lecture

22.12.2020

Clément Dalloux . « Fouille de texte et extraction d’informations dans les données cliniques » [thèse]

« Avec la mise en place d’entrepôts de données cliniques, de plus en plus de données de santé sont disponibles pour…

hal.archives-ouvertes.fr, Clément Dalloux. Fouille de texte et extraction d'informations dans les données cliniques. Traitement du texte et du document. Université de Rennes 1, 2020. Français. ⟨tel-03081563⟩

Continuer la lecture

08.01.2020

Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d’été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus)

« L’UMR Thalim en collaboration avec l’UMR LATTICE et la TGIR HUMANUM du 28 juin au 4 juillet 2020 dans le…

humanum.hypotheses.org, pbusonera, 7 janvier 2020

Continuer la lecture

08.01.2020

The SmartSHARK Ecosystem for Software Repository Mining

« Software repository mining is the foundation for many empirical software engineering studies. The collection and analysis of detailed data can…

arxiv.org, Alexander Trautsch, Fabian Trautsch, Steffen Herbold, Benjamin Ledel, Jens Grabowski, 6 Jan 2020, arXiv:2001.01606v1

Continuer la lecture

09.12.2019

Towards Learning from User Feedback for Ontology-basedInformation Extraction (.pdf)

« (…) To automate the evolution of ontologies, we developed ConTrOn- Continuously Trained Ontology – that automatically extracts information from data…

di2kg.inf.uniroma3.it, Opasjumruskit, Kobkaew, Schindler, Sirko, Thiele, Laura, Thiele, LauraSchäfer, Philipp Matthias, DI2KG ’19, August 05, 2019, Anchorage, AK

Continuer la lecture

25.09.2019

#VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining

« Dans le cadre du projet Visa TM du Comité pour la Science Ouverte, un « Visa TM Day » sera organisé…

inist.fr, 25 septembre 2019

Continuer la lecture

22.08.2019

SEMANTiCS 2019 « The Power of AI and Knowledge Graphs », Sept. 09-12, 2019 , Karlsruhe (Germany) [programme]

« SEMANTiCS conference is the leading European conference on Semantic Technologies and AI. Researchers, industry experts and business leaders can develop…

2019.semantics.cc, 2019

Continuer la lecture

20.08.2019

Atelier – Du parchemin à la fouille de données. Nouveaux outils pour la création, la formalisation et l’analyse des corpus médiévaux – 28-30 octobre 2019 – Campus Condorcet (Paris)

« (…) L’objectif de cet atelier sera d’offrir une première initiation à des outils informatiques de création, de formalisation et d’analyse…

cosme.hypotheses.org, paulbertrand2, 19 aout 2019

Continuer la lecture

13.08.2019

Application of Natural Language Processing Algorithms to the Task of Automatic Classification of Russian Scientific Texts

« This work is devoted to the study of applicability of modern methods of machine learning to the task of automatic…

datascience.codata.org, Romanov, A., Lomotin, K. and Kozlova, E., 2019, Data Science Journal, 18(1), p.37. DOI: http://doi.org/10.5334/dsj-2019-037

Continuer la lecture

13.08.2019

VIANA: Visual Interactive Annotation of Argumentation

« (…) In this paper, we present a visual analytics system that augments the manual annotation process by automatically suggesting which…

arxiv.org, Fabian Sperrle, Rita Sevastjanova, Rebecca Kehlbeck, Mennatallah El-Assady, 2019, arXiv:1907.12413v1

Continuer la lecture

08.08.2019

Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 4 – 8, 2019 – Anchorage, Alaska – USA

« The annual ACM SIGKDD Conference is the premier international forum for data mining researchers and practitioners from academia, industry, and…

dl.acm.org, Ankur Teredesai, Vipin Kumar, Ying Li, Rómer Rosales, Evimaria Terzi, George Karypis, aout 2019

Continuer la lecture

07.08.2019

NaCTeM announced as the winners of NLP challenge on scholarly discourse and summarisation

« A team of researchers from NaCTeM group were recently announced as the winners of an NLP challenge. Dr. Chrysoula Zerva,…

nactem.ac.uk, 5 aout 2019

Continuer la lecture

03.06.2019

Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse]

« (…) Cette thèse étudie différentes stratégies en recherche d’information et en fouille de données textuelles (amélioration du triage de documents…

archive-ouverte.unige.ch, Mottin, Luc, Directeurs Chopard, Bastien, Ruch, Patrick, DOI: 10.13097/archive-ouverte/unige:118269 URN: urn:nbn:ch:unige-1182697

Continuer la lecture

10.04.2019

A Hybrid Information Extraction Approach Exploiting Structured Data Within a Text Mining Process

« Many data sets encompass structured data fields with embedded free text fields. The text fields allow customers and workers to…

dl.gi.de/handle, Kiefer, C., Reimann, P. & Mitschang, B., In: Grust, T., Naumann, F., Böhm, A. et al, BTW 2019. Gesellschaft für Informatik, Bonn. (S. 149-168)

Continuer la lecture

15.02.2019

Stéphanie Challita. « Inferring Models from Cloud APIs and Reasoning over Them: A Tooled and Formal Approach » [PhD thesis]

« In recent years, multi-cloud computing which aims to combine different offerings ormigrate applications between different cloud providers, has become a…

hal.inria.fr, Stéphanie Challita, Software Engineering [cs.SE]. Universite Lille 1, 2018. English.

Continuer la lecture

25.01.2019

EGC 2019 – 19ème conférence francophone sur l’Extraction et la Gestion des Connaissances – 21 au 25 janvier 2019 – Metz [actes de conférence]

« (…) La conférence Extraction et Gestion de Connaissances (EGC) est le rendez-vous annuel de chercheurs et praticiens travaillant dans les…

editions-rnti.fr, Revue des Nouvelles Technologies de l'Information vol.RNTI-E-35, 2019

Continuer la lecture

21.09.2018

HathiTrust Research Center Extends Non-Consumptive Research Tools to Copyrighted Materials: Expanding Research through Fair Use

« HathiTrust has reached a tremendous milestone in the history of HathiTrust and the HathiTrust Research Center’s services. Since 2011, HTRC…

hathitrust.org, jbelle, 20 septembre 2018

Continuer la lecture

17.09.2018

Emmanuel Le Roy Ladurie, précurseur du data mining ?

« En affirmant dès la fin des années 1960 que « les historiens seront programmeurs ou ne seront plus »…

bnf.hypotheses.org, Olivier Jacquot, 14 septembre 2018

Continuer la lecture

20.08.2018

Méthodologie pour identifier les terrains d’étude dans des corpus scientifiques

« Le projet interdisciplinaire TERRE-ISTEX a pour objectif d’identifier l’évolution des fronts de recherche en relation avec les territoires d’études, les…

hal.archives-ouvertes.fr, Eric Kergosien, Marie-Noëlle Bessagnet, Maguelonne Teisseire, Joachim Schöpfel, Mohammad Amin Farvardin, et al., Revue des Sciences et Technologies de l'Information - Série Document Numérique, Lavoisier, 2017, 20 (2-3), pp.11-30. 〈https://dn.revuesonline.com/article.jsp?articleId=39554〉. 〈10.3166/dn.2017.00011〉. 〈hal-01856066v2〉

Continuer la lecture

14.05.2018

New Named-Entity Recognition (NER) Toolchain and Demo

« The Semantic Lab has launched a demo of the Named-Entity Recognition (NER) toolchain developed by Prof. Matt Miller, which is…

semlab.io, 1 mai 2018

Continuer la lecture

07.05.2018

Armel Fotsoh Tawaofaing. « Recherche d’entités nommées complexes sur le web : propositions pour l’extraction et pour le calcul de similarité » [thèse]

« Les récents développements des nouvelles technologies de l’information et de la communication font du Web une véritable mine d’information. Cependant,…

theses.fr, Armel Fotsoh Tawaofaing, sous la direction de Christian Sallaberry et de Annig Le Parc-Lacayrelle, 2018

Continuer la lecture

02.05.2018

Abstract Mining

« We have developed an application that will take a « MEDLINE » output from the PubMed database and allows the user to…

arxiv.org, Ellie Small, Javier Cabrera, John B. Kostis, William Kostis, 26 avril 2018, arXiv:1804.10530v1

Continuer la lecture

19.04.2018

Extraction et Gestion des Connaissances, EGC’2018 [actes de conférence]

« La sélection d’articles publiés dans le présent recueil constitue les actes de la 18e édition de la conférence (EGC 2018)…

editions-rnti.fr, Revue des Nouvelles Technologies de l'Information vol.RNTI-E-34, 2018

Continuer la lecture

13.04.2018

Le petit laboratoire sémantique : expérimentation à la BM de Fresnes

« Dans une démarche d’expérimentation, le petit laboratoire sémantique, développé en interne à la bibliothèque municipale de Fresnes,…

transition-bibliographique.fr, 9 avril 2018

Continuer la lecture

28.03.2018

Grégory Smits. « Personnalisation et enrichissement des méthodes d’accès aux données »

« La transformation de données en connaissances constitue une tâche cruciale au cœur de nombreuses activités professionnelles. Deux principales stratégies peuvent…

hal-centralesupelec.archives-ouvertes.fr, Grégory Smits, Université Rennes 1, 2018. 〈tel-01739707〉

Continuer la lecture

23.03.2018

Annotation et analyse syntaxique de corpus hétérogènes [podcast]

« Comment doter le français médiéval (IXe-XVe siècles) d’une chaîne d’annotation automatique en syntaxe de dépendances ? Par Mathilde Regnault, doctorante…

franceculture.fr, La Recherche montre en main, 21 mars 2018

Continuer la lecture

23.03.2018

Releasing 1.8 million open access publications from publisher systems for text and data mining

« Text and data mining offers an opportunity to improve the way we access and analyse the outputs of academic research.

blogs.lse.ac.uk, Petr Knoth, Nancy Pontika, Lucas Anastasiou, 22 mars 2018

Continuer la lecture

15.03.2018

Text Data Mining from the Author’s Perspective: Whose Text, Whose Mining, and to Whose Benefit?

« Given the many technical, social, and policy shifts in access to scholarly content since the early days of text data…

arxiv.org, Christine L. Borgman, 12 mars 2018, arXiv:1803.04552

Continuer la lecture

12.03.2018

The articles of SciELO journals on the European Commission Open Science platforms

« From March 2018 the articles published by SciELO journals will integrate and enjoy the features offered by two important development…

blog.scielo.org, Abel L. Packer, Gustavo Fonseca, 9 mars 2018

Continuer la lecture

06.03.2018

OpenMinTed : une plateforme d’outils informatiques pour extraire et exploiter les informations de la littérature scientifique

« L’équipe Bibliome-MaIAGE et la Délégation Information Scientifique et Technique (DIST) de l’Inra contribuent au projet européen d’infrastructure OpenMinTeD dont l’objectif…

jouy.inra.fr, Céline Bezy, 2 mars 2018

Continuer la lecture

09.02.2018

revue RIDoWS / Recherche d’Information, Document, Web sémantique / dans la collection OpenScience d’ISTE

« Recherche d’information, document et web sémantique est un point de rencontre pour ces communautés scientifiques ou industrielles qui s’intéressent à…

www.openscience.fr, Rédacteur en chef, Vincent Claveau, 2017-2018

Continuer la lecture

02.02.2018

TDM STORIES: A Text & Data Miner Talks About Analysing The Recent Past

« Federico Nanni is a researcher who uses TDM to build collections of materials from large archives which can be used…

openminted.eu, 02 février 2018

Continuer la lecture

31.01.2018

KEY CONCEPTS AND AREAS IN TDM EXPLAINED – PART 6: DEEP LEARNING

« It’s time for our final episode of this series of ‘Key concepts and areas in TDM explained’. This time Robert…

openminted.eu, 30 janvier 2018

Continuer la lecture

16.01.2018

Key concepts and areas in TDM explained – Part 5: Knowledge Discovery

« Knowledge discovery is the process of discovering new information. In text and data mining this happens for example by finding…

openminted.eu, 16 janvier 2018

Continuer la lecture

18.12.2017

Étiquetage thématique automatisé de corpus par représentation sémantique

« Dans les corpus de textes scientifiques, certains articles issus de communautés de chercheurs différentes peuvent ne pas être décrits par…

hal.archives-ouvertes.fr, Lucie Martinet, Hussein Al-Natsheh, Fabien Rico, Fabrice Muhlenbach, Djamel Zighed, 2018 - 18ème Conférence Internationale sur l'Extraction et la Gestion de Connaissances, Jan 2018, Paris-Nord, France. pp.1-6. 〈hal-01659639〉

Continuer la lecture

14.12.2017

Prototype expérimental pour l’exploration de corpus audiovisuels et textuels

« Paroles, Images et Textes des Savoirs (P.I.T.S) est une plateforme d’extraction automatique de métadonnées et d’exploration innovante des contenus audiovisuels.

fmsh.fr, décembre 2017

Continuer la lecture

11.03.2016