15.07.2024
Mot-clé :
19.06.2024
ANF TDM 2023 | Retrouver les interviews vidéos autour des logiciels de fouille de textes
« Chaque année, le CNRS et INRAE organisent l’action nationale de formation dédiée à l’exploration documentaire et l’extraction d’informations. Retrouvez les…14.06.2024
ANF TDM 2024 | Exploration documentaire et extraction d’informations | 3-4 octobre 2024, Villejuif
« La production scientifique s’accélère chaque année. D’après une étude parue sur arXiv, le nombre d’articles publiés dans le monde…06.06.2024
La fouille de textes en IST : les outils Istex-TDM
« (…) Dans cet article nous illustrons l’utilisation de l’IA dans le domaine de l’IST (Information Scientifique et Technique) à travers…26.04.2024
Istex Search : votre interface de création de corpus
« Istex Search, le dernier-né des services Istex, incarne la fusion du démonstrateur Istex et d’Istex-DL dans une interface unique, facilitant…09.04.2024
Text mining arXiv: a look through quantitative finance papers
« This paper explores articles hosted on the arXiv preprint server with the aim to uncover valuable insights hidden in this…21.03.2024
University of California: Fair use rights to conduct text and data mining and use artificial intelligence tools are essential for UC research and teaching
« The UC Libraries strive to preserve fair use rights when licensing electronic resources—including the fair use rights to conduct computational…07.03.2024
TextMine’24
« La fouille de textes couvre de multiples domaines comme le traitement automatique des langues, l’intelligence artificielle, la linguistique, les statistiques,…01.03.2024
Europe PMC POSI update – 2 years on
« Two years have sailed by since Europe PMC adopted the Principles of Open Scholarly Infrastructure (POSI) in February 2021. POSI…01.12.2023
JSO CNRS 2023 | Science ouverte : logiciels libres et fouille de textes – 22 novembre 2023 (présentations)
« La Direction des données ouvertes de la recherche (DDOR) du CNRS a organisé la 5ème édition de…30.06.2023
Webinaire « Découverte du TDM »
« Ce webinaire présente le TDM et ses enjeux. Vous découvrirez les objectifs et méthodes, les aspects éthiques et juridiques, et…27.06.2023
Istex pour le TAL et le TDM
« La conférence CORIA-TALN se tenait du 5 au 9 juin à Paris. Istex était à l’honneur dans diverses présentations montrant…26.06.2023
Text and data mining : explorons les cités enfouies ! (vidéo)
« Ce webinaire s’est tenu le 21/06/23.. La fouille de texte et de données à des fins de…05.06.2023
Actes de l’Atelier sur l’Analyse et la Recherche de Textes Scientifiques, CORIA-TALN 2023 – 5 juin 2023 Paris (France) (.pdf)
« (…) L’atelier sur l’Analyse et la Recherche de Textes Scientifiques (ARTS) 3, qui se déroule le 5 juin 2023 pendant…12.05.2023
Webinaire « Découverte du TDM » jeudi 8 juin 10h30 à 12h30
« Vous avez entendu parler du TDM (Text et data Mining) mais vous vous interrogez sur les principes et le fonctionnement,…16.03.2023
Introducing Europe PMC Annotated Full-text Corpus for bioentities and associations
« Europe PubMed Central (Europe PMC) is an open access repository of life science research, including peer-reviewed journal…02.03.2023
Istex – Télécharger une liste de DOI
« Istex-DL, l’application de téléchargement de ressources issues de l’archive Istex, continue de s’améliorer pour être au plus…09.02.2023
Les ressources qui ont rejoint Istex depuis la fin du projet !
« Pour rappel Istex qui vient de fêter ses 10 ans, est passé d’état de projet à celui de service en…27.01.2023
Data Management Plans: Implications for Automated Analyses
« Data management plans (DMPs) are an essential part of planning data-driven research projects and ensuring long-term access and use of…20.01.2023
Extraction et Gestion des Connaissances, EGC’2023
« La sélection d’articles publiés dans le présent recueil constitue les actes de la 23e édition de la conférence francophone sur…09.12.2022
Istex à la croisée du climat et des risques naturels
« A l’instar des archives glaciaires, qui renferment la trace des climats du passé et contribuent au décryptage des changements climatiques…05.10.2022
Lancement du Groupe de Travail TextMine – 21 octobre 2022, Paris
« La journée de lancement du groupe de travail TextMine a pour objectif de partager les activités proposées par le groupe…03.10.2022
ISTEX-DL se dote d’une passerelle avec CorText
Si vous êtes familier avec Istex et ses outils associés, vous connaissez sans doute Istex-DL, l’application web…14.09.2022
Formation | La fouille de textes par l’exemple – 29 novembre 2022, Villeurbanne
« Du corpus à la représentation des résultats en passant par les outils: venez-vous former à la fouille de textes le…04.07.2022
NISO vision interview with CORE’s Petr Knoth on the role of text mining in scholarly communication
« This Vision Interview with Petr Knoth, Senior Research Fellow in Text and Data Mining at the Open University and Head…10.05.2022
Atelier pratique sur l’usage des ressources ISTEX – 2 juin 2022, Toulouse
« Pour faciliter la prise en main des services et des outils de constitution, de visualisation et d’exploration d’un corpus thématique,…31.03.2022
La version française de TM Tools Explorer
« Nous avions présenté en novembre 2021 la version bêta de TM Tools Explorer, une application en ligne vous permettant de…18.03.2022
Le site Istex fait peau neuve !
« S’inscrivant dans une démarche UX (User Experience), le site Istex évolue afin de mieux répondre à vos besoins d’information et…18.02.2022
Guillaume Cabanac, traqueur de fake science
« »Corrosif nucléique » pour « acide nucléique ». « Conscience contrefaite » à la place de « intelligence artificielle »… Ce sont les expressions « torturées » que Guillaume…20.12.2021
La fouille de textes et de données à des fins de recherche : une pratique confirmée et désormais opérationnelle en droit français
« La fouille de textes et de données à des fins de recherche : une pratique confirmée et désormais opérationnelle en…29.11.2021
Ordonnance n° 2021-1518 du 24 novembre 2021 complétant la transposition de la directive 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique et modifiant les directives 96/9/CE et 2001/29/CE
« La ministre de la culture a présenté une ordonnance complétant la transposition de la directive 2019/790 du Parlement européen et…23.11.2021
Des outils s’appuyant sur le Web sémantique pour explorer le corpus de la correspondance d’Henri Poincaré [vidéo]
« De nombreux travaux s’intéressent à la vie et à l’œuvre d’Henri Poincaré, en particulier par l’étude et la publication du…16.11.2021
De l’ontologie OntoTM à TM Tools Explorer
« Fruit d’une collaboration entre les services « Text et Data Mining » et « Ingénierie terminologique » de l’Inist,…03.11.2021
Librarian of Congress Adopts Research-Friendly Exemptions to Section 1201
« On October 27, 2021, the Librarian of Congress issued new exemptions to the prohibition on the circumvention…28.09.2021
Comment mobiliser des approches de fouille de textes et d’extraction de la terminologie dans un contexte pluridisciplinaire ?
« L’analyse des masses de données nécessite l’utilisation de méthodes mêlant harmonieusement différentes disciplines comme l’informatique, les mathématiques, les statistiques. L’ensemble…19.07.2021
ITEXT-BIO: Intelligent Term EXTraction for BIOmedical analysis
« Here, we introduce ITEXT-BIO, an intelligent process for biomedical domain terminology extraction from textual documents and subsequent analysis. The proposed…12.07.2021
Proceedings of the Workshop on Challenges in the Management of Large Corpora (CMLC-9) 2021. Limerick, 12 July 2021
« The ninth CMLC meeting continues the successful series of “Challenges in the management of large corpora” events, previously hosted at…09.07.2021
Action nationale de formation | Exploration documentaire et extraction d’information
« (…) Le CNRS et INRAE organisent la 2ème édition de l’Action nationale de formation sur l’exploration documentaire et…29.06.2021
Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles, Lille, France, 28 juin au 2 juillet 2021
« Les laboratoires organisateurs lillois (CRIStAL, Inria Nord-Lille Europe, STL, GERIICO) travaillant dans les domaines du traitement automatique des langues écrites…28.06.2021
Nouveau corpus d’actualités sur data.Istex : Réfugiés – Demandeurs d’asile
« Data.Istex propose des collections de corpus d’actualités permettant d’expliquer ou de préciser le présent à partir des documents…01.06.2021
Text mining to support abstract screening for knowledge syntheses: a semi-automated workflow
« Current text mining tools supporting abstract screening in systematic reviews are not widely used, in part because they lack sensitivity…25.05.2021
R.temis, un paquet d’analyse textuelle
« R.temis est un paquet R dédié à l’analyse textuelle d’utilisation simple. Son principe est de faciliter les…10.05.2021
Dix ans avec CAHIER: des corpus d’auteurs pour les humanités à leur exploitation numérique
« Ce document réunit les résumés des communications acceptées pour la conférence finale du consortium CAHIER. Les participants ont été invités…29.04.2021
3 new tools to try for Literature mapping — Connected Papers, Inciteful and Litmaps
« Tired of entering keywords and getting thousands of hits and not sure where to start your literature review? Or having…20.04.2021
Text categorization with WEKA: A survey
« (…) The goal of this paper is to illustrate the steps required to perform a text categorization analysis, using WEKA…15.04.2021
Advances in Information Retrieval – 43rd European Conference on IR Research, ECIR 2021 Virtual Event, March 28–April 1, 2021 [proceedings]
« ECIR 2021, the 43rd edition of the annual BCS-IRSG European Conference on Information Retrieval, initially planned…08.04.2021
A Prospective Comparison of Evidence Synthesis Search Strategies Developed With and Without Text-Mining Tools
« (…) In an era of explosive growth in biomedical evidence, improving systematic review (SR) search…26.01.2021
BIBLIOME : Acquisition et Formalisation de Connaissances à partir de Textes
« L’équipe Bibliome développe des méthodes d’extraction et de formalisation d’information à partir de textes écrits. Ces méthodes identifient et formalisent…08.01.2021
Formation : fouille de textes à travers l’exploitation des corpus ISTEX, 7 et 8 avril 2021
« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation.14.12.2020
Text mining approaches for dealing with the rapidly expanding literature on COVID-19
« More than 50 000 papers have been published about COVID-19 since the beginning of 2020 and several hundred new papers…14.12.2020
New TDM Data Visualization Interface Supports Research at all Levels
« (…) Text and data mining (TDM) is now accessible to all researchers – even those without coding experience – thanks…08.12.2020
Accelerating Text Mining Using Domain-Specific Stop Word Lists
« (…) In this paper, we present a novel mathematical approach for the automatic extraction of domain-specific words called the hyperplane-based…arxiv.org, Farah Alshanik, Amy Apon, Alexander Herzog, Ilya Safro, Justin Sybrandt, 18 novembre 2020
17.11.2020
Proceedings of the First Workshop on Scholarly Document Processing (SDP 2020) – November 19, Online
« SDP is a full day workshop that provides an interdisciplinary venue for researchers interested in any aspect of mining scientific…aclweb.org, Association for Computational Linguistics, novembre 2020
16.11.2020
PubSqueezer: A Text-Mining Web Tool to Transform Unstructured Documents into Structured Data
« (…) In this work, I present a web tool which uses a Text Mining strategy to transform large collections of…arxiv.org, Alberto Calderone Dr., 9 novembre 2020 arXiv:2011.03123v2
30.10.2020
ODDPub – a Text-Mining Algorithm to Detect Data Sharing in Biomedical Publications
« Open research data are increasingly recognized as a quality indicator and an important resource to increase transparency, robustness and collaboration…11.05.2020
Cited text span identification for scientific summarisation using pre-trained encoders
« We present our approach for the identification of cited text spans in scientific literature, using pre-trained encoders (BERT) in combination…01.04.2020
Plongez au cœur d’ISTEX grâce à ses enrichissements
« (…) l’équipe ISTEX vous invite à retrouver, dans la dernière version de sa documentation “Usage TDM d’ISTEX”, les éléments vous…09.03.2020
LIBER: Metrics & Machines [Webinar Video]
« This webinar, presented on 6 March 2020, was organised by LIBER’s Innovative Metrics Group. The webinar…13.02.2020
Hussein Al-Natsheh. « Text Mining Approaches for Semantic Similarity Exploration and Metadata Enrichment of Scientific Digital Libraries » [thèse]
« (…) L’objectif principal de nos travaux est d’élargir ou développer le spectre des connaissances des chercheurs travaillant dans un domaine…29.01.2020
Formation : fouille de textes à travers l’exploitation des corpus istex
« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation.08.01.2020
Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d’été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus)
« L’UMR Thalim en collaboration avec l’UMR LATTICE et la TGIR HUMANUM du 28 juin au 4 juillet 2020 dans le…08.01.2020
The SmartSHARK Ecosystem for Software Repository Mining
« Software repository mining is the foundation for many empirical software engineering studies. The collection and analysis of detailed data can…23.12.2019