12.05.2023
Mot-clé : Text mining
16.03.2023
Introducing Europe PMC Annotated Full-text Corpus for bioentities and associations
« Europe PubMed Central (Europe PMC) is an open access repository of life science research, including peer-reviewed journal…02.03.2023
Istex – Télécharger une liste de DOI
« Istex-DL, l’application de téléchargement de ressources issues de l’archive Istex, continue de s’améliorer pour être au plus…09.02.2023
Les ressources qui ont rejoint Istex depuis la fin du projet !
« Pour rappel Istex qui vient de fêter ses 10 ans, est passé d’état de projet à celui de service en…27.01.2023
Data Management Plans: Implications for Automated Analyses
« Data management plans (DMPs) are an essential part of planning data-driven research projects and ensuring long-term access and use of…20.01.2023
Extraction et Gestion des Connaissances, EGC’2023
« La sélection d’articles publiés dans le présent recueil constitue les actes de la 23e édition de la conférence francophone sur…09.12.2022
Istex à la croisée du climat et des risques naturels
« A l’instar des archives glaciaires, qui renferment la trace des climats du passé et contribuent au décryptage des changements climatiques…05.10.2022
Lancement du Groupe de Travail TextMine – 21 octobre 2022, Paris
« La journée de lancement du groupe de travail TextMine a pour objectif de partager les activités proposées par le groupe…03.10.2022
ISTEX-DL se dote d’une passerelle avec CorText
Si vous êtes familier avec Istex et ses outils associés, vous connaissez sans doute Istex-DL, l’application web…14.09.2022
Formation | La fouille de textes par l’exemple – 29 novembre 2022, Villeurbanne
« Du corpus à la représentation des résultats en passant par les outils: venez-vous former à la fouille de textes le…04.07.2022
NISO vision interview with CORE’s Petr Knoth on the role of text mining in scholarly communication
« This Vision Interview with Petr Knoth, Senior Research Fellow in Text and Data Mining at the Open University and Head…10.05.2022
Atelier pratique sur l’usage des ressources ISTEX – 2 juin 2022, Toulouse
« Pour faciliter la prise en main des services et des outils de constitution, de visualisation et d’exploration d’un corpus thématique,…31.03.2022
La version française de TM Tools Explorer
« Nous avions présenté en novembre 2021 la version bêta de TM Tools Explorer, une application en ligne vous permettant de…18.03.2022
Le site Istex fait peau neuve !
« S’inscrivant dans une démarche UX (User Experience), le site Istex évolue afin de mieux répondre à vos besoins d’information et…18.02.2022
Guillaume Cabanac, traqueur de fake science
« »Corrosif nucléique » pour « acide nucléique ». « Conscience contrefaite » à la place de « intelligence artificielle »… Ce sont les expressions « torturées » que Guillaume…20.12.2021
La fouille de textes et de données à des fins de recherche : une pratique confirmée et désormais opérationnelle en droit français
« La fouille de textes et de données à des fins de recherche : une pratique confirmée et désormais opérationnelle en…29.11.2021
Ordonnance n° 2021-1518 du 24 novembre 2021 complétant la transposition de la directive 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique et modifiant les directives 96/9/CE et 2001/29/CE
« La ministre de la culture a présenté une ordonnance complétant la transposition de la directive 2019/790 du Parlement européen et…23.11.2021
Des outils s’appuyant sur le Web sémantique pour explorer le corpus de la correspondance d’Henri Poincaré [vidéo]
« De nombreux travaux s’intéressent à la vie et à l’œuvre d’Henri Poincaré, en particulier par l’étude et la publication du…16.11.2021
De l’ontologie OntoTM à TM Tools Explorer
« Fruit d’une collaboration entre les services « Text et Data Mining » et « Ingénierie terminologique » de l’Inist,…03.11.2021
Librarian of Congress Adopts Research-Friendly Exemptions to Section 1201
« On October 27, 2021, the Librarian of Congress issued new exemptions to the prohibition on the circumvention…28.09.2021
Comment mobiliser des approches de fouille de textes et d’extraction de la terminologie dans un contexte pluridisciplinaire ?
« L’analyse des masses de données nécessite l’utilisation de méthodes mêlant harmonieusement différentes disciplines comme l’informatique, les mathématiques, les statistiques. L’ensemble…19.07.2021
ITEXT-BIO: Intelligent Term EXTraction for BIOmedical analysis
« Here, we introduce ITEXT-BIO, an intelligent process for biomedical domain terminology extraction from textual documents and subsequent analysis. The proposed…12.07.2021
Proceedings of the Workshop on Challenges in the Management of Large Corpora (CMLC-9) 2021. Limerick, 12 July 2021
« The ninth CMLC meeting continues the successful series of “Challenges in the management of large corpora” events, previously hosted at…09.07.2021
Action nationale de formation | Exploration documentaire et extraction d’information
« (…) Le CNRS et INRAE organisent la 2ème édition de l’Action nationale de formation sur l’exploration documentaire et…29.06.2021
Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles, Lille, France, 28 juin au 2 juillet 2021
« Les laboratoires organisateurs lillois (CRIStAL, Inria Nord-Lille Europe, STL, GERIICO) travaillant dans les domaines du traitement automatique des langues écrites…28.06.2021
Nouveau corpus d’actualités sur data.Istex : Réfugiés – Demandeurs d’asile
« Data.Istex propose des collections de corpus d’actualités permettant d’expliquer ou de préciser le présent à partir des documents…01.06.2021
Text mining to support abstract screening for knowledge syntheses: a semi-automated workflow
« Current text mining tools supporting abstract screening in systematic reviews are not widely used, in part because they lack sensitivity…25.05.2021
R.temis, un paquet d’analyse textuelle
« R.temis est un paquet R dédié à l’analyse textuelle d’utilisation simple. Son principe est de faciliter les…10.05.2021
Dix ans avec CAHIER: des corpus d’auteurs pour les humanités à leur exploitation numérique
« Ce document réunit les résumés des communications acceptées pour la conférence finale du consortium CAHIER. Les participants ont été invités…29.04.2021
3 new tools to try for Literature mapping — Connected Papers, Inciteful and Litmaps
« Tired of entering keywords and getting thousands of hits and not sure where to start your literature review? Or having…20.04.2021
Text categorization with WEKA: A survey
« (…) The goal of this paper is to illustrate the steps required to perform a text categorization analysis, using WEKA…15.04.2021
Advances in Information Retrieval – 43rd European Conference on IR Research, ECIR 2021 Virtual Event, March 28–April 1, 2021 [proceedings]
« ECIR 2021, the 43rd edition of the annual BCS-IRSG European Conference on Information Retrieval, initially planned…08.04.2021
A Prospective Comparison of Evidence Synthesis Search Strategies Developed With and Without Text-Mining Tools
« (…) In an era of explosive growth in biomedical evidence, improving systematic review (SR) search…26.01.2021
BIBLIOME : Acquisition et Formalisation de Connaissances à partir de Textes
« L’équipe Bibliome développe des méthodes d’extraction et de formalisation d’information à partir de textes écrits. Ces méthodes identifient et formalisent…08.01.2021
Formation : fouille de textes à travers l’exploitation des corpus ISTEX, 7 et 8 avril 2021
« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation.14.12.2020
Text mining approaches for dealing with the rapidly expanding literature on COVID-19
« More than 50 000 papers have been published about COVID-19 since the beginning of 2020 and several hundred new papers…14.12.2020
New TDM Data Visualization Interface Supports Research at all Levels
« (…) Text and data mining (TDM) is now accessible to all researchers – even those without coding experience – thanks…08.12.2020
Accelerating Text Mining Using Domain-Specific Stop Word Lists
« (…) In this paper, we present a novel mathematical approach for the automatic extraction of domain-specific words called the hyperplane-based…arxiv.org, Farah Alshanik, Amy Apon, Alexander Herzog, Ilya Safro, Justin Sybrandt, 18 novembre 2020
17.11.2020
Proceedings of the First Workshop on Scholarly Document Processing (SDP 2020) – November 19, Online
« SDP is a full day workshop that provides an interdisciplinary venue for researchers interested in any aspect of mining scientific…aclweb.org, Association for Computational Linguistics, novembre 2020
16.11.2020
PubSqueezer: A Text-Mining Web Tool to Transform Unstructured Documents into Structured Data
« (…) In this work, I present a web tool which uses a Text Mining strategy to transform large collections of…arxiv.org, Alberto Calderone Dr., 9 novembre 2020 arXiv:2011.03123v2
30.10.2020
ODDPub – a Text-Mining Algorithm to Detect Data Sharing in Biomedical Publications
« Open research data are increasingly recognized as a quality indicator and an important resource to increase transparency, robustness and collaboration…11.05.2020
Cited text span identification for scientific summarisation using pre-trained encoders
« We present our approach for the identification of cited text spans in scientific literature, using pre-trained encoders (BERT) in combination…01.04.2020
Plongez au cœur d’ISTEX grâce à ses enrichissements
« (…) l’équipe ISTEX vous invite à retrouver, dans la dernière version de sa documentation “Usage TDM d’ISTEX”, les éléments vous…09.03.2020
LIBER: Metrics & Machines [Webinar Video]
« This webinar, presented on 6 March 2020, was organised by LIBER’s Innovative Metrics Group. The webinar…13.02.2020
Hussein Al-Natsheh. « Text Mining Approaches for Semantic Similarity Exploration and Metadata Enrichment of Scientific Digital Libraries » [thèse]
« (…) L’objectif principal de nos travaux est d’élargir ou développer le spectre des connaissances des chercheurs travaillant dans un domaine…29.01.2020
Formation : fouille de textes à travers l’exploitation des corpus istex
« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation.08.01.2020
Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d’été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus)
« L’UMR Thalim en collaboration avec l’UMR LATTICE et la TGIR HUMANUM du 28 juin au 4 juillet 2020 dans le…08.01.2020
The SmartSHARK Ecosystem for Software Repository Mining
« Software repository mining is the foundation for many empirical software engineering studies. The collection and analysis of detailed data can…23.12.2019
Automatic Slide Generation for Scientific Papers
« We describe our approach for automatically generating presentation slides for scientific papers using deep neural networks. Such slides can help…20.11.2019
Rapports publics du projet Visa TM
(…) Les principaux résultats de Visa TM portent sur : l’étude de la création d’une e-infrastructure de fouille de textes…25.09.2019
#VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining
« Dans le cadre du projet Visa TM du Comité pour la Science Ouverte, un « Visa TM Day » sera organisé…02.09.2019
Using Transkribus for automated text recognition of historical Bengali Books
« Are you working with digitised printed collections that you want to ‘unlock’ for keyword search and text mining? Maybe you…13.08.2019
Application of Natural Language Processing Algorithms to the Task of Automatic Classification of Russian Scientific Texts
« This work is devoted to the study of applicability of modern methods of machine learning to the task of automatic…13.08.2019
VIANA: Visual Interactive Annotation of Argumentation
« (…) In this paper, we present a visual analytics system that augments the manual annotation process by automatically suggesting which…12.08.2019
Informatique et tamis | #BrèveDeScience [vidéo]
« Je suis chercheure d’or… mais en fait je cherche de l’or dans les textes »…07.08.2019
NaCTeM announced as the winners of NLP challenge on scholarly discourse and summarisation
« A team of researchers from NaCTeM group were recently announced as the winners of an NLP challenge. Dr. Chrysoula Zerva,…26.07.2019
Mining Text, Linking Entities – National Library Board of Singapore’s Journey
« Connecting collections across institutions and discovering hidden knowledge has always been our goal. Due to disparate data sources, differing levels…11.07.2019
Cette IA aide à compléter d’anciennes recherches scientifiques
« Des chercheurs du laboratoire national américain Lawrence-Berkeley ont utilisé le machine learning pour révéler de nouvelles connaissances scientifiques cachées dans…08.07.2019
Gerrish, Charlotte. « European Copyright Law and the Text and Data Mining Exceptions and Limitations » [thesis]
« We are in a digital age with Big Data at the heart of our global online environment. Exploiting Big Data…03.06.2019
Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse]
« (…) Cette thèse étudie différentes stratégies en recherche d’information et en fouille de données textuelles (amélioration du triage de documents…28.05.2019
Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities
« Istex is a database of twenty million full text scientific papers bought by the French Government for the use of…21.05.2019
Identifying Clinical Terms in Medical Text Using Ontology-Guided Machine Learning
« (…) We present a neural dictionary model that can be used to predict if a phrase is synonymous to a…14.05.2019