Mot-clé :

14.06.2024

ANF TDM 2024 | Exploration documentaire et extraction d’informations | 3-4 octobre 2024, Villejuif

« La production scientifique s’accélère chaque année. D’après une étude parue sur arXiv, le nombre d’articles publiés dans le monde…

anf-tdm

06.06.2024

La fouille de textes en IST : les outils Istex-TDM

« (…) Dans cet article nous illustrons l’utilisation de l’IA dans le domaine de l’IST (Information Scientifique et Technique) à travers…

hal.science

26.04.2024

Istex Search : votre interface de création de corpus

« Istex Search, le dernier-né des services Istex, incarne la fusion du démonstrateur Istex et d’Istex-DL dans une interface unique, facilitant…

09.04.2024

Text mining arXiv: a look through quantitative finance papers

« This paper explores articles hosted on the arXiv preprint server with the aim to uncover valuable insights hidden in this…

arxiv.org

osc.universityofcalifornia.edu

21.03.2024

University of California: Fair use rights to conduct text and data mining and use artificial intelligence tools are essential for UC research and teaching

« The UC Libraries strive to preserve fair use rights when licensing electronic resources—including the fair use rights to conduct computational…

07.03.2024

TextMine’24

« La fouille de textes couvre de multiples domaines comme le traitement automatique des langues, l’intelligence artificielle, la linguistique, les statistiques,…

hal.science

01.03.2024

Europe PMC POSI update – 2 years on

« Two years have sailed by since Europe PMC adopted the Principles of Open Scholarly Infrastructure (POSI) in February 2021. POSI…

blog.europepmc.org

01.12.2023

JSO CNRS 2023 | Science ouverte : logiciels libres et fouille de textes – 22 novembre 2023 (présentations)

« La Direction des données ouvertes de la recherche (DDOR) du CNRS a organisé la 5ème édition de…

jso-cnrs

canal-u.tv/chaines/inist-cnrs

30.06.2023

Webinaire « Découverte du TDM »

« Ce webinaire présente le TDM et ses enjeux. Vous découvrirez les objectifs et méthodes, les aspects éthiques et juridiques, et…

27.06.2023

Istex pour le TAL et le TDM

« La conférence CORIA-TALN se tenait du 5 au 9 juin à Paris. Istex était à l’honneur dans diverses présentations montrant…

inist.fr/nos-actualites

youtube, GTSO Données de Couperin

26.06.2023

Text and data mining : explorons les cités enfouies ! (vidéo)

« Ce webinaire s’est tenu le 21/06/23.. La fouille de texte et de données à des fins de…

arts2023.sciencesconf.org

05.06.2023

Actes de l’Atelier sur l’Analyse et la Recherche de Textes Scientifiques, CORIA-TALN 2023 – 5 juin 2023 Paris (France) (.pdf)

« (…) L’atelier sur l’Analyse et la Recherche de Textes Scientifiques (ARTS) 3, qui se déroule le 5 juin 2023 pendant…

12.05.2023

Webinaire « Découverte du TDM » jeudi 8 juin 10h30 à 12h30

« Vous avez entendu parler du TDM (Text et data Mining) mais vous vous interrogez sur les principes et le fonctionnement,…

objectif-tdm.inist.fr

16.03.2023

Introducing Europe PMC Annotated Full-text Corpus for bioentities and associations

« Europe PubMed Central (Europe PMC) is an open access repository of life science research, including peer-reviewed journal…

blog.europepmc.org

02.03.2023

Istex – Télécharger une liste de DOI

« Istex-DL, l’application de téléchargement de ressources issues de l’archive Istex, continue de s’améliorer pour être au plus…

09.02.2023

Les ressources qui ont rejoint Istex depuis la fin du projet !

« Pour rappel Istex qui vient de fêter ses 10 ans, est passé d’état de projet à celui de service en…

27.01.2023

Data Management Plans: Implications for Automated Analyses

« Data management plans (DMPs) are an essential part of planning data-driven research projects and ensuring long-term access and use of…

datascience.codata.org

20.01.2023

Extraction et Gestion des Connaissances, EGC’2023

« La sélection d’articles publiés dans le présent recueil constitue les actes de la 23e édition de la conférence francophone sur…

editions-rnti.fr

09.12.2022

Istex à la croisée du climat et des risques naturels

« A l’instar des archives glaciaires, qui renferment la trace des climats du passé et contribuent au décryptage des changements climatiques…

textmine.sciencesconf.org

05.10.2022

Lancement du Groupe de Travail TextMine – 21 octobre 2022, Paris

« La journée de lancement du groupe de travail TextMine a pour objectif de partager les activités proposées par le groupe…

03.10.2022

ISTEX-DL se dote d’une passerelle avec CorText

Si vous êtes familier avec Istex et ses outils associés, vous connaissez sans doute Istex-DL, l’application web…

14.09.2022

Formation | La fouille de textes par l’exemple – 29 novembre 2022, Villeurbanne

« Du corpus à la représentation des résultats en passant par les outils: venez-vous former à la fouille de textes le…

04.07.2022

NISO vision interview with CORE’s Petr Knoth on the role of text mining in scholarly communication

« This Vision Interview with Petr Knoth, Senior Research Fellow in Text and Data Mining at the Open University and Head…

blog.core.ac.uk

10.05.2022

Atelier pratique sur l’usage des ressources ISTEX – 2 juin 2022, Toulouse

« Pour faciliter la prise en main des services et des outils de constitution, de visualisation et d’exploration d’un corpus thématique,…

31.03.2022

La version française de TM Tools Explorer

« Nous avions présenté en novembre 2021 la version bêta de TM Tools Explorer, une application en ligne vous permettant de…

objectif-tdm.inist.fr

18.03.2022

Le site Istex fait peau neuve !

« S’inscrivant dans une démarche UX (User Experience), le site Istex évolue afin de mieux répondre à vos besoins d’information et…

18.02.2022

Guillaume Cabanac, traqueur de fake science

« »Corrosif nucléique » pour « acide nucléique ». « Conscience contrefaite » à la place de « intelligence artificielle »… Ce sont les expressions « torturées » que Guillaume…

lejournal.cnrs.fr

20.12.2021

La fouille de textes et de données à des fins de recherche : une pratique confirmée et désormais opérationnelle en droit français

« La fouille de textes et de données à des fins de recherche : une pratique confirmée et désormais opérationnelle en…

ouvrirlascience.fr

29.11.2021

Ordonnance n° 2021-1518 du 24 novembre 2021 complétant la transposition de la directive 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique et modifiant les directives 96/9/CE et 2001/29/CE

« La ministre de la culture a présenté une ordonnance complétant la transposition de la directive 2019/790 du Parlement européen et…

legifrance.gouv.fr

23.11.2021

Des outils s’appuyant sur le Web sémantique pour explorer le corpus de la correspondance d’Henri Poincaré [vidéo]

« De nombreux travaux s’intéressent à la vie et à l’œuvre d’Henri Poincaré, en particulier par l’étude et la publication du…

videos.ahp-numerique.fr

16.11.2021

De l’ontologie OntoTM à TM Tools Explorer

« Fruit d’une collaboration entre les services « Text et Data Mining » et « Ingénierie terminologique » de l’Inist,…

inist.fr/realisations

03.11.2021

Librarian of Congress Adopts Research-Friendly Exemptions to Section 1201

« On October 27, 2021, the Librarian of Congress issued new exemptions to the prohibition on the circumvention…

infojustice.org

28.09.2021

Comment mobiliser des approches de fouille de textes et d’extraction de la terminologie dans un contexte pluridisciplinaire ?

« L’analyse des masses de données nécessite l’utilisation de méthodes mêlant harmonieusement différentes disciplines comme l’informatique, les mathématiques, les statistiques. L’ensemble…

nss-journal.org

19.07.2021

ITEXT-BIO: Intelligent Term EXTraction for BIOmedical analysis

« Here, we introduce ITEXT-BIO, an intelligent process for biomedical domain terminology extraction from textual documents and subsequent analysis. The proposed…

link.springer.com

12.07.2021

Proceedings of the Workshop on Challenges in the Management of Large Corpora (CMLC-9) 2021. Limerick, 12 July 2021

« The ninth CMLC meeting continues the successful series of “Challenges in the management of large corpora” events, previously hosted at…

ids-pub.bsz-bw.de/

09.07.2021

Action nationale de formation | Exploration documentaire et extraction d’information

« (…) Le CNRS et INRAE organisent la 2ème édition de l’Action nationale de formation sur l’exploration documentaire et…

science-ouverte.cnrs.fr

29.06.2021

Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles, Lille, France, 28 juin au 2 juillet 2021

« Les laboratoires organisateurs lillois (CRIStAL, Inria Nord-Lille Europe, STL, GERIICO) travaillant dans les domaines du traitement automatique des langues écrites…

hal.archives-ouvertes.fr

28.06.2021

Nouveau corpus d’actualités sur data.Istex : Réfugiés – Demandeurs d’asile

« Data.Istex propose des collections de corpus d’actualités permettant d’expliquer ou de préciser le présent à partir des documents…

systematicreviewsjournal.biomedcentral.com

01.06.2021

Text mining to support abstract screening for knowledge syntheses: a semi-automated workflow

« Current text mining tools supporting abstract screening in systematic reviews are not widely used, in part because they lack sensitivity…

25.05.2021

R.temis, un paquet d’analyse textuelle

« R.temis est un paquet R dédié à l’analyse textuelle d’utilisation simple. Son principe est de faciliter les…

mate-shs.cnrs.fr

10.05.2021

Dix ans avec CAHIER: des corpus d’auteurs pour les humanités à leur exploitation numérique

« Ce document réunit les résumés des communications acceptées pour la conférence finale du consortium CAHIER. Les participants ont été invités…

hal.archives-ouvertes.fr

29.04.2021

3 new tools to try for Literature mapping — Connected Papers, Inciteful and Litmaps

« Tired of entering keywords and getting thousands of hits and not sure where to start your literature review? Or having…

aarontay.medium.com

20.04.2021

Text categorization with WEKA: A survey

« (…) The goal of this paper is to illustrate the steps required to perform a text categorization analysis, using WEKA…

sciencedirect.com

15.04.2021

Advances in Information Retrieval – 43rd European Conference on IR Research, ECIR 2021 Virtual Event, March 28–April 1, 2021 [proceedings]

« ECIR 2021, the 43rd edition of the annual BCS-IRSG European Conference on Information Retrieval, initially planned…

ecir2021.eu

08.04.2021

A Prospective Comparison of Evidence Synthesis Search Strategies Developed With and Without Text-Mining Tools

« (…) In an era of explosive growth in biomedical evidence, improving systematic review (SR) search…

ncbi.nlm.nih.gov

hal.archives-ouvertes.fr, Robert Bossy, Arnaud Ferré, Équipe Bibliome, Claire Nédellec, Louise Deleger. BIBLIOME : Acquisition et Formalisation de Connaissances à partir de Textes. Bulletin de l'AFIA, AFIA, 2020, Dossier « Technologies du Langage Humain », pp.7-9. ⟨hal-03025321⟩

26.01.2021

BIBLIOME : Acquisition et Formalisation de Connaissances à partir de Textes

« L’équipe Bibliome développe des méthodes d’extraction et de formalisation d’information à partir de textes écrits. Ces méthodes identifient et formalisent…

inist.fr/nos-actualites, 7 janvier 2021

08.01.2021

Formation : fouille de textes à travers l’exploitation des corpus ISTEX, 7 et 8 avril 2021

« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation.

academic.oup.com, Lucy Lu Wang, Kyle Lo, Text mining approaches for dealing with the rapidly expanding literature on COVID-19, Briefings in Bioinformatics, , bbaa296, https://doi.org/10.1093/bib/bbaa296

14.12.2020

Text mining approaches for dealing with the rapidly expanding literature on COVID-19

« More than 50 000 papers have been published about COVID-19 since the beginning of 2020 and several hundred new papers…

about.proquest.com, 11 decembre 2020

14.12.2020

New TDM Data Visualization Interface Supports Research at all Levels

« (…) Text and data mining (TDM) is now accessible to all researchers – even those without coding experience – thanks…

arxiv.org, Farah Alshanik, Amy Apon, Alexander Herzog, Ilya Safro, Justin Sybrandt, 18 novembre 2020

08.12.2020

Accelerating Text Mining Using Domain-Specific Stop Word Lists

« (…) In this paper, we present a novel mathematical approach for the automatic extraction of domain-specific words called the hyperplane-based…

aclweb.org, Association for Computational Linguistics, novembre 2020

17.11.2020

Proceedings of the First Workshop on Scholarly Document Processing (SDP 2020) – November 19, Online

« SDP is a full day workshop that provides an interdisciplinary venue for researchers interested in any aspect of mining scientific…

arxiv.org, Alberto Calderone Dr., 9 novembre 2020 arXiv:2011.03123v2

16.11.2020

PubSqueezer: A Text-Mining Web Tool to Transform Unstructured Documents into Structured Data

« (…) In this work, I present a web tool which uses a Text Mining strategy to transform large collections of…

datascience.codata.org, Riedel, N., Kip, M. and Bobrov, E., 2020. ODDPub – a Text-Mining Algorithm to Detect Data Sharing in Biomedical Publications. Data Science Journal, 19(1), p.42. DOI: http://doi.org/10.5334/dsj-2020-042

30.10.2020

ODDPub – a Text-Mining Algorithm to Detect Data Sharing in Biomedical Publications

« Open research data are increasingly recognized as a quality indicator and an important resource to increase transparency, robustness and collaboration…

link.springer.com, Zerva, C., Nghiem, M., Nguyen, N.T.H. et al. Cited text span identification for scientific summarisation using pre-trained encoders. Scientometrics (2020). https://doi.org/10.1007/s11192-020-03455-z

11.05.2020

Cited text span identification for scientific summarisation using pre-trained encoders

« We present our approach for the identification of cited text spans in scientific literature, using pre-trained encoders (BERT) in combination…

blog.istex.fr, Camille De Salabert, 30 mars 2020

01.04.2020

Plongez au cœur d’ISTEX grâce à ses enrichissements

« (…) l’équipe ISTEX vous invite à retrouver, dans la dernière version de sa documentation “Usage TDM d’ISTEX”, les éléments vous…

libereurope.eu, 6 mars 2020

09.03.2020

LIBER: Metrics & Machines [Webinar Video]

« This webinar, presented on 6 March 2020, was organised by LIBER’s Innovative Metrics Group. The webinar…

tel.archives-ouvertes.fr, Artificial Intelligence [cs.AI]. Université de Lyon, 2019. English. ⟨NNT : 2019LYSE2062⟩. ⟨tel-02476157⟩

13.02.2020

Hussein Al-Natsheh. « Text Mining Approaches for Semantic Similarity Exploration and Metadata Enrichment of Scientific Digital Libraries » [thèse]

« (…) L’objectif principal de nos travaux est d’élargir ou développer le spectre des connaissances des chercheurs travaillant dans un domaine…

inist.fr, 22 janvier 2020

29.01.2020

Formation : fouille de textes à travers l’exploitation des corpus istex

« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation.

humanum.hypotheses.org, pbusonera, 7 janvier 2020

08.01.2020

Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d’été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus)

« L’UMR Thalim en collaboration avec l’UMR LATTICE et la TGIR HUMANUM du 28 juin au 4 juillet 2020 dans le…

arxiv.org, Alexander Trautsch, Fabian Trautsch, Steffen Herbold, Benjamin Ledel, Jens Grabowski, 6 Jan 2020, arXiv:2001.01606v1

08.01.2020

The SmartSHARK Ecosystem for Software Repository Mining

« Software repository mining is the foundation for many empirical software engineering studies. The collection and analysis of detailed data can…

ceur-ws.org, Athar Sefid, Prasenjit Mitra, Jian Wu, C. Lee Giles, Proceedings of the Third International Workshop on Capturing Scientific Knowledge, CEUR Workshop Proceedings, vol 2526, urn:nbn:de:0074-2526-7

23.12.2019

Automatic Slide Generation for Scientific Papers

« We describe our approach for automatically generating presentation slides for scientific papers using deep neural networks. Such slides can help…