05.06.2023
Mot-clé : TDM (Text and Data Mining)
12.05.2023
Webinaire « Découverte du TDM » jeudi 8 juin 10h30 à 12h30
« Vous avez entendu parler du TDM (Text et data Mining) mais vous vous interrogez sur les principes et le fonctionnement,…04.05.2023
Istex – Les corpus éditeurs sous toutes leurs facettes
« (…) Aujourd’hui, 41 corpus éditeurs sont mis à disposition pour des usages divers, qu’ils soient documentaires ou spécialisés en fouille…16.03.2023
Introducing Europe PMC Annotated Full-text Corpus for bioentities and associations
« Europe PubMed Central (Europe PMC) is an open access repository of life science research, including peer-reviewed journal…15.02.2023
Climatosceptiques : sur Twitter, enquête sur les mercenaires de l’intox
« Au sein du projet Climatoscope, David Chavalarias et ses collègues étudient la structure, les tactiques et les arguments des réseaux…10.02.2023
« ANF TDM 2022, Exploration documentaire et extraction d’information» : 4 Interviews disponibles [vidéo]
« Du 3 au 5 octobre 2022, a eu lieu la 3e édition d’une action nationale de formation de « text…09.02.2023
Les ressources qui ont rejoint Istex depuis la fin du projet !
« Pour rappel Istex qui vient de fêter ses 10 ans, est passé d’état de projet à celui de service en…20.01.2023
Extraction et Gestion des Connaissances, EGC’2023
« La sélection d’articles publiés dans le présent recueil constitue les actes de la 23e édition de la conférence francophone sur…10.01.2023
ANF TDM 2022 – Exploration documentaire et extraction d’information 3-5 oct. 2022 Paris (France) [Interviews]
« Production réalisée dans le cadre de l’action nationale de formation du CNRS 2022 intitulée « Exploration documentaire et extraction d’informations »…21.10.2022
#ISTEX10ans | #Istex de ses origines à aujourd’hui ! (vidéo)
« Avec à ce jour (18/10/22) plus de 27 millions de documents, le projet Istex est devenu en 10 ans le…05.10.2022
Lancement du Groupe de Travail TextMine – 21 octobre 2022, Paris
« La journée de lancement du groupe de travail TextMine a pour objectif de partager les activités proposées par le groupe…03.10.2022
ISTEX-DL se dote d’une passerelle avec CorText
Si vous êtes familier avec Istex et ses outils associés, vous connaissez sans doute Istex-DL, l’application web…14.09.2022
Formation | La fouille de textes par l’exemple – 29 novembre 2022, Villeurbanne
« Du corpus à la représentation des résultats en passant par les outils: venez-vous former à la fouille de textes le…24.08.2022
Rappel : Appel à projets 2022 pour l’accueil de chercheurs au BnF DataLab
« La BnF et son partenaire Huma-Num lancent leur deuxième appel à projet DataLab. A destination des chercheurs qui souhaitent…18.08.2022
KDD ’22: Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining
« The annual ACM SIGKDD conference is the premier international forum for data mining researchers and practitioners from academia, industry, and…17.08.2022
Launching Legal Literacies for Text Data Mining – Cross Border (LLTDM-X)
We are excited to announce that the National Endowment for the Humanities (NEH) has awarded nearly $50,000…04.08.2022
Dix ans de corpus d’auteurs
« De 2011 à 2021, le consortium CAHIER d’Huma-Num a réuni une soixantaine de projets en lettres et langues sur une…22.07.2022
ANF TDM 2022 – Exploration documentaire et extraction d’information 3-5 oct. 2022 Paris (France)
« (…) Cette formation s’adresse aux chercheurs et chercheuses, doctorant(e)s et ingénieur(e)s d’appui à la recherche qui souhaitent se former aux…04.07.2022
NISO vision interview with CORE’s Petr Knoth on the role of text mining in scholarly communication
« This Vision Interview with Petr Knoth, Senior Research Fellow in Text and Data Mining at the Open University and Head…30.06.2022
[UK Government] Artificial Intelligence and IP: copyright and patents
« The Government has published its response to its consultation on Intellectual Property and Artificial Intelligence Following this…27.06.2022
Décret n° 2022-928 du 23 juin 2022 portant modification du code de la propriété intellectuelle et complétant la transposition de la directive 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique et modifiant les directives 96/9/CE et 2001/29/CE
« (…) le décret précise les modalités d’application des exceptions au droit d’auteur, aux droits voisins et au droit sui generis…12.05.2022
Research Exceptions in Comparative Copyright
« This Article categorizes the world’s copyright laws according to the degree to which they provide exceptions to copyright exclusivity for…10.05.2022
Atelier pratique sur l’usage des ressources ISTEX – 2 juin 2022, Toulouse
« Pour faciliter la prise en main des services et des outils de constitution, de visualisation et d’exploration d’un corpus thématique,…05.05.2022
« Exploitation de l’innovation », Cahiers Droit, Sciences & Technologies, 14 | 2022
(…) La réutilisation des données de la recherche est, comme pour les autres données publiques, considérée au moins comme une…26.04.2022
Zampolli Prize Awarded to Voyant Tools
« (…) Initially released in 2003 and launched as Voyant Tools 2.0 in 2016, the project’s website provides hands-on access to…12.04.2022
Quentin Lutz. « Graph-based contributions to machine-learning. Data Structures and Algorithms » [thèse]
« Un graphe est un objet mathématique permettant de représenter des relations entre des entités (appelées nœuds) sous forme d’arêtes. Les…31.03.2022
La version française de TM Tools Explorer
« Nous avions présenté en novembre 2021 la version bêta de TM Tools Explorer, une application en ligne vous permettant de…28.03.2022
Les webservices à l’Inist
« L’Inist-CNRS propose une série de services web, accessibles de l’extérieur. Ces services tournent autour du TDM (Text and Data…18.03.2022
Le site Istex fait peau neuve !
« S’inscrivant dans une démarche UX (User Experience), le site Istex évolue afin de mieux répondre à vos besoins d’information et…18.02.2022
Guillaume Cabanac, traqueur de fake science
« »Corrosif nucléique » pour « acide nucléique ». « Conscience contrefaite » à la place de « intelligence artificielle »… Ce sont les expressions « torturées » que Guillaume…31.01.2022
VOSviewer version 1.6.18
« VOSviewer version 1.6.18 was released on January 24, 2022. The following features have been added: Creating maps based on OpenAlex…07.01.2022
Nature’s 10 : Guillaume Cabanac parmi les 10 personnalités qui ont marqué la science en 2021
« Publiée par la prestigieuse revue scientifique Nature depuis 2011, la liste Nature’s 10 met en avant chaque année 10 scientifiques…21.12.2021
Adhésion à la plateforme ISTEX
« La plateforme ISTEX met à disposition de l’ensemble de la communauté de l’Enseignement Supérieur et de la Recherche un accès…20.12.2021
La fouille de textes et de données à des fins de recherche : une pratique confirmée et désormais opérationnelle en droit français
« La fouille de textes et de données à des fins de recherche : une pratique confirmée et désormais opérationnelle en…29.11.2021
Ordonnance n° 2021-1518 du 24 novembre 2021 complétant la transposition de la directive 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique et modifiant les directives 96/9/CE et 2001/29/CE
« La ministre de la culture a présenté une ordonnance complétant la transposition de la directive 2019/790 du Parlement européen et…23.11.2021
Des outils s’appuyant sur le Web sémantique pour explorer le corpus de la correspondance d’Henri Poincaré [vidéo]
« De nombreux travaux s’intéressent à la vie et à l’œuvre d’Henri Poincaré, en particulier par l’étude et la publication du…16.11.2021
De l’ontologie OntoTM à TM Tools Explorer
« Fruit d’une collaboration entre les services « Text et Data Mining » et « Ingénierie terminologique » de l’Inist,…15.11.2021
CLARIN Café on Text and Data Mining Exceptions in the Directive on Copyright in the Digital Single Market
« The CLARIN Café on Text and Data Mining (TDM) Exceptions in the Directive on Copyright in the…03.11.2021
Librarian of Congress Adopts Research-Friendly Exemptions to Section 1201
« On October 27, 2021, the Librarian of Congress issued new exemptions to the prohibition on the circumvention…28.09.2021
Comment mobiliser des approches de fouille de textes et d’extraction de la terminologie dans un contexte pluridisciplinaire ?
« L’analyse des masses de données nécessite l’utilisation de méthodes mêlant harmonieusement différentes disciplines comme l’informatique, les mathématiques, les statistiques. L’ensemble…25.08.2021
Update: 1201 Exemption to Enable Text and Data Mining Research
« Authors Alliance, joined by the Library Copyright Alliance and the American Association of University Professors, is…20.07.2021
Building Legal Literacies for Text Data Mining
« Until now, humanities researchers conducting text data mining in the U.S. have had to maneuver through a thicket of legal…19.07.2021
ITEXT-BIO: Intelligent Term EXTraction for BIOmedical analysis
« Here, we introduce ITEXT-BIO, an intelligent process for biomedical domain terminology extraction from textual documents and subsequent analysis. The proposed…12.07.2021
Proceedings of the Workshop on Challenges in the Management of Large Corpora (CMLC-9) 2021. Limerick, 12 July 2021
« The ninth CMLC meeting continues the successful series of “Challenges in the management of large corpora” events, previously hosted at…09.07.2021
Action nationale de formation | Exploration documentaire et extraction d’information
« (…) Le CNRS et INRAE organisent la 2ème édition de l’Action nationale de formation sur l’exploration documentaire et…29.06.2021
Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles, Lille, France, 28 juin au 2 juillet 2021
« Les laboratoires organisateurs lillois (CRIStAL, Inria Nord-Lille Europe, STL, GERIICO) travaillant dans les domaines du traitement automatique des langues écrites…10.06.2021
BnF DataLab : appel à projets 2021
« Le BnF DataLab Depuis une vingtaine d’années, la BnF conduit une politique en matière de numérisation de masse, d’ouverture…01.06.2021
Text mining to support abstract screening for knowledge syntheses: a semi-automated workflow
« Current text mining tools supporting abstract screening in systematic reviews are not widely used, in part because they lack sensitivity…01.06.2021
Τhe Exception of Text and Data Mining from the Academic Libraries Standpoint
« (…) This paper analyses in detail the legal infrastructure of TDM exception as provided in Article 3 of the DSM…29.04.2021
3 new tools to try for Literature mapping — Connected Papers, Inciteful and Litmaps
« Tired of entering keywords and getting thousands of hits and not sure where to start your literature review? Or having…20.04.2021
The Missing Goal-Scorers in the Artificial Intelligence Team: Of Big Data, the Fundamental Right to Research and the failed Text and Data Mining limitations in the CSDM Directive
« This article argues that recent strategies of the European Union in the field of Artificial Intelligence (AI) resemble a football…20.04.2021
Text categorization with WEKA: A survey
« (…) The goal of this paper is to illustrate the steps required to perform a text categorization analysis, using WEKA…15.04.2021
Advances in Information Retrieval – 43rd European Conference on IR Research, ECIR 2021 Virtual Event, March 28–April 1, 2021 [proceedings]
« ECIR 2021, the 43rd edition of the annual BCS-IRSG European Conference on Information Retrieval, initially planned…08.04.2021
A Prospective Comparison of Evidence Synthesis Search Strategies Developed With and Without Text-Mining Tools
« (…) In an era of explosive growth in biomedical evidence, improving systematic review (SR) search…15.03.2021
Journée ISTEX 2021, 10 janvier 2021 [Vidéos et présentations]
« La plateforme ISTEX met à disposition des institutions de l’enseignement supérieur et de la recherche (ESR), plus…12.03.2021
CUAD: An Expert-Annotated NLP Dataset for Legal Contract Review
« Many specialized domains remain untouched by deep learning, as large labeled datasets require expensive expert annotators. We address this bottleneck…arxiv.org, Dan Hendrycks, Collin Burns, Anya Chen, Spencer Ball, 10 mars 2021, arXiv:2103.06268v1
12.03.2021
Opscidia’s ontology generator
« Opscidia, a French startup, was the winner in the OpenAIRE open call for innovation. The team…11.03.2021
Anne O’Tate: Value-added PubMed search engine for analysis and text mining
« Over a decade ago, we introduced Anne O’Tate, a free, public web-based tool http://arrowsmith.psych.uic.edu/cgi-bin/arrowsmith_uic/AnneOTate.cgi to support user-driven…26.01.2021
BIBLIOME : Acquisition et Formalisation de Connaissances à partir de Textes
« L’équipe Bibliome développe des méthodes d’extraction et de formalisation d’information à partir de textes écrits. Ces méthodes identifient et formalisent…15.01.2021
Data.Istex : une autre vision d’ISTEX
« Data.Istex est une vision d’ISTEX élaborée pour la fouille de texte et pour le web de données.08.01.2021
Formation : fouille de textes à travers l’exploitation des corpus ISTEX, 7 et 8 avril 2021
« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation.18.12.2020
Mission du CSPLA sur les exceptions de fouille de textes et de données (« text and data mining ») [rapport]
« La mission confiée en juin 2020 à Mme Alexandra Bensamoun, professeure des universités, et à M. Yohann Bouquerel, maître des…18.12.2020