22.11.2023
Mot-clé : TDM (Text and Data Mining)
17.11.2023
ISTEX : deux nouveaux corpus dans la collection mémoire
« Les corpus spécialisés ISTEX, constitués par les équipes de l’Inist, sont proposés en vue d’une exploitation en traitement automatique des…17.11.2023
Les « non-consumptive research uses » des ressources numériques
« La non-consumptive research est la recherche où le seul usage que le chercheur fait d’une ressource numérique est d’y appliquer…11.08.2023
#Nuitsdesétoiles : un corpus thématique sur data Istex
« A l’occasion des nuits des étoiles, l’équipe Istex de l’Inist a constitué et mis…18.07.2023
« OpenEdition journals » dans Istex pour le TDM
« (…) La plateforme OpenEdition héberge actuellement 615 revues, dont 75% sont en accès ouvert immédiat et 25% avec une période…07.07.2023
ANF TDM 2023 | Exploration documentaire et extraction d’informations – 12-13 oct. 2023 Villejuif (France)
« (…) Cette formation nationale invite les communautés scientifiques à exploiter les techniques numériques de la recherche d’information et à développer…30.06.2023
Webinaire « Découverte du TDM »
« Ce webinaire présente le TDM et ses enjeux. Vous découvrirez les objectifs et méthodes, les aspects éthiques et juridiques, et…27.06.2023
Istex pour le TAL et le TDM
« La conférence CORIA-TALN se tenait du 5 au 9 juin à Paris. Istex était à l’honneur dans diverses présentations montrant…26.06.2023
Text and data mining : explorons les cités enfouies ! (vidéo)
« Ce webinaire s’est tenu le 21/06/23.. La fouille de texte et de données à des fins de…26.06.2023
Le cadre juridique européen du Text and Data Mining
« Le TDM est une pratique encadrée juridiquement en tant qu’exception de la propriété intellectuelle, puisque majoritairement exercée sur du contenu…05.06.2023
Actes de l’Atelier sur l’Analyse et la Recherche de Textes Scientifiques, CORIA-TALN 2023 – 5 juin 2023 Paris (France) (.pdf)
« (…) L’atelier sur l’Analyse et la Recherche de Textes Scientifiques (ARTS) 3, qui se déroule le 5 juin 2023 pendant…12.05.2023
Webinaire « Découverte du TDM » jeudi 8 juin 10h30 à 12h30
« Vous avez entendu parler du TDM (Text et data Mining) mais vous vous interrogez sur les principes et le fonctionnement,…04.05.2023
Istex – Les corpus éditeurs sous toutes leurs facettes
« (…) Aujourd’hui, 41 corpus éditeurs sont mis à disposition pour des usages divers, qu’ils soient documentaires ou spécialisés en fouille…16.03.2023
Introducing Europe PMC Annotated Full-text Corpus for bioentities and associations
« Europe PubMed Central (Europe PMC) is an open access repository of life science research, including peer-reviewed journal…15.02.2023
Climatosceptiques : sur Twitter, enquête sur les mercenaires de l’intox
« Au sein du projet Climatoscope, David Chavalarias et ses collègues étudient la structure, les tactiques et les arguments des réseaux…10.02.2023
« ANF TDM 2022, Exploration documentaire et extraction d’information» : 4 Interviews disponibles [vidéo]
« Du 3 au 5 octobre 2022, a eu lieu la 3e édition d’une action nationale de formation de « text…09.02.2023
Les ressources qui ont rejoint Istex depuis la fin du projet !
« Pour rappel Istex qui vient de fêter ses 10 ans, est passé d’état de projet à celui de service en…20.01.2023
Extraction et Gestion des Connaissances, EGC’2023
« La sélection d’articles publiés dans le présent recueil constitue les actes de la 23e édition de la conférence francophone sur…10.01.2023
ANF TDM 2022 – Exploration documentaire et extraction d’information 3-5 oct. 2022 Paris (France) [Interviews]
« Production réalisée dans le cadre de l’action nationale de formation du CNRS 2022 intitulée « Exploration documentaire et extraction d’informations »…21.10.2022
#ISTEX10ans | #Istex de ses origines à aujourd’hui ! (vidéo)
« Avec à ce jour (18/10/22) plus de 27 millions de documents, le projet Istex est devenu en 10 ans le…05.10.2022
Lancement du Groupe de Travail TextMine – 21 octobre 2022, Paris
« La journée de lancement du groupe de travail TextMine a pour objectif de partager les activités proposées par le groupe…03.10.2022
ISTEX-DL se dote d’une passerelle avec CorText
Si vous êtes familier avec Istex et ses outils associés, vous connaissez sans doute Istex-DL, l’application web…14.09.2022
Formation | La fouille de textes par l’exemple – 29 novembre 2022, Villeurbanne
« Du corpus à la représentation des résultats en passant par les outils: venez-vous former à la fouille de textes le…24.08.2022
Rappel : Appel à projets 2022 pour l’accueil de chercheurs au BnF DataLab
« La BnF et son partenaire Huma-Num lancent leur deuxième appel à projet DataLab. A destination des chercheurs qui souhaitent…18.08.2022
KDD ’22: Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining
« The annual ACM SIGKDD conference is the premier international forum for data mining researchers and practitioners from academia, industry, and…17.08.2022
Launching Legal Literacies for Text Data Mining – Cross Border (LLTDM-X)
We are excited to announce that the National Endowment for the Humanities (NEH) has awarded nearly $50,000…04.08.2022
Dix ans de corpus d’auteurs
« De 2011 à 2021, le consortium CAHIER d’Huma-Num a réuni une soixantaine de projets en lettres et langues sur une…22.07.2022
ANF TDM 2022 – Exploration documentaire et extraction d’information 3-5 oct. 2022 Paris (France)
« (…) Cette formation s’adresse aux chercheurs et chercheuses, doctorant(e)s et ingénieur(e)s d’appui à la recherche qui souhaitent se former aux…04.07.2022
NISO vision interview with CORE’s Petr Knoth on the role of text mining in scholarly communication
« This Vision Interview with Petr Knoth, Senior Research Fellow in Text and Data Mining at the Open University and Head…30.06.2022
[UK Government] Artificial Intelligence and IP: copyright and patents
« The Government has published its response to its consultation on Intellectual Property and Artificial Intelligence Following this…27.06.2022
Décret n° 2022-928 du 23 juin 2022 portant modification du code de la propriété intellectuelle et complétant la transposition de la directive 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique et modifiant les directives 96/9/CE et 2001/29/CE
« (…) le décret précise les modalités d’application des exceptions au droit d’auteur, aux droits voisins et au droit sui generis…12.05.2022
Research Exceptions in Comparative Copyright
« This Article categorizes the world’s copyright laws according to the degree to which they provide exceptions to copyright exclusivity for…10.05.2022
Atelier pratique sur l’usage des ressources ISTEX – 2 juin 2022, Toulouse
« Pour faciliter la prise en main des services et des outils de constitution, de visualisation et d’exploration d’un corpus thématique,…05.05.2022
« Exploitation de l’innovation », Cahiers Droit, Sciences & Technologies, 14 | 2022
(…) La réutilisation des données de la recherche est, comme pour les autres données publiques, considérée au moins comme une…26.04.2022
Zampolli Prize Awarded to Voyant Tools
« (…) Initially released in 2003 and launched as Voyant Tools 2.0 in 2016, the project’s website provides hands-on access to…12.04.2022
Quentin Lutz. « Graph-based contributions to machine-learning. Data Structures and Algorithms » [thèse]
« Un graphe est un objet mathématique permettant de représenter des relations entre des entités (appelées nœuds) sous forme d’arêtes. Les…31.03.2022
La version française de TM Tools Explorer
« Nous avions présenté en novembre 2021 la version bêta de TM Tools Explorer, une application en ligne vous permettant de…28.03.2022
Les webservices à l’Inist
« L’Inist-CNRS propose une série de services web, accessibles de l’extérieur. Ces services tournent autour du TDM (Text and Data…18.03.2022
Le site Istex fait peau neuve !
« S’inscrivant dans une démarche UX (User Experience), le site Istex évolue afin de mieux répondre à vos besoins d’information et…18.02.2022
Guillaume Cabanac, traqueur de fake science
« »Corrosif nucléique » pour « acide nucléique ». « Conscience contrefaite » à la place de « intelligence artificielle »… Ce sont les expressions « torturées » que Guillaume…31.01.2022
VOSviewer version 1.6.18
« VOSviewer version 1.6.18 was released on January 24, 2022. The following features have been added: Creating maps based on OpenAlex…07.01.2022
Nature’s 10 : Guillaume Cabanac parmi les 10 personnalités qui ont marqué la science en 2021
« Publiée par la prestigieuse revue scientifique Nature depuis 2011, la liste Nature’s 10 met en avant chaque année 10 scientifiques…21.12.2021
Adhésion à la plateforme ISTEX
« La plateforme ISTEX met à disposition de l’ensemble de la communauté de l’Enseignement Supérieur et de la Recherche un accès…20.12.2021
La fouille de textes et de données à des fins de recherche : une pratique confirmée et désormais opérationnelle en droit français
« La fouille de textes et de données à des fins de recherche : une pratique confirmée et désormais opérationnelle en…29.11.2021
Ordonnance n° 2021-1518 du 24 novembre 2021 complétant la transposition de la directive 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique et modifiant les directives 96/9/CE et 2001/29/CE
« La ministre de la culture a présenté une ordonnance complétant la transposition de la directive 2019/790 du Parlement européen et…23.11.2021
Des outils s’appuyant sur le Web sémantique pour explorer le corpus de la correspondance d’Henri Poincaré [vidéo]
« De nombreux travaux s’intéressent à la vie et à l’œuvre d’Henri Poincaré, en particulier par l’étude et la publication du…16.11.2021
De l’ontologie OntoTM à TM Tools Explorer
« Fruit d’une collaboration entre les services « Text et Data Mining » et « Ingénierie terminologique » de l’Inist,…15.11.2021
CLARIN Café on Text and Data Mining Exceptions in the Directive on Copyright in the Digital Single Market
« The CLARIN Café on Text and Data Mining (TDM) Exceptions in the Directive on Copyright in the…03.11.2021
Librarian of Congress Adopts Research-Friendly Exemptions to Section 1201
« On October 27, 2021, the Librarian of Congress issued new exemptions to the prohibition on the circumvention…28.09.2021
Comment mobiliser des approches de fouille de textes et d’extraction de la terminologie dans un contexte pluridisciplinaire ?
« L’analyse des masses de données nécessite l’utilisation de méthodes mêlant harmonieusement différentes disciplines comme l’informatique, les mathématiques, les statistiques. L’ensemble…25.08.2021
Update: 1201 Exemption to Enable Text and Data Mining Research
« Authors Alliance, joined by the Library Copyright Alliance and the American Association of University Professors, is…20.07.2021
Building Legal Literacies for Text Data Mining
« Until now, humanities researchers conducting text data mining in the U.S. have had to maneuver through a thicket of legal…19.07.2021
ITEXT-BIO: Intelligent Term EXTraction for BIOmedical analysis
« Here, we introduce ITEXT-BIO, an intelligent process for biomedical domain terminology extraction from textual documents and subsequent analysis. The proposed…12.07.2021
Proceedings of the Workshop on Challenges in the Management of Large Corpora (CMLC-9) 2021. Limerick, 12 July 2021
« The ninth CMLC meeting continues the successful series of “Challenges in the management of large corpora” events, previously hosted at…09.07.2021
Action nationale de formation | Exploration documentaire et extraction d’information
« (…) Le CNRS et INRAE organisent la 2ème édition de l’Action nationale de formation sur l’exploration documentaire et…29.06.2021
Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles, Lille, France, 28 juin au 2 juillet 2021
« Les laboratoires organisateurs lillois (CRIStAL, Inria Nord-Lille Europe, STL, GERIICO) travaillant dans les domaines du traitement automatique des langues écrites…10.06.2021
BnF DataLab : appel à projets 2021
« Le BnF DataLab Depuis une vingtaine d’années, la BnF conduit une politique en matière de numérisation de masse, d’ouverture…01.06.2021
Text mining to support abstract screening for knowledge syntheses: a semi-automated workflow
« Current text mining tools supporting abstract screening in systematic reviews are not widely used, in part because they lack sensitivity…01.06.2021
Τhe Exception of Text and Data Mining from the Academic Libraries Standpoint
« (…) This paper analyses in detail the legal infrastructure of TDM exception as provided in Article 3 of the DSM…29.04.2021
3 new tools to try for Literature mapping — Connected Papers, Inciteful and Litmaps
« Tired of entering keywords and getting thousands of hits and not sure where to start your literature review? Or having…20.04.2021
The Missing Goal-Scorers in the Artificial Intelligence Team: Of Big Data, the Fundamental Right to Research and the failed Text and Data Mining limitations in the CSDM Directive
« This article argues that recent strategies of the European Union in the field of Artificial Intelligence (AI) resemble a football…20.04.2021
Text categorization with WEKA: A survey
« (…) The goal of this paper is to illustrate the steps required to perform a text categorization analysis, using WEKA…15.04.2021