29.04.2021
Mot-clé : TDM (Text and Data Mining)
20.04.2021
The Missing Goal-Scorers in the Artificial Intelligence Team: Of Big Data, the Fundamental Right to Research and the failed Text and Data Mining limitations in the CSDM Directive
« This article argues that recent strategies of the European Union in the field of Artificial Intelligence (AI) resemble a football…20.04.2021
Text categorization with WEKA: A survey
« (…) The goal of this paper is to illustrate the steps required to perform a text categorization analysis, using WEKA…15.04.2021
Advances in Information Retrieval – 43rd European Conference on IR Research, ECIR 2021 Virtual Event, March 28–April 1, 2021 [proceedings]
« ECIR 2021, the 43rd edition of the annual BCS-IRSG European Conference on Information Retrieval, initially planned…08.04.2021
A Prospective Comparison of Evidence Synthesis Search Strategies Developed With and Without Text-Mining Tools
« (…) In an era of explosive growth in biomedical evidence, improving systematic review (SR) search…15.03.2021
Journée ISTEX 2021, 10 janvier 2021 [Vidéos et présentations]
« La plateforme ISTEX met à disposition des institutions de l’enseignement supérieur et de la recherche (ESR), plus…12.03.2021
CUAD: An Expert-Annotated NLP Dataset for Legal Contract Review
« Many specialized domains remain untouched by deep learning, as large labeled datasets require expensive expert annotators. We address this bottleneck…arxiv.org, Dan Hendrycks, Collin Burns, Anya Chen, Spencer Ball, 10 mars 2021, arXiv:2103.06268v1
12.03.2021
Opscidia’s ontology generator
« Opscidia, a French startup, was the winner in the OpenAIRE open call for innovation. The team…11.03.2021
Anne O’Tate: Value-added PubMed search engine for analysis and text mining
« Over a decade ago, we introduced Anne O’Tate, a free, public web-based tool http://arrowsmith.psych.uic.edu/cgi-bin/arrowsmith_uic/AnneOTate.cgi to support user-driven…26.01.2021
BIBLIOME : Acquisition et Formalisation de Connaissances à partir de Textes
« L’équipe Bibliome développe des méthodes d’extraction et de formalisation d’information à partir de textes écrits. Ces méthodes identifient et formalisent…15.01.2021
Data.Istex : une autre vision d’ISTEX
« Data.Istex est une vision d’ISTEX élaborée pour la fouille de texte et pour le web de données.08.01.2021
Formation : fouille de textes à travers l’exploitation des corpus ISTEX, 7 et 8 avril 2021
« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation.18.12.2020
Mission du CSPLA sur les exceptions de fouille de textes et de données (« text and data mining ») [rapport]
« La mission confiée en juin 2020 à Mme Alexandra Bensamoun, professeure des universités, et à M. Yohann Bouquerel, maître des…18.12.2020
Authors Alliance Files Comment in Support of New Exemption to Section 1201 of the DMCA to Enable Text and Data Mining Research
« Yesterday, Authors Alliance, joined by the Library Copyright Alliance and the American Association of University Professors, filed…14.12.2020
Text mining approaches for dealing with the rapidly expanding literature on COVID-19
« More than 50 000 papers have been published about COVID-19 since the beginning of 2020 and several hundred new papers…14.12.2020
New TDM Data Visualization Interface Supports Research at all Levels
« (…) Text and data mining (TDM) is now accessible to all researchers – even those without coding experience – thanks…08.12.2020
Accelerating Text Mining Using Domain-Specific Stop Word Lists
« (…) In this paper, we present a novel mathematical approach for the automatic extraction of domain-specific words called the hyperplane-based…arxiv.org, Farah Alshanik, Amy Apon, Alexander Herzog, Ilya Safro, Justin Sybrandt, 18 novembre 2020
17.11.2020
Proceedings of the First Workshop on Scholarly Document Processing (SDP 2020) – November 19, Online
« SDP is a full day workshop that provides an interdisciplinary venue for researchers interested in any aspect of mining scientific…aclweb.org, Association for Computational Linguistics, novembre 2020
16.11.2020
From Data Collection to Text Interpretation. An interview on exploring techniques and use cases for text mining
« Meet two text mining experts in today’s interview, which explores some of the common issues faced by data scientists in…16.11.2020
PubSqueezer: A Text-Mining Web Tool to Transform Unstructured Documents into Structured Data
« (…) In this work, I present a web tool which uses a Text Mining strategy to transform large collections of…arxiv.org, Alberto Calderone Dr., 9 novembre 2020 arXiv:2011.03123v2
13.11.2020
SciBite launches SciBiteAI Relationship Extraction models
« SciBite announces the release of SciBiteAI Relationship Extraction models, which provide the enhanced ability to identify complex relationships within text…25.08.2020
KDD ’20: Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining
« The annual ACM SIGKDD conference is the premier international forum for data mining researchers and practitioners from academia, industry, and…24.08.2020
Evolving our support for text-and-data mining
« Many researchers want to carry out analysis and extraction of information from large sets of data, such as journal articles…17.08.2020
Research Trends in Text Mining: Semantic Network and Main Path Analysis of Selected Journals
« In this study, network and main path analyses were conducted on 1,856 studies related to text mining, by extracting keywords…07.08.2020
Une ontologie des outils de fouille de textes
« Au cours du projet VisaTM, nous avions produit une liste de trois…objectif-tdm.inist.fr, Fabienne Kettani, Frank Arnould, 5 aout 2020
23.07.2020
Détecter l’émergence de la prochaine maladie X
« L’émergence du Covid-19, fin décembre 2019, a été repérée en ligne par certains systèmes de surveillance. Noyés sous une montagne…02.07.2020
Blog Objectif-TDM
« De Visa-tm à Objectif-TDM Un blog avait été ouvert à l’initiative de l’Inist afin de…24.06.2020
#openVirus – Knowledge in the Hands of Citizens
« openVirus is innovating new types of search for research literature using data mining technologies to enable citizens to make use…23.06.2020
JEP-TALN-RECITAL 2020 – Nancy, 8-19 juin 2020 [actes de la conférence]
« La conférence JEP-TALN-RECITAL, organisée par le Loria, l’ATILF et l’INIST, s’est déroulée du 8 au 19 juin en mode virtuel.09.06.2020
Beethoven250@ISTEX : écouter Beethoven autrement
« (…) Pour rendre hommage à ce grand musicien en cette année 2020, l’équipe ISTEX a souhaité créer une collection de…02.06.2020
An Experiment in Annotating Animal Species Names from ISTEX Resources (.pdf)
« To exploit scientific publications from global research for TDM purposes, the ISTEX platform enriched its data with value-added information to…11.05.2020
Research Libraries: How You Can Support Text and Data Mining
« Europe’s incoming Directive on Copyright in the Digital Single Market contains two new exceptions allowing text…27.04.2020
Visualiser la recherche sur le coronavirus en un coup d’œil
« L’Institut des systèmes complexes de Paris Île-de-France a publié plusieurs cartes construites à partir de l’analyse automatisée de toutes les…01.04.2020
Plongez au cœur d’ISTEX grâce à ses enrichissements
« (…) l’équipe ISTEX vous invite à retrouver, dans la dernière version de sa documentation “Usage TDM d’ISTEX”, les éléments vous…26.03.2020
Des initiatives en fouille de textes fleurissent sur le coronavirus
« Des exemples d’initiatives en fouille de texte autour du CoronaVirus et Covid-19 (…) »…13.03.2020
Webinar Video: How Can Libraries Support TDM?
« In this webinar, held on 12 March 2020 and organised by LIBER’s Copyright & Legal Matters Working…12.03.2020
Europe’s TDM Exception for Research: Will It Be Undermined By Technical Blocking From Publishers?
« A mandatory exception for Text and Data Mining (TDM) for research, included in Europe’s new Directive on Copyright in the…14.02.2020
LIBER Webinar: How Can Libraries Support TDM?
« Europe’s new Copyright Directive includes a mandatory text and data mining (TDM) exception for non-commercial research. This opens up new…10.02.2020
La fouille de textes aujourd’hui…et demain ? résultats de l’enquête
« (…) La fouille de textes est pratiquée aussi bien par des non spécialistes utilisant la fouille de textes de façon…31.01.2020
Analyse comparative de huit plateformes étrangères de diffusion de revues scientifiques
« Effectuée pour le compte du Comité de suivi de l’édition scientifique (CSES), cette étude présente une analyse comparative de huit…29.01.2020
Formation : fouille de textes à travers l’exploitation des corpus istex
« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation.28.01.2020
TextMine’20 – Atelier sur la Fouille de Textes – Conférence EGC (Extraction et Gestion des Connaissances), 28 janvier 2020, Bruxelles (.pdf)
« La fouille de textes couvre de multiples domaines comme, le traitement automatique des langues, l’intelligence artificielle, la linguistique, les statistiques,…vincentlemaire-labs.fr, Pascal Cuxac, Vincent Lemaire, janvier 2020
28.01.2020
Springer Nature and OpenAIRE collaborate to further Open Science
« Starting immediately, Springer Nature will provide OpenAIRE, an EU organisation that facilitates…28.01.2020
ProQuest’s TDM Studio™ Service Transforms Text and Data Mining with Efficiency, Flexibility and Power
« New solution streamlines the text-mining workflow from end to end, enabling researchers to gain new insights. (…) »…28.01.2020
VOSviewer version 1.6.14
« VOSviewer version 1.6.14 was released on January 27, 2020. This version offers improved support for querying APIs. DOI files provide…07.01.2020
Recommandations sur l’analyse automatique de documents : acquisition, gestion, exploration
« Le groupe de travail « Fouille de textes et analyse de données » du Comité pour la science ouverte émet des recommandations…23.12.2019
A brief analysis of Opscidia’s survey on scientific publishing
« (…) A quite diverse panel of respondents We were very happy to have 362 responders from all around the…04.12.2019
Text and Data Quality Mining in CRIS
« (…) This present paper deploys TDM in CRIS to analyze, quantify, and correct the unstructured data and its quality issues.mdpi.com, Otmane Azeroual, Information 2019, 10(12), 374; https://doi.org/10.3390/info10120374
03.12.2019
LIBER and Communia Launch Joint Guidelines on Text and Data Mining
« The LIBER-Communia guidelines come in addition to detailed library guidelines on the Digital Single Market Directive,…28.11.2019
Les ateliers de Visa TM Day
« Les ateliers prospectifs autour de “quelle infrastructure de service de fouille de textes pour demain” ont permis de faire émerger…20.11.2019
Rapports publics du projet Visa TM
(…) Les principaux résultats de Visa TM portent sur : l’étude de la création d’une e-infrastructure de fouille de textes…07.11.2019
OPEN SCIENCE : 3 questions à Sylvain Massip PDG et fondateur d’Opscidia
« (…) « Opscidia est une toute jeune société qui promeut l’open access pour les publications scientifiques.07.11.2019
Why Every Python Developer Will Love Ray
« There are many reasons why Python has emerged as the number one language for data science. It’s easy to get…01.10.2019
Copyright as an Obstacle or an Enabler? A European Perspective on Text and Data Mining and Its Role in the Development of AI Creativity
« (…) This contribution discusses the interplay between TDM and AI creativity by focusing, first, on the potential and technicalities of…25.09.2019
#VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining
« Dans le cadre du projet Visa TM du Comité pour la Science Ouverte, un « Visa TM Day » sera organisé…25.09.2019
Galaxy server for complex TDM analysis : Part 2
« For several years Galaxy project has been constantly growing and evolving. Having an active community, the new projects are running…16.09.2019
Galaxy server for complex TDM analysis – Part 1
« Galaxy is an open source, web-based platform for data-intensive analysis. Founded for biomedical research, today galaxy can also be applied…02.09.2019
Using Transkribus for automated text recognition of historical Bengali Books
« Are you working with digitised printed collections that you want to ‘unlock’ for keyword search and text mining? Maybe you…22.08.2019
The Right to Read is the Right To Mine: But Not When Blocked by Technical Protection Measures
(…) Our Copyright & Legal Matters Working Group is working with LACA…08.08.2019
Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 4 – 8, 2019 – Anchorage, Alaska – USA
« The annual ACM SIGKDD Conference is the premier international forum for data mining researchers and practitioners from academia, industry, and…08.07.2019
Gerrish, Charlotte. « European Copyright Law and the Text and Data Mining Exceptions and Limitations » [thesis]
« We are in a digital age with Big Data at the heart of our global online environment. Exploiting Big Data…14.06.2019
Proceedings of the International Conference on Process Mining (ICPM) Demo Track, Aachen, Germany, June 24-26, 2019
« This proceedings volume collects the papers presented at the ICPM DemoTrack 2019, which was part of the 1st International Conference…28.05.2019