« L’équipe Bibliome développe des méthodes d’extraction et de formalisation d’information à partir de textes écrits. Ces méthodes identifient et formalisent … Continuer la lecture de « BIBLIOME : Acquisition et Formalisation de Connaissances à partir de Textes »
Data.Istex : une autre vision d’ISTEX
« Data.Istex est une vision d’ISTEX élaborée pour la fouille de texte et pour le web de données. Découvrez sa vidéo … Continuer la lecture de « Data.Istex : une autre vision d’ISTEX »
Source > inist.fr, 14 janvier 2021
Formation : fouille de textes à travers l’exploitation des corpus ISTEX, 7 et 8 avril 2021
« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation. … Continuer la lecture de « Formation : fouille de textes à travers l’exploitation des corpus ISTEX, 7 et 8 avril 2021 »
Mission du CSPLA sur les exceptions de fouille de textes et de données (« text and data mining ») [rapport]
« La mission confiée en juin 2020 à Mme Alexandra Bensamoun, professeure des universités, et à M. Yohann Bouquerel, maître des … Continuer la lecture de « Mission du CSPLA sur les exceptions de fouille de textes et de données (« text and data mining ») [rapport] »
Authors Alliance Files Comment in Support of New Exemption to Section 1201 of the DMCA to Enable Text and Data Mining Research
« Yesterday, Authors Alliance, joined by the Library Copyright Alliance and the American Association of University Professors, filed a comment with … Continuer la lecture de « Authors Alliance Files Comment in Support of New Exemption to Section 1201 of the DMCA to Enable Text and Data Mining Research »
Text mining approaches for dealing with the rapidly expanding literature on COVID-19
« More than 50 000 papers have been published about COVID-19 since the beginning of 2020 and several hundred new papers … Continuer la lecture de « Text mining approaches for dealing with the rapidly expanding literature on COVID-19 »
New TDM Data Visualization Interface Supports Research at all Levels
« (…) Text and data mining (TDM) is now accessible to all researchers – even those without coding experience – thanks … Continuer la lecture de « New TDM Data Visualization Interface Supports Research at all Levels »
Source > about.proquest.com, 11 decembre 2020
Accelerating Text Mining Using Domain-Specific Stop Word Lists
« (…) In this paper, we present a novel mathematical approach for the automatic extraction of domain-specific words called the hyperplane-based … Continuer la lecture de « Accelerating Text Mining Using Domain-Specific Stop Word Lists »
Source > arxiv.org, Farah Alshanik, Amy Apon, Alexander Herzog, Ilya Safro, Justin Sybrandt, 18 novembre 2020
Proceedings of the First Workshop on Scholarly Document Processing (SDP 2020) – November 19, Online
« SDP is a full day workshop that provides an interdisciplinary venue for researchers interested in any aspect of mining scientific … Continuer la lecture de « Proceedings of the First Workshop on Scholarly Document Processing (SDP 2020) – November 19, Online »
Source > aclweb.org, Association for Computational Linguistics, novembre 2020
From Data Collection to Text Interpretation. An interview on exploring techniques and use cases for text mining
« Meet two text mining experts in today’s interview, which explores some of the common issues faced by data scientists in … Continuer la lecture de « From Data Collection to Text Interpretation. An interview on exploring techniques and use cases for text mining »
Source > datasciencecentral.com, Rosaria Silipo, 15 novembre 2020
PubSqueezer: A Text-Mining Web Tool to Transform Unstructured Documents into Structured Data
« (…) In this work, I present a web tool which uses a Text Mining strategy to transform large collections of … Continuer la lecture de « PubSqueezer: A Text-Mining Web Tool to Transform Unstructured Documents into Structured Data »
Source > arxiv.org, Alberto Calderone Dr., 9 novembre 2020 arXiv:2011.03123v2
SciBite launches SciBiteAI Relationship Extraction models
« SciBite announces the release of SciBiteAI Relationship Extraction models, which provide the enhanced ability to identify complex relationships within text … Continuer la lecture de « SciBite launches SciBiteAI Relationship Extraction models »
Source > scibite.com, 11 novembre 2020
KDD ’20: Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining
« The annual ACM SIGKDD conference is the premier international forum for data mining researchers and practitioners from academia, industry, and … Continuer la lecture de « KDD ’20: Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining »
Evolving our support for text-and-data mining
« Many researchers want to carry out analysis and extraction of information from large sets of data, such as journal articles … Continuer la lecture de « Evolving our support for text-and-data mining »
Research Trends in Text Mining: Semantic Network and Main Path Analysis of Selected Journals
« In this study, network and main path analyses were conducted on 1,856 studies related to text mining, by extracting keywords … Continuer la lecture de « Research Trends in Text Mining: Semantic Network and Main Path Analysis of Selected Journals »
Une ontologie des outils de fouille de textes
« Au cours du projet VisaTM, nous avions produit une liste de trois cents outils spécialisés dans le traitement automatique du … Continuer la lecture de « Une ontologie des outils de fouille de textes »
Source > objectif-tdm.inist.fr, Fabienne Kettani, Frank Arnould, 5 aout 2020
Détecter l’émergence de la prochaine maladie X
« L’émergence du Covid-19, fin décembre 2019, a été repérée en ligne par certains systèmes de surveillance. Noyés sous une montagne … Continuer la lecture de « Détecter l’émergence de la prochaine maladie X »
Source > cirad.fr, 20 juillet 2020
Blog Objectif-TDM
« De Visa-tm à Objectif-TDM Un blog avait été ouvert à l’initiative de l’Inist afin de communiquer sur le projet VisaTM … Continuer la lecture de « Blog Objectif-TDM »
Source > inist.fr, 1er juillet 2020
#openVirus – Knowledge in the Hands of Citizens
« openVirus is innovating new types of search for research literature using data mining technologies to enable citizens to make use … Continuer la lecture de « #openVirus – Knowledge in the Hands of Citizens »
JEP-TALN-RECITAL 2020 – Nancy, 8-19 juin 2020 [actes de la conférence]
« La conférence JEP-TALN-RECITAL, organisée par le Loria, l’ATILF et l’INIST, s’est déroulée du 8 au 19 juin en mode virtuel. … Continuer la lecture de « JEP-TALN-RECITAL 2020 – Nancy, 8-19 juin 2020 [actes de la conférence] »
Source > jep-taln2020.loria.fr, juin 2020
Beethoven250@ISTEX : écouter Beethoven autrement
« (…) Pour rendre hommage à ce grand musicien en cette année 2020, l’équipe ISTEX a souhaité créer une collection de … Continuer la lecture de « Beethoven250@ISTEX : écouter Beethoven autrement »
An Experiment in Annotating Animal Species Names from ISTEX Resources (.pdf)
« To exploit scientific publications from global research for TDM purposes, the ISTEX platform enriched its data with value-added information to … Continuer la lecture de « An Experiment in Annotating Animal Species Names from ISTEX Resources (.pdf) »
Research Libraries: How You Can Support Text and Data Mining
« Europe’s incoming Directive on Copyright in the Digital Single Market contains two new exceptions allowing text and data mining (TDM). … Continuer la lecture de « Research Libraries: How You Can Support Text and Data Mining »
Source > libereurope.eu, 7 mai 2020
Visualiser la recherche sur le coronavirus en un coup d’œil
« L’Institut des systèmes complexes de Paris Île-de-France a publié plusieurs cartes construites à partir de l’analyse automatisée de toutes les … Continuer la lecture de « Visualiser la recherche sur le coronavirus en un coup d’œil »
Plongez au cœur d’ISTEX grâce à ses enrichissements
« (…) l’équipe ISTEX vous invite à retrouver, dans la dernière version de sa documentation “Usage TDM d’ISTEX”, les éléments vous … Continuer la lecture de « Plongez au cœur d’ISTEX grâce à ses enrichissements »
Des initiatives en fouille de textes fleurissent sur le coronavirus
« Des exemples d’initiatives en fouille de texte autour du CoronaVirus et Covid-19 (…) »
Source > inist.fr, 24 mars 2020
Webinar Video: How Can Libraries Support TDM?
« In this webinar, held on 12 March 2020 and organised by LIBER’s Copyright & Legal Matters Working Group, two LIBER libraries … Continuer la lecture de « Webinar Video: How Can Libraries Support TDM? »
Source > libereurope.eu, 12 mars 2020
Europe’s TDM Exception for Research: Will It Be Undermined By Technical Blocking From Publishers?
« A mandatory exception for Text and Data Mining (TDM) for research, included in Europe’s new Directive on Copyright in the … Continuer la lecture de « Europe’s TDM Exception for Research: Will It Be Undermined By Technical Blocking From Publishers? »
Source > libereurope.eu, 10 mars 2020
LIBER Webinar: How Can Libraries Support TDM?
« Europe’s new Copyright Directive includes a mandatory text and data mining (TDM) exception for non-commercial research. This opens up new … Continuer la lecture de « LIBER Webinar: How Can Libraries Support TDM? »
Source > anymeeting.com, février 2020
La fouille de textes aujourd’hui…et demain ? résultats de l’enquête
« (…) La fouille de textes est pratiquée aussi bien par des non spécialistes utilisant la fouille de textes de façon … Continuer la lecture de « La fouille de textes aujourd’hui…et demain ? résultats de l’enquête »
Analyse comparative de huit plateformes étrangères de diffusion de revues scientifiques
« Effectuée pour le compte du Comité de suivi de l’édition scientifique (CSES), cette étude présente une analyse comparative de huit … Continuer la lecture de « Analyse comparative de huit plateformes étrangères de diffusion de revues scientifiques »
Formation : fouille de textes à travers l’exploitation des corpus istex
« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation. … Continuer la lecture de « Formation : fouille de textes à travers l’exploitation des corpus istex »
Source > inist.fr, 22 janvier 2020
TextMine’20 – Atelier sur la Fouille de Textes – Conférence EGC (Extraction et Gestion des Connaissances), 28 janvier 2020, Bruxelles (.pdf)
« La fouille de textes couvre de multiples domaines comme, le traitement automatique des langues, l’intelligence artificielle, la linguistique, les statistiques, … Continuer la lecture de « TextMine’20 – Atelier sur la Fouille de Textes – Conférence EGC (Extraction et Gestion des Connaissances), 28 janvier 2020, Bruxelles (.pdf) »
Source > vincentlemaire-labs.fr, Pascal Cuxac, Vincent Lemaire, janvier 2020
Springer Nature and OpenAIRE collaborate to further Open Science
« Starting immediately, Springer Nature will provide OpenAIRE, an EU organisation that facilitates openness in scholarly communication, access to its full-text … Continuer la lecture de « Springer Nature and OpenAIRE collaborate to further Open Science »
Source > openaire.eu, 27 janvier 2020
ProQuest’s TDM Studio™ Service Transforms Text and Data Mining with Efficiency, Flexibility and Power
« New solution streamlines the text-mining workflow from end to end, enabling researchers to gain new insights. (…) »
Source > proquest.com, 24 janvier 2020
VOSviewer version 1.6.14
« VOSviewer version 1.6.14 was released on January 27, 2020. This version offers improved support for querying APIs. DOI files provide … Continuer la lecture de « VOSviewer version 1.6.14 »
Source > vosviewer.com, 27 janvier 2020
Recommandations sur l’analyse automatique de documents : acquisition, gestion, exploration
« Le groupe de travail « Fouille de textes et analyse de données » du Comité pour la science ouverte émet des recommandations … Continuer la lecture de « Recommandations sur l’analyse automatique de documents : acquisition, gestion, exploration »
A brief analysis of Opscidia’s survey on scientific publishing
« (…) A quite diverse panel of respondents We were very happy to have 362 responders from all around the world. … Continuer la lecture de « A brief analysis of Opscidia’s survey on scientific publishing »
Source > opscidia.com, 20 décembre 2019
Text and Data Quality Mining in CRIS
« (…) This present paper deploys TDM in CRIS to analyze, quantify, and correct the unstructured data and its quality issues. … Continuer la lecture de « Text and Data Quality Mining in CRIS »
Source > mdpi.com, Otmane Azeroual, Information 2019, 10(12), 374; https://doi.org/10.3390/info10120374
LIBER and Communia Launch Joint Guidelines on Text and Data Mining
« The LIBER-Communia guidelines come in addition to detailed library guidelines on the Digital Single Market Directive, published last week by … Continuer la lecture de « LIBER and Communia Launch Joint Guidelines on Text and Data Mining »
Source > libereurope.eu/, 2 décembre 2019
Les ateliers de Visa TM Day
« Les ateliers prospectifs autour de “quelle infrastructure de service de fouille de textes pour demain” ont permis de faire émerger … Continuer la lecture de « Les ateliers de Visa TM Day »
Source > visatm.inist.fr, Marie-Sophie Nourdin, 26 novembre 2019
Rapports publics du projet Visa TM
(…) Les principaux résultats de Visa TM portent sur : l’étude de la création d’une e-infrastructure de fouille de textes … Continuer la lecture de « Rapports publics du projet Visa TM »
Source > visatm.inist.fr, Marie-Sophie Nourdin, 18 novembre 2019
OPEN SCIENCE : 3 questions à Sylvain Massip PDG et fondateur d’Opscidia
« (…) « Opscidia est une toute jeune société qui promeut l’open access pour les publications scientifiques. Notre pari est que … Continuer la lecture de « OPEN SCIENCE : 3 questions à Sylvain Massip PDG et fondateur d’Opscidia »
Source > inria-alumni.fr, 5 novembre 2019
Why Every Python Developer Will Love Ray
« There are many reasons why Python has emerged as the number one language for data science. It’s easy to get … Continuer la lecture de « Why Every Python Developer Will Love Ray »
Copyright as an Obstacle or an Enabler? A European Perspective on Text and Data Mining and Its Role in the Development of AI Creativity
« (…) This contribution discusses the interplay between TDM and AI creativity by focusing, first, on the potential and technicalities of … Continuer la lecture de « Copyright as an Obstacle or an Enabler? A European Perspective on Text and Data Mining and Its Role in the Development of AI Creativity »
#VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining
« Dans le cadre du projet Visa TM du Comité pour la Science Ouverte, un « Visa TM Day » sera organisé … Continuer la lecture de « #VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining »
Source > inist.fr, 25 septembre 2019
Galaxy server for complex TDM analysis : Part 2
« For several years Galaxy project has been constantly growing and evolving. Having an active community, the new projects are running … Continuer la lecture de « Galaxy server for complex TDM analysis : Part 2 »
Galaxy server for complex TDM analysis – Part 1
« Galaxy is an open source, web-based platform for data-intensive analysis. Founded for biomedical research, today galaxy can also be applied … Continuer la lecture de « Galaxy server for complex TDM analysis – Part 1 »
Using Transkribus for automated text recognition of historical Bengali Books
« Are you working with digitised printed collections that you want to ‘unlock’ for keyword search and text mining? Maybe you … Continuer la lecture de « Using Transkribus for automated text recognition of historical Bengali Books »
The Right to Read is the Right To Mine: But Not When Blocked by Technical Protection Measures
(…) Our Copyright & Legal Matters Working Group is working with LACA to gather evidence about what happens when Technical … Continuer la lecture de « The Right to Read is the Right To Mine: But Not When Blocked by Technical Protection Measures »
Source > libereurope.eu, 1er aout 2019
Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 4 – 8, 2019 – Anchorage, Alaska – USA
« The annual ACM SIGKDD Conference is the premier international forum for data mining researchers and practitioners from academia, industry, and … Continuer la lecture de « Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 4 – 8, 2019 – Anchorage, Alaska – USA »
Gerrish, Charlotte. « European Copyright Law and the Text and Data Mining Exceptions and Limitations » [thesis]
« We are in a digital age with Big Data at the heart of our global online environment. Exploiting Big Data … Continuer la lecture de « Gerrish, Charlotte. « European Copyright Law and the Text and Data Mining Exceptions and Limitations » [thesis] »
Proceedings of the International Conference on Process Mining (ICPM) Demo Track, Aachen, Germany, June 24-26, 2019
« This proceedings volume collects the papers presented at the ICPM DemoTrack 2019, which was part of the 1st International Conference … Continuer la lecture de « Proceedings of the International Conference on Process Mining (ICPM) Demo Track, Aachen, Germany, June 24-26, 2019 »
Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities
« Istex is a database of twenty million full text scientific papers bought by the French Government for the use of … Continuer la lecture de « Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities »
Atelier ISTEX à Nancy le mardi 18 juin
« Ces ateliers vous permettront de prendre en main les services et les outils de constitution, de visualisation et d’exploration d’un … Continuer la lecture de « Atelier ISTEX à Nancy le mardi 18 juin »
Source > inist.fr, 13 mai 2019
BIR 2019 / 8th International Workshop on Bibliometric-enhanced Information Retrieval* – Cologne, Germany, April 14th, 2019 [book of proceedings]
*co-located with the 41st European Conference on Information Retrieval (ECIR 2019) « The Bibliometric-enhanced Information Retrieval workshop series (BIR) at ECIR … Continuer la lecture de « BIR 2019 / 8th International Workshop on Bibliometric-enhanced Information Retrieval* – Cologne, Germany, April 14th, 2019 [book of proceedings] »
Blog #VisaTM : Recensement d’outils de fouille de textes
« Dans le cadre du volet Étude du projet VisaTM, nous avons réalisé un recensement d’outils de fouille de textes. Le … Continuer la lecture de « Blog #VisaTM : Recensement d’outils de fouille de textes »
A Hybrid Information Extraction Approach Exploiting Structured Data Within a Text Mining Process
« Many data sets encompass structured data fields with embedded free text fields. The text fields allow customers and workers to … Continuer la lecture de « A Hybrid Information Extraction Approach Exploiting Structured Data Within a Text Mining Process »
TOTh 2019 Terminology & Ontology: Theories and applications, 6 -7 June 2019, Campus Scientifique – Le Bourget du Lac – France
« The 13th TOTh International Conference will be held on Thursday 6th and Friday 7th of June 2019 at the Scientific … Continuer la lecture de « TOTh 2019 Terminology & Ontology: Theories and applications, 6 -7 June 2019, Campus Scientifique – Le Bourget du Lac – France »
Source > toth.condillac.org, 2019
Europe’s ability to lead in AI will be helped by the new TDM exception
« EARE welcomes the decision from EU institutions to enable all Europeans – public researchers and commercial entities – to benefit … Continuer la lecture de « Europe’s ability to lead in AI will be helped by the new TDM exception »
Source > eare.eu, 29 mars 2019
Le Parlement approuve de nouvelles règles sur le droit d’auteur sur internet
« (…) Les députés ont adopté la directive en plénière par 348 voix pour, 274 contre et 36 abstentions. Cela marque … Continuer la lecture de « Le Parlement approuve de nouvelles règles sur le droit d’auteur sur internet »
Source > europarl.europa.eu, 26 mars 2019
LIBER welcomes final compromise text for the European Union’s Directive on Copyright in the Digital Single Market
« LIBER welcomes news that negotiators from the European Parliament and the Council have agreed a final compromise text for the … Continuer la lecture de « LIBER welcomes final compromise text for the European Union’s Directive on Copyright in the Digital Single Market »
Source > libereurope.eu, 14 février 2019
Visa pour le Text Mining
« La création d’une offre de service en fouille de textes et de données ‐ TDM (text and data mining) à … Continuer la lecture de « Visa pour le Text Mining »
Source > visatm.inist.fr, février 2019