BIBLIOME : Acquisition et Formalisation de Connaissances à partir de Textes

« L’équipe Bibliome développe des méthodes d’extraction et de formalisation d’information à partir de textes écrits. Ces méthodes identifient et formalisent … Continuer la lecture de « BIBLIOME : Acquisition et Formalisation de Connaissances à partir de Textes »

Source > hal.archives-ouvertes.fr, Robert Bossy, Arnaud Ferré, Équipe Bibliome, Claire Nédellec, Louise Deleger. BIBLIOME : Acquisition et Formalisation de Connaissances à partir de Textes. Bulletin de l'AFIA, AFIA, 2020, Dossier « Technologies du Langage Humain », pp.7-9. ⟨hal-03025321⟩

Data.Istex : une autre vision d’ISTEX

« Data.Istex est une vision d’ISTEX élaborée pour la fouille de texte et pour le web de données. Découvrez sa vidéo … Continuer la lecture de « Data.Istex : une autre vision d’ISTEX »

Source > inist.fr, 14 janvier 2021

Formation : fouille de textes à travers l’exploitation des corpus ISTEX, 7 et 8 avril 2021

« La fouille de textes et de données (TDM)  est aujourd’hui un enjeu majeur pour la recherche et pour la documentation. … Continuer la lecture de « Formation : fouille de textes à travers l’exploitation des corpus ISTEX, 7 et 8 avril 2021 »

Source > inist.fr/nos-actualites, 7 janvier 2021

Mission du CSPLA sur les exceptions de fouille de textes et de données (« text and data mining ») [rapport]

« La mission confiée en juin 2020 à Mme Alexandra Bensamoun, professeure des universités, et à M. Yohann Bouquerel, maître des … Continuer la lecture de « Mission du CSPLA sur les exceptions de fouille de textes et de données (« text and data mining ») [rapport] »

Source > culture.gouv.fr, CSPLA, 18 décembre 2020

Authors Alliance Files Comment in Support of New Exemption to Section 1201 of the DMCA to Enable Text and Data Mining Research

« Yesterday, Authors Alliance, joined by the Library Copyright Alliance and the American Association of University Professors, filed a comment with … Continuer la lecture de « Authors Alliance Files Comment in Support of New Exemption to Section 1201 of the DMCA to Enable Text and Data Mining Research »

Source > authorsalliance.org, 15 décembre 2020

Text mining approaches for dealing with the rapidly expanding literature on COVID-19

« More than 50 000 papers have been published about COVID-19 since the beginning of 2020 and several hundred new papers … Continuer la lecture de « Text mining approaches for dealing with the rapidly expanding literature on COVID-19 »

Source > academic.oup.com, Lucy Lu Wang, Kyle Lo, Text mining approaches for dealing with the rapidly expanding literature on COVID-19, Briefings in Bioinformatics, , bbaa296, https://doi.org/10.1093/bib/bbaa296

New TDM Data Visualization Interface Supports Research at all Levels

« (…) Text and data mining (TDM) is now accessible to all researchers – even those without coding experience – thanks … Continuer la lecture de « New TDM Data Visualization Interface Supports Research at all Levels »

Source > about.proquest.com, 11 decembre 2020

Accelerating Text Mining Using Domain-Specific Stop Word Lists

« (…) In this paper, we present a novel mathematical approach for the automatic extraction of domain-specific words called the hyperplane-based … Continuer la lecture de « Accelerating Text Mining Using Domain-Specific Stop Word Lists »

Source > arxiv.org, Farah Alshanik, Amy Apon, Alexander Herzog, Ilya Safro, Justin Sybrandt, 18 novembre 2020

Proceedings of the First Workshop on Scholarly Document Processing (SDP 2020) – November 19, Online

« SDP is a full day workshop that provides an interdisciplinary venue for researchers interested in any aspect of mining scientific … Continuer la lecture de « Proceedings of the First Workshop on Scholarly Document Processing (SDP 2020) – November 19, Online »

Source > aclweb.org, Association for Computational Linguistics, novembre 2020

From Data Collection to Text Interpretation. An interview on exploring techniques and use cases for text mining

« Meet two text mining experts in today’s interview, which explores some of the common issues faced by data scientists in … Continuer la lecture de « From Data Collection to Text Interpretation. An interview on exploring techniques and use cases for text mining »

Source > datasciencecentral.com, Rosaria Silipo, 15 novembre 2020

PubSqueezer: A Text-Mining Web Tool to Transform Unstructured Documents into Structured Data

« (…) In this work, I present a web tool which uses a Text Mining strategy to transform large collections of … Continuer la lecture de « PubSqueezer: A Text-Mining Web Tool to Transform Unstructured Documents into Structured Data »

Source > arxiv.org, Alberto Calderone Dr., 9 novembre 2020 arXiv:2011.03123v2

SciBite launches SciBiteAI Relationship Extraction models

« SciBite announces the release of SciBiteAI Relationship Extraction models, which provide the enhanced ability to identify complex relationships within text … Continuer la lecture de « SciBite launches SciBiteAI Relationship Extraction models »

Source > scibite.com, 11 novembre 2020

KDD ’20: Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining

« The annual ACM SIGKDD conference is the premier international forum for data mining researchers and practitioners from academia, industry, and … Continuer la lecture de « KDD ’20: Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining »

Source > dl.acm.org, 2020. Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. Association for Computing Machinery, New York, NY, USA.

Research Trends in Text Mining: Semantic Network and Main Path Analysis of Selected Journals

« In this study, network and main path analyses were conducted on 1,856 studies related to text mining, by extracting keywords … Continuer la lecture de « Research Trends in Text Mining: Semantic Network and Main Path Analysis of Selected Journals »

Source > sciencedirect.com, Jung, H., Gyou Lee, B., Research Trends in Text Mining: Semantic Network and MainPath Analysis of Selected Journals, Expert Systems with Applications (2020), doi: https://doi.org/10.1016/j.eswa.2020.113851

Une ontologie des outils de fouille de textes

« Au cours du projet VisaTM, nous avions produit une liste de trois cents outils spécialisés dans le traitement automatique du … Continuer la lecture de « Une ontologie des outils de fouille de textes »

Source > objectif-tdm.inist.fr, Fabienne Kettani, Frank Arnould, 5 aout 2020

Détecter l’émergence de la prochaine maladie X

« L’émergence du Covid-19, fin décembre 2019, a été repérée en ligne par certains systèmes de surveillance. Noyés sous une montagne … Continuer la lecture de « Détecter l’émergence de la prochaine maladie X »

Source > cirad.fr, 20 juillet 2020

Blog Objectif-TDM

« De Visa-tm à Objectif-TDM Un blog avait été ouvert à l’initiative de l’Inist afin de communiquer sur le projet VisaTM … Continuer la lecture de « Blog Objectif-TDM »

Source > inist.fr, 1er juillet 2020

#openVirus – Knowledge in the Hands of Citizens

« openVirus is innovating new types of search for research literature using data mining technologies to enable citizens to make use … Continuer la lecture de « #openVirus – Knowledge in the Hands of Citizens »

Source > genr.eu, 23 juin 2020, DOI 10.25815/18ph-6j92

JEP-TALN-RECITAL 2020 – Nancy, 8-19 juin 2020 [actes de la conférence]

« La conférence JEP-TALN-RECITAL, organisée par le Loria, l’ATILF et l’INIST, s’est déroulée du 8 au 19 juin en mode virtuel. … Continuer la lecture de « JEP-TALN-RECITAL 2020 – Nancy, 8-19 juin 2020 [actes de la conférence] »

Source > jep-taln2020.loria.fr, juin 2020

Beethoven250@ISTEX : écouter Beethoven autrement

« (…) Pour rendre hommage à ce grand musicien en cette année 2020, l’équipe ISTEX a souhaité créer une collection de … Continuer la lecture de « Beethoven250@ISTEX : écouter Beethoven autrement »

Source > blog.istex.fr, Camille De Salabert, 8 juin 2020

An Experiment in Annotating Animal Species Names from ISTEX Resources (.pdf)

« To exploit scientific publications from global research for TDM purposes, the ISTEX platform enriched its data with value-added information to … Continuer la lecture de « An Experiment in Annotating Animal Species Names from ISTEX Resources (.pdf) »

Source > aclweb.org, Sabine Barreaux, Dominique Besagni, Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020), pages 4509–4513Marseille, 11–16 May 2020

Research Libraries: How You Can Support Text and Data Mining

« Europe’s incoming Directive on Copyright in the Digital Single Market contains two new exceptions allowing text and data mining (TDM). … Continuer la lecture de « Research Libraries: How You Can Support Text and Data Mining »

Source > libereurope.eu, 7 mai 2020

Visualiser la recherche sur le coronavirus en un coup d’œil

« L’Institut des systèmes complexes de Paris Île-de-France a publié plusieurs cartes construites à partir de l’analyse automatisée de toutes les … Continuer la lecture de « Visualiser la recherche sur le coronavirus en un coup d’œil »

Source > lejournal.cnrs.fr, Julien Bourdet, 22 avril 2020

Plongez au cœur d’ISTEX grâce à ses enrichissements

« (…) l’équipe ISTEX vous invite à retrouver, dans la dernière version de sa documentation “Usage TDM d’ISTEX”, les éléments vous … Continuer la lecture de « Plongez au cœur d’ISTEX grâce à ses enrichissements »

Source > blog.istex.fr, Camille De Salabert, 30 mars 2020

Webinar Video: How Can Libraries Support TDM?

« In this webinar, held on 12 March 2020 and organised by LIBER’s Copyright & Legal Matters Working Group, two LIBER libraries … Continuer la lecture de « Webinar Video: How Can Libraries Support TDM? »

Source > libereurope.eu, 12 mars 2020

Europe’s TDM Exception for Research: Will It Be Undermined By Technical Blocking From Publishers?

« A mandatory exception for Text and Data Mining (TDM) for research, included in Europe’s new Directive on Copyright in the … Continuer la lecture de « Europe’s TDM Exception for Research: Will It Be Undermined By Technical Blocking From Publishers? »

Source > libereurope.eu, 10 mars 2020

LIBER Webinar: How Can Libraries Support TDM?

« Europe’s new Copyright Directive includes a mandatory text and data mining (TDM) exception for non-commercial research. This opens up new … Continuer la lecture de « LIBER Webinar: How Can Libraries Support TDM? »

Source > anymeeting.com, février 2020

La fouille de textes aujourd’hui…et demain ? résultats de l’enquête

« (…) La fouille de textes est pratiquée aussi bien par des non spécialistes utilisant la fouille de textes de façon … Continuer la lecture de « La fouille de textes aujourd’hui…et demain ? résultats de l’enquête »

Source > visatm.inist.fr, Fabienne Kettani, 7 février 2020

Analyse comparative de huit plateformes étrangères de diffusion de revues scientifiques

« Effectuée pour le compte du Comité de suivi de l’édition scientifique (CSES), cette étude présente une analyse comparative de huit … Continuer la lecture de « Analyse comparative de huit plateformes étrangères de diffusion de revues scientifiques »

Source > enseignementsup-recherche.gouv.fr, 30 janvier 2020

Formation : fouille de textes à travers l’exploitation des corpus istex

« La fouille de textes et de données (TDM)  est aujourd’hui un enjeu majeur pour la recherche et pour la documentation. … Continuer la lecture de « Formation : fouille de textes à travers l’exploitation des corpus istex »

Source > inist.fr, 22 janvier 2020

TextMine’20 – Atelier sur la Fouille de Textes – Conférence EGC (Extraction et Gestion des Connaissances), 28 janvier 2020, Bruxelles (.pdf)

« La fouille de textes couvre de multiples domaines comme, le traitement automatique des langues, l’intelligence artificielle, la linguistique, les statistiques, … Continuer la lecture de « TextMine’20 – Atelier sur la Fouille de Textes – Conférence EGC (Extraction et Gestion des Connaissances), 28 janvier 2020, Bruxelles (.pdf) »

Source > vincentlemaire-labs.fr, Pascal Cuxac, Vincent Lemaire, janvier 2020

Springer Nature and OpenAIRE collaborate to further Open Science

« Starting immediately, Springer Nature will provide OpenAIRE, an EU organisation that facilitates openness in scholarly communication, access to its full-text … Continuer la lecture de « Springer Nature and OpenAIRE collaborate to further Open Science »

Source > openaire.eu, 27 janvier 2020

Recommandations sur l’analyse automatique de documents : acquisition, gestion, exploration

« Le groupe de travail « Fouille de textes et analyse de données » du Comité pour la science ouverte émet des recommandations … Continuer la lecture de « Recommandations sur l’analyse automatique de documents : acquisition, gestion, exploration »

Source > ouvrirlascience.fr, mise en ligne, 6 janvier 2020

A brief analysis of Opscidia’s survey on scientific publishing

« (…) A quite diverse panel of respondents We were very happy to have 362 responders from all around the world. … Continuer la lecture de « A brief analysis of Opscidia’s survey on scientific publishing »

Source > opscidia.com, 20 décembre 2019

Text and Data Quality Mining in CRIS

« (…) This present paper deploys TDM in CRIS to analyze, quantify, and correct the unstructured data and its quality issues. … Continuer la lecture de « Text and Data Quality Mining in CRIS »

Source > mdpi.com, Otmane Azeroual, Information 2019, 10(12), 374; https://doi.org/10.3390/info10120374

LIBER and Communia Launch Joint Guidelines on Text and Data Mining

« The LIBER-Communia guidelines come in addition to detailed library guidelines on the Digital Single Market Directive, published last week by … Continuer la lecture de « LIBER and Communia Launch Joint Guidelines on Text and Data Mining »

Source > libereurope.eu/, 2 décembre 2019

Les ateliers de Visa TM Day

« Les ateliers prospectifs autour de “quelle infrastructure de service de fouille de textes pour demain” ont permis de faire émerger … Continuer la lecture de « Les ateliers de Visa TM Day »

Source > visatm.inist.fr, Marie-Sophie Nourdin, 26 novembre 2019

Rapports publics du projet Visa TM

(…) Les principaux résultats de Visa TM portent sur : l’étude de la création d’une e-infrastructure de fouille de textes … Continuer la lecture de « Rapports publics du projet Visa TM »

Source > visatm.inist.fr, Marie-Sophie Nourdin, 18 novembre 2019

OPEN SCIENCE : 3 questions à Sylvain Massip PDG et fondateur d’Opscidia

« (…) « Opscidia est une toute jeune société qui promeut l’open access pour les publications scientifiques. Notre pari est que … Continuer la lecture de « OPEN SCIENCE : 3 questions à Sylvain Massip PDG et fondateur d’Opscidia »

Source > inria-alumni.fr, 5 novembre 2019

Copyright as an Obstacle or an Enabler? A European Perspective on Text and Data Mining and Its Role in the Development of AI Creativity

« (…) This contribution discusses the interplay between TDM and AI creativity by focusing, first, on the potential and technicalities of … Continuer la lecture de « Copyright as an Obstacle or an Enabler? A European Perspective on Text and Data Mining and Its Role in the Development of AI Creativity »

Source > papers.ssrn.com, Eleonora Rosati, (September 12, 2019). Asia Pacific Law Review. Available at SSRN: https://ssrn.com/abstract=3452376

#VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining

« Dans le cadre du projet Visa TM du Comité pour la Science Ouverte, un « Visa TM Day » sera organisé … Continuer la lecture de « #VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining »

Source > inist.fr, 25 septembre 2019

Galaxy server for complex TDM analysis – Part 1

« Galaxy is an open source, web-based platform for data-intensive analysis. Founded for biomedical research, today galaxy can also be applied … Continuer la lecture de « Galaxy server for complex TDM analysis – Part 1 »

Source > visatm.inist.fr, Olha Nahorna, 13 septembre 2019

Using Transkribus for automated text recognition of historical Bengali Books

« Are you working with digitised printed collections that you want to ‘unlock’ for keyword search and text mining? Maybe you … Continuer la lecture de « Using Transkribus for automated text recognition of historical Bengali Books »

Source > blogs.bl.uk, Tom Derrick, 30 aout 2019

The Right to Read is the Right To Mine: But Not When Blocked by Technical Protection Measures

(…) Our Copyright & Legal Matters Working Group is working with LACA to gather evidence about what happens when Technical … Continuer la lecture de « The Right to Read is the Right To Mine: But Not When Blocked by Technical Protection Measures »

Source > libereurope.eu, 1er aout 2019

Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 4 – 8, 2019 – Anchorage, Alaska – USA

« The annual ACM SIGKDD Conference is the premier international forum for data mining researchers and practitioners from academia, industry, and … Continuer la lecture de « Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 4 – 8, 2019 – Anchorage, Alaska – USA »

Source > dl.acm.org, Ankur Teredesai, Vipin Kumar, Ying Li, Rómer Rosales, Evimaria Terzi, George Karypis, aout 2019

Gerrish, Charlotte. « European Copyright Law and the Text and Data Mining Exceptions and Limitations » [thesis]

« We are in a digital age with Big Data at the heart of our global online environment. Exploiting Big Data … Continuer la lecture de « Gerrish, Charlotte. « European Copyright Law and the Text and Data Mining Exceptions and Limitations » [thesis] »

Source > diva-portal.org, Gerrish, Charlotte, Supervisors, Szkalej, Kacper, Doktorand, Examiners Wolk, Sanna, Professor, Uppsala University, URN: urn:nbn:se:uu:diva-385195, OAI: oai:DiVA.org:uu-385195, DiVA, id: diva2:1323355, 1 er juillet 2019

Proceedings of the International Conference on Process Mining (ICPM) Demo Track, Aachen, Germany, June 24-26, 2019

« This proceedings volume collects the papers presented at the ICPM DemoTrack 2019, which was part of the 1st International Conference … Continuer la lecture de « Proceedings of the International Conference on Process Mining (ICPM) Demo Track, Aachen, Germany, June 24-26, 2019 »

Source > ceur-ws.org, Andrea Burattin, Artem Polyvyanyy, Sebastiaan van Zelst, CEUR Workshop Proceedings, Vol-2374 urn:nbn:de:0074-2374-1

Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities

« Istex is a database of twenty million full text scientific papers bought by the French Government for the use of … Continuer la lecture de « Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities »

Source > mdpi.com, Maurel, Denis, Morale, Enza, Thouvenin, Nicolas, Ringot, Patrice, Turri, Angel, Information 2019, 10, 178, ; https://doi.org/10.3390/info10050178

Atelier ISTEX à Nancy le mardi 18 juin

« Ces ateliers vous permettront de prendre en main les services et les outils de constitution, de visualisation et d’exploration d’un … Continuer la lecture de « Atelier ISTEX à Nancy le mardi 18 juin »

Source > inist.fr, 13 mai 2019

BIR 2019 / 8th International Workshop on Bibliometric-enhanced Information Retrieval* – Cologne, Germany, April 14th, 2019 [book of proceedings]

*co-located with the 41st European Conference on Information Retrieval (ECIR 2019) « The Bibliometric-enhanced Information Retrieval workshop series (BIR) at ECIR … Continuer la lecture de « BIR 2019 / 8th International Workshop on Bibliometric-enhanced Information Retrieval* – Cologne, Germany, April 14th, 2019 [book of proceedings] »

Source > ceur-ws.org, Guillaume Cabanac, Ingo Frommholz, Philipp Mayr,CEUR Workshop Proceedings Vol-2345, urn:nbn:de:0074-2345-4

Blog #VisaTM : Recensement d’outils de fouille de textes

« Dans le cadre du volet Étude du projet VisaTM, nous avons réalisé un recensement d’outils de fouille de textes. Le … Continuer la lecture de « Blog #VisaTM : Recensement d’outils de fouille de textes »

Source > visatm.inist.fr, Frank Arnould, 11 avril 2019

A Hybrid Information Extraction Approach Exploiting Structured Data Within a Text Mining Process

« Many data sets encompass structured data fields with embedded free text fields. The text fields allow customers and workers to … Continuer la lecture de « A Hybrid Information Extraction Approach Exploiting Structured Data Within a Text Mining Process »

Source > dl.gi.de/handle, Kiefer, C., Reimann, P. & Mitschang, B., In: Grust, T., Naumann, F., Böhm, A. et al, BTW 2019. Gesellschaft für Informatik, Bonn. (S. 149-168)

TOTh 2019 Terminology & Ontology: Theories and applications, 6 -7 June 2019, Campus Scientifique – Le Bourget du Lac – France

« The 13th TOTh International Conference will be held on Thursday 6th and Friday 7th of June 2019 at the Scientific … Continuer la lecture de « TOTh 2019 Terminology & Ontology: Theories and applications, 6 -7 June 2019, Campus Scientifique – Le Bourget du Lac – France »

Source > toth.condillac.org, 2019

Europe’s ability to lead in AI will be helped by the new TDM exception

« EARE welcomes the decision from EU institutions to enable all Europeans – public researchers and commercial entities – to benefit … Continuer la lecture de « Europe’s ability to lead in AI will be helped by the new TDM exception »

Source > eare.eu, 29 mars 2019

Le Parlement approuve de nouvelles règles sur le droit d’auteur sur internet

« (…) Les députés ont adopté la directive en plénière par 348 voix pour, 274 contre et 36 abstentions. Cela marque … Continuer la lecture de « Le Parlement approuve de nouvelles règles sur le droit d’auteur sur internet »

Source > europarl.europa.eu, 26 mars 2019

LIBER welcomes final compromise text for the European Union’s Directive on Copyright in the Digital Single Market

« LIBER welcomes news that negotiators from the European Parliament and the Council have agreed a final compromise text for the … Continuer la lecture de « LIBER welcomes final compromise text for the European Union’s Directive on Copyright in the Digital Single Market »

Source > libereurope.eu, 14 février 2019