Une ontologie des outils de fouille de textes

« Au cours du projet VisaTM, nous avions produit une liste de trois cents outils spécialisés dans le traitement automatique du … Continuer la lecture de « Une ontologie des outils de fouille de textes »

Source > objectif-tdm.inist.fr, Fabienne Kettani, Frank Arnould, 5 aout 2020

Détecter l’émergence de la prochaine maladie X

« L’émergence du Covid-19, fin décembre 2019, a été repérée en ligne par certains systèmes de surveillance. Noyés sous une montagne … Continuer la lecture de « Détecter l’émergence de la prochaine maladie X »

Source > cirad.fr, 20 juillet 2020

Blog Objectif-TDM

« De Visa-tm à Objectif-TDM Un blog avait été ouvert à l’initiative de l’Inist afin de communiquer sur le projet VisaTM … Continuer la lecture de « Blog Objectif-TDM »

Source > inist.fr, 1er juillet 2020

#openVirus – Knowledge in the Hands of Citizens

« openVirus is innovating new types of search for research literature using data mining technologies to enable citizens to make use … Continuer la lecture de « #openVirus – Knowledge in the Hands of Citizens »

Source > genr.eu, 23 juin 2020, DOI 10.25815/18ph-6j92

JEP-TALN-RECITAL 2020 – Nancy, 8-19 juin 2020 [actes de la conférence]

« La conférence JEP-TALN-RECITAL, organisée par le Loria, l’ATILF et l’INIST, s’est déroulée du 8 au 19 juin en mode virtuel. … Continuer la lecture de « JEP-TALN-RECITAL 2020 – Nancy, 8-19 juin 2020 [actes de la conférence] »

Source > jep-taln2020.loria.fr, juin 2020

Beethoven250@ISTEX : écouter Beethoven autrement

« (…) Pour rendre hommage à ce grand musicien en cette année 2020, l’équipe ISTEX a souhaité créer une collection de … Continuer la lecture de « Beethoven250@ISTEX : écouter Beethoven autrement »

Source > blog.istex.fr, Camille De Salabert, 8 juin 2020

An Experiment in Annotating Animal Species Names from ISTEX Resources (.pdf)

« To exploit scientific publications from global research for TDM purposes, the ISTEX platform enriched its data with value-added information to … Continuer la lecture de « An Experiment in Annotating Animal Species Names from ISTEX Resources (.pdf) »

Source > aclweb.org, Sabine Barreaux, Dominique Besagni, Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020), pages 4509–4513Marseille, 11–16 May 2020

Research Libraries: How You Can Support Text and Data Mining

« Europe’s incoming Directive on Copyright in the Digital Single Market contains two new exceptions allowing text and data mining (TDM). … Continuer la lecture de « Research Libraries: How You Can Support Text and Data Mining »

Source > libereurope.eu, 7 mai 2020

Visualiser la recherche sur le coronavirus en un coup d’œil

« L’Institut des systèmes complexes de Paris Île-de-France a publié plusieurs cartes construites à partir de l’analyse automatisée de toutes les … Continuer la lecture de « Visualiser la recherche sur le coronavirus en un coup d’œil »

Source > lejournal.cnrs.fr, Julien Bourdet, 22 avril 2020

Plongez au cœur d’ISTEX grâce à ses enrichissements

« (…) l’équipe ISTEX vous invite à retrouver, dans la dernière version de sa documentation “Usage TDM d’ISTEX”, les éléments vous … Continuer la lecture de « Plongez au cœur d’ISTEX grâce à ses enrichissements »

Source > blog.istex.fr, Camille De Salabert, 30 mars 2020

Webinar Video: How Can Libraries Support TDM?

« In this webinar, held on 12 March 2020 and organised by LIBER’s Copyright & Legal Matters Working Group, two LIBER libraries … Continuer la lecture de « Webinar Video: How Can Libraries Support TDM? »

Source > libereurope.eu, 12 mars 2020

Europe’s TDM Exception for Research: Will It Be Undermined By Technical Blocking From Publishers?

« A mandatory exception for Text and Data Mining (TDM) for research, included in Europe’s new Directive on Copyright in the … Continuer la lecture de « Europe’s TDM Exception for Research: Will It Be Undermined By Technical Blocking From Publishers? »

Source > libereurope.eu, 10 mars 2020

LIBER Webinar: How Can Libraries Support TDM?

« Europe’s new Copyright Directive includes a mandatory text and data mining (TDM) exception for non-commercial research. This opens up new … Continuer la lecture de « LIBER Webinar: How Can Libraries Support TDM? »

Source > anymeeting.com, février 2020

La fouille de textes aujourd’hui…et demain ? résultats de l’enquête

« (…) La fouille de textes est pratiquée aussi bien par des non spécialistes utilisant la fouille de textes de façon … Continuer la lecture de « La fouille de textes aujourd’hui…et demain ? résultats de l’enquête »

Source > visatm.inist.fr, Fabienne Kettani, 7 février 2020

Analyse comparative de huit plateformes étrangères de diffusion de revues scientifiques

« Effectuée pour le compte du Comité de suivi de l’édition scientifique (CSES), cette étude présente une analyse comparative de huit … Continuer la lecture de « Analyse comparative de huit plateformes étrangères de diffusion de revues scientifiques »

Source > enseignementsup-recherche.gouv.fr, 30 janvier 2020

Formation : fouille de textes à travers l’exploitation des corpus istex

« La fouille de textes et de données (TDM)  est aujourd’hui un enjeu majeur pour la recherche et pour la documentation. … Continuer la lecture de « Formation : fouille de textes à travers l’exploitation des corpus istex »

Source > inist.fr, 22 janvier 2020

TextMine’20 – Atelier sur la Fouille de Textes – Conférence EGC (Extraction et Gestion des Connaissances), 28 janvier 2020, Bruxelles (.pdf)

« La fouille de textes couvre de multiples domaines comme, le traitement automatique des langues, l’intelligence artificielle, la linguistique, les statistiques, … Continuer la lecture de « TextMine’20 – Atelier sur la Fouille de Textes – Conférence EGC (Extraction et Gestion des Connaissances), 28 janvier 2020, Bruxelles (.pdf) »

Source > vincentlemaire-labs.fr, Pascal Cuxac, Vincent Lemaire, janvier 2020

Springer Nature and OpenAIRE collaborate to further Open Science

« Starting immediately, Springer Nature will provide OpenAIRE, an EU organisation that facilitates openness in scholarly communication, access to its full-text … Continuer la lecture de « Springer Nature and OpenAIRE collaborate to further Open Science »

Source > openaire.eu, 27 janvier 2020

Recommandations sur l’analyse automatique de documents : acquisition, gestion, exploration

« Le groupe de travail « Fouille de textes et analyse de données » du Comité pour la science ouverte émet des recommandations … Continuer la lecture de « Recommandations sur l’analyse automatique de documents : acquisition, gestion, exploration »

Source > ouvrirlascience.fr, mise en ligne, 6 janvier 2020

A brief analysis of Opscidia’s survey on scientific publishing

« (…) A quite diverse panel of respondents We were very happy to have 362 responders from all around the world. … Continuer la lecture de « A brief analysis of Opscidia’s survey on scientific publishing »

Source > opscidia.com, 20 décembre 2019

Text and Data Quality Mining in CRIS

« (…) This present paper deploys TDM in CRIS to analyze, quantify, and correct the unstructured data and its quality issues. … Continuer la lecture de « Text and Data Quality Mining in CRIS »

Source > mdpi.com, Otmane Azeroual, Information 2019, 10(12), 374; https://doi.org/10.3390/info10120374

LIBER and Communia Launch Joint Guidelines on Text and Data Mining

« The LIBER-Communia guidelines come in addition to detailed library guidelines on the Digital Single Market Directive, published last week by … Continuer la lecture de « LIBER and Communia Launch Joint Guidelines on Text and Data Mining »

Source > libereurope.eu/, 2 décembre 2019

Les ateliers de Visa TM Day

« Les ateliers prospectifs autour de “quelle infrastructure de service de fouille de textes pour demain” ont permis de faire émerger … Continuer la lecture de « Les ateliers de Visa TM Day »

Source > visatm.inist.fr, Marie-Sophie Nourdin, 26 novembre 2019

Rapports publics du projet Visa TM

(…) Les principaux résultats de Visa TM portent sur : l’étude de la création d’une e-infrastructure de fouille de textes … Continuer la lecture de « Rapports publics du projet Visa TM »

Source > visatm.inist.fr, Marie-Sophie Nourdin, 18 novembre 2019

OPEN SCIENCE : 3 questions à Sylvain Massip PDG et fondateur d’Opscidia

« (…) « Opscidia est une toute jeune société qui promeut l’open access pour les publications scientifiques. Notre pari est que … Continuer la lecture de « OPEN SCIENCE : 3 questions à Sylvain Massip PDG et fondateur d’Opscidia »

Source > inria-alumni.fr, 5 novembre 2019

Copyright as an Obstacle or an Enabler? A European Perspective on Text and Data Mining and Its Role in the Development of AI Creativity

« (…) This contribution discusses the interplay between TDM and AI creativity by focusing, first, on the potential and technicalities of … Continuer la lecture de « Copyright as an Obstacle or an Enabler? A European Perspective on Text and Data Mining and Its Role in the Development of AI Creativity »

Source > papers.ssrn.com, Eleonora Rosati, (September 12, 2019). Asia Pacific Law Review. Available at SSRN: https://ssrn.com/abstract=3452376

#VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining

« Dans le cadre du projet Visa TM du Comité pour la Science Ouverte, un « Visa TM Day » sera organisé … Continuer la lecture de « #VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining »

Source > inist.fr, 25 septembre 2019

Galaxy server for complex TDM analysis – Part 1

« Galaxy is an open source, web-based platform for data-intensive analysis. Founded for biomedical research, today galaxy can also be applied … Continuer la lecture de « Galaxy server for complex TDM analysis – Part 1 »

Source > visatm.inist.fr, Olha Nahorna, 13 septembre 2019

Using Transkribus for automated text recognition of historical Bengali Books

« Are you working with digitised printed collections that you want to ‘unlock’ for keyword search and text mining? Maybe you … Continuer la lecture de « Using Transkribus for automated text recognition of historical Bengali Books »

Source > blogs.bl.uk, Tom Derrick, 30 aout 2019

The Right to Read is the Right To Mine: But Not When Blocked by Technical Protection Measures

(…) Our Copyright & Legal Matters Working Group is working with LACA to gather evidence about what happens when Technical … Continuer la lecture de « The Right to Read is the Right To Mine: But Not When Blocked by Technical Protection Measures »

Source > libereurope.eu, 1er aout 2019

Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 4 – 8, 2019 – Anchorage, Alaska – USA

« The annual ACM SIGKDD Conference is the premier international forum for data mining researchers and practitioners from academia, industry, and … Continuer la lecture de « Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 4 – 8, 2019 – Anchorage, Alaska – USA »

Source > dl.acm.org, Ankur Teredesai, Vipin Kumar, Ying Li, Rómer Rosales, Evimaria Terzi, George Karypis, aout 2019

Gerrish, Charlotte. « European Copyright Law and the Text and Data Mining Exceptions and Limitations » [thesis]

« We are in a digital age with Big Data at the heart of our global online environment. Exploiting Big Data … Continuer la lecture de « Gerrish, Charlotte. « European Copyright Law and the Text and Data Mining Exceptions and Limitations » [thesis] »

Source > diva-portal.org, Gerrish, Charlotte, Supervisors, Szkalej, Kacper, Doktorand, Examiners Wolk, Sanna, Professor, Uppsala University, URN: urn:nbn:se:uu:diva-385195, OAI: oai:DiVA.org:uu-385195, DiVA, id: diva2:1323355, 1 er juillet 2019

Proceedings of the International Conference on Process Mining (ICPM) Demo Track, Aachen, Germany, June 24-26, 2019

« This proceedings volume collects the papers presented at the ICPM DemoTrack 2019, which was part of the 1st International Conference … Continuer la lecture de « Proceedings of the International Conference on Process Mining (ICPM) Demo Track, Aachen, Germany, June 24-26, 2019 »

Source > ceur-ws.org, Andrea Burattin, Artem Polyvyanyy, Sebastiaan van Zelst, CEUR Workshop Proceedings, Vol-2374 urn:nbn:de:0074-2374-1

Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities

« Istex is a database of twenty million full text scientific papers bought by the French Government for the use of … Continuer la lecture de « Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities »

Source > mdpi.com, Maurel, Denis, Morale, Enza, Thouvenin, Nicolas, Ringot, Patrice, Turri, Angel, Information 2019, 10, 178, ; https://doi.org/10.3390/info10050178

Atelier ISTEX à Nancy le mardi 18 juin

« Ces ateliers vous permettront de prendre en main les services et les outils de constitution, de visualisation et d’exploration d’un … Continuer la lecture de « Atelier ISTEX à Nancy le mardi 18 juin »

Source > inist.fr, 13 mai 2019

BIR 2019 / 8th International Workshop on Bibliometric-enhanced Information Retrieval* – Cologne, Germany, April 14th, 2019 [book of proceedings]

*co-located with the 41st European Conference on Information Retrieval (ECIR 2019) « The Bibliometric-enhanced Information Retrieval workshop series (BIR) at ECIR … Continuer la lecture de « BIR 2019 / 8th International Workshop on Bibliometric-enhanced Information Retrieval* – Cologne, Germany, April 14th, 2019 [book of proceedings] »

Source > ceur-ws.org, Guillaume Cabanac, Ingo Frommholz, Philipp Mayr,CEUR Workshop Proceedings Vol-2345, urn:nbn:de:0074-2345-4

Blog #VisaTM : Recensement d’outils de fouille de textes

« Dans le cadre du volet Étude du projet VisaTM, nous avons réalisé un recensement d’outils de fouille de textes. Le … Continuer la lecture de « Blog #VisaTM : Recensement d’outils de fouille de textes »

Source > visatm.inist.fr, Frank Arnould, 11 avril 2019

A Hybrid Information Extraction Approach Exploiting Structured Data Within a Text Mining Process

« Many data sets encompass structured data fields with embedded free text fields. The text fields allow customers and workers to … Continuer la lecture de « A Hybrid Information Extraction Approach Exploiting Structured Data Within a Text Mining Process »

Source > dl.gi.de/handle, Kiefer, C., Reimann, P. & Mitschang, B., In: Grust, T., Naumann, F., Böhm, A. et al, BTW 2019. Gesellschaft für Informatik, Bonn. (S. 149-168)

TOTh 2019 Terminology & Ontology: Theories and applications, 6 -7 June 2019, Campus Scientifique – Le Bourget du Lac – France

« The 13th TOTh International Conference will be held on Thursday 6th and Friday 7th of June 2019 at the Scientific … Continuer la lecture de « TOTh 2019 Terminology & Ontology: Theories and applications, 6 -7 June 2019, Campus Scientifique – Le Bourget du Lac – France »

Source > toth.condillac.org, 2019

Europe’s ability to lead in AI will be helped by the new TDM exception

« EARE welcomes the decision from EU institutions to enable all Europeans – public researchers and commercial entities – to benefit … Continuer la lecture de « Europe’s ability to lead in AI will be helped by the new TDM exception »

Source > eare.eu, 29 mars 2019

Le Parlement approuve de nouvelles règles sur le droit d’auteur sur internet

« (…) Les députés ont adopté la directive en plénière par 348 voix pour, 274 contre et 36 abstentions. Cela marque … Continuer la lecture de « Le Parlement approuve de nouvelles règles sur le droit d’auteur sur internet »

Source > europarl.europa.eu, 26 mars 2019

LIBER welcomes final compromise text for the European Union’s Directive on Copyright in the Digital Single Market

« LIBER welcomes news that negotiators from the European Parliament and the Council have agreed a final compromise text for the … Continuer la lecture de « LIBER welcomes final compromise text for the European Union’s Directive on Copyright in the Digital Single Market »

Source > libereurope.eu, 14 février 2019

2014 copyright changes: post-implementation reviews Call for Evidence

« Following the implementation of policy, the Government aims to complete a post-implementation review (PIR). These reviews evaluate whether the regulation … Continuer la lecture de « 2014 copyright changes: post-implementation reviews Call for Evidence »

Source > gov.uk, 30 janvier 2019

EGC 2019 – 19ème conférence francophone sur l’Extraction et la Gestion des Connaissances – 21 au 25 janvier 2019 – Metz [actes de conférence]

« (…) La conférence Extraction et Gestion de Connaissances (EGC) est le rendez-vous annuel de chercheurs et praticiens travaillant dans les … Continuer la lecture de « EGC 2019 – 19ème conférence francophone sur l’Extraction et la Gestion des Connaissances – 21 au 25 janvier 2019 – Metz [actes de conférence] »

Source > editions-rnti.fr, Revue des Nouvelles Technologies de l'Information vol.RNTI-E-35, 2019

Mémoire de Portage au Comité INDU sur l’exploration de textes et de données

« Portage se réjouit de l’occasion qui lui est donnée d’apporter une contribution à l’examen de la Loi sur le droit … Continuer la lecture de « Mémoire de Portage au Comité INDU sur l’exploration de textes et de données »

Source > portagenetwork.ca, 11 janvier 2019

Questionnaire : la fouille de textes aujourd’hui…et demain ?

« Ce questionnaire vise à qualifier les pratiques autour de la fouille de texte et à identifier les verrous et les … Continuer la lecture de « Questionnaire : la fouille de textes aujourd’hui…et demain ? »

Source > inist.fr, 17 janvier 2019

Text data mining and data quality management for research information systems in the context of open data and open science

 » (…) Using text data mining, the quality of the metadata is analyzed and this identifies the entities and general … Continuer la lecture de « Text data mining and data quality management for research information systems in the context of open data and open science »

Source > arxiv.org, Otmane Azeroual, Gunter Saake, Mohammad Abuosba, Joachim Schöpfel, 11 décembre 2018, arXiv:1812.04298

Voyant Tools. Analyse automatique de texte et text mining

« Voyant Tools est un puissant outil d’analyse automatique de texte. Un analyseur de textes open source qui va vous surprendre … Continuer la lecture de « Voyant Tools. Analyse automatique de texte et text mining »

Source > outilstice.com, Fidel Navamuel, 9 novembre 2018

A Text Mining Pipeline Using Active and Deep Learning Aimed at Curating Information in Computational Neuroscience

« The curation of neuroscience entities is crucial to ongoing efforts in neuroinformatics and computational neuroscience, such as those being deployed … Continuer la lecture de « A Text Mining Pipeline Using Active and Deep Learning Aimed at Curating Information in Computational Neuroscience »

Source > link.springer.com, Shardlow, M., Ju, M., Li, M. et al., Neuroinform (2018). https://doi.org/10.1007/s12021-018-9404-y

LIBER has signed an open letter calling for a broad and mandatory Text and Data Mining exception, in order to guarantee that European research and innovation can thrive

« LIBER has signed an open letter calling for a broad and mandatory Text and Data Mining exception, in order to … Continuer la lecture de « LIBER has signed an open letter calling for a broad and mandatory Text and Data Mining exception, in order to guarantee that European research and innovation can thrive »

Source > libereurope.eu, 13 novembre 2018

Japan amends its copyright legislation to meet future demands in AI and Big Data

« In May this year, Japan’s National Diet approved a legislation for updating its “Copyright Act”[1], a reform that focused on … Continuer la lecture de « Japan amends its copyright legislation to meet future demands in AI and Big Data »

Source > eare.eu, 2018

Text Mining with the HathiTrust & Empowering Librarians to Support Digital Scholarships [video]

« Arm librarians with instructional content and tools in digital scholarships and digital humanities. Enable librarians to build foundations for digital … Continuer la lecture de « Text Mining with the HathiTrust & Empowering Librarians to Support Digital Scholarships [video] »

Source > loc.gov, EVENT DATE: 2018/08/08

Directive sur le droit d’auteur : vers un accord d’ici la fin décembre 2018 ?

« (…) Selon l’eurodéputée Julia Reda, très impliquée sur ce dossier, le prochain trilogue doit avoir lieu le 25 octobre. Outre … Continuer la lecture de « Directive sur le droit d’auteur : vers un accord d’ici la fin décembre 2018 ? »

Source > numerama.com, Julien Lausson, 10 octobre 2018

Projet de directive européenne sur le droit d’auteur : garantir le libre accès aux résultats de la recherche

« En tant que présidents d’organismes de recherche et d’établissements d’enseignement supérieur et de recherche français nous souhaitons rappeler que la … Continuer la lecture de « Projet de directive européenne sur le droit d’auteur : garantir le libre accès aux résultats de la recherche »

Source > cpu.fr, 5 octobre 2018

National Centre for Text Mining (NaCTeM): Keynote talk at Journées pour la science ouverte

« Prof. Sophia Ananiadou, director of NaCTeM, has been invited to give a keynote talk at the Journées pour la science … Continuer la lecture de « National Centre for Text Mining (NaCTeM): Keynote talk at Journées pour la science ouverte »

Source > nactem.ac.uk, 2 octobre 2018

HathiTrust Research Center Extends Non-Consumptive Research Tools to Copyrighted Materials: Expanding Research through Fair Use

« HathiTrust has reached a tremendous milestone in the history of HathiTrust and the HathiTrust Research Center’s services. Since 2011, HTRC … Continuer la lecture de « HathiTrust Research Center Extends Non-Consumptive Research Tools to Copyrighted Materials: Expanding Research through Fair Use »

Source > hathitrust.org, jbelle, 20 septembre 2018

Emmanuel Le Roy Ladurie, précurseur du data mining ?

« En affirmant dès la fin des années 1960 que « les historiens seront programmeurs ou ne seront plus »1, Emmanuel … Continuer la lecture de « Emmanuel Le Roy Ladurie, précurseur du data mining ? »

Source > bnf.hypotheses.org, Olivier Jacquot, 14 septembre 2018