« L’équipe Bibliome développe des méthodes d’extraction et de formalisation d’information à partir de textes écrits. Ces méthodes identifient et formalisent … Continuer la lecture de « BIBLIOME : Acquisition et Formalisation de Connaissances à partir de Textes »
Data.Istex : une autre vision d’ISTEX
« Data.Istex est une vision d’ISTEX élaborée pour la fouille de texte et pour le web de données. Découvrez sa vidéo … Continuer la lecture de « Data.Istex : une autre vision d’ISTEX »
Source > inist.fr, 14 janvier 2021
Intelligence artificielle et technologies des langues : l’ordinateur passe la barrière de la langue. 12 janvier 2021 [vidéos]
« Cette journée propose un tour d’horizon des récentes avancées des technologies des langues pour des applications au cœur de notre … Continuer la lecture de « Intelligence artificielle et technologies des langues : l’ordinateur passe la barrière de la langue. 12 janvier 2021 [vidéos] »
Formation : fouille de textes à travers l’exploitation des corpus ISTEX, 7 et 8 avril 2021
« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation. … Continuer la lecture de « Formation : fouille de textes à travers l’exploitation des corpus ISTEX, 7 et 8 avril 2021 »
The evolutionary pattern of language in scientific writings: A case study of Philosophical Transactions of Royal Society (1665–1869)
« Scientific writings, as one essential part of human culture, have evolved over centuries into their current form. Knowing how scientific … Continuer la lecture de « The evolutionary pattern of language in scientific writings: A case study of Philosophical Transactions of Royal Society (1665–1869) »
CNRS : Invitation à la journée « Intelligence artificielle : l’ordinateur passe la barrière de la langue ». 12 janvier 2021
« Le traitement automatique des langues est une discipline de l’informatique mettant en œuvre des techniques et des outils de l’intelligence … Continuer la lecture de « CNRS : Invitation à la journée « Intelligence artificielle : l’ordinateur passe la barrière de la langue ». 12 janvier 2021 »
Source > cnrs.fr, 4 janvier 2021
Clément Dalloux . « Fouille de texte et extraction d’informations dans les données cliniques » [thèse]
« Avec la mise en place d’entrepôts de données cliniques, de plus en plus de données de santé sont disponibles pour … Continuer la lecture de « Clément Dalloux . « Fouille de texte et extraction d’informations dans les données cliniques » [thèse] »
Mission du CSPLA sur les exceptions de fouille de textes et de données (« text and data mining ») [rapport]
« La mission confiée en juin 2020 à Mme Alexandra Bensamoun, professeure des universités, et à M. Yohann Bouquerel, maître des … Continuer la lecture de « Mission du CSPLA sur les exceptions de fouille de textes et de données (« text and data mining ») [rapport] »
Accelerating Text Mining Using Domain-Specific Stop Word Lists
« (…) In this paper, we present a novel mathematical approach for the automatic extraction of domain-specific words called the hyperplane-based … Continuer la lecture de « Accelerating Text Mining Using Domain-Specific Stop Word Lists »
Source > arxiv.org, Farah Alshanik, Amy Apon, Alexander Herzog, Ilya Safro, Justin Sybrandt, 18 novembre 2020
From Data Collection to Text Interpretation. An interview on exploring techniques and use cases for text mining
« Meet two text mining experts in today’s interview, which explores some of the common issues faced by data scientists in … Continuer la lecture de « From Data Collection to Text Interpretation. An interview on exploring techniques and use cases for text mining »
Source > datasciencecentral.com, Rosaria Silipo, 15 novembre 2020
PubSqueezer: A Text-Mining Web Tool to Transform Unstructured Documents into Structured Data
« (…) In this work, I present a web tool which uses a Text Mining strategy to transform large collections of … Continuer la lecture de « PubSqueezer: A Text-Mining Web Tool to Transform Unstructured Documents into Structured Data »
Source > arxiv.org, Alberto Calderone Dr., 9 novembre 2020 arXiv:2011.03123v2
Colloque Sciences Ouvertes 2020 – Prendre soin de ses données et les valoriser – Université de Lorraine – 8 octobre 2020
« L’Université organise le jeudi 8 octobre sa troisième journée annuelle de séminaire autour de la science ouverte, consacrée cette année … Continuer la lecture de « Colloque Sciences Ouvertes 2020 – Prendre soin de ses données et les valoriser – Université de Lorraine – 8 octobre 2020 »
Research Trends in Text Mining: Semantic Network and Main Path Analysis of Selected Journals
« In this study, network and main path analyses were conducted on 1,856 studies related to text mining, by extracting keywords … Continuer la lecture de « Research Trends in Text Mining: Semantic Network and Main Path Analysis of Selected Journals »
Une ontologie des outils de fouille de textes
« Au cours du projet VisaTM, nous avions produit une liste de trois cents outils spécialisés dans le traitement automatique du … Continuer la lecture de « Une ontologie des outils de fouille de textes »
Source > objectif-tdm.inist.fr, Fabienne Kettani, Frank Arnould, 5 aout 2020
Détecter l’émergence de la prochaine maladie X
« L’émergence du Covid-19, fin décembre 2019, a été repérée en ligne par certains systèmes de surveillance. Noyés sous une montagne … Continuer la lecture de « Détecter l’émergence de la prochaine maladie X »
Source > cirad.fr, 20 juillet 2020
Blog Objectif-TDM
« De Visa-tm à Objectif-TDM Un blog avait été ouvert à l’initiative de l’Inist afin de communiquer sur le projet VisaTM … Continuer la lecture de « Blog Objectif-TDM »
Source > inist.fr, 1er juillet 2020
#openVirus – Knowledge in the Hands of Citizens
« openVirus is innovating new types of search for research literature using data mining technologies to enable citizens to make use … Continuer la lecture de « #openVirus – Knowledge in the Hands of Citizens »
JEP-TALN-RECITAL 2020 – Nancy, 8-19 juin 2020 [actes de la conférence]
« La conférence JEP-TALN-RECITAL, organisée par le Loria, l’ATILF et l’INIST, s’est déroulée du 8 au 19 juin en mode virtuel. … Continuer la lecture de « JEP-TALN-RECITAL 2020 – Nancy, 8-19 juin 2020 [actes de la conférence] »
Source > jep-taln2020.loria.fr, juin 2020
Beethoven250@ISTEX : écouter Beethoven autrement
« (…) Pour rendre hommage à ce grand musicien en cette année 2020, l’équipe ISTEX a souhaité créer une collection de … Continuer la lecture de « Beethoven250@ISTEX : écouter Beethoven autrement »
An Experiment in Annotating Animal Species Names from ISTEX Resources (.pdf)
« To exploit scientific publications from global research for TDM purposes, the ISTEX platform enriched its data with value-added information to … Continuer la lecture de « An Experiment in Annotating Animal Species Names from ISTEX Resources (.pdf) »
Cited text span identification for scientific summarisation using pre-trained encoders
« We present our approach for the identification of cited text spans in scientific literature, using pre-trained encoders (BERT) in combination … Continuer la lecture de « Cited text span identification for scientific summarisation using pre-trained encoders »
Research Libraries: How You Can Support Text and Data Mining
« Europe’s incoming Directive on Copyright in the Digital Single Market contains two new exceptions allowing text and data mining (TDM). … Continuer la lecture de « Research Libraries: How You Can Support Text and Data Mining »
Source > libereurope.eu, 7 mai 2020
Visualiser la recherche sur le coronavirus en un coup d’œil
« L’Institut des systèmes complexes de Paris Île-de-France a publié plusieurs cartes construites à partir de l’analyse automatisée de toutes les … Continuer la lecture de « Visualiser la recherche sur le coronavirus en un coup d’œil »
Plongez au cœur d’ISTEX grâce à ses enrichissements
« (…) l’équipe ISTEX vous invite à retrouver, dans la dernière version de sa documentation “Usage TDM d’ISTEX”, les éléments vous … Continuer la lecture de « Plongez au cœur d’ISTEX grâce à ses enrichissements »
Des initiatives en fouille de textes fleurissent sur le coronavirus
« Des exemples d’initiatives en fouille de texte autour du CoronaVirus et Covid-19 (…) »
Source > inist.fr, 24 mars 2020
Hussein Al-Natsheh. « Text Mining Approaches for Semantic Similarity Exploration and Metadata Enrichment of Scientific Digital Libraries » [thèse]
« (…) L’objectif principal de nos travaux est d’élargir ou développer le spectre des connaissances des chercheurs travaillant dans un domaine … Continuer la lecture de « Hussein Al-Natsheh. « Text Mining Approaches for Semantic Similarity Exploration and Metadata Enrichment of Scientific Digital Libraries » [thèse] »
La fouille de textes aujourd’hui…et demain ? résultats de l’enquête
« (…) La fouille de textes est pratiquée aussi bien par des non spécialistes utilisant la fouille de textes de façon … Continuer la lecture de « La fouille de textes aujourd’hui…et demain ? résultats de l’enquête »
Formation : fouille de textes à travers l’exploitation des corpus istex
« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation. … Continuer la lecture de « Formation : fouille de textes à travers l’exploitation des corpus istex »
Source > inist.fr, 22 janvier 2020
TextMine’20 – Atelier sur la Fouille de Textes – Conférence EGC (Extraction et Gestion des Connaissances), 28 janvier 2020, Bruxelles (.pdf)
« La fouille de textes couvre de multiples domaines comme, le traitement automatique des langues, l’intelligence artificielle, la linguistique, les statistiques, … Continuer la lecture de « TextMine’20 – Atelier sur la Fouille de Textes – Conférence EGC (Extraction et Gestion des Connaissances), 28 janvier 2020, Bruxelles (.pdf) »
Source > vincentlemaire-labs.fr, Pascal Cuxac, Vincent Lemaire, janvier 2020
Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d’été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus)
« L’UMR Thalim en collaboration avec l’UMR LATTICE et la TGIR HUMANUM du 28 juin au 4 juillet 2020 dans le … Continuer la lecture de « Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d’été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus) »
The SmartSHARK Ecosystem for Software Repository Mining
« Software repository mining is the foundation for many empirical software engineering studies. The collection and analysis of detailed data can … Continuer la lecture de « The SmartSHARK Ecosystem for Software Repository Mining »
Recommandations sur l’analyse automatique de documents : acquisition, gestion, exploration
« Le groupe de travail « Fouille de textes et analyse de données » du Comité pour la science ouverte émet des recommandations … Continuer la lecture de « Recommandations sur l’analyse automatique de documents : acquisition, gestion, exploration »
Les ateliers de Visa TM Day
« Les ateliers prospectifs autour de “quelle infrastructure de service de fouille de textes pour demain” ont permis de faire émerger … Continuer la lecture de « Les ateliers de Visa TM Day »
Source > visatm.inist.fr, Marie-Sophie Nourdin, 26 novembre 2019
Rapports publics du projet Visa TM
(…) Les principaux résultats de Visa TM portent sur : l’étude de la création d’une e-infrastructure de fouille de textes … Continuer la lecture de « Rapports publics du projet Visa TM »
Source > visatm.inist.fr, Marie-Sophie Nourdin, 18 novembre 2019
#VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining
« Dans le cadre du projet Visa TM du Comité pour la Science Ouverte, un « Visa TM Day » sera organisé … Continuer la lecture de « #VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining »
Source > inist.fr, 25 septembre 2019
Atelier – Du parchemin à la fouille de données. Nouveaux outils pour la création, la formalisation et l’analyse des corpus médiévaux – 28-30 octobre 2019 – Campus Condorcet (Paris)
« (…) L’objectif de cet atelier sera d’offrir une première initiation à des outils informatiques de création, de formalisation et d’analyse … Continuer la lecture de « Atelier – Du parchemin à la fouille de données. Nouveaux outils pour la création, la formalisation et l’analyse des corpus médiévaux – 28-30 octobre 2019 – Campus Condorcet (Paris) »
Mining Text, Linking Entities – National Library Board of Singapore’s Journey
« Connecting collections across institutions and discovering hidden knowledge has always been our goal. Due to disparate data sources, differing levels … Continuer la lecture de « Mining Text, Linking Entities – National Library Board of Singapore’s Journey »
Fiche d’information à propos de la directive sur le droit d’auteur et les droits voisins dans le marché unique numérique
« L’European IP Helpdesk propose une fiche d’information à propos de la directive sur le droit d’auteur et les droits voisins … Continuer la lecture de « Fiche d’information à propos de la directive sur le droit d’auteur et les droits voisins dans le marché unique numérique »
Source > www.ouvrirlascience.fr, juillet 2019
Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse]
« (…) Cette thèse étudie différentes stratégies en recherche d’information et en fouille de données textuelles (amélioration du triage de documents … Continuer la lecture de « Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse] »
Le patrimoine numérique national à l’heure de l’intelligence artificielle. Le programme de recherche Corpus comme espace d’expérimentation pour les humanités numériques
« Dans un contexte d’augmentation des volumétries des données et de réduction des temps de traitement, la Bibliothèque nationale de France … Continuer la lecture de « Le patrimoine numérique national à l’heure de l’intelligence artificielle. Le programme de recherche Corpus comme espace d’expérimentation pour les humanités numériques »
Atelier ISTEX à Nancy le mardi 18 juin
« Ces ateliers vous permettront de prendre en main les services et les outils de constitution, de visualisation et d’exploration d’un … Continuer la lecture de « Atelier ISTEX à Nancy le mardi 18 juin »
Source > inist.fr, 13 mai 2019
Critères de sélection d’outils de fouille de textes
« Le travail sur les critères de sélection doit permettre de caractériser les outils de fouille de textes et de données … Continuer la lecture de « Critères de sélection d’outils de fouille de textes »
Giovanni Filippo Caruso. «Text Mining extraction from videos in a learning environment through Educational Data Mining» [thèse]
« The thesis aims to study and to find new learning scenarios for teachers according to new technologies and possibilities of … Continuer la lecture de « Giovanni Filippo Caruso. «Text Mining extraction from videos in a learning environment through Educational Data Mining» [thèse] »
Blog #VisaTM : Recensement d’outils de fouille de textes
« Dans le cadre du volet Étude du projet VisaTM, nous avons réalisé un recensement d’outils de fouille de textes. Le … Continuer la lecture de « Blog #VisaTM : Recensement d’outils de fouille de textes »
Le Parlement approuve de nouvelles règles sur le droit d’auteur sur internet
« (…) Les députés ont adopté la directive en plénière par 348 voix pour, 274 contre et 36 abstentions. Cela marque … Continuer la lecture de « Le Parlement approuve de nouvelles règles sur le droit d’auteur sur internet »
Source > europarl.europa.eu, 26 mars 2019
Questionnaire : la fouille de textes aujourd’hui…et demain ?
« Ce questionnaire vise à qualifier les pratiques autour de la fouille de texte et à identifier les verrous et les … Continuer la lecture de « Questionnaire : la fouille de textes aujourd’hui…et demain ? »
Source > inist.fr, 17 janvier 2019
EGC 2019 – 19ème conférence francophone sur l’Extraction et la Gestion des Connaissances – 21 au 25 janvier 2019 – Metz [actes de conférence]
« (…) La conférence Extraction et Gestion de Connaissances (EGC) est le rendez-vous annuel de chercheurs et praticiens travaillant dans les … Continuer la lecture de « EGC 2019 – 19ème conférence francophone sur l’Extraction et la Gestion des Connaissances – 21 au 25 janvier 2019 – Metz [actes de conférence] »
Source > editions-rnti.fr, Revue des Nouvelles Technologies de l'Information vol.RNTI-E-35, 2019
Les avancées de Numapresse : pour une approche contextuelle du Text Mining
« Cet article est le premier d’une série de retours d’expériences sur les travaux menés par le projet Numapresse au cours … Continuer la lecture de « Les avancées de Numapresse : pour une approche contextuelle du Text Mining »
Source > numapresse.org, Pierre-Carl Langlais, 22 janvier 2019
Mémoire de Portage au Comité INDU sur l’exploration de textes et de données
« Portage se réjouit de l’occasion qui lui est donnée d’apporter une contribution à l’examen de la Loi sur le droit … Continuer la lecture de « Mémoire de Portage au Comité INDU sur l’exploration de textes et de données »
Source > portagenetwork.ca, 11 janvier 2019
Questionnaire : la fouille de textes aujourd’hui…et demain ?
« Ce questionnaire vise à qualifier les pratiques autour de la fouille de texte et à identifier les verrous et les … Continuer la lecture de « Questionnaire : la fouille de textes aujourd’hui…et demain ? »
Source > inist.fr, 17 janvier 2019
Text data mining and data quality management for research information systems in the context of open data and open science
» (…) Using text data mining, the quality of the metadata is analyzed and this identifies the entities and general … Continuer la lecture de « Text data mining and data quality management for research information systems in the context of open data and open science »
Voyant Tools. Analyse automatique de texte et text mining
« Voyant Tools est un puissant outil d’analyse automatique de texte. Un analyseur de textes open source qui va vous surprendre … Continuer la lecture de « Voyant Tools. Analyse automatique de texte et text mining »
A Text Mining Pipeline Using Active and Deep Learning Aimed at Curating Information in Computational Neuroscience
« The curation of neuroscience entities is crucial to ongoing efforts in neuroinformatics and computational neuroscience, such as those being deployed … Continuer la lecture de « A Text Mining Pipeline Using Active and Deep Learning Aimed at Curating Information in Computational Neuroscience »
Elsevier Launches Entellect™ Platform, Unlocking Value by Creating AI-ready Life Sciences Data
« Entellect leverages Elsevier‘s unique heritage to help enrich data and help companies overcome challenges in modern R&D Elsevier, the information … Continuer la lecture de « Elsevier Launches Entellect™ Platform, Unlocking Value by Creating AI-ready Life Sciences Data »
Source > prnewswire.com, 14 novembre 2018
LIBER has signed an open letter calling for a broad and mandatory Text and Data Mining exception, in order to guarantee that European research and innovation can thrive
« LIBER has signed an open letter calling for a broad and mandatory Text and Data Mining exception, in order to … Continuer la lecture de « LIBER has signed an open letter calling for a broad and mandatory Text and Data Mining exception, in order to guarantee that European research and innovation can thrive »
Source > libereurope.eu, 13 novembre 2018
Japan amends its copyright legislation to meet future demands in AI and Big Data
« In May this year, Japan’s National Diet approved a legislation for updating its “Copyright Act”[1], a reform that focused on … Continuer la lecture de « Japan amends its copyright legislation to meet future demands in AI and Big Data »
Source > eare.eu, 2018
Text Mining with the HathiTrust & Empowering Librarians to Support Digital Scholarships [video]
« Arm librarians with instructional content and tools in digital scholarships and digital humanities. Enable librarians to build foundations for digital … Continuer la lecture de « Text Mining with the HathiTrust & Empowering Librarians to Support Digital Scholarships [video] »
Source > loc.gov, EVENT DATE: 2018/08/08
Entity-fishing for Scholarly Publishing: Challenges and Recommendations
« On 4th September 2018 the Göttingen State and University Library, with the support of the Max Weber Stiftung, organised the … Continuer la lecture de « Entity-fishing for Scholarly Publishing: Challenges and Recommendations »
Thalia: Semantic search engine for biomedical abstracts
« While publication rate of the biomedical literature has been growing steadily during the last decades, the accessibility of pertinent research … Continuer la lecture de « Thalia: Semantic search engine for biomedical abstracts »
Directive sur le droit d’auteur : vers un accord d’ici la fin décembre 2018 ?
« (…) Selon l’eurodéputée Julia Reda, très impliquée sur ce dossier, le prochain trilogue doit avoir lieu le 25 octobre. Outre … Continuer la lecture de « Directive sur le droit d’auteur : vers un accord d’ici la fin décembre 2018 ? »
Emmanuel Le Roy Ladurie, précurseur du data mining ?
« En affirmant dès la fin des années 1960 que « les historiens seront programmeurs ou ne seront plus »1, Emmanuel … Continuer la lecture de « Emmanuel Le Roy Ladurie, précurseur du data mining ? »
Source > bnf.hypotheses.org, Olivier Jacquot, 14 septembre 2018
European Parliament Vote on Copyright Fails to Provide Legal Clarity for Research (.pdf)
« Science Europe is disappointed that the European Parliament did not sufficiently improve the far too restrictive proposal by the European … Continuer la lecture de « European Parliament Vote on Copyright Fails to Provide Legal Clarity for Research (.pdf) »
Source > scienceeurope.org, 12 septembre 2018
Jisc gateway to text and data-mining – status update
« Over the past few months, we have been investigating the opportunities for a possible Jisc-delivered text and data mining (TDM) … Continuer la lecture de « Jisc gateway to text and data-mining – status update »
Source > scholarlycommunications.jiscinvolve.org, Sarah Fahmy, 11 septembre 2018