17.11.2020
Proceedings of the First Workshop on Scholarly Document Processing (SDP 2020) – November 19, Online
« SDP is a full day workshop that provides an interdisciplinary venue for researchers interested in any aspect of mining scientific…
aclweb.org, Association for Computational Linguistics, novembre 2020
Continuer la lecture
16.11.2020
PubSqueezer: A Text-Mining Web Tool to Transform Unstructured Documents into Structured Data
« (…) In this work, I present a web tool which uses a Text Mining strategy to transform large collections of…
arxiv.org, Alberto Calderone Dr., 9 novembre 2020 arXiv:2011.03123v2
Continuer la lecture
30.10.2020
ODDPub – a Text-Mining Algorithm to Detect Data Sharing in Biomedical Publications
« Open research data are increasingly recognized as a quality indicator and an important resource to increase transparency, robustness and collaboration…
datascience.codata.org, Riedel, N., Kip, M. and Bobrov, E., 2020. ODDPub – a Text-Mining Algorithm to Detect Data Sharing in Biomedical Publications. Data Science Journal, 19(1), p.42. DOI: http://doi.org/10.5334/dsj-2020-042
Continuer la lecture
11.05.2020
Cited text span identification for scientific summarisation using pre-trained encoders
« We present our approach for the identification of cited text spans in scientific literature, using pre-trained encoders (BERT) in combination…
link.springer.com, Zerva, C., Nghiem, M., Nguyen, N.T.H. et al. Cited text span identification for scientific summarisation using pre-trained encoders. Scientometrics (2020). https://doi.org/10.1007/s11192-020-03455-z
Continuer la lecture
01.04.2020
Plongez au cœur d’ISTEX grâce à ses enrichissements
« (…) l’équipe ISTEX vous invite à retrouver, dans la dernière version de sa documentation “Usage TDM d’ISTEX”, les éléments vous…
blog.istex.fr, Camille De Salabert, 30 mars 2020
Continuer la lecture
09.03.2020
LIBER: Metrics & Machines [Webinar Video]
« This webinar, presented on 6 March 2020, was organised by LIBER’s Innovative Metrics Group. The webinar…
libereurope.eu, 6 mars 2020
Continuer la lecture
13.02.2020
Hussein Al-Natsheh. « Text Mining Approaches for Semantic Similarity Exploration and Metadata Enrichment of Scientific Digital Libraries » [thèse]
« (…) L’objectif principal de nos travaux est d’élargir ou développer le spectre des connaissances des chercheurs travaillant dans un domaine…
tel.archives-ouvertes.fr, Artificial Intelligence [cs.AI]. Université de Lyon, 2019. English. ⟨NNT : 2019LYSE2062⟩. ⟨tel-02476157⟩
Continuer la lecture
29.01.2020
Formation : fouille de textes à travers l’exploitation des corpus istex
« La fouille de textes et de données (TDM) est aujourd’hui un enjeu majeur pour la recherche et pour la documentation.
inist.fr, 22 janvier 2020
Continuer la lecture
08.01.2020
Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d’été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus)
« L’UMR Thalim en collaboration avec l’UMR LATTICE et la TGIR HUMANUM du 28 juin au 4 juillet 2020 dans le…
humanum.hypotheses.org, pbusonera, 7 janvier 2020
Continuer la lecture
08.01.2020
The SmartSHARK Ecosystem for Software Repository Mining
« Software repository mining is the foundation for many empirical software engineering studies. The collection and analysis of detailed data can…
arxiv.org, Alexander Trautsch, Fabian Trautsch, Steffen Herbold, Benjamin Ledel, Jens Grabowski, 6 Jan 2020, arXiv:2001.01606v1
Continuer la lecture
23.12.2019
Automatic Slide Generation for Scientific Papers
« We describe our approach for automatically generating presentation slides for scientific papers using deep neural networks. Such slides can help…
ceur-ws.org, Athar Sefid, Prasenjit Mitra, Jian Wu, C. Lee Giles, Proceedings of the Third International Workshop on Capturing Scientific Knowledge, CEUR Workshop Proceedings, vol 2526, urn:nbn:de:0074-2526-7
Continuer la lecture
20.11.2019
Rapports publics du projet Visa TM
(…) Les principaux résultats de Visa TM portent sur : l’étude de la création d’une e-infrastructure de fouille de textes…
visatm.inist.fr, Marie-Sophie Nourdin, 18 novembre 2019
Continuer la lecture
25.09.2019
#VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining
« Dans le cadre du projet Visa TM du Comité pour la Science Ouverte, un « Visa TM Day » sera organisé…
inist.fr, 25 septembre 2019
Continuer la lecture
02.09.2019
Using Transkribus for automated text recognition of historical Bengali Books
« Are you working with digitised printed collections that you want to ‘unlock’ for keyword search and text mining? Maybe you…
blogs.bl.uk, Tom Derrick, 30 aout 2019
Continuer la lecture
13.08.2019
Application of Natural Language Processing Algorithms to the Task of Automatic Classification of Russian Scientific Texts
« This work is devoted to the study of applicability of modern methods of machine learning to the task of automatic…
datascience.codata.org, Romanov, A., Lomotin, K. and Kozlova, E., 2019, Data Science Journal, 18(1), p.37. DOI: http://doi.org/10.5334/dsj-2019-037
Continuer la lecture
13.08.2019
VIANA: Visual Interactive Annotation of Argumentation
« (…) In this paper, we present a visual analytics system that augments the manual annotation process by automatically suggesting which…
arxiv.org, Fabian Sperrle, Rita Sevastjanova, Rebecca Kehlbeck, Mennatallah El-Assady, 2019, arXiv:1907.12413v1
Continuer la lecture
12.08.2019
Informatique et tamis | #BrèveDeScience [vidéo]
« Je suis chercheure d’or… mais en fait je cherche de l’or dans les textes »
youtube.com, Adeline Nazarenko, enseignante-chercheure en informatique
Laboratoire d'Informatique de Paris-Nord (LIPN), 21 juillet 2019
Continuer la lecture
07.08.2019
NaCTeM announced as the winners of NLP challenge on scholarly discourse and summarisation
« A team of researchers from NaCTeM group were recently announced as the winners of an NLP challenge. Dr. Chrysoula Zerva,…
nactem.ac.uk, 5 aout 2019
Continuer la lecture
26.07.2019
Mining Text, Linking Entities – National Library Board of Singapore’s Journey
« Connecting collections across institutions and discovering hidden knowledge has always been our goal. Due to disparate data sources, differing levels…
library.ifla.org, EE, Min Hoon, NLB’s Journey. Paper presented at: IFLA WLIC 2019 - Athens, Greece - Libraries: dialogue for change in Session 114 - Knowledge Management with Information Technology and Big Data
Continuer la lecture
11.07.2019
Cette IA aide à compléter d’anciennes recherches scientifiques
« Des chercheurs du laboratoire national américain Lawrence-Berkeley ont utilisé le machine learning pour révéler de nouvelles connaissances scientifiques cachées dans…
futura-sciences.com, Fabrice Auclert, 10 juillet 2019
Continuer la lecture
08.07.2019
Gerrish, Charlotte. « European Copyright Law and the Text and Data Mining Exceptions and Limitations » [thesis]
« We are in a digital age with Big Data at the heart of our global online environment. Exploiting Big Data…
diva-portal.org, Gerrish, Charlotte, Supervisors, Szkalej, Kacper, Doktorand, Examiners Wolk, Sanna, Professor, Uppsala University, URN: urn:nbn:se:uu:diva-385195, OAI: oai:DiVA.org:uu-385195, DiVA, id: diva2:1323355, 1 er juillet 2019
Continuer la lecture
03.06.2019
Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse]
« (…) Cette thèse étudie différentes stratégies en recherche d’information et en fouille de données textuelles (amélioration du triage de documents…
archive-ouverte.unige.ch, Mottin, Luc, Directeurs Chopard, Bastien, Ruch, Patrick, DOI: 10.13097/archive-ouverte/unige:118269
URN: urn:nbn:ch:unige-1182697
Continuer la lecture
28.05.2019
Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities
« Istex is a database of twenty million full text scientific papers bought by the French Government for the use of…
mdpi.com, Maurel, Denis, Morale, Enza, Thouvenin, Nicolas, Ringot, Patrice, Turri, Angel, Information 2019, 10, 178, ; https://doi.org/10.3390/info10050178
Continuer la lecture
21.05.2019
Identifying Clinical Terms in Medical Text Using Ontology-Guided Machine Learning
« (…) We present a neural dictionary model that can be used to predict if a phrase is synonymous to a…
medinform.jmir.org, Arbabi A, Adams DR, Fidler S, Brudno M, JMIR Med Inform 2019;7(2):e12596, DOI: 10.2196/12596
PMID: 31094361
Continuer la lecture
14.05.2019
Le patrimoine numérique national à l’heure de l’intelligence artificielle. Le programme de recherche Corpus comme espace d’expérimentation pour les humanités numériques
« Dans un contexte d’augmentation des volumétries des données et de réduction des temps de traitement, la Bibliothèque nationale de France…
hal-bnf.archives-ouvertes.fr, Emmanuelle Bermès, Eleonora Moiraghi, Revue d'Intelligence Artificielle (RIA), A paraître. ⟨hal-02122073⟩
Continuer la lecture
13.05.2019
Atelier ISTEX à Nancy le mardi 18 juin
« Ces ateliers vous permettront de prendre en main les services et les…
inist.fr, 13 mai 2019
Continuer la lecture
10.05.2019
Critères de sélection d’outils de fouille de textes
« Le travail sur les critères de sélection doit permettre de caractériser les outils de fouille de textes et de données…
visatm.inist.fr, Mouhamadou Ba, 9 mai 2019
Continuer la lecture
09.05.2019
Giovanni Filippo Caruso. «Text Mining extraction from videos in a learning environment through Educational Data Mining» [thèse]
« The thesis aims to study and to find new learning scenarios for teachers according to new technologies and possibilities of…
webthesis.biblio.polito.it, Rel. Laura Farinetti. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Del Cinema E Dei Mezzi Di Comunicazione, 2019
Continuer la lecture
15.04.2019
BIR 2019 / 8th International Workshop on Bibliometric-enhanced Information Retrieval* – Cologne, Germany, April 14th, 2019 [book of proceedings]
*co-located with the 41st European Conference on Information Retrieval (ECIR 2019) « The Bibliometric-enhanced Information Retrieval workshop series (BIR) at…
ceur-ws.org, Guillaume Cabanac, Ingo Frommholz, Philipp Mayr,CEUR Workshop Proceedings Vol-2345, urn:nbn:de:0074-2345-4
Continuer la lecture
15.04.2019
41st European Conference on IR Research, ECIR 2019, Cologne, Germany, April 14–18, 2019 [Proceedings, Part I and Part II]
« The 41st European Conference on Information Retrieval (ECIR) was held in Cologne, Germany, during April 14–18, 2019, and brought together…
ecir2019.org, LNCS, Leif Azzopardi, Benno Stein, Norbert Fuhr, Philipp Mayr,Claudia, Hauff, Djoerd Hiemstra, volume 11437, 2019, https://doi.org/10.1007/978-3-030-15712-8_1, volume 11438, 2019, https://doi.org/10.1007/978-3-030-15719-7_1
Continuer la lecture
19.03.2019
Introduction to Data Science Data Analysis and Prediction Algorithms with R
« (…) The link for the online version of the book is https://rafalab.github.io/dsbook/ The R markdown…
rafalab.github.io, Rafael A. Irizarry, 17 mars 2019
Continuer la lecture
08.03.2019
Nouveau paquet R.temis
« Un nouveau paquet dénommé R.temis a été mis en ligne sur le CRAN. Il fournit des fonctions utilisables dans des…
rtemis.hypotheses.org/, milan, 6 mars 2019
Continuer la lecture
22.02.2019
Questionnaire : la fouille de textes aujourd’hui…et demain ?
« Ce questionnaire vise à qualifier les pratiques autour de la fouille de texte et à identifier les verrous et les…
inist.fr, 17 janvier 2019
Continuer la lecture
07.02.2019
Visa pour le Text Mining
« La création d’une offre de service en fouille de textes et de données ‐ TDM (text and data mining) à…
visatm.inist.fr, février 2019
Continuer la lecture
23.01.2019
Les avancées de Numapresse : pour une approche contextuelle du Text Mining
« Cet article est le premier d’une série de retours d’expériences sur les travaux menés par le projet Numapresse au cours…
numapresse.org, Pierre-Carl Langlais, 22 janvier 2019
Continuer la lecture
18.01.2019
Questionnaire : la fouille de textes aujourd’hui…et demain ?
« Ce questionnaire vise à qualifier les pratiques autour de la fouille de texte et à identifier les verrous et les…
inist.fr, 17 janvier 2019
Continuer la lecture
16.11.2018
Elsevier Launches Entellect™ Platform, Unlocking Value by Creating AI-ready Life Sciences Data
« Entellect leverages Elsevier‘s unique heritage to help enrich data and help companies overcome challenges in modern R&D…
prnewswire.com, 14 novembre 2018
Continuer la lecture
05.11.2018
Entity-fishing for Scholarly Publishing: Challenges and Recommendations
« On 4th September 2018 the Göttingen State and University Library, with the support of the…
zenodo.org, Bertino, Andrea, Foppiano, Luca, Arias, Javier, Ekanger, Aysa, & Thoden, Klaus. (2018, November 1), 10.5281/zenodo.1476474.
Continuer la lecture
18.10.2018
Thalia: Semantic search engine for biomedical abstracts
« While publication rate of the biomedical literature has been growing steadily during the last decades, the accessibility of pertinent research…
academic.oup.com, Axel J Soto, Piotr Przybyła, Sophia Ananiadou, Bioinformatics, , bty871, https://doi.org/10.1093/bioinformatics/bty871
Continuer la lecture
13.08.2018
OpenMinTeD: A Platform Facilitating Text Mining of Scholarly Content [.pdf]
« The OpenMinTeD platform aims to bring full text Open Access scholarly content from a wide range of providers together with…
oro.open.ac.uk, Labourable, Penny; Galanis, Dimitrios; Lempesis, Antonis; Greenwood, Mark; Knoth, Petr et.al., LREC 2018
Continuer la lecture
08.08.2018
L’Inist-CNRS partenaire de VisaTM
« Partenaire de VisaTM avec l’INRA et l’Université de Montpellier, l’INIST s’est fait l’ambassadeur de ce projet lors du 29ème Congrès…
inist.fr, 6 août 2018
Continuer la lecture
29.06.2018
Introduction à Voyant Tools
« Voyant Tools est un environnement d’analyse, de lecture et de visualisation de textes numériques. Cette plateforme…
github.com/aurelberra/voyant_tools, Aurélien Berra, 28 juin 2018
Continuer la lecture
16.05.2018
Enriching metadata of an institutional research repository: Mining grey literature/technical reports for research funding-related information
« (…) As it becomes increasingly important for research organizations to show the impact of their research to donor agencies, grey…
dspacecris.eurocris.org, Zschocke, Thomas, CRIS2018: 14th International Conference on Current Research Information Systems (Umeå, June 13-16, 2018), http://hdl.handle.net/11366/652
Continuer la lecture
02.05.2018
Abstract Mining
« We have developed an application that will take a « MEDLINE » output from the PubMed database and allows the user to…
arxiv.org, Ellie Small, Javier Cabrera, John B. Kostis, William Kostis, 26 avril 2018, arXiv:1804.10530v1
Continuer la lecture
06.10.2017
Le temps des SIC
« Pour rendre compte du temps des Sciences de l’Information et de la Communication (SIC), nous avons choisi d’analyser le lexique…
archivesic.ccsd.cnrs.fr, Gabriel Gallezot, Marty Emmanuel, 2 octobre 2017, HAL Id: sic_01599944
Continuer la lecture
03.08.2017
Library Support for Text and Data Mining: A Report for the University Libraries at Virginia Tech (.pdf)
« This report examines how the University Libraries at Virginia Tech have supported text and data mining in the past, and…
vtechworks.lib.vt.edu, Young, P., Brittle, C., Haugen, I., Lener, E., Pannabecker,V, 22 juin 2017
Continuer la lecture
16.06.2017
A New Webliography of Text Mining Resources
« The Science and Technology Resources on the Internet column in the Spring 2017 issue of Issues in…
infodocket.com, Gary Price, 14 juin 2017
Continuer la lecture
02.11.2016
Etude critique des nouveaux modes « d’éditorialisation » de revues scientifiques en accès-ouvert
« Ce rapport commandé par BSN 4 et BSN 7 porte sur les nouveaux modes d’éditorialisation des revues en…
hal.archives-ouvertes.fr, Pierre-Carl Langlais, 27 octobre 2016
Continuer la lecture
05.09.2016
Le deep learning est-il le futur du text mining ?
« Deep learning : le terme symbolise la grande espérance technologique du moment (et, dans les milieux spécialisés, commence…
scoms.hypotheses.org, Pierre-Carl Langlais, 2 septembre 2016
Continuer la lecture
20.06.2016
Bilbo sur OpenEdition Books
« Depuis début juin, une nouvelle fonctionnalité est installée sur OpenEdition Books : l’outil de text-mining Bilbo,…
lab.hypotheses.org, Élodie Faath, 16 juin 2016
Continuer la lecture
20.07.2015
Le statut juridique des données de la recherche : entre droit des bases de données et données publiques
« …
scinfolex, Lionel Maurel, 13 juillet 2015
Continuer la lecture
08.07.2014
Infotrieve Spearheads Text Mining Initiative. Text mining capabilities within Mobile LibraryTM successfully tested via pilot with UCB
« Infotrieve, Inc. (www.infotrieve.com), the leader in global-enterprise SaaS software and business services for scientific, technical…
businesswire.com, Robert Mata, 7 juillet 2014
Continuer la lecture
26.06.2014
What are the Public Library of Science Collections ? – Part II
« PLOS Collections (1) is a specific section of the Public Library of Science (PLOS) initiative which hosts collections…
blog.scielo.org, Ernesto Spinak, 24 juin 2014
Continuer la lecture
24.04.2014
Bringing Digital Science Deep Inside the Scientific Article: the Elsevier Article of the Future Project – IJsbrand Jan Aalbersberg, Sophia Atzeni, Hylke Koers, Beate Specker, Elena Zudilova-Seinstra (.pdf)
« Abstract The ICT revolution of the last decades impacted scientific communication as it has impacted many…
microblogging.infodocs.eu, avril 2014
Continuer la lecture
10.04.2014
Standardisation in the area of innovation and technological development, notably in the field of Text and Data Mining. Report from the Expert Group. European Commission (.pdf)
« Executive summary Text and data mining (TDM) is an important technique for analysing and extracting new insights…
ec.europa.eu, 4 avril 2014
Continuer la lecture
24.01.2014
Droit et open data : les bases de données de Légifrance, bientôt sous licences gratuites
« …Jusque-là, il fallait s’acquitter de licences payantes pour disposer, depuis Légifrance, de chacune des bases de…
archimag.com, Clémence Jost, 24 janvier 2014
Continuer la lecture
04.11.2013
Workshop report from The Perfect Swell: defining the ideal conditions for the growth of text and data mining in Europe
» … LIBER, has taken the lead on this issue and, in conjunction with Copyright4Creativity, organised a workshop on…
libereurope.eu, 29 octobre 2013
Continuer la lecture
10.10.2013
Archimag n° 268 – DOSSIER : « Tour de France de la dématérialisation »
Sommaire : « ACTUALITÉS Retrouvez toute l’actualité et les tendances des technologies de l’information !…
archimag.com, octobre 2013
Continuer la lecture
18.06.2013
R.TeMiS : création et analyse de corpus de textes sous R
» Fonctionnalités générales R.TeMiS (R Text Mining Solution) est un environnement graphique de travail sous R permettant…
projet-plume.org, Milan Bouchet-Valat, 10 juin 2013
Continuer la lecture
21.05.2013
Text and Data Mining
» 1. Licences for Europe, Text and Data Mining working group, 3rd meeting | Brussels, 22 April 2013…
donneesdelarecherche.fr, Thérèse Hameau, 17 mai 2013
Continuer la lecture
16.04.2013
Quel droit pour faire du text et du data mining ?
» Licences for Europe [1], initiative prise en février 2013 par la Commission européenne pour trouver des solutions…
paralipomenes.net, Michèle Battisti, 15 avril 2013
Continuer la lecture