Cited text span identification for scientific summarisation using pre-trained encoders

« We present our approach for the identification of cited text spans in scientific literature, using pre-trained encoders (BERT) in combination … Continuer la lecture de « Cited text span identification for scientific summarisation using pre-trained encoders »

Source > link.springer.com, Zerva, C., Nghiem, M., Nguyen, N.T.H. et al. Cited text span identification for scientific summarisation using pre-trained encoders. Scientometrics (2020). https://doi.org/10.1007/s11192-020-03455-z

Plongez au cœur d’ISTEX grâce à ses enrichissements

« (…) l’équipe ISTEX vous invite à retrouver, dans la dernière version de sa documentation “Usage TDM d’ISTEX”, les éléments vous … Continuer la lecture de « Plongez au cœur d’ISTEX grâce à ses enrichissements »

Source > blog.istex.fr, Camille De Salabert, 30 mars 2020

Hussein Al-Natsheh. « Text Mining Approaches for Semantic Similarity Exploration and Metadata Enrichment of Scientific Digital Libraries » [thèse]

« (…) L’objectif principal de nos travaux est d’élargir ou développer le spectre des connaissances des chercheurs travaillant dans un domaine … Continuer la lecture de « Hussein Al-Natsheh. « Text Mining Approaches for Semantic Similarity Exploration and Metadata Enrichment of Scientific Digital Libraries » [thèse] »

Source > tel.archives-ouvertes.fr, Artificial Intelligence [cs.AI]. Université de Lyon, 2019. English. ⟨NNT : 2019LYSE2062⟩. ⟨tel-02476157⟩

Formation : fouille de textes à travers l’exploitation des corpus istex

« La fouille de textes et de données (TDM)  est aujourd’hui un enjeu majeur pour la recherche et pour la documentation. … Continuer la lecture de « Formation : fouille de textes à travers l’exploitation des corpus istex »

Source > inist.fr, 22 janvier 2020

Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d’été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus)

« L’UMR Thalim en collaboration avec l’UMR LATTICE et la TGIR HUMANUM du 28 juin au 4 juillet 2020 dans le … Continuer la lecture de « Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d’été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus) »

Source > humanum.hypotheses.org, pbusonera, 7 janvier 2020

The SmartSHARK Ecosystem for Software Repository Mining

« Software repository mining is the foundation for many empirical software engineering studies. The collection and analysis of detailed data can … Continuer la lecture de « The SmartSHARK Ecosystem for Software Repository Mining »

Source > arxiv.org, Alexander Trautsch, Fabian Trautsch, Steffen Herbold, Benjamin Ledel, Jens Grabowski, 6 Jan 2020, arXiv:2001.01606v1

Automatic Slide Generation for Scientific Papers

« We describe our approach for automatically generating presentation slides for scientific papers using deep neural networks. Such slides can help … Continuer la lecture de « Automatic Slide Generation for Scientific Papers »

Source > ceur-ws.org, Athar Sefid, Prasenjit Mitra, Jian Wu, C. Lee Giles, Proceedings of the Third International Workshop on Capturing Scientific Knowledge, CEUR Workshop Proceedings, vol 2526, urn:nbn:de:0074-2526-7

Rapports publics du projet Visa TM

(…) Les principaux résultats de Visa TM portent sur : l’étude de la création d’une e-infrastructure de fouille de textes … Continuer la lecture de « Rapports publics du projet Visa TM »

Source > visatm.inist.fr, Marie-Sophie Nourdin, 18 novembre 2019

#VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining

« Dans le cadre du projet Visa TM du Comité pour la Science Ouverte, un « Visa TM Day » sera organisé … Continuer la lecture de « #VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining »

Source > inist.fr, 25 septembre 2019

Using Transkribus for automated text recognition of historical Bengali Books

« Are you working with digitised printed collections that you want to ‘unlock’ for keyword search and text mining? Maybe you … Continuer la lecture de « Using Transkribus for automated text recognition of historical Bengali Books »

Source > blogs.bl.uk, Tom Derrick, 30 aout 2019

Application of Natural Language Processing Algorithms to the Task of Automatic Classification of Russian Scientific Texts

« This work is devoted to the study of applicability of modern methods of machine learning to the task of automatic … Continuer la lecture de « Application of Natural Language Processing Algorithms to the Task of Automatic Classification of Russian Scientific Texts »

Source > datascience.codata.org, Romanov, A., Lomotin, K. and Kozlova, E., 2019, Data Science Journal, 18(1), p.37. DOI: http://doi.org/10.5334/dsj-2019-037

VIANA: Visual Interactive Annotation of Argumentation

« (…) In this paper, we present a visual analytics system that augments the manual annotation process by automatically suggesting which … Continuer la lecture de « VIANA: Visual Interactive Annotation of Argumentation »

Source > arxiv.org, Fabian Sperrle, Rita Sevastjanova, Rebecca Kehlbeck, Mennatallah El-Assady, 2019, arXiv:1907.12413v1

NaCTeM announced as the winners of NLP challenge on scholarly discourse and summarisation

« A team of researchers from NaCTeM group were recently announced as the winners of an NLP challenge. Dr. Chrysoula Zerva, … Continuer la lecture de « NaCTeM announced as the winners of NLP challenge on scholarly discourse and summarisation »

Source > nactem.ac.uk, 5 aout 2019

Mining Text, Linking Entities – National Library Board of Singapore’s Journey

« Connecting collections across institutions and discovering hidden knowledge has always been our goal. Due to disparate data sources, differing levels … Continuer la lecture de « Mining Text, Linking Entities – National Library Board of Singapore’s Journey »

Source > library.ifla.org, EE, Min Hoon, NLB’s Journey. Paper presented at: IFLA WLIC 2019 - Athens, Greece - Libraries: dialogue for change in Session 114 - Knowledge Management with Information Technology and Big Data

Cette IA aide à compléter d’anciennes recherches scientifiques

« Des chercheurs du laboratoire national américain Lawrence-Berkeley ont utilisé le machine learning pour révéler de nouvelles connaissances scientifiques cachées dans … Continuer la lecture de « Cette IA aide à compléter d’anciennes recherches scientifiques »

Source > futura-sciences.com, Fabrice Auclert, 10 juillet 2019

Gerrish, Charlotte. « European Copyright Law and the Text and Data Mining Exceptions and Limitations » [thesis]

« We are in a digital age with Big Data at the heart of our global online environment. Exploiting Big Data … Continuer la lecture de « Gerrish, Charlotte. « European Copyright Law and the Text and Data Mining Exceptions and Limitations » [thesis] »

Source > diva-portal.org, Gerrish, Charlotte, Supervisors, Szkalej, Kacper, Doktorand, Examiners Wolk, Sanna, Professor, Uppsala University, URN: urn:nbn:se:uu:diva-385195, OAI: oai:DiVA.org:uu-385195, DiVA, id: diva2:1323355, 1 er juillet 2019

Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse]

« (…) Cette thèse étudie différentes stratégies en recherche d’information et en fouille de données textuelles (amélioration du triage de documents … Continuer la lecture de « Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse] »

Source > archive-ouverte.unige.ch, Mottin, Luc, Directeurs Chopard, Bastien, Ruch, Patrick, DOI: 10.13097/archive-ouverte/unige:118269 URN: urn:nbn:ch:unige-1182697

Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities

« Istex is a database of twenty million full text scientific papers bought by the French Government for the use of … Continuer la lecture de « Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities »

Source > mdpi.com, Maurel, Denis, Morale, Enza, Thouvenin, Nicolas, Ringot, Patrice, Turri, Angel, Information 2019, 10, 178, ; https://doi.org/10.3390/info10050178

Identifying Clinical Terms in Medical Text Using Ontology-Guided Machine Learning

« (…) We present a neural dictionary model that can be used to predict if a phrase is synonymous to a … Continuer la lecture de « Identifying Clinical Terms in Medical Text Using Ontology-Guided Machine Learning »

Source > medinform.jmir.org, Arbabi A, Adams DR, Fidler S, Brudno M, JMIR Med Inform 2019;7(2):e12596, DOI: 10.2196/12596 PMID: 31094361

Le patrimoine numérique national à l’heure de l’intelligence artificielle. Le programme de recherche Corpus comme espace d’expérimentation pour les humanités numériques

« Dans un contexte d’augmentation des volumétries des données et de réduction des temps de traitement, la Bibliothèque nationale de France … Continuer la lecture de « Le patrimoine numérique national à l’heure de l’intelligence artificielle. Le programme de recherche Corpus comme espace d’expérimentation pour les humanités numériques »

Source > hal-bnf.archives-ouvertes.fr, Emmanuelle Bermès, Eleonora Moiraghi, Revue d'Intelligence Artificielle (RIA), A paraître. ⟨hal-02122073⟩

Atelier ISTEX à Nancy le mardi 18 juin

« Ces ateliers vous permettront de prendre en main les services et les outils de constitution, de visualisation et d’exploration d’un … Continuer la lecture de « Atelier ISTEX à Nancy le mardi 18 juin »

Source > inist.fr, 13 mai 2019

Critères de sélection d’outils de fouille de textes

« Le travail sur les critères de sélection doit permettre de caractériser les outils de fouille de textes et de données … Continuer la lecture de « Critères de sélection d’outils de fouille de textes »

Source > visatm.inist.fr, Mouhamadou Ba, 9 mai 2019

Giovanni Filippo Caruso. «Text Mining extraction from videos in a learning environment through Educational Data Mining» [thèse]

« The thesis aims to study and to find new learning scenarios for teachers according to new technologies and possibilities of … Continuer la lecture de « Giovanni Filippo Caruso. «Text Mining extraction from videos in a learning environment through Educational Data Mining» [thèse] »

Source > webthesis.biblio.polito.it, Rel. Laura Farinetti. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Del Cinema E Dei Mezzi Di Comunicazione, 2019

BIR 2019 / 8th International Workshop on Bibliometric-enhanced Information Retrieval* – Cologne, Germany, April 14th, 2019 [book of proceedings]

*co-located with the 41st European Conference on Information Retrieval (ECIR 2019) « The Bibliometric-enhanced Information Retrieval workshop series (BIR) at ECIR … Continuer la lecture de « BIR 2019 / 8th International Workshop on Bibliometric-enhanced Information Retrieval* – Cologne, Germany, April 14th, 2019 [book of proceedings] »

Source > ceur-ws.org, Guillaume Cabanac, Ingo Frommholz, Philipp Mayr,CEUR Workshop Proceedings Vol-2345, urn:nbn:de:0074-2345-4

41st European Conference on IR Research, ECIR 2019, Cologne, Germany, April 14–18, 2019 [Proceedings, Part I and Part II]

« The 41st European Conference on Information Retrieval (ECIR) was held in Cologne, Germany, during April 14–18, 2019, and brought together … Continuer la lecture de « 41st European Conference on IR Research, ECIR 2019, Cologne, Germany, April 14–18, 2019 [Proceedings, Part I and Part II] »

Source > ecir2019.org, LNCS, Leif Azzopardi, Benno Stein, Norbert Fuhr, Philipp Mayr,Claudia, Hauff, Djoerd Hiemstra, volume 11437, 2019, https://doi.org/10.1007/978-3-030-15712-8_1, volume 11438, 2019, https://doi.org/10.1007/978-3-030-15719-7_1

Introduction to Data Science Data Analysis and Prediction Algorithms with R

« (…) The link for the online version of the book is https://rafalab.github.io/dsbook/ The R markdown code used to generate the … Continuer la lecture de « Introduction to Data Science Data Analysis and Prediction Algorithms with R »

Source > rafalab.github.io, Rafael A. Irizarry, 17 mars 2019

Questionnaire : la fouille de textes aujourd’hui…et demain ?

« Ce questionnaire vise à qualifier les pratiques autour de la fouille de texte et à identifier les verrous et les … Continuer la lecture de « Questionnaire : la fouille de textes aujourd’hui…et demain ? »

Source > inist.fr, 17 janvier 2019

Les avancées de Numapresse : pour une approche contextuelle du Text Mining

« Cet article est le premier d’une série de retours d’expériences sur les travaux menés par le projet Numapresse au cours … Continuer la lecture de « Les avancées de Numapresse : pour une approche contextuelle du Text Mining »

Source > numapresse.org, Pierre-Carl Langlais, 22 janvier 2019

Questionnaire : la fouille de textes aujourd’hui…et demain ?

« Ce questionnaire vise à qualifier les pratiques autour de la fouille de texte et à identifier les verrous et les … Continuer la lecture de « Questionnaire : la fouille de textes aujourd’hui…et demain ? »

Source > inist.fr, 17 janvier 2019

Elsevier Launches Entellect™ Platform, Unlocking Value by Creating AI-ready Life Sciences Data

« Entellect leverages Elsevier‘s unique heritage to help enrich data and help companies overcome challenges in modern R&D Elsevier, the information … Continuer la lecture de « Elsevier Launches Entellect™ Platform, Unlocking Value by Creating AI-ready Life Sciences Data »

Source > prnewswire.com, 14 novembre 2018

Entity-fishing for Scholarly Publishing: Challenges and Recommendations

« On 4th September 2018 the Göttingen State and University Library, with the support of the Max Weber Stiftung, organised the … Continuer la lecture de « Entity-fishing for Scholarly Publishing: Challenges and Recommendations »

Source > zenodo.org, Bertino, Andrea, Foppiano, Luca, Arias, Javier, Ekanger, Aysa, & Thoden, Klaus. (2018, November 1), 10.5281/zenodo.1476474.

Thalia: Semantic search engine for biomedical abstracts

« While publication rate of the biomedical literature has been growing steadily during the last decades, the accessibility of pertinent research … Continuer la lecture de « Thalia: Semantic search engine for biomedical abstracts »

Source > academic.oup.com, Axel J Soto, Piotr Przybyła, Sophia Ananiadou, Bioinformatics, , bty871, https://doi.org/10.1093/bioinformatics/bty871

OpenMinTeD: A Platform Facilitating Text Mining of Scholarly Content [.pdf]

« The OpenMinTeD platform aims to bring full text Open Access scholarly content from a wide range of providers together with … Continuer la lecture de « OpenMinTeD: A Platform Facilitating Text Mining of Scholarly Content [.pdf] »

Source > oro.open.ac.uk, Labourable, Penny; Galanis, Dimitrios; Lempesis, Antonis; Greenwood, Mark; Knoth, Petr et.al., LREC 2018

L’Inist-CNRS partenaire de VisaTM

« Partenaire de VisaTM avec l’INRA et l’Université de Montpellier, l’INIST s’est fait l’ambassadeur de ce projet lors du 29ème Congrès … Continuer la lecture de « L’Inist-CNRS partenaire de VisaTM »

Source > inist.fr, 6 août 2018

Introduction à Voyant Tools

« Voyant Tools est un environnement d’analyse, de lecture et de visualisation de textes numériques. Cette plateforme fait partie d’un projet … Continuer la lecture de « Introduction à Voyant Tools »

Source > github.com/aurelberra/voyant_tools, Aurélien Berra, 28 juin 2018

Enriching metadata of an institutional research repository: Mining grey literature/technical reports for research funding-related information

« (…) As it becomes increasingly important for research organizations to show the impact of their research to donor agencies, grey … Continuer la lecture de « Enriching metadata of an institutional research repository: Mining grey literature/technical reports for research funding-related information »

Source > dspacecris.eurocris.org, Zschocke, Thomas, CRIS2018: 14th International Conference on Current Research Information Systems (Umeå, June 13-16, 2018), http://hdl.handle.net/11366/652

Le temps des SIC

« Pour rendre compte du temps des Sciences de l’Information et de la Communication (SIC), nous avons choisi d’analyser le lexique … Continuer la lecture de « Le temps des SIC »

Source > archivesic.ccsd.cnrs.fr, Gabriel Gallezot, Marty Emmanuel, 2 octobre 2017, HAL Id: sic_01599944

Library Support for Text and Data Mining: A Report for the University Libraries at Virginia Tech (.pdf)

« This report examines how the University Libraries at Virginia Tech have supported text and data mining in the past, and … Continuer la lecture de « Library Support for Text and Data Mining: A Report for the University Libraries at Virginia Tech (.pdf) »

Source > vtechworks.lib.vt.edu, Young, P., Brittle, C., Haugen, I., Lener, E., Pannabecker,V, 22 juin 2017

A New Webliography of Text Mining Resources

« The Science and Technology Resources on the Internet column in the Spring 2017 issue of Issues in Science and Technology Librarianship includes … Continuer la lecture de « A New Webliography of Text Mining Resources »

Source > infodocket.com, Gary Price, 14 juin 2017

Etude critique des nouveaux modes « d’éditorialisation » de revues scientifiques en accès-ouvert

« Ce rapport commandé par BSN 4 et BSN 7 porte sur les nouveaux modes d’éditorialisation des revues en accès ouvert. … Continuer la lecture de « Etude critique des nouveaux modes « d’éditorialisation » de revues scientifiques en accès-ouvert »

Source > hal.archives-ouvertes.fr, Pierre-Carl Langlais, 27 octobre 2016

Le deep learning est-il le futur du text mining ?

« Deep learning : le terme symbolise la grande espérance technologique du moment (et, dans les milieux spécialisés, commence à reléguer … Continuer la lecture de « Le deep learning est-il le futur du text mining ? »

Source > scoms.hypotheses.org, Pierre-Carl Langlais, 2 septembre 2016

Bilbo sur OpenEdition Books

« Depuis début juin, une nouvelle fonctionnalité est installée sur OpenEdition Books : l’outil de text-mining Bilbo, dédié à l’annotation automatique … Continuer la lecture de « Bilbo sur OpenEdition Books »

Source > lab.hypotheses.org, Élodie Faath, 16 juin 2016

Le statut juridique des données de la recherche : entre droit des bases de données et données publiques

« Le statut des données de la recherche : entre droit des bases de données et données publiques from Calimaq S.I.Lex (…) … Continuer la lecture de « Le statut juridique des données de la recherche : entre droit des bases de données et données publiques »

Source > scinfolex, Lionel Maurel, 13 juillet 2015

Infotrieve Spearheads Text Mining Initiative. Text mining capabilities within Mobile LibraryTM successfully tested via pilot with UCB

« Infotrieve, Inc. (www.infotrieve.com), the leader in global-enterprise SaaS software and business services for scientific, technical and medical (“STM”) published content … Continuer la lecture de « Infotrieve Spearheads Text Mining Initiative. Text mining capabilities within Mobile LibraryTM successfully tested via pilot with UCB »

Source > businesswire.com, Robert Mata, 7 juillet 2014

What are the Public Library of Science Collections ? – Part II

« PLOS Collections (1) is a specific section of the Public Library of Science (PLOS) initiative which hosts collections of articles … Continuer la lecture de « What are the Public Library of Science Collections ? – Part II »

Source > blog.scielo.org, Ernesto Spinak, 24 juin 2014

Bringing Digital Science Deep Inside the Scientific Article: the Elsevier Article of the Future Project – IJsbrand Jan Aalbersberg, Sophia Atzeni, Hylke Koers, Beate Specker, Elena Zudilova-Seinstra (.pdf)

« Abstract The ICT revolution of the last decades impacted scientific communication as it has impacted many other forms of communications, … Continuer la lecture de « Bringing Digital Science Deep Inside the Scientific Article: the Elsevier Article of the Future Project – IJsbrand Jan Aalbersberg, Sophia Atzeni, Hylke Koers, Beate Specker, Elena Zudilova-Seinstra (.pdf) »

Source > microblogging.infodocs.eu, avril 2014

Standardisation in the area of innovation and technological development, notably in the field of Text and Data Mining. Report from the Expert Group. European Commission (.pdf)

« Executive summary Text and data mining (TDM) is an important technique for analysing and extracting new insights and knowledge from the … Continuer la lecture de « Standardisation in the area of innovation and technological development, notably in the field of Text and Data Mining. Report from the Expert Group. European Commission (.pdf) »

Source > ec.europa.eu, 4 avril 2014

Droit et open data : les bases de données de Légifrance, bientôt sous licences gratuites

« …Jusque-là, il fallait s’acquitter de licences payantes pour disposer, depuis Légifrance, de chacune des bases de données juridiques produites par … Continuer la lecture de « Droit et open data : les bases de données de Légifrance, bientôt sous licences gratuites »

Source > archimag.com, Clémence Jost, 24 janvier 2014

Workshop report from The Perfect Swell: defining the ideal conditions for the growth of text and data mining in Europe

 » … LIBER, has taken the lead on this issue and, in conjunction with Copyright4Creativity, organised a workshop on the 29th … Continuer la lecture de « Workshop report from The Perfect Swell: defining the ideal conditions for the growth of text and data mining in Europe »

Source > libereurope.eu, 29 octobre 2013

Archimag n° 268 – DOSSIER : « Tour de France de la dématérialisation »

Sommaire : « ACTUALITÉS Retrouvez toute l’actualité et les tendances des technologies de l’information ! OUTILS – Tendance : cloud français : … Continuer la lecture de « Archimag n° 268 – DOSSIER : « Tour de France de la dématérialisation » »

Source > archimag.com, octobre 2013

R.TeMiS : création et analyse de corpus de textes sous R

 » Fonctionnalités générales R.TeMiS (R Text Mining Solution) est un environnement graphique de travail sous R permettant de créer, manipuler et … Continuer la lecture de « R.TeMiS : création et analyse de corpus de textes sous R »

Source > projet-plume.org, Milan Bouchet-Valat, 10 juin 2013

Quel droit pour faire du text et du data mining ?

 » Licences for Europe [1], initiative prise en février 2013 par la Commission européenne pour trouver des solutions juridiques en matière de … Continuer la lecture de « Quel droit pour faire du text et du data mining ? »

Source > paralipomenes.net, Michèle Battisti, 15 avril 2013