#VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining

« Dans le cadre du projet Visa TM du Comité pour la Science Ouverte, un « Visa TM Day » sera organisé … Continuer la lecture de « #VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining »

Using Transkribus for automated text recognition of historical Bengali Books

« Are you working with digitised printed collections that you want to ‘unlock’ for keyword search and text mining? Maybe you … Continuer la lecture de « Using Transkribus for automated text recognition of historical Bengali Books »

Application of Natural Language Processing Algorithms to the Task of Automatic Classification of Russian Scientific Texts

« This work is devoted to the study of applicability of modern methods of machine learning to the task of automatic … Continuer la lecture de « Application of Natural Language Processing Algorithms to the Task of Automatic Classification of Russian Scientific Texts »

VIANA: Visual Interactive Annotation of Argumentation

« (…) In this paper, we present a visual analytics system that augments the manual annotation process by automatically suggesting which … Continuer la lecture de « VIANA: Visual Interactive Annotation of Argumentation »

NaCTeM announced as the winners of NLP challenge on scholarly discourse and summarisation

« A team of researchers from NaCTeM group were recently announced as the winners of an NLP challenge. Dr. Chrysoula Zerva, … Continuer la lecture de « NaCTeM announced as the winners of NLP challenge on scholarly discourse and summarisation »

Mining Text, Linking Entities – National Library Board of Singapore’s Journey

« Connecting collections across institutions and discovering hidden knowledge has always been our goal. Due to disparate data sources, differing levels … Continuer la lecture de « Mining Text, Linking Entities – National Library Board of Singapore’s Journey »

Cette IA aide à compléter d’anciennes recherches scientifiques

« Des chercheurs du laboratoire national américain Lawrence-Berkeley ont utilisé le machine learning pour révéler de nouvelles connaissances scientifiques cachées dans … Continuer la lecture de « Cette IA aide à compléter d’anciennes recherches scientifiques »

Gerrish, Charlotte. « European Copyright Law and the Text and Data Mining Exceptions and Limitations » [thesis]

« We are in a digital age with Big Data at the heart of our global online environment. Exploiting Big Data … Continuer la lecture de « Gerrish, Charlotte. « European Copyright Law and the Text and Data Mining Exceptions and Limitations » [thesis] »

Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse]

« (…) Cette thèse étudie différentes stratégies en recherche d’information et en fouille de données textuelles (amélioration du triage de documents … Continuer la lecture de « Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse] »

Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities

« Istex is a database of twenty million full text scientific papers bought by the French Government for the use of … Continuer la lecture de « Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities »

Identifying Clinical Terms in Medical Text Using Ontology-Guided Machine Learning

« (…) We present a neural dictionary model that can be used to predict if a phrase is synonymous to a … Continuer la lecture de « Identifying Clinical Terms in Medical Text Using Ontology-Guided Machine Learning »

Le patrimoine numérique national à l’heure de l’intelligence artificielle. Le programme de recherche Corpus comme espace d’expérimentation pour les humanités numériques

« Dans un contexte d’augmentation des volumétries des données et de réduction des temps de traitement, la Bibliothèque nationale de France … Continuer la lecture de « Le patrimoine numérique national à l’heure de l’intelligence artificielle. Le programme de recherche Corpus comme espace d’expérimentation pour les humanités numériques »

Atelier ISTEX à Nancy le mardi 18 juin

« Ces ateliers vous permettront de prendre en main les services et les outils de constitution, de visualisation et d’exploration d’un … Continuer la lecture de « Atelier ISTEX à Nancy le mardi 18 juin »

Critères de sélection d’outils de fouille de textes

« Le travail sur les critères de sélection doit permettre de caractériser les outils de fouille de textes et de données … Continuer la lecture de « Critères de sélection d’outils de fouille de textes »

Giovanni Filippo Caruso. «Text Mining extraction from videos in a learning environment through Educational Data Mining» [thèse]

« The thesis aims to study and to find new learning scenarios for teachers according to new technologies and possibilities of … Continuer la lecture de « Giovanni Filippo Caruso. «Text Mining extraction from videos in a learning environment through Educational Data Mining» [thèse] »

BIR 2019 / 8th International Workshop on Bibliometric-enhanced Information Retrieval* – Cologne, Germany, April 14th, 2019 [book of proceedings]

*co-located with the 41st European Conference on Information Retrieval (ECIR 2019) « The Bibliometric-enhanced Information Retrieval workshop series (BIR) at ECIR … Continuer la lecture de « BIR 2019 / 8th International Workshop on Bibliometric-enhanced Information Retrieval* – Cologne, Germany, April 14th, 2019 [book of proceedings] »

41st European Conference on IR Research, ECIR 2019, Cologne, Germany, April 14–18, 2019 [Proceedings, Part I and Part II]

« The 41st European Conference on Information Retrieval (ECIR) was held in Cologne, Germany, during April 14–18, 2019, and brought together … Continuer la lecture de « 41st European Conference on IR Research, ECIR 2019, Cologne, Germany, April 14–18, 2019 [Proceedings, Part I and Part II] »

Introduction to Data Science Data Analysis and Prediction Algorithms with R

« (…) The link for the online version of the book is https://rafalab.github.io/dsbook/ The R markdown code used to generate the … Continuer la lecture de « Introduction to Data Science Data Analysis and Prediction Algorithms with R »

Questionnaire : la fouille de textes aujourd’hui…et demain ?

« Ce questionnaire vise à qualifier les pratiques autour de la fouille de texte et à identifier les verrous et les … Continuer la lecture de « Questionnaire : la fouille de textes aujourd’hui…et demain ? »

Les avancées de Numapresse : pour une approche contextuelle du Text Mining

« Cet article est le premier d’une série de retours d’expériences sur les travaux menés par le projet Numapresse au cours … Continuer la lecture de « Les avancées de Numapresse : pour une approche contextuelle du Text Mining »

Questionnaire : la fouille de textes aujourd’hui…et demain ?

« Ce questionnaire vise à qualifier les pratiques autour de la fouille de texte et à identifier les verrous et les … Continuer la lecture de « Questionnaire : la fouille de textes aujourd’hui…et demain ? »

Elsevier Launches Entellect™ Platform, Unlocking Value by Creating AI-ready Life Sciences Data

« Entellect leverages Elsevier‘s unique heritage to help enrich data and help companies overcome challenges in modern R&D Elsevier, the information … Continuer la lecture de « Elsevier Launches Entellect™ Platform, Unlocking Value by Creating AI-ready Life Sciences Data »

Entity-fishing for Scholarly Publishing: Challenges and Recommendations

« On 4th September 2018 the Göttingen State and University Library, with the support of the Max Weber Stiftung, organised the … Continuer la lecture de « Entity-fishing for Scholarly Publishing: Challenges and Recommendations »

Thalia: Semantic search engine for biomedical abstracts

« While publication rate of the biomedical literature has been growing steadily during the last decades, the accessibility of pertinent research … Continuer la lecture de « Thalia: Semantic search engine for biomedical abstracts »

OpenMinTeD: A Platform Facilitating Text Mining of Scholarly Content [.pdf]

« The OpenMinTeD platform aims to bring full text Open Access scholarly content from a wide range of providers together with … Continuer la lecture de « OpenMinTeD: A Platform Facilitating Text Mining of Scholarly Content [.pdf] »

L’Inist-CNRS partenaire de VisaTM

« Partenaire de VisaTM avec l’INRA et l’Université de Montpellier, l’INIST s’est fait l’ambassadeur de ce projet lors du 29ème Congrès … Continuer la lecture de « L’Inist-CNRS partenaire de VisaTM »

Introduction à Voyant Tools

« Voyant Tools est un environnement d’analyse, de lecture et de visualisation de textes numériques. Cette plateforme fait partie d’un projet … Continuer la lecture de « Introduction à Voyant Tools »

Enriching metadata of an institutional research repository: Mining grey literature/technical reports for research funding-related information

« (…) As it becomes increasingly important for research organizations to show the impact of their research to donor agencies, grey … Continuer la lecture de « Enriching metadata of an institutional research repository: Mining grey literature/technical reports for research funding-related information »

Le temps des SIC

« Pour rendre compte du temps des Sciences de l’Information et de la Communication (SIC), nous avons choisi d’analyser le lexique … Continuer la lecture de « Le temps des SIC »

Library Support for Text and Data Mining: A Report for the University Libraries at Virginia Tech (.pdf)

« This report examines how the University Libraries at Virginia Tech have supported text and data mining in the past, and … Continuer la lecture de « Library Support for Text and Data Mining: A Report for the University Libraries at Virginia Tech (.pdf) »

A New Webliography of Text Mining Resources

« The Science and Technology Resources on the Internet column in the Spring 2017 issue of Issues in Science and Technology Librarianship includes … Continuer la lecture de « A New Webliography of Text Mining Resources »

Etude critique des nouveaux modes « d’éditorialisation » de revues scientifiques en accès-ouvert

« Ce rapport commandé par BSN 4 et BSN 7 porte sur les nouveaux modes d’éditorialisation des revues en accès ouvert. … Continuer la lecture de « Etude critique des nouveaux modes « d’éditorialisation » de revues scientifiques en accès-ouvert »

Le deep learning est-il le futur du text mining ?

« Deep learning : le terme symbolise la grande espérance technologique du moment (et, dans les milieux spécialisés, commence à reléguer … Continuer la lecture de « Le deep learning est-il le futur du text mining ? »

Bilbo sur OpenEdition Books

« Depuis début juin, une nouvelle fonctionnalité est installée sur OpenEdition Books : l’outil de text-mining Bilbo, dédié à l’annotation automatique … Continuer la lecture de « Bilbo sur OpenEdition Books »

Le statut juridique des données de la recherche : entre droit des bases de données et données publiques

« Le statut des données de la recherche : entre droit des bases de données et données publiques from Calimaq S.I.Lex (…) … Continuer la lecture de « Le statut juridique des données de la recherche : entre droit des bases de données et données publiques »

Infotrieve Spearheads Text Mining Initiative. Text mining capabilities within Mobile LibraryTM successfully tested via pilot with UCB

« Infotrieve, Inc. (www.infotrieve.com), the leader in global-enterprise SaaS software and business services for scientific, technical and medical (“STM”) published content … Continuer la lecture de « Infotrieve Spearheads Text Mining Initiative. Text mining capabilities within Mobile LibraryTM successfully tested via pilot with UCB »

What are the Public Library of Science Collections ? – Part II

« PLOS Collections (1) is a specific section of the Public Library of Science (PLOS) initiative which hosts collections of articles … Continuer la lecture de « What are the Public Library of Science Collections ? – Part II »

Bringing Digital Science Deep Inside the Scientific Article: the Elsevier Article of the Future Project – IJsbrand Jan Aalbersberg, Sophia Atzeni, Hylke Koers, Beate Specker, Elena Zudilova-Seinstra (.pdf)

« Abstract The ICT revolution of the last decades impacted scientific communication as it has impacted many other forms of communications, … Continuer la lecture de « Bringing Digital Science Deep Inside the Scientific Article: the Elsevier Article of the Future Project – IJsbrand Jan Aalbersberg, Sophia Atzeni, Hylke Koers, Beate Specker, Elena Zudilova-Seinstra (.pdf) »

Standardisation in the area of innovation and technological development, notably in the field of Text and Data Mining. Report from the Expert Group. European Commission (.pdf)

« Executive summary Text and data mining (TDM) is an important technique for analysing and extracting new insights and knowledge from the … Continuer la lecture de « Standardisation in the area of innovation and technological development, notably in the field of Text and Data Mining. Report from the Expert Group. European Commission (.pdf) »

Droit et open data : les bases de données de Légifrance, bientôt sous licences gratuites

« …Jusque-là, il fallait s’acquitter de licences payantes pour disposer, depuis Légifrance, de chacune des bases de données juridiques produites par … Continuer la lecture de « Droit et open data : les bases de données de Légifrance, bientôt sous licences gratuites »

Workshop report from The Perfect Swell: defining the ideal conditions for the growth of text and data mining in Europe

 » … LIBER, has taken the lead on this issue and, in conjunction with Copyright4Creativity, organised a workshop on the 29th … Continuer la lecture de « Workshop report from The Perfect Swell: defining the ideal conditions for the growth of text and data mining in Europe »

Archimag n° 268 – DOSSIER : « Tour de France de la dématérialisation »

Sommaire : « ACTUALITÉS Retrouvez toute l’actualité et les tendances des technologies de l’information ! OUTILS – Tendance : cloud français : … Continuer la lecture de « Archimag n° 268 – DOSSIER : « Tour de France de la dématérialisation » »

R.TeMiS : création et analyse de corpus de textes sous R

 » Fonctionnalités générales R.TeMiS (R Text Mining Solution) est un environnement graphique de travail sous R permettant de créer, manipuler et … Continuer la lecture de « R.TeMiS : création et analyse de corpus de textes sous R »

Quel droit pour faire du text et du data mining ?

 » Licences for Europe [1], initiative prise en février 2013 par la Commission européenne pour trouver des solutions juridiques en matière de … Continuer la lecture de « Quel droit pour faire du text et du data mining ? »