Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d’été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus)

« L’UMR Thalim en collaboration avec l’UMR LATTICE et la TGIR HUMANUM du 28 juin au 4 juillet 2020 dans le … Continuer la lecture de « Nouvelles méthodes pour la fouille et l’analyse des corpus textuels (école d’été du 28 juin au 4 juillet 2020, villa Cynthia à Fréjus) »

Source > humanum.hypotheses.org, pbusonera, 7 janvier 2020

The SmartSHARK Ecosystem for Software Repository Mining

« Software repository mining is the foundation for many empirical software engineering studies. The collection and analysis of detailed data can … Continuer la lecture de « The SmartSHARK Ecosystem for Software Repository Mining »

Source > arxiv.org, Alexander Trautsch, Fabian Trautsch, Steffen Herbold, Benjamin Ledel, Jens Grabowski, 6 Jan 2020, arXiv:2001.01606v1

Towards Learning from User Feedback for Ontology-basedInformation Extraction (.pdf)

« (…) To automate the evolution of ontologies, we developed ConTrOn- Continuously Trained Ontology – that automatically extracts information from data … Continuer la lecture de « Towards Learning from User Feedback for Ontology-basedInformation Extraction (.pdf) »

Source > di2kg.inf.uniroma3.it, Opasjumruskit, Kobkaew, Schindler, Sirko, Thiele, Laura, Thiele, LauraSchäfer, Philipp Matthias, DI2KG ’19, August 05, 2019, Anchorage, AK

#VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining

« Dans le cadre du projet Visa TM du Comité pour la Science Ouverte, un « Visa TM Day » sera organisé … Continuer la lecture de « #VisaTMDay le 15 novembre : vers une infrastructure de services avancés en text-mining »

Source > inist.fr, 25 septembre 2019

SEMANTiCS 2019 « The Power of AI and Knowledge Graphs », Sept. 09-12, 2019 , Karlsruhe (Germany) [programme]

« SEMANTiCS conference is the leading European conference on Semantic Technologies and AI. Researchers, industry experts and business leaders can develop … Continuer la lecture de « SEMANTiCS 2019 « The Power of AI and Knowledge Graphs », Sept. 09-12, 2019 , Karlsruhe (Germany) [programme] »

Source > 2019.semantics.cc, 2019

Atelier – Du parchemin à la fouille de données. Nouveaux outils pour la création, la formalisation et l’analyse des corpus médiévaux – 28-30 octobre 2019 – Campus Condorcet (Paris)

« (…) L’objectif de cet atelier sera d’offrir une première initiation à des outils informatiques de création, de formalisation et d’analyse … Continuer la lecture de « Atelier – Du parchemin à la fouille de données. Nouveaux outils pour la création, la formalisation et l’analyse des corpus médiévaux – 28-30 octobre 2019 – Campus Condorcet (Paris) »

Source > cosme.hypotheses.org, paulbertrand2, 19 aout 2019

Application of Natural Language Processing Algorithms to the Task of Automatic Classification of Russian Scientific Texts

« This work is devoted to the study of applicability of modern methods of machine learning to the task of automatic … Continuer la lecture de « Application of Natural Language Processing Algorithms to the Task of Automatic Classification of Russian Scientific Texts »

Source > datascience.codata.org, Romanov, A., Lomotin, K. and Kozlova, E., 2019, Data Science Journal, 18(1), p.37. DOI: http://doi.org/10.5334/dsj-2019-037

VIANA: Visual Interactive Annotation of Argumentation

« (…) In this paper, we present a visual analytics system that augments the manual annotation process by automatically suggesting which … Continuer la lecture de « VIANA: Visual Interactive Annotation of Argumentation »

Source > arxiv.org, Fabian Sperrle, Rita Sevastjanova, Rebecca Kehlbeck, Mennatallah El-Assady, 2019, arXiv:1907.12413v1

Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 4 – 8, 2019 – Anchorage, Alaska – USA

« The annual ACM SIGKDD Conference is the premier international forum for data mining researchers and practitioners from academia, industry, and … Continuer la lecture de « Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 4 – 8, 2019 – Anchorage, Alaska – USA »

Source > dl.acm.org, Ankur Teredesai, Vipin Kumar, Ying Li, Rómer Rosales, Evimaria Terzi, George Karypis, aout 2019

NaCTeM announced as the winners of NLP challenge on scholarly discourse and summarisation

« A team of researchers from NaCTeM group were recently announced as the winners of an NLP challenge. Dr. Chrysoula Zerva, … Continuer la lecture de « NaCTeM announced as the winners of NLP challenge on scholarly discourse and summarisation »

Source > nactem.ac.uk, 5 aout 2019

Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse]

« (…) Cette thèse étudie différentes stratégies en recherche d’information et en fouille de données textuelles (amélioration du triage de documents … Continuer la lecture de « Mottin, Luc. « Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques » [thèse] »

Source > archive-ouverte.unige.ch, Mottin, Luc, Directeurs Chopard, Bastien, Ruch, Patrick, DOI: 10.13097/archive-ouverte/unige:118269 URN: urn:nbn:ch:unige-1182697

A Hybrid Information Extraction Approach Exploiting Structured Data Within a Text Mining Process

« Many data sets encompass structured data fields with embedded free text fields. The text fields allow customers and workers to … Continuer la lecture de « A Hybrid Information Extraction Approach Exploiting Structured Data Within a Text Mining Process »

Source > dl.gi.de/handle, Kiefer, C., Reimann, P. & Mitschang, B., In: Grust, T., Naumann, F., Böhm, A. et al, BTW 2019. Gesellschaft für Informatik, Bonn. (S. 149-168)

Stéphanie Challita. « Inferring Models from Cloud APIs and Reasoning over Them: A Tooled and Formal Approach » [PhD thesis]

« In recent years, multi-cloud computing which aims to combine different offerings ormigrate applications between different cloud providers, has become a … Continuer la lecture de « Stéphanie Challita. « Inferring Models from Cloud APIs and Reasoning over Them: A Tooled and Formal Approach » [PhD thesis] »

Source > hal.inria.fr, Stéphanie Challita, Software Engineering [cs.SE]. Universite Lille 1, 2018. English.

EGC 2019 – 19ème conférence francophone sur l’Extraction et la Gestion des Connaissances – 21 au 25 janvier 2019 – Metz [actes de conférence]

« (…) La conférence Extraction et Gestion de Connaissances (EGC) est le rendez-vous annuel de chercheurs et praticiens travaillant dans les … Continuer la lecture de « EGC 2019 – 19ème conférence francophone sur l’Extraction et la Gestion des Connaissances – 21 au 25 janvier 2019 – Metz [actes de conférence] »

Source > editions-rnti.fr, Revue des Nouvelles Technologies de l'Information vol.RNTI-E-35, 2019

HathiTrust Research Center Extends Non-Consumptive Research Tools to Copyrighted Materials: Expanding Research through Fair Use

« HathiTrust has reached a tremendous milestone in the history of HathiTrust and the HathiTrust Research Center’s services. Since 2011, HTRC … Continuer la lecture de « HathiTrust Research Center Extends Non-Consumptive Research Tools to Copyrighted Materials: Expanding Research through Fair Use »

Source > hathitrust.org, jbelle, 20 septembre 2018

Emmanuel Le Roy Ladurie, précurseur du data mining ?

« En affirmant dès la fin des années 1960 que « les historiens seront programmeurs ou ne seront plus »1, Emmanuel … Continuer la lecture de « Emmanuel Le Roy Ladurie, précurseur du data mining ? »

Source > bnf.hypotheses.org, Olivier Jacquot, 14 septembre 2018

Méthodologie pour identifier les terrains d’étude dans des corpus scientifiques

« Le projet interdisciplinaire TERRE-ISTEX a pour objectif d’identifier l’évolution des fronts de recherche en relation avec les territoires d’études, les … Continuer la lecture de « Méthodologie pour identifier les terrains d’étude dans des corpus scientifiques »

Source > hal.archives-ouvertes.fr, Eric Kergosien, Marie-Noëlle Bessagnet, Maguelonne Teisseire, Joachim Schöpfel, Mohammad Amin Farvardin, et al., Revue des Sciences et Technologies de l'Information - Série Document Numérique, Lavoisier, 2017, 20 (2-3), pp.11-30. 〈https://dn.revuesonline.com/article.jsp?articleId=39554〉. 〈10.3166/dn.2017.00011〉. 〈hal-01856066v2〉

Armel Fotsoh Tawaofaing. « Recherche d’entités nommées complexes sur le web : propositions pour l’extraction et pour le calcul de similarité » [thèse]

« Les récents développements des nouvelles technologies de l’information et de la communication font du Web une véritable mine d’information. Cependant, … Continuer la lecture de « Armel Fotsoh Tawaofaing. « Recherche d’entités nommées complexes sur le web : propositions pour l’extraction et pour le calcul de similarité » [thèse] »

Source > theses.fr, Armel Fotsoh Tawaofaing, sous la direction de Christian Sallaberry et de Annig Le Parc-Lacayrelle, 2018

Extraction et Gestion des Connaissances, EGC’2018 [actes de conférence]

« La sélection d’articles publiés dans le présent recueil constitue les actes de la 18e édition de la conférence (EGC 2018) … Continuer la lecture de « Extraction et Gestion des Connaissances, EGC’2018 [actes de conférence] »

Source > editions-rnti.fr, Revue des Nouvelles Technologies de l'Information vol.RNTI-E-34, 2018

Le petit laboratoire sémantique : expérimentation à la BM de Fresnes

« Dans une démarche d’expérimentation, le petit laboratoire sémantique, développé en interne à la bibliothèque municipale de Fresnes, vise à explorer … Continuer la lecture de « Le petit laboratoire sémantique : expérimentation à la BM de Fresnes »

Source > transition-bibliographique.fr, 9 avril 2018

Grégory Smits. « Personnalisation et enrichissement des méthodes d’accès aux données »

« La transformation de données en connaissances constitue une tâche cruciale au cœur de nombreuses activités professionnelles. Deux principales stratégies peuvent … Continuer la lecture de « Grégory Smits. « Personnalisation et enrichissement des méthodes d’accès aux données » »

Source > hal-centralesupelec.archives-ouvertes.fr, Grégory Smits, Université Rennes 1, 2018. 〈tel-01739707〉

Annotation et analyse syntaxique de corpus hétérogènes [podcast]

« Comment doter le français médiéval (IXe-XVe siècles) d’une chaîne d’annotation automatique en syntaxe de dépendances ? Par Mathilde Regnault, doctorante … Continuer la lecture de « Annotation et analyse syntaxique de corpus hétérogènes [podcast] »

Source > franceculture.fr, La Recherche montre en main, 21 mars 2018

Releasing 1.8 million open access publications from publisher systems for text and data mining

« Text and data mining offers an opportunity to improve the way we access and analyse the outputs of academic research. … Continuer la lecture de « Releasing 1.8 million open access publications from publisher systems for text and data mining »

Source > blogs.lse.ac.uk, Petr Knoth, Nancy Pontika, Lucas Anastasiou, 22 mars 2018

Text Data Mining from the Author’s Perspective: Whose Text, Whose Mining, and to Whose Benefit?

« Given the many technical, social, and policy shifts in access to scholarly content since the early days of text data … Continuer la lecture de « Text Data Mining from the Author’s Perspective: Whose Text, Whose Mining, and to Whose Benefit? »

Source > arxiv.org, Christine L. Borgman, 12 mars 2018, arXiv:1803.04552

The articles of SciELO journals on the European Commission Open Science platforms

« From March 2018 the articles published by SciELO journals will integrate and enjoy the features offered by two important development … Continuer la lecture de « The articles of SciELO journals on the European Commission Open Science platforms »

Source > blog.scielo.org, Abel L. Packer, Gustavo Fonseca, 9 mars 2018

OpenMinTed : une plateforme d’outils informatiques pour extraire et exploiter les informations de la littérature scientifique

« L’équipe Bibliome-MaIAGE et la Délégation Information Scientifique et Technique (DIST) de l’Inra contribuent au projet européen d’infrastructure OpenMinTeD dont l’objectif … Continuer la lecture de « OpenMinTed : une plateforme d’outils informatiques pour extraire et exploiter les informations de la littérature scientifique »

Source > jouy.inra.fr, Céline Bezy, 2 mars 2018

revue RIDoWS / Recherche d’Information, Document, Web sémantique / dans la collection OpenScience d’ISTE

« Recherche d’information, document et web sémantique est un point de rencontre pour ces communautés scientifiques ou industrielles qui s’intéressent à … Continuer la lecture de « revue RIDoWS / Recherche d’Information, Document, Web sémantique / dans la collection OpenScience d’ISTE »

Source > www.openscience.fr, Rédacteur en chef, Vincent Claveau, 2017-2018

TDM STORIES: A Text & Data Miner Talks About Analysing The Recent Past

« Federico Nanni is a researcher who uses TDM to build collections of materials from large archives which can be used … Continuer la lecture de « TDM STORIES: A Text & Data Miner Talks About Analysing The Recent Past »

Source > openminted.eu, 02 février 2018

KEY CONCEPTS AND AREAS IN TDM EXPLAINED – PART 6: DEEP LEARNING

« It’s time for our final episode of this series of ‘Key concepts and areas in TDM explained’. This time Robert … Continuer la lecture de « KEY CONCEPTS AND AREAS IN TDM EXPLAINED – PART 6: DEEP LEARNING »

Source > openminted.eu, 30 janvier 2018

Key concepts and areas in TDM explained – Part 5: Knowledge Discovery

« Knowledge discovery is the process of discovering new information. In text and data mining this happens for example by finding … Continuer la lecture de « Key concepts and areas in TDM explained – Part 5: Knowledge Discovery »

Source > openminted.eu, 16 janvier 2018

Étiquetage thématique automatisé de corpus par représentation sémantique

« Dans les corpus de textes scientifiques, certains articles issus de communautés de chercheurs différentes peuvent ne pas être décrits par … Continuer la lecture de « Étiquetage thématique automatisé de corpus par représentation sémantique »

Source > hal.archives-ouvertes.fr, Lucie Martinet, Hussein Al-Natsheh, Fabien Rico, Fabrice Muhlenbach, Djamel Zighed, 2018 - 18ème Conférence Internationale sur l'Extraction et la Gestion de Connaissances, Jan 2018, Paris-Nord, France. pp.1-6. 〈hal-01659639〉

Prototype expérimental pour l’exploration de corpus audiovisuels et textuels

« Paroles, Images et Textes des Savoirs (P.I.T.S) est une plateforme d’extraction automatique de métadonnées et d’exploration innovante des contenus audiovisuels. … Continuer la lecture de « Prototype expérimental pour l’exploration de corpus audiovisuels et textuels »

Source > fmsh.fr, décembre 2017

Identifying and Improving Dataset References in Social Sciences Full Texts

« Scientific full text papers are usually stored in separate places than their underlying research datasets. Authors typically make references to … Continuer la lecture de « Identifying and Improving Dataset References in Social Sciences Full Texts »

Source > arxiv, Behnam Ghavimi, Philipp Mayr, Sahar Vahdati, Christoph Lange, 6 mars 2016

Thèse de François-Régis Chaumartin « Antelope, une plate-forme de TAL permettant d’extraire les sens du texte : théorie et applications de l’interface syntaxe-sémantique »

 » Créer rapidement un analyseur sémantique dédié à une tâche particulière n’est pas une tâche aisée. En effet, composants d’analyse et … Continuer la lecture de « Thèse de François-Régis Chaumartin « Antelope, une plate-forme de TAL permettant d’extraire les sens du texte : théorie et applications de l’interface syntaxe-sémantique » »

Source > tel.archives-ouvertes.fr, 22 Mars 2013

Thèse de Charles Teissèdre « Analyse sémantique automatique des adverbiaux de localisation temporelle : application à la recherche d’information et à l’acquisition de connaissances »

« Cette thèse concerne la question de l’accès aux textes numériques, en particulier de l’accès à leur  » contenu informationnel « , … Continuer la lecture de « Thèse de Charles Teissèdre « Analyse sémantique automatique des adverbiaux de localisation temporelle : application à la recherche d’information et à l’acquisition de connaissances » »

Source > tel.archives-ouvertes.fr, 7 décembre 2012

Discours de presse et veille stratégique d’événements. Approche textométrique et extraction d’informations pour la fouille de textes – Thèse de Erin Macmurray

« Ce travail a pour objet l’étude de deux méthodes de fouille automatique de textes, l’extraction d’informations et la textométrie, toutes … Continuer la lecture de « Discours de presse et veille stratégique d’événements. Approche textométrique et extraction d’informations pour la fouille de textes – Thèse de Erin Macmurray »

Source > tel.archives-ouvertes, Erin Macmurray, 10 octobre 2012