Eléments de réflexion sur l’utilisation de corpus pour la construction d’ontologies. Xavier Aimé

« Résumé : L’Ingénierie des Connaissances (IC) est née d’une inter-disciplinarité alliant informatique, intelligence artificielle, psychologie cognitive, ergonomie et sciences de gestion. Aujourd’hui, il semblerait que l’IC soit plus orientée vers la dimension technologique, notamment de par les problèmes d’hétérogénéité et de quantité massive de données qu’elle doit gérer. Un petit retour aux sources, vers les Sciences Humaines et Sociales, ne serait pas préjudiciable. De nos jours, il est communément fait appel aux corpus de textes pour la construction d’ontologies de domaine, corpus essentiellement considérés comme des ensembles de termes plus ou moins structurés. Or un texte est avant tout un acte de communication, un outil de transmission d’un message de la part d’un émetteur doté d’une intention à destination d’un récepteur. Nous proposons dans cet article quelques éléments de réflexions à prendre en compte pour la constitution du corpus et l’extraction de termes en nous fondons notamment sur l’analyse de contenu utilisé en psychologie. »