Thibaut Thonet. « Modèles thématiques pour la découverte non supervisée de points de vue sur le Web » [thèse]

« Les plateformes en ligne telles que les blogs et les réseaux sociaux permettent aux internautes de s’exprimer sur des sujets d’une grande variété (produits commerciaux, politique, services, etc.). Cet important volume de données d’opinions peut être exploré et exploité grâce à des techniques de fouille de texte connues sous le nom de fouille d’opinions ou analyse de sentiments. (…)

Dans notre première contribution, nous avons exploré l’idée de différencier mots d’opinions (spécifiques à la fois à un point de vue et à un thème) et mots thématiques (dépendants du thème mais neutres vis-à-vis des différents points de vue) en nous basant sur les parties de discours, inspirée par des pratiques similaires dans la littérature de fouille d’opinions classique – restreinte aux opinions positives et négatives. Notre seconde contribution se focalise quant à elle sur les points de vue exprimés sur les réseaux sociaux. Notre objectif est ici d’analyser dans quelle mesure l’utilisation des interactions entre utilisateurs, en outre de leur contenu textuel généré, est bénéfique à l’identification de leurs points de vue. Nos différentes contributions ont été évaluées et comparées à l’état de l’art sur des collections de documents réels. »