« Construction d’ontologies à partir d’une collection de pages web structurées » – Aussenac-Gilles N., Kamel M., Buscaldi D., Comparot C. (dans Actes des 24 èmes Journées Francophones d’Ingénierie des Connaissances)

 » De nombreuses collections de documents disponibles sur le web décrivent les caractéristiques d’entités d’un même type (e.g. des produits, des plantes), chaque page présentant une de ces entités. Ces documents sont des sources de connaissances particulièrement adaptées pour la construction d’ontologies. Alors qu’ils partagent une même mise en forme régulière, ils contiennent moins de texte rédigé que des fichiers textes mais leur architecture est riche de sens. De ce fait, les méthodes linguistiques classiques pour identifier des concepts et des relations sont moins adaptées pour les analyser. Nous proposons une approche exploitant les diverses propriétés de ces documents, combinant analyse de la structure et de la mise en forme avec une analyse linguistique, et exploitant leur annotation sémantique. »

ic2013-08.pdf(609.3 KB)