Fouiller un corpus en structurant sa terminologie
Abstract
L’exploitation d’un grand ensemble de textes, dans le contexte d’une veille technologique par exemple, passe souvent par l’utilisation d’un logiciel de Text Mining. L’objet de cet article est de présenter un nouvel algorithme pour la construction de représentations simplifiées de contenus textuels. La simple notion de cooccurrence entre termes y est dépassée pour mettre en évidence des relations de nature hiérarchique, traduisant des différences de niveau de généralité au sein de la terminologie extraite d’un ensemble important de textes. Cet outil fait appel à un pré-traitement linguistique des textes permettant de dégager leur terminologie sous une forme normalisée, à la fois composée de termes simples et de multi-termes
Origin : Files produced by the author(s)