Fouiller un corpus en structurant sa terminologie - Archive ouverte HAL Access content directly
Conference Papers Year :

Fouiller un corpus en structurant sa terminologie

(1) , (1) , (1) ,
1
Olivier Ferret
Christian Fluhr
  • Function : Author
Françoise Rousseau-Hans
Jean-Luc Simoni
  • Function : Author

Abstract

L’exploitation d’un grand ensemble de textes, dans le contexte d’une veille technologique par exemple, passe souvent par l’utilisation d’un logiciel de Text Mining. L’objet de cet article est de présenter un nouvel algorithme pour la construction de représentations simplifiées de contenus textuels. La simple notion de cooccurrence entre termes y est dépassée pour mettre en évidence des relations de nature hiérarchique, traduisant des différences de niveau de généralité au sein de la terminologie extraite d’un ensemble important de textes. Cet outil fait appel à un pré-traitement linguistique des textes permettant de dégager leur terminologie sous une forme normalisée, à la fois composée de termes simples et de multi-termes
Fichier principal
Vignette du fichier
VSST2001Tome%20I_Chap%206.pdf (299.7 Ko) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

cea-03527765 , version 1 (16-01-2022)

Identifiers

  • HAL Id : cea-03527765 , version 1

Cite

Olivier Ferret, Christian Fluhr, Françoise Rousseau-Hans, Jean-Luc Simoni. Fouiller un corpus en structurant sa terminologie. VSST'2001 - Veille stratégique scientifique et technologique, Oct 2001, Barcelone, Espagne. ⟨cea-03527765⟩

Collections

CEA
18 View
16 Download

Share

Gmail Facebook Twitter LinkedIn More