Fouiller un corpus en structurant sa terminologie - CEA - Commissariat à l’énergie atomique et aux énergies alternatives Accéder directement au contenu
Communication Dans Un Congrès Année : 2001

Fouiller un corpus en structurant sa terminologie

Olivier Ferret
Christian Fluhr
  • Fonction : Auteur
Françoise Rousseau-Hans
Jean-Luc Simoni
  • Fonction : Auteur

Résumé

L’exploitation d’un grand ensemble de textes, dans le contexte d’une veille technologique par exemple, passe souvent par l’utilisation d’un logiciel de Text Mining. L’objet de cet article est de présenter un nouvel algorithme pour la construction de représentations simplifiées de contenus textuels. La simple notion de cooccurrence entre termes y est dépassée pour mettre en évidence des relations de nature hiérarchique, traduisant des différences de niveau de généralité au sein de la terminologie extraite d’un ensemble important de textes. Cet outil fait appel à un pré-traitement linguistique des textes permettant de dégager leur terminologie sous une forme normalisée, à la fois composée de termes simples et de multi-termes
Fichier principal
Vignette du fichier
VSST2001Tome%20I_Chap%206.pdf (299.7 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

cea-03527765 , version 1 (16-01-2022)

Identifiants

  • HAL Id : cea-03527765 , version 1

Citer

Olivier Ferret, Christian Fluhr, Françoise Rousseau-Hans, Jean-Luc Simoni. Fouiller un corpus en structurant sa terminologie. VSST'2001 - Veille stratégique scientifique et technologique, Oct 2001, Barcelone, Espagne. ⟨cea-03527765⟩

Collections

CEA
26 Consultations
25 Téléchargements

Partager

Gmail Facebook X LinkedIn More