HAL will be down for maintenance from Friday, June 10 at 4pm through Monday, June 13 at 9am. More information
Skip to Main content Skip to Navigation
Conference papers

Fouiller un corpus en structurant sa terminologie

Abstract : L’exploitation d’un grand ensemble de textes, dans le contexte d’une veille technologique par exemple, passe souvent par l’utilisation d’un logiciel de Text Mining. L’objet de cet article est de présenter un nouvel algorithme pour la construction de représentations simplifiées de contenus textuels. La simple notion de cooccurrence entre termes y est dépassée pour mettre en évidence des relations de nature hiérarchique, traduisant des différences de niveau de généralité au sein de la terminologie extraite d’un ensemble important de textes. Cet outil fait appel à un pré-traitement linguistique des textes permettant de dégager leur terminologie sous une forme normalisée, à la fois composée de termes simples et de multi-termes
Document type :
Conference papers
Complete list of metadata

https://hal-cea.archives-ouvertes.fr/cea-03527765
Contributor : Françoise Rousseau-Hans Connect in order to contact the contributor
Submitted on : Sunday, January 16, 2022 - 5:44:22 PM
Last modification on : Monday, January 17, 2022 - 9:21:01 AM
Long-term archiving on: : Sunday, April 17, 2022 - 6:09:30 PM

File

VSST2001Tome%20I_Chap%206.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : cea-03527765, version 1

Collections

CEA

Citation

Olivier Ferret, Christian Fluhr, Françoise Rousseau-Hans, Jean-Luc Simoni. Fouiller un corpus en structurant sa terminologie. VSST'2001 - Veille stratégique scientifique et technologique, Oct 2001, Barcelone, Espagne. ⟨cea-03527765⟩

Share

Metrics

Record views

10

Files downloads

12