Décontextualiser des plongements contextuels pour construire des thésaurus distributionnels - CEA - Commissariat à l’énergie atomique et aux énergies alternatives Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

Décontextualiser des plongements contextuels pour construire des thésaurus distributionnels

Résumé

Même si les modèles de langue contextuels sont aujourd'hui dominants en traitement automatique des langues, les représentations qu'ils construisent ne sont pas toujours adaptées à toutes les utilisations. Dans cet article, nous proposons une nouvelle méthode pour construire des plongements statiques à partir de modèles contextuels. Cette méthode combine la généralisation et l'agrégation des représentations contextuelles. Nous l'évaluons pour un large ensemble de noms en anglais dans la perspective de la construction de thésaurus distributionnels pour l'extraction de relations de similarité sémantique. Finalement, nous montrons que les représentations ainsi construites et les plongements statiques natifs peuvent être complémentaires.
Fichier principal
Vignette du fichier
2022.jeptalnrecital-taln.31.pdf (334.4 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

cea-03760370 , version 1 (25-08-2022)

Identifiants

  • HAL Id : cea-03760370 , version 1

Citer

Olivier Ferret. Décontextualiser des plongements contextuels pour construire des thésaurus distributionnels. 29e Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2022), Jun 2022, Avignon, France. pp.315-324. ⟨cea-03760370⟩
87 Consultations
17 Téléchargements

Partager

Gmail Facebook X LinkedIn More