Décontextualiser des plongements contextuels pour construire des thésaurus distributionnels - CEA - Commissariat à l’énergie atomique et aux énergies alternatives Access content directly
Conference Papers Year : 2022

Décontextualiser des plongements contextuels pour construire des thésaurus distributionnels

Abstract

Même si les modèles de langue contextuels sont aujourd'hui dominants en traitement automatique des langues, les représentations qu'ils construisent ne sont pas toujours adaptées à toutes les utilisations. Dans cet article, nous proposons une nouvelle méthode pour construire des plongements statiques à partir de modèles contextuels. Cette méthode combine la généralisation et l'agrégation des représentations contextuelles. Nous l'évaluons pour un large ensemble de noms en anglais dans la perspective de la construction de thésaurus distributionnels pour l'extraction de relations de similarité sémantique. Finalement, nous montrons que les représentations ainsi construites et les plongements statiques natifs peuvent être complémentaires.
Fichier principal
Vignette du fichier
2022.jeptalnrecital-taln.31.pdf (334.4 Ko) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

cea-03760370 , version 1 (25-08-2022)

Identifiers

  • HAL Id : cea-03760370 , version 1

Cite

Olivier Ferret. Décontextualiser des plongements contextuels pour construire des thésaurus distributionnels. 29e Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2022), Jun 2022, Avignon, France. pp.315-324. ⟨cea-03760370⟩
83 View
4 Download

Share

Gmail Facebook Twitter LinkedIn More