Utilisation de ressources lexicales et terminologiques en traduction neuronale

François Yvon; Sadaf Abdul Rauf

Rapport (Rapport De Recherche) Année : 2020

Utilisation de ressources lexicales et terminologiques en traduction neuronale

(1) , (1)

François Yvon

Fonction : Auteur
PersonId : 5347
IdHAL : francois-yvon
ORCID : 0000-0002-7972-7442
IdRef : 057593531

Traitement du Langage Parlé

Sadaf Abdul Rauf

Fonction : Auteur
PersonId : 766890
IdRef : 164057293

Traitement du Langage Parlé

Résumé

La traduction automatique (TA) neuronale a conduit à une amélioration perceptible de la qualité de traduction et de l'utilisabilité des textes ainsi produits dans un nombre varié de contextes. Cette technologie repose sur l'exploitation d'algorithmes qui fonctionnent en boite noire, ce qui rend difficile le contrôle fin du processus de traduction. En particulier, alors que la génération antérieure de modèles de traduction (statistique) permettait assez directement d'injecter des ressources dictionnairiques ou terminologiques, l'hybridation de la TA neuronale par des méthodes à base de dictionnaires ou de règles s'avère plus délicate. Ceci est parfois vécu comme une régression, en particulier dans des contextes de traduction assistée par ordinateur (TAO) ou de post-édition (PE), ou encore dans les contextes ou domaines pour lesquels il existe peu de données parallèles. Dans ce rapport, nous proposons une revue critique des tentatives récentes pour intégrer des lexiques bilingues en TA neuronales, pour constater que la plupart peuvent s'interpréter comme des essais pour adapter au cadre de la TA neuronale des méthodes anciennes. Nous discutons également diverses pistes qui restent à explorer pour rendre cette hybridation de la TA plus prédictible et plus transparente.

Mots clés

Traduction automatique neuronale Ressources terminologiques

Domaines

Traitement du texte et du document Intelligence artificielle [cs.AI]

Fichier principal

d2-1.pdf (1022.93 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

François Yvon : Connectez-vous pour contacter le contributeur

https://hal.science/hal-02895535

Soumis le : jeudi 9 juillet 2020-18:18:14

Dernière modification le : vendredi 24 mars 2023-14:53:18

Archivage à long terme le : lundi 30 novembre 2020-18:26:21

Dates et versions

hal-02895535 , version 1 (09-07-2020)

hal-02895535 , version 2 (21-08-2020)

hal-02895535 , version 3 (28-12-2020)

hal-02895535 , version 4 (20-01-2022)

Identifiants

HAL Id : hal-02895535 , version 1

Citer

François Yvon, Sadaf Abdul Rauf. Utilisation de ressources lexicales et terminologiques en traduction neuronale. [Rapport de recherche] 2020-001, LIMSI-CNRS. 2020, 54 p. ⟨hal-02895535v1⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

415 Consultations

540 Téléchargements

Utilisation de ressources lexicales et terminologiques en traduction neuronale

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Partager