Le niveau d’utilisation et de fiabilité de la traduction automatique

Toujours des promesses. Et pas de véritables nouveautés !

Remplacer le premier traducteur : la révision du texte d’arrivée « sans connaître  » la langue de départ
A la fin des années 80, les espoirs vis-à-vis de la traduction automatique, c’est-à-dire la traduction réalisée totalement par un logiciel, étaient assez nombreux. Et, naturellement, on ne parle pas ici de la TAO ( la Traduction Assistée par Ordinateur ) dont le leader mondial est Trados par rapport à Transit, Déjà Vu, Star et autres marques. La TAO a bien progressé et est utilisée quotidiennement par la plupart des traducteurs professionnels.
Après une quinzaine d’années qui ont vu s’accomplir la révolution informatique ( de la compatibilité totale à Internet ! ), quel est le niveau réel d’utilisation et de fiabilité des systèmes de traduction automatique ? Et, surtout, quels sont les résultats par rapport aux attentes fondamentales de l’époque, à savoir l’élimination du premier traducteur et son affectation à la révision du texte traduit par la machine ?
La double conférence sur la traduction automatique, organisée par Teleport le 9 mars 2005 à Bruxelles, a été l’occasion de trouver les réponses à ces trois questions. Les deux orateurs, Dominique Orban, de la société REVER, et Josep Bonet, de la Commission Européenne, se sont appliqués à bien présenter,



La progression du nombre de pages par an traduites automatiquement à l’Union Européenne est éloquente
respectivement, «  Les industries de la langue » et la « Machine Translation in a production environment ! The example of the European Commission. » En résumé ( voir encadré ), les réponses ont été les suivantes.

Une utilisation grandissante de la traduction automatique mais une stagnation de sa fiabilité
Les domaines d’application de la traduction automatique se sont multipliés d’une façon extraordinaire au point qu’une nouvelle notion d’industrie est née : celle des « Industries de la langue » ( « l’ensemble des activités de recherches, de développements et de commercialisation de produits et services qui s’appuient sur un traitement automatique des langues », suivant la définition fournie par Dominique Orban lui-même ). Les enquêtes du bureau Vandijk de Bruxelles, qui étudie les phénomènes de la traduction depuis plus de vingt ans – surtout pour le compte de l’UE – ont été présentées en détail. Ainsi, neuf segments de marché ont été identifiés :
  • gestion des documents
  • gestion de contenu
  • production et édition
  • ressources linguistiques
  • moteurs de recherche intelligents
  • e-business
  • traductions
  • e-learning
  • interfaces vocales, multimodales
Depuis l’application aux commandes des machines et des voitures jusqu’aux traductions juridiques des institutions publiques, on a pu constater l’ampleur du marché de la demande.
Mais on a été contraint de constater la stagnation relative des niveaux de performance dans la traduction automatique. Depuis les années 80,
les progrès ont été presque insignifiants. En effet, ceux-ci sont liés au travail de « feedback » des traductions obtenues automatiquement et révisées par les traducteurs. L’intelligence artificielle des machines s’enrichit en « corrigeant », c’est-à-dire en introduisant les corrections sémantiques, orthosyntaxiques et lexicales dans les logiciels.

Les entreprises privées ne peuvent pas se permettre la recherche en traduction automatique
Cela peut paraître paradoxal, mais l’apprentissage de la « machine translation » suit les mêmes principes pédagogiques de l’intelligence et de la connaissance humaines : il faut corriger et répéter, tout simplement.
Mais voilà, cela suppose un travail énorme de « feedback » ( voir encadré ) très coûteux en termes de main d’œuvre. Quelles sont les entreprises privées en mesure de pratiquer des investissements adéquats dans cette tâche de R&D ?
Au cours des vingt dernières années, l’on a pu observer un déferlement de tentatives, plus ou moins naïves ou malhonnêtes, de réaliser de nouveaux systèmes de traduction automatique. La mortalité enfantine a décimé sinon liquidé ces tentatives qui, à l’évidence, ont présumé de la tâche. Que l’on pense aux initiatives de toutes les universités, les provinces, les régions et les entreprises linguistiques qui se sont lancées dans l’aventure.
Tandis que le marché de la demande ne cesse de croître, celui de l’offre ( celle de l’industrie de la langue ) s’enlise surtout dans les difficultés financières résultant d’investissements très lourds.
Les espoirs que nous fondons sur la traduction automatique demeurent, même si son application reste encore très ( trop ) limitée.


La traduction automatique ne remplacera jamais le traducteur. Mais…

Systran : la traduction automatique grâce à l’espionnage
   
L’intelligibilité des traductions automatiques supérieure à 95%
Au début des années 90, le siège d’Eurologos-Bruxelles a été le représentant du système Systran pour le secteur privé en Belgique. L’Union Européenne actuelle était (et demeure) la propriétaire de Systran pour le secteur public.
Systran est toujours le système de traduction automatique le plus performant au monde pour beaucoup de couples de langues. Ses performances découlent du travail de « feedback » que le Ministère de la défense américain (et par la suite, le projet Soyuz pour Apollo) avait mené à bien afin d’espionner les communications radio des Russes déjà à partir des années 60, lorsque les Etats-Unis ont racheté Systran à son inventeur, le Hongrois Peter Toma. Ainsi, le couple russe-anglais a atteint une performance d’environ 96 % (déjà à 90 % le texte traduit est presque inintelligible), ce qui le rapprochait du niveau de qualité linguistique des traductions permettant de réviser l’anglais (langue d’arrivée) sans connaître le russe (langue source).

Le travail de bénédictin du feedback et le sabotage des luddistes
Évidemment, le couple symétrique anglais-russe est beaucoup moins performant à cause de l’absence de ce travail correctif de bénédictin. C’est sur cette base que se sont fondés tant d’espoirs vis-à-vis de la traduction automatique qui aurait libéré les traducteurs du travail fastidieux (et lent) de la première traduction : ainsi ils auraient pu se transformer illico en réviseurs et adaptateurs
de textes édités et ce à un très haut niveau de qualité et à des prix bas. La question que beaucoup se posent est pourquoi l’UE n’a pas affecté de 5 à 10 % de son armée de traducteurs (plus de 1200 à la seule Commission) à la traduction automatique et au travail de « feedback » depuis presque 30 ans. Aujourd’hui, on aurait pu disposer de nombreux couples de langues bien performants. Par contre, les témoignages de sabotages culturels de la traduction Systran de la part de traducteurs-fonctionnaires pendant les années 70-80 sont nombreux. Ceci, à la manière des « luddistes », les obscurantistes anglais qui s’opposaient aux locomotives à vapeur car destructrices d’emploi…
 
Un graphique des couples de langues les plus utilisés à l’Union Européenne.

EUROLOGOS GROUP OFFICES.
TRANSLATING AND PUBLISHING WHERE THE LANGUAGES ARE SPOKEN

Eurologos Newsletter AVRIL - MAI 2005