La performance de la traduction automatique a considérablement évolué ces dernières années avec les progrès de l’intelligence artificielle, en particulier dans les techniques de Deep Learning. Cette avancée notoire a conduit les entreprises, de toutes tailles, à internaliser leurs besoins en traduction et à mobiliser leur effectif pour effectuer la correction de traduction automatique. Cette réorientation stratégique des besoins en services de traduction, rapidement perçue comme un exceptionnel cost killer, entraine une perte de productivité des salariés et des coûts inattendus. Une solution visant à repositionner le traducteur professionnel, dans le workflow internalisé de traduction, se profile.
La performance croissante de la traduction automatique
Il y a une dizaine d’années, nous écrivions, sur ce blog, que comparer la traduction humaine et la traduction automatique revenait d’abord à accepter l’idée que ces deux méthodologies étaient comparables, or s’agissant de deux processus complètement différents, tant en termes de process, de coût que de résultat, la comparaison n’avait pas lieu d’être.
Force et de constater que ce qui valait il y a dix ans n’est plus de mise aujourd’hui. La traduction automatique a atteint un niveau tel que même les agences de traduction et les agences de services multilingues l’utilisent (Voice Cloning, transcription timecodée) et ont été jusqu’à créer des prestations spécifiques basées sur la traduction automatique telles que la Post-édition ou la correction de traduction automatique (Machine Translation Checking). Pourquoi ? Tout simplement parce que sur certaines combinaisons linguistiques, certains types de textes dans certains domaines de traduction, la traduction automatique est très efficace.
La précision grammaticale permet aux outils de traduction automatique d’éviter les erreurs courantes, la fluidité réduit sensiblement la quantité de phrases maladroites, l’augmentation de la compréhension contextuelle permet d’éviter des erreurs de traduction dues à des ambiguïtés ou des homonymes et enfin, elle gère de mieux en mieux les expressions idiomatiques et les tournures de phrases complexes.
Les performances de la traduction automatique n’ont cessé de croître et les indicateurs de mesure BLEU (Bilingual Evaluation Understudy), METEOR( Metric for Evaluation of Translation with Explicit ORdering) ou encore BERT (Bidirectional Encoder Representations from Transformers) indiquent une correspondance de plus en plus forte avec les traductions humaines.
Ces indicateurs évaluent la qualité des traductions automatiques en comparant, pour un même texte source, la traduction générée par une machine et une, autre réalisée par un humain. Pour ce faire, ils comparent des segments de mots de longueur équivalente dans la traduction automatique et la version humaine et comptent le nombre de correspondances exactes entre les segments traduits automatiquement et les segments traduits humainement. Le score est indiqué en pourcentage de similarité. Théoriquement, un score de 100% indiquerait une correspondance parfaite entre une traduction automatique et une traduction humaine. Aujourd’hui on est plutôt à 30 ou 40% dans le meilleur des cas.
L’internalisation généralisée des traductions
Perçue comme un Game changer, la traduction automatique, devenue efficace vient modifier de manière significative les dynamiques des secteurs économiques et culturels. Elle a entrainé logiquement un changement d’habitude des entreprises qui ont progressivement décidé de retirer leur budget traduction aux agences de traduction et autres fournisseurs de services linguistiques (Language service provider) pour se diriger, exclusivement pour certaines, vers la traduction. La prestation étant quasi gratuite, le gain financier immédiat apparaît comme total.
Peut-on passer d’une traduction 100% humaine à une traduction 100% automatisée sans que cela ait de conséquence ?
L’indispensable nécessité de vérifier et corriger une traduction automatique
Dans les faits, les scores des outils BLEU, METEOR et BERT varient considérablement en fonction des combinaisons linguistiques, de la technicité des documents, du domaine d’application et, bien évidemment, des systèmes de traduction automatique utilisés. Les progrès sont inégaux selon les langues, avec des performances encore insuffisantes pour les langues moins documentées ou ayant peu de ressources disponibles pour l’entraînement des modèles.
Parmi les performances notables, Google Translate a obtenu un score BLEU moyen de 31,07 pour des traductions de langues non anglaises vers l’anglais et de 27,54 pour les traductions de l’anglais vers des langues non anglaises. Ces scores, parmi les plus élevés rapportés pour les systèmes de traduction automatiques montrent que 60% à 70% d’une traduction automatique nécessite une vérification attentive et une correction.
Concrètement si les traductions automatiques de l’anglais ou vers l’anglais donnent un résultat tout à fait satisfaisant, les langues avec des structures grammaticales très différentes de celles des langues majoritaires et les langues à idéogrammes (chinois, japonais) présentent encore des défis. Les scores BLEU pour les traductions de et vers le chinois peuvent varier entre 10% et 40%. Lors de la 6e édition du Workshop sur les Corpus Arabes Open-Source et les Outils de Traitement (OSACT6), divers modèles de traduction automatique développés pour traiter la traduction entre les dialectes arabes et l’Arabe Standard Moderne ont obtenu un score BLEU de 21,0 sur le jeu de développement et 9,57 sur le jeu de test, une performance très modérée.
Bien que les outils modernes soient meilleurs pour comprendre le contexte, ils peuvent encore manquer de sensibilité culturelle, produisant des traductions qui sont techniquement correctes mais culturellement inappropriées. A cause de la présence de contresens, de mauvais choix terminologiques et de lourdeurs syntaxiques, la traduction automatique reste très imparfaite et impose d’être corrigée dès lors que l’objectif attendu est supérieure à une compréhension correcte du contenue par le lecteur.
Perte de productivité liée à la correction des traductions automatiques dans l’entreprise
Les entreprises œuvrant à l’international ont progressivement généralisé l’utilisation des outils de traduction automatiques Google Translate, DeepL ou encore ChatGPT pour traduire rapidement de grands volumes de texte. C’est aux salariés qu’est confié la relecture et la correction des traductions générées. Leur maîtrise du jargon de l’entreprise et de la terminologie du secteur d’activité garantissant la précision et la cohérence du contenu final.
Avec une correspondance moyenne de 20 à 30%, entre la traduction automatique et une traduction humaine, la phase de relecture prend beaucoup plus de temps à un salariés non natif et de surcroit non professionnel de la traduction. Concrètement, là ou un traducteur professionnel en langue maternelle peut relire et corriger environ 5000 mots en une journée, un salarié non natif aura besoin du double, du triple voire davantage. Et cela suppose de bénéficier de longues plages horaires pour pouvoir se concentrer sur le texte, une relecture ne pouvant pas être effectuée sur le pouce, entre deux coups de téléphone ou entre la rédaction de deux mails.
En outre, la relecture et la correction des traductions automatiques sont perçues, par les salariés, comme des tâches répétitives et monotones, conduisant à une perte de motivation et de satisfaction au travail. Par ailleurs, ce n’est pas un exercice facile et la nécessité de vigilance constante qu’impose une correction de traduction, peut accroître la fatigue cognitive et réduire l’efficacité des salariés sur le long terme.
Activité chronophage difficilement compatibles avec les plannings quotidiens des sociétés en effectif optimisé ou en sous-effectif, comme c’est souvent le cas en période de crise et d’incertitude économique, le gain financier attendu s’amenuise sensiblement.
Le gain se réduit encore lorsque les salariés doivent suivre une formation spécifique pour être efficaces en post-édition. Cette formation représente un investissement en temps et en ressources pour l’entreprise, et tous les employés ne s’adaptent pas facilement à cette nouvelle tâche.
Repositionner le traducteur professionnel dans la traduction automatique
Le repositionnement du traducteur professionnel dans le workflow de traduction internalisé fait le lien entre le gain financier attendu par l’entreprise et le maintien de la productivité interne.
Les traducteurs professionnels détectent et corrigent facilement les erreurs subtiles que les outils de traduction automatique et les salariés peuvent laisser passer. Ils sont capables de garantir que le texte traduit respecte les attentes culturelles et stylistiques du public cible ce que les salariés peuvent difficilement réaliser. Ils peuvent interpréter le contexte de manière plus précise, ce qui est essentiel pour éviter les contresens et les mauvaises interprétations. Ils peuvent adapter le ton et le style du texte pour qu’il corresponde aux attentes du lecteur final, quelque chose que les machines et les traducteurs amateurs ont du mal à faire efficacement.
A travers ses deux prestations de traduction low cost intégrant l’IA que sont la correction de traduction automatique (machine translation checking) et la révision de traduction automatique (Post-Edition) Atenao répond à la logique d’optimisation des coûts des entreprises tout en maintenant la productivité. Les traductions sont à nouveau externalisées, mais à des prix inférieurs. Cette segmentation, avec 4 niveaux de traduction et 2 niveaux de relecture, propose une réponse spécifique pour chaque besoin.