Intelligence artificielle et nouvelles technologies : le coin moderne de la traduction ?
Quelques années Depuis 2007, Google, avec Translate, Microsoft et d'autres géants du web, diffusent des traductions automatiques statistiques : de semi-comiques, les traductions automatiques, bien que non parfaites, ont parfois commencé à devenir des produits également utilisables, surtout si elles sont ajustées par des interventions humaines appropriées.
En 2011, le futurologue et cybernéticien Ray Kurzweil prédisait dans une interview au Huffington Post qu'en 2029, la traduction automatique serait capable de remplacer les humains.
Depuis l'été 2016, la traduction automatique neuronale a fait son apparition.
Ce qui s'est passé
Le 26 septembre 2016, Google Brain, le groupe de recherche sur les applications de l'intelligence artificielle, a annoncé la sortie d'un nouveau système de traduction automatique basé sur les réseaux neuronaux. Le 17 octobre, Systran a fait une annonce similaire et le 15 novembre, le blog de Microsoft a informé que Microsoft Translator est désormais également disponible en "version neuronale". En mai 2017, Facebook a annoncé vouloir évoluer vers des réseaux neuronaux convolutifs. Ceux-ci seraient neuf fois plus rapides dans l'entraînement des réseaux de neurones récurrents introduits à la place presque sur l'étiquette sur les plateformes du groupe Facebook, Instagram et Workplace depuis juin 2016. Et pendant ce temps, d'autres géants de l'informatique comme Apple, Amazon et Baidu investissent également dans l'intelligence artificielle.
On prétend que cette technologie serait capable de produire des traductions beaucoup plus précises et comparables à la traduction humaine.
Il semble que le travail du futur, et pas seulement celui des traducteurs, sera géré par l'intelligence artificielle (grâce à sa capacité d'apprendre par elle-même, c'est-à-dire par ce qu'on appelle l'apprentissage automatique) et par des robots et des applications, avec toutes les conséquences économiques et sociales que cela implique.
Les machines commencent à "penser" et sont destinées à remplacer le travail humain même dans les activités considérées comme complexes.
Par exemple, Google et Tesla sont très en avance dans le développement de voitures sans conducteur, qui préfigurent une révolution dans la mobilité individuelle. Y aura-t-il encore des chauffeurs de taxi dans notre futur proche ?
Qu'est-ce que l'intelligence artificielle ?
L'intelligence artificielle est la discipline qui étudie les moyens de reproduire les processus mentaux les plus complexes à l'aide d'ordinateurs. Pour ce faire, elle utilise des systèmes qui impliquent l'acquisition et le traitement de données et d'informations (provenant de l'extérieur ou contenues dans le système de manière organisée) sur la base de modèles appropriés.
L'intelligence artificielle a aujourd'hui abandonné l'idée de construire un système pré-constitué de règles et de données, selon une logique symbolique, pour permettre aux machines d'interagir avec le monde réel.
Les meilleurs résultats proviennent désormais de systèmes utilisant l'apprentissage automatique, où les machines apprennent sur le terrain à partir de données réelles et orientent leur fonctionnement.
L'apprentissage profond est le terme utilisé pour décrire une classe particulière d'algorithmes d'apprentissage automatique des machines, qui utilise des réseaux de neurones.
Traduction statistique et traduction neuronale : l'exemple de Google
Les traducteurs automatiques statistiques, tels que l'"ancien" Google Translate, sont des systèmes de "traduction automatique basée sur des phrases" qui disposent de bases de données plus ou moins importantes de correspondances linguistiques d'une langue à l'autre, ainsi que de règles préchargées pour chaque paire de langues.
Avec ces systèmes, une phrase était traduite pour des fragments, des locutions ou des groupes de mots, trouvés sur les serveurs de Google, au sein d'immenses corpus multilingues, de manière similaire à ce qui se fait en cherchant dans les mémoires de traduction d'un outil de TAO.
Le résultat était ensuite réajusté par le système, en interpolant la traduction avec des dictionnaires et en utilisant des modèles interlangues pour renvoyer la construction correcte de la phrase dans les différentes langues.
Le résultat a toujours été bon : très bon pour plusieurs langues, mais suffisant ou médiocre pour certaines langues (notamment l'allemand et le finnois, parmi les langues européennes). Avec des variations parfois dues à la ponctuation, à l'ordre des mots et autres, qui ont été à l'origine d'une série de recommandations pour la pré-édition des textes.
Dans tous les cas, la phrase suivante était celle qui repartait du début et ne tenait pas compte du résultat (bon ou mauvais) de la traduction de la phrase précédente.
La particularité des réseaux neuronaux est leur capacité à transformer les données de grands ensembles non structurés en ensembles plus petits à haute densité sémantique. Dans la traduction automatique neuronale, le système, explique Google, lit le texte original mot à mot et le traduit mot à mot, en essayant de donner du poids à la distribution des mots du texte original lu et à leur relation avec chaque mot traduit.
Le système analyse la phrase entière comme une seule unité à traduire en préservant le contexte et en parvenant également à traduire des séquences avec ponctuation et articulation grammaticale complexe, ainsi que des paragraphes de sens complété.
L'amélioration de la précision de la traduction observée jusqu'à présent est surprenante et est destinée, avec le temps, à être améliorée par l'apprentissage automatique, contrairement aux systèmes précédents, qui étaient des systèmes fermés.
Pourquoi et pourquoi les traducteurs humains seront-ils encore nécessaires ?
L'automatisation de la traduction, quelle qu'elle soit, rendra-t-elle les traducteurs superflus ? Probablement pas, ou du moins pas de sitôt. Cependant, de nouveaux modes et pratiques de communication interlinguale vont se développer et nécessiteront de nouvelles connaissances et compétences qu'il faudra apprendre... Essayons d'en énumérer quelques-unes.
Les traducteurs devront, bien sûr, posséder un haut niveau d'expertise technologique. Ils devront avoir une culture, des compétences rédactionnelles et des connaissances linguistiques et sectorielles approfondies pour être en mesure d'évaluer les difficultés et la qualité des textes. Ils devront être capables de traiter de grandes quantités de textes en un temps limité. Ils devront être capables d'évaluer l'opportunité d'une traduction automatique, d'évaluer la quantité de post-édition, de soumettre un texte à une pré-édition avant sa traduction, de rédiger des traductions (écriture contrôlée), de former des systèmes d'AT ou de les adapter à des besoins particuliers.
Les traducteurs deviendront des gestionnaires de projets de traduction ou de révision multilingues. Un peu 'éditeurs, rédacteurs, chefs de projet, mais surtout de plus en plus de réviseurs. Avant et après la traduction, effectuée par la machine. Ce n'est pas, après tout, une question totalement nouvelle, mais elle devient aujourd'hui évidente. Depuis longtemps déjà, écrire signifie interagir avec diverses technologies et mémoires numériques (dictionnaires, glossaires, bases de données, corpus, moteurs de recherche, etc.)
). Comme le principal effet de la révolution technologique a été l'augmentation considérable de nos possibilités de stockage de données, une grande partie de l'activité du traducteur consiste à rechercher des sources appropriées (mémoires) avant la rédaction et à effectuer diverses formes de traduction ou d'adaptation intralinguistique (révision, correction de segments, post-édition, etc.) après la rédaction.
Ainsi, depuis des années, le travail du traducteur consiste en grande partie à assembler (copier-coller) des fragments récupérés dans une mémoire numérique quelconque : portions de texte, expressions ou termes récupérés dans des travaux antérieurs, résultats de moteurs de recherche, dictionnaires électroniques, glossaires, bases de données terminologiques, corpus parallèles trouvés sur le web, bitextes, mémoires de traduction ou encore pré-traductions fournies par des systèmes de traduction automatique. Le patchwork ou "salade de phrases" constitué de tous les segments et fragments générés par une telle façon de travailler doit ensuite être arrangé dans la phase de post-traduction ou de révision, en tenant compte du degré de précision requis.
La question qui se pose est la suivante : les programmes de cours de traduction actuels permettent-ils de développer ces compétences ? En regardant un peu, la réponse est que pour les formateurs de futurs traducteurs, il y a certainement beaucoup de travail à faire...