N’apprenez plus le néerlandais, l’intelligence artificielle le traduira pour vous !
Les logiciels de traduction créés par Google, Microsoft ou Systran sont de plus en plus performants. Combinés à la reconnaissance vocale, ils nous permettront bientôt de tenir des conversations dans des langues étrangères. Jusqu’à rendre la traduction humaine et l’apprentissage des langues obsolètes ?
Google Translate est l’un des services les plus populaires du Web. Le traducteur en ligne est utilisé, chaque mois, par 500 millions d’internautes. Il traduit quotidiennement 140 milliards de mots dans l’une des 103 langues étrangères qu’il traite. Souvent raillé pour ses traductions à l’emporte-pièce, qui peuvent déboucher sur un charabia incompréhensible, Google Translate a pourtant fait des progrès spectaculaires ces derniers mois.
En septembre dernier, les équipes du département Google Brain, qui pilote la recherche en intelligence artificielle au sein de l’entreprise américaine, annonçaient une avancée majeure pour leur logiciel de traduction. Grâce à un nouvel algorithme basé sur les ” réseaux neuronaux “, la qualité des traductions de Google Translate a fait un bond de géant, se rapprochant de celle d’une traduction ” humaine “, sans pour autant encore l’égaler.
Ces progrès sont dus à une nouvelle technologie, qui pourrait bien supplanter les programmes traditionnels de traduction automatique. Jusqu’à présent, ces systèmes se basaient sur une approche ” statistique ” de la traduction. Dans cette approche basée sur le big data, la machine est alimentée par des montagnes de documents ou de pages web déjà traduits, à partir desquels le logiciel élabore des modèles statistiques permettant de faire correspondre tel mot ou tel morceau de phrase avec son équivalent en langue étrangère.
La machine bientôt plus efficace que l’homme ?
Les nouveaux logiciels neuronaux vont plus loin que la simple règle statistique : ils sont capables de comprendre le contexte dans lequel se situe le texte soumis à traduction. Il peuvent donc choisir une occurrence statistique moins forte mais qui s’avérera plus pertinente. Par exemple, si le texte traite de trafic routier, le logiciel devrait opter pour la traduction du terme ” bouchon ” liée aux embouteillages et non au domaine du vin. Grâce à cette évolution majeure, la qualité des traductions est en passe de s’améliorer de manière significative. Ce bond en avant aurait été rendu possible par l’apparition d’un nouveau langage… codé, inventé par l’intelligence artificielle de Google à la grande stupéfaction des scientifiques.
Ces avancées déboucheront-elles un jour sur une intelligence artificielle capable de traduire instantanément n’importe quelle langue étrangère ? Du côté des géants de la technologie, on s’y emploie. ” Nous travaillons à la création de librairies cognitives, qui interprètent les interactions avec les être humains, explique Bruno Schröder, technology officer chez Microsoft Belgique. Ces outils ont déjà fait des progrès énormes : dans l’identification de photos ou la retranscription d’un discours par écrit, la machine est désormais plus efficace que l’être humain. Pour le traitement du langage, ce n’est pas encore le cas, mais nous progressons. ”
Des conversations traduites instantanément
Les nouveaux logiciels neuronaux vont plus loin que la simple règle statistique : ils sont capables de comprendre le contexte dans lequel se situe le texte soumis à traduction.
Au-delà du dictionnaire en ligne que l’on peut utiliser pour traduire des textes écrits, les entreprises technologiques développent des systèmes de traduction vocale instantanée. Grâce au développement des assistants comme Siri (Apple), Cortana (Microsoft) ou Google Now, la reconnaissance vocale est désormais suffisamment efficace pour servir de base à une traduction. Une fois celle-ci effectuée, elle peut facilement être reproduite vocalement. Cela ouvre des perspectives particulièrement alléchantes pour les voyageurs, mais aussi pour tous les entrepreneurs et hommes d’affaires qui travaillent dans un environnement international. Demain, si la technologie de traduction se perfectionne, ils auront la possibilité de converser avec leurs interlocuteurs chinois, indonésiens, brésiliens, japonais ou iraniens, sans plus devoir se soucier de la barrière de la langue.
Un outil comme Google Translate fournit déjà une fonction de reconnaissance vocale, permettant de traduire instantanément une conversation via un smartphone posé entre deux interlocuteurs. De même, l’interface de Microsoft, dénommée Translator, est accessible en version bêta sur son application de téléphonie Skype, ce qui permet de tester la traduction vocale instantanée dans une dizaine de langues. La qualité n’est pas celle d’un interprète, mais elle permet de cerner le contexte de la discussion et de donner un coup de pouce à un interlocuteur qui se sentirait moins à l’aise avec une langue étrangère. ” Quand l’outil se sera amélioré, nous pourrons l’utiliser pour des conversations simples, standardisées. Par exemple, pour réserver un hôtel à l’étranger “, estime Bruno Schröder. Les touristes n’auront plus besoin de leur dictionnaire de voyage. Et les relations d’affaires pourront plus facilement se nouer. ” Pour la plupart des interactions multilingues, les outils technologiques suffiront “, assure le représentant de Microsoft.
Oreillette multilingue sans fil
Pour fluidifier encore un peu plus les conversations multilingues, de nouveaux outils technologiques apparaissent. Une start-up néerlandaise a ainsi créé Travis, un petit appareil électronique équipé d’un micro et d’une enceinte, capable selon ses concepteurs de traduire 80 langues. Il suffit de le déposer entre deux personnes se parlant dans des langues différentes. ” Les traductions de Travis sont exactes à environ 80 %. La compréhension mutuelle des interlocuteurs atteint quant à elle quasiment 100 % “, assure Nick Yap, cofondateur de Travis. Même si la traduction est loin d’être parfaite, deux personnes qui discutent par l’intermédiaire de Travis compléteraient leur compréhension grâce au contexte de l’échange et grâce à leurs expressions non verbales.
La start-up utilise actuellement les outils de traduction de Google, IBM, Systran ou Microsoft. Mais elle compte développer sa propre interface, afin d’aller plus loin, notamment dans la compréhension de l’argot, qui est actuellement très mal traduit. ” Si vous parlez comme un présentateur de la BBC, tout va bien. Par contre, le langage de la rue n’est pas du tout pris en compte par les outils de traduction. Nous voulons changer cela “, explique Nick Yap. Son entreprise a déjà levé près de 400.000 dollars via une campagne de crowdfunding toujours en cours. La commercialisation de son produit, qui coûtera 199 dollars, débute en juin prochain.
Une start-up américaine va encore plus loin, avec un prototype d’oreillettes connectées en bluetooth avec votre smartphone. Cinq langues (anglais, français, italien, espagnol, portugais) sont actuellement supportées pour une traduction via une voix synthétisée féminine ou masculine, qui prend tout de même quelques secondes avant de parvenir à votre oreille. Waverly Labs ne précise pas quelle technologie de traduction elle utilise, mais elle promet des améliorations rapides de son application, grâce au machine learning (logiciel auto-apprenant). La jeune entreprise a déjà levé plus de quatre millions de dollars en crowdfunding et prévoit de lancer son produit (prix : 249 dollars) d’ici la fin du mois de mai prochain.
Les “bio-traducteurs” font de la résistance
Dans le secteur de la traduction, on reste dubitatif quant au réel potentiel de ces outils numériques. Pour le président de la Chambre belge des traducteurs et interprètes, l’homme ne sera pas remplacé par un logiciel de sitôt : ” Nous sommes attentifs à tous les développements technologiques, mais nous ne les voyons pas comme une menace, plutôt comme une aide à la productivité, réagit Guillaume Deneufbourg, par ailleurs chargé de cours en technologies de la traduction à l’Université de Mons. Comme dans tous les métiers, l’informatique est de plus en plus présente dans notre secteur. Les logiciels de traduction automatique ont certes fait de gros progrès, grâce notamment à la traduction neuronale. Mais les machines ne sont pas encore capables de s’élever au niveau des ‘bio-traducteurs’ ou traducteurs humains, et je doute que ce soit un jour le cas. ”
Selon le représentant des traducteurs, les programmes de traduction automatique, qui sont de plus en plus souvent utilisés par les entreprises, s’attaquent au segment inférieur du marché, celui qui ne nécessite pas une qualité parfaite de traduction. C’est ainsi que l’on peut parfois découvrir des manuels d’utilisation de produits électroniques rédigés dans un français approximatif.
Certaines entreprises renoncent également à procéder à des traductions ” humaines ” qui leur coûteraient trop cher, mais font appel à un logiciel, qui s’avérera plus accessible. Par exemple, le site internet de recommandations touristiques TripAdvisor traduit automatiquement les commentaires de ses utilisateurs dans la langue de l’internaute. Avec plus de 400 millions d’avis sur son site, le coût d’une agence de traduction serait exorbitant. TripAdvisor estime que la qualité de traduction atteinte est suffisante pour des commentaires qui sont déjà eux-mêmes rédigés par des touristes lambda, et donc d’une qualité orthographique, grammaticale et syntaxique aléatoire.
Un marché en croissance, à haut potentiel
Sans logiciel de traduction automatique, des sites internet comme TripAdvisor ne recourraient tout simplement pas à la traduction. C’est la raison pour laquelle de nombreux acteurs du secteur estiment que la technologie ne remplace pas les traducteurs, mais qu’elle crée au contraire de nouveaux marchés. Chez Systran, leader européen de la traduction automatique, on estime que le potentiel est énorme. Si le marché mondial de la traduction pèse 40 milliards de dollars (+ 5 % en 2016) d’après le consultant spécialisé Common Sense Advisory, les technologies de la traduction représentent à peine 5 % de celui-ci. ” Sur le marché de la traduction, la partie automatisée est encore faible. La perception de qualité était un frein pour les clients. Maintenant que celle-ci est levée, on voit que les besoins grandissent “, explique Gaëlle Bou, directrice marketing de Systran.
La société travaille ainsi avec les guides touristiques Le Petit Futé : ” Ils ont six millions d’occurrences à traduire. Sans la traduction automatique, ils ne les auraient jamais traduites, parce que le coût serait beaucoup trop important “, pointe Jean Senellart, directeur technique de Systran. Avec le logiciel, Le Petit Futé traduit toutes les informations ” descriptives ” de ses guides (informations de base sur les hôtels, restaurants, transports, etc.), ainsi que les commentaires sur ses sites internet. Seul le contenu à caractère éditorial est confié à des traducteurs humains. Le Petit Futé va également lancer une application développée avec Systran intégrant un guide et un interprète de poche pour les voyageurs.
La Commission européenne a créé son propre logiciel de traduction automatique. Celui-ci traduit 20 millions de pages par an, soit 10 fois plus que le volume traité par ses 1.600 traducteurs humains.
Chez Systran, on est convaincu que les bonds de géant réalisés récemment au niveau technologique vont continuer d’offrir de nouveaux débouchés : ” La technologie neuronale que nous avons développée offre des résultats impressionnants. L’algorithme maîtrise mieux la langue que nous. La machine donne l’impression de comprendre la langue “, s’étonne Jean Senellart. Cela ne signifie pas que la machine traduit mieux qu’un traducteur humain, mais qu’elle intègre beaucoup plus les finesses d’une langue. Ce qui est déjà un grand pas en avant. ” On a parfois du mal à faire la différence entre la traduction humaine et la traduction automatique “, complète Gaëlle Bou.
Mémoires de traduction
Geert Vanderhaege, patron de Lexitech, PME belge spécialisée dans la traduction, n’est, quant à lui, pas impressionné par les performances des logiciels de traduction : ” Ceux qui sont convaincus, ce sont les entreprises qui les vendent, grince-t-il. Un logiciel ne peut pas remplacer un traducteur qui affiche 20 ans d’expérience dans le domaine médical. ”
Les traducteurs reconnaissent cependant que le métier doit évoluer : ” La machine remplacera peut-être les traducteurs qui travaillent comme des machines, ironise Guillaume Deneufbourg, président de la Chambre belge des traducteurs et interprètes. Les traducteurs humains doivent faire valoir leurs compétences sur les tâches à plus haute valeur ajoutée. Il est probable que certaines traductions à usage interne se feront de plus en plus par traduction automatique. Par contre, les contenus plus importants ou à haute visibilité, des campagnes marketing par exemple, nécessiteront toujours l’expertise d’un traducteur. ”
Reste que certaines entreprises ont développé des techniques poussées permettant de restreindre au minimum le recours aux traducteurs. Grâce à une nomenclature très stricte, elles produisent leur contenu de base dans un langage simple sous forme ” sujet-verbe-complément “, excluant les propositions subordonnées, afin de faciliter la tâche du logiciel de traduction, qui s’avère du coup beaucoup plus performant.
Par ailleurs, dans certains secteurs, le volume de traductions publiées est parfois tel que des pans entiers de publications peuvent aujourd’hui être traduits de manière automatique. C’est ainsi que se sont développées ce que l’on appelle les ” mémoires de traduction “, qui permettent de ne pas retraduire un contenu déjà traduit antérieurement. Si un nouveau manuel pour un four à micro-ondes est identique à 80 % à la version précédente, inutile de tout retraduire. Les mémoires de traduction limitent dans ce cas l’intervention du traducteur au strict minimum.
Dix fois plus de traduction automatique
Au niveau des institutions européennes, qui occupent au total environ 6.000 traducteurs, on fait un usage important de ces mémoires de traduction. Avec l’élargissement du nombre de pays membres et donc du nombre de langues utilisées – 552 combinaisons linguistiques différentes ! -, c’est rapidement devenu une nécessité. La Commission européenne s’est engagée depuis quelques années dans un processus de rationalisation visant à juguler l’inflation des coûts de traduction. Dans cette optique, elle a créé son propre logiciel de traduction automatique. Celui-ci traduit 20 millions de pages par an, soit 10 fois plus que le volume traité par ses 1.600 traducteurs humains.
” Les demandes ne sont pas les mêmes, explique Andreas Eisele, en charge du projet Machine Translation à la Commission européenne. Pour les documents officiels, nous avons besoin d’une traduction vérifiée, réalisée par un professionnel. Par contre, dans d’autres cas, une traduction quick & dirty (rapide, bâclée, Ndlr) faite par notre logiciel peut suffire. ” Un fonctionnaire de la Commission peut avoir besoin de rapidement passer en revue un document de 1.000 pages dans lequel il cherche quelques éléments importants. Dans ce cas, une traduction automatique, même imparfaite, est la solution la plus efficace et la moins onéreuse. Le responsable de la Commission est convaincu que les outils technologiques rendront de plus en plus de services à son institution dans les prochaines années. ” Cela ne rendra pas les traducteurs obsolètes, mais au contraire plus productifs “, avance-t-il.
Chez Telelingua, entreprise belge qui fait partie du Top 25 mondial des sociétés de traduction, et qui travaille avec plus de 5.000 traducteurs, la productivité et la technologie occupent aussi une place importante. ” Nous travaillons beaucoup sur l’automatisation des flux, explique son CEO Jean-Didier Boucau. Nous avons cinq développeurs à temps plein qui cherchent à nous faire gagner du temps, à nous et à nos clients. Le marché de la traduction est très concurrentiel, avec des prix qui sont tirés vers le bas malgré une demande croissance. Nous devons donc sans cesse gagner en efficacité, tant sur le plan administratif que linguistique. ”
Toutes ces évolutions technologiques sont à portée de la main des développeurs d’applications qui cherchent à faire sauter la barrière des langues étrangères. Un jour peut-être, grâce aux outils numériques, nous serons tous capables de ” comprendre ” et de ” parler” toutes les langues du monde. Un jour peut-être, nous ne devrons même plus faire l’effort d’apprendre l’anglais, le chinois, l’espagnol, l’arabe ou le néerlandais.
Les robots de Google ont-ils créé un nouveau langage, incompréhensible pour le commun des mortels ? C’est ce que laissent sous-entendre les ingénieurs de Google Brain qui ont mis sur pied un nouveau système de traduction, qualifié de “neuronal”. D’après les scientifiques de l’entreprise, l’intelligence artificielle de Google est désormais capable d’apporter des éléments de traduction d’une langue à une autre, sans y avoir jamais été entraîné ! Dans un post publié sur le blog de l’entreprise, les chercheurs expliquent qu’il ont injecté des traductions coréen-anglais et japonais-anglais dans le logiciel. Celui-ci a ensuite généré des traductions coréen-japonais d’un niveau “correct”. Les chercheurs y voient le signe de la création par la machine d’une “langue intermédiaire” non humaine (qu’ils ont appelée interlingua), basée sur du code informatique.
Google n’est pas la seule firme à avoir fait des progrès dans le domaine du langage. Fin mars, des bots dotés d’une intelligence artificielle ont créé leur propre langue. Développés dans le cadre d’Open AI, un laboratoire fondé notamment par Elon Musk (Tesla, Space X, etc.), ces robots numériques ont appris à communiquer entre eux pour résoudre certaines tâches “simples”. Les bots, représentés par des cercles rouges, bleus et verts, devaient progresser dans les limites d’un grand carré blanc, en passant par différents points de couleur. Pour y arriver, ils devaient communiquer entre eux, afin d’apprendre l’un l’autre de leurs réussites et erreurs. Cela les a amenés à créer de toutes pièces leur propre langage, basé non pas sur des mots, mais sur des séries de nombres.
Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici