Meta se dote d’un traducteur vocal en 100 langues et nous rapproche du mythe du poisson Babel

Le traducteur V4 dispose d’une carte SIM qui fournit un accès Internet gratuit et illimité /EPC

Avoir un traducteur de texte disponible jusqu’à 100 langues est impressionnant, mais être capable de traduire directement de voix à voix est quelque chose qui jusqu’à présent n’était vu que dans les séries et les films de science-fiction.

Dans le Guide du voyageur galactiquele poisson Babel, lorsqu’il est placé dans l’oreille, traduit instantanément toutes les langues. mrrtist21, CC BY-SA

L’utopie du traducteur universel, dispositif jusqu’ici fictif, a servi dans l’univers fictionnel de Star Trek comprendre avec les extraterrestres. dans le roman Guide du voyageur galactiquede Douglas Adams, le Babel Fish était un appareil biologique en forme de poisson placé dans l’oreille et capable de traduire n’importe quelle langue en temps réel. Aujourd’hui, le mythe est sur le point de devenir réalité.

Meta, la société de Mark Zuckerberg, a publié un article dans le magazine Nature où il présente un système d’intelligence artificielle capable d’effectuer des traductions dans plusieurs langues, à la fois depuis et vers le texte et depuis et vers l’audio, ainsi que toutes leurs combinaisons.

Traduction automatique avant Meta

Les premiers systèmes de traduction automatique basés sur des règles et des calculs statistiques avant le passage à la traduction automatique neuronale en 2016 sont très loin. Aujourd’hui, nous disposons d’une grande puissance de calcul dont nous pouvons tirer parti pour laisser libre cours à l’apprentissage automatique.apprentissage automatique) à travers des réseaux de neurones artificiels appliqués à la création de grands modèles linguistiques. Ces mêmes qui sont à la base de notre ChatGPT bien-aimé (et parfois détesté).

Jusqu’à présent, la plupart des traducteurs automatiques traduisent d’une langue X vers une autre Y en utilisant une langue intermédiaire où il y a beaucoup de données pour pouvoir entraîner ces systèmes. Et oui, comme prévu, la plupart des systèmes de traduction utilisent l’anglais comme intermédiaire. C’est logique, car si l’on pense que nous avons 100 langues et que nous voulons traduire de toutes vers toutes, nous aurions besoin de 19 800 traducteurs (100 => 99 et vice versa). Autrement dit, vous devez les combiner tous avec chacun d’eux. Cependant, si nous utilisons l’anglais comme langue intermédiaire, de nombreuses étapes sont enregistrées et nous n’en aurons besoin que de 198 (99 => Anglais + Anglais => 99).

Le problème est que cette utilisation d’une langue intermédiaire nécessite deux étapes de traduction (de la langue source vers l’anglais et de l’anglais vers la langue cible), ce qui entraîne éventuellement la commission de nombreuses erreurs.

La traduction automatique aujourd’hui

La proposition de Meta est de réaliser des traductions directes entre deux langues grâce à l’utilisation d’un espace de représentation commun. Autrement dit, le texte (ou l’audio) est converti en une série de valeurs numériques qui les représentent, afin qu’une machine puisse les traiter.

Dans cet espace multidimensionnel, les phrases ayant des significations similaires seront proches les unes des autres, de sorte qu’il soit possible de mesurer des distances et d’effectuer des calculs dans cette zone. Ce qui est intéressant, c’est que le système Meta est capable d’apprendre à représenter le texte et l’audio dans cet espace, quelle que soit la langue dans laquelle il se trouve.

Imaginez un espace multidimensionnel où différentes phrases sont organisées en fonction de leur similitude avec beaucoup d’autres. Une phrase dans une langue et sa traduction dans une autre seront très proches l’une de l’autre ; se chevauchant presque, pourrait-on dire.

Grâce à ce prétraitement des données, il n’est vraiment pas nécessaire de créer de nouveaux réseaux de neurones artificiels bien plus complexes que ceux dont nous disposons déjà. Il s’agit d’utiliser intelligemment les informations disponibles.

Grâce à cela, il est possible d’effectuer certaines tâches, comme la traduction texte-parole pour certaines langues où il n’est pas possible de disposer de données d’entraînement suffisantes. Autrement dit, si nous savons comment traduire du texte en texte de la langue X vers la langue Y, mais que nous n’avons pas d’exemples de traductions de texte à partir de la langue

Apprendre de 0 exemple

Ceci est réalisé grâce à l’utilisation d’une technique d’apprentissage appelée tir nulquelque chose comme « zéro exemple d’apprentissage ». Puisque le texte et l’audio sont représentés dans le même espace multidimensionnel, il est possible de passer de l’un à l’autre.

Quelqu’un pourrait objecter que la synthèse vocale est une solution résolue et qu’il existe de nombreux programmes capables de faire un travail acceptable. Cependant, si je veux traduire de parole en parole et décomposer le problème en étapes (la voix dans la langue tarde longtemps et finit par être inutilisable dans un cas réel. Pouvoir réaliser l’ensemble du processus en une seule étape rend la traduction fluide.

La traduction automatique dans le futur

Malgré toutes ces avancées, la traduction automatique ne peut être considérée comme un problème résolu. De nombreux éléments ne sont pas pris en compte, tels que les inflexions vocales ou d’autres composantes émotionnelles qui peuvent affecter l’exactitude de la traduction finale, surtout si une traduction voix-parole est utilisée.

Il est également vrai qu’il peut y avoir des problèmes lors de la détermination du genre grammatical de certains mots – comme, par exemple, professeur, qui en anglais n’a pas de genre et en espagnol il en a un – car il y a une généralisation excessive vers un genre spécifique.

Mais le problème le plus complexe à résoudre est le manque de données de qualité pour entraîner ces systèmes d’intelligence artificielle très avancés. Par conséquent, la traduction entre langues minoritaires (telles que le zoulou ou le nyanja) reste un grand défi. Les traducteurs automatiques à venir devront tenir compte de tout cela et être rapides et économes en énergie pour pouvoir les intégrer dans nos appareils mobiles.

Même si cela peut sembler incroyable de traduire entre 100 langues, nous ne parlons que d’une petite partie des langues parlées dans le monde, qui dépassent les 7 000. Cependant, l’objectif (et cet objectif est en minuscule. lettre) de la construction de la Tour de Babel semble se rapprocher chaque jour un peu plus.

La conversation