¨ Dépannage Maintenance Informatique | Articles-Info | Deep learning et traduction automatique |
Deep learning et traduction automatique : Pourquoi la traduction automatique est de plus en plus efficace.
Tweeter |
Directeur de recherche au CNRS, Thierry Poibeau publie «Babel 2.0 » aux éditions Odile Jacob. Il y explique notamment pourquoi les machines sont devenues de bien meilleures traductrices.
Selon l’auteur, depuis les années 90, on utilisait surtout l’approche statistique qui avait beaucoup amélioré la discipline.
Cette approche exploite des corpus de textes alignés c’est à dire des textes où l’on a une version dans la langue source (ex: l’anglais) et une version dans la langue cible (ex: le français).
Cela permet de trouver des équivalences au niveau des mots, des expressions et d’assembler petit à petit une phrase.
ð Mais récemment, une nouvelle approche a permis d’aller plus loin : le deep learning.
Cette méthode permet d’étudier la fréquence avec laquelle les mots apparaissent à proximité les uns des autres. Même si l’on n’encode pas le sens, analyser ces récurrences permet de constituer des classes de mots, des familles de sens très homogènes.
Avec le deep learning, on ne se contente plus d’assembler des bouts de mot, d’expressions.
On a une représentation directe de la phrase.
L’analyse du contexte permet d’identifier plus facilement la traduction la mieux adaptée.
Avec le deep learning, l’augmentation de la puissance de calcul et celle des volumes de données disponibles, le niveau global est devenu bon.
Mais ces outils ont encore leurs limites.
Ils ont souvent du mal à traiter les expressions figées.
Si la langue est très éloignée de l’anglais en terme de typologie linguistique, le risque d’erreur est également plus élevé.
Certaines langues comme l’arabe ou le finnois, par exemple, sont des langues dans lesquelles un même mot peut avoir beaucoup de variations (selon qu’il est sujet ou objet, qu’il s’accompagne d’un possessif, etc.)
Ceci va être plus complexe à traiter.
Un autre problème que l’on rencontre est celui des langues pour lesquelles nous avons peu de données.
Enfin, les outils proposent en général une traduction très littérale.
Dans certains cas, sur des textes techniques par exemple, cela peut s’avérer parfaitement adapté. Mais sur de la poésie ou certains types d’œuvres littéraires, cela l’est parfois beaucoup moins.
Aurons-nous bientôt des appareils capables de traduire fidèlement et en temps réel?
C’est sans doute le champ d’application qui nécessite le plus d’investissements.
Selon le chercheur, d’ici cinq ou dix ans, il y aura de la traduction en direct, peut-être pas totalement parfaite mais utilisable.
Les langages informatiques les plus demandés par les entreprises. - News - publié le 16/05/2019
L’IEEE (Institute of Electrical and Electronic Engineers), une association à l’échelle internationale regroupant des professionnels du secteur de l’electronique et du numérique, a procédé voici deux ans à une étude sur les langages informatiques les plus recherchés par les entreprises. |
Une application de stockage de photos a été utilisée pour développer un logiciel de reconnaissance faciale. - News - publié le 15/05/2019
Des milliards de photos privées utilisées pour développer un logiciel de reconnaissance faciale. |