Microsoft alcanza un logro histórico al utilizar IA para igualar el desempeño humano en traducción de noticias del chino al inglés

[caption id="attachment_17015" align="aligncenter" width="800"] Xuedong Huang, Técnico a cargo de los esfuerzos de habla, lenguaje natural y traducción automática de Microsoft. (Foto por Scott Eklund/Red Box Pictures)[/caption]

Un equipo de investigadores de Microsoft comentó hace unos días que creían que habían creado el primer sistema de traducción automática que puede traducir enunciados de artículos noticiosos del chino al inglés con la misma cualidad y precisión en que lo haría una persona.

Investigadores en los laboratorios de Asia y Estados Unidos de la compañía, comentaron que su sistema consiguió la paridad humana en un conjunto de pruebas de historias noticiosas utilizado de manera común, llamado newstest2017, que fue desarrollado por un grupo de socios de la industria y la academia y que fue lanzado en una conferencia de investigación llamada WMT17, hace un año. Para asegurar que los resultados fueran precisos y a la par con lo que la gente haría, el equipo contrató a evaluadores humanos bilingües externos, que compararon los resultados de Microsoft con dos traducciones humanas de referencia producidas de manera independiente.

Xuedong Huang, Técnico a cargo de los esfuerzos de habla, lenguaje natural y traducción automática de Microsoft, lo llamó un logro muy importante en una de las tareas más desafiantes del procesamiento de lenguaje natural.

“Alcanzar la paridad humana en una tarea de traducción automática es un sueño que todos hemos tenido”, comentó Huang. “No sabíamos que lo íbamos a conseguir tan pronto”.

Huang, que también lideró el grupo que de manera reciente consiguió la paridad humana en una tarea de reconocimiento de habla conversacional, comentó que el logro en la traducción era en especial gratificante debido a las posibilidades que tiene de ayudar a la gente a entenderse mejor.

“La búsqueda de remover las barreras del lenguaje para ayudar a la gente a comunicarse mejor es fantástica”, mencionó. “Es muy, muy gratificante”.

La traducción automática es un problema con el que los investigadores han trabajado por décadas – y, comentan los expertos, durante gran parte de ese tiempo muchos creían que la paridad humana no podría alcanzarse. Aún así, los investigadores advirtieron que este logro no significa que la traducción automática es un problema resuelto.

Ming Zhou, Asistente de la Dirección General de Microsoft Research Asia y jefe del grupo de procesamiento de lenguaje natural que trabajó en el proyecto, comentó que el equipo estaba emocionado por conseguir el logro de la paridad humana sobre ese conjunto de datos. Pero advirtió que aún hay muchos retos por delante, como probar el sistema en historias noticiosas en tiempo real.

Arul Menezes, Gerente Asociado de Investigación del equipo de traducción automática de Microsoft, comentó que el equipo demostró que sus sistemas se podían desempeñar casi tan bien como una persona cuando utilizó una pareja de idiomas – chino e inglés – para los cuales existe una gran cantidad de datos, en un conjunto de pruebas que incluye el vocabulario habitual de las historias noticiosas de interés general.

[caption id="attachment_16995" align="aligncenter" width="800"] Arul Menezes, Gerente Asociado de Investigación del equipo de traducción automática de Microsoft. (Foto por Dan DeLong)[/caption]

“En la mejor de las situaciones de qué tan lejos van los datos y la disponibilidad de recursos, queríamos descubrir si podíamos igualar el desempeño de un traductor humano profesional”, comentó Menezes, que ayudó a liderar el proyecto.

Menezes comentó que el equipo de investigación puede aplicar los avances técnicos que han conseguido para este logro a los productos de traducción de Microsoft disponibles a nivel comercial en múltiples idiomas. Esto pavimentará el camino para traducciones más precisas y naturales a través de diferentes idiomas y para pruebas con vocabulario más complejo o que sea de nicho.

Aprendizaje dual, deliberación, entrenamiento conjunto y regularización de acuerdo

Si bien los investigadores académicos y de la industria han trabajado por años en la traducción, de manera reciente consiguieron avances sustanciales al utilizar un método de sistemas de entrenamiento de IA llamado redes neurales profundas. Esto les ha permitido crear traducciones más fluidas y naturales que toman en cuenta un contexto aún más amplio que el enfoque previo, conocido como traducción automática estadística.

Para alcanzar el logro de la paridad humana en este logro, tres equipos de investigación en Beijín y Redmond Washington, los laboratorios de investigación de Microsoft trabajaron en conjunto para agregar algunos otros métodos de entrenamiento que podrían hacer al sistema más fluido y preciso. En muchos casos, estos nuevos métodos imitaban cómo la gente mejora su propio trabajo de manera iterativa, al repasarlo una y otra vez hasta que lo consiguen.

“Mucha de nuestra investigación en realidad está inspirada en cómo los humanos hacemos las cosas”, comentó Tie-Yan Liu, Gerente de Investigación con Microsoft Research Asia en Beijing, quien lidera un equipo de aprendizaje automático que trabajó en este proyecto.

[caption id="attachment_17005" align="aligncenter" width="800"] Tie-Yan Liu, Gerente de Investigación con Microsoft Research Asia en Beijing. (Foto cortesía de Microsoft)[/caption]

Un método que utilizaron es el aprendizaje dual. Piensen en él como una manera de revisión rápida del trabajo del sistema: Cada cierto tiempo envían un enunciado a través del sistema para ser traducido del chino al inglés, el equipo de investigación también lo traduce de vuelta del inglés al chino. Esto es similar a lo que la gente haría para asegurarse que sus traducciones automatizadas fueron precisas, y esto permitió al sistema refinar y aprender de sus propios sistemas. El aprendizaje dual, que fue desarrollado por el equipo de investigación de Microsoft, también puede ser utilizado para mejorar los resultados en otras tareas de IA.

Otro método, llamado redes de deliberación, es similar a cómo la gente edita y revisa su propia escritura al revisarla una y otra vez. Los investigadores enseñaron al sistema a repetir el proceso de traducir el mismo enunciado una y otra vez, para refinar y mejorar la respuesta de manera gradual.

Los investigadores también desarrollaron dos nuevas técnicas para mejorar la precisión de sus traducciones, comentó Zhou.

Una de ellas, llamada entrenamiento conjunto, fue utilizada para estimular los sistemas de traducción de inglés a chino y de chino a inglés de manera iterativa. Con este método, el sistema de traducción de inglés a chino traduce nuevos enunciados para obtener nuevas parejas de enunciados. Estos luego son utilizados para aumentar el conjunto de datos de entrenamiento que va a ir en la dirección opuesta, del chino al inglés. Luego, el mismo procedimiento es aplicado en la otra dirección. Cuando convergen, mejora el desempeño de ambos sistemas.

Otra técnica es llamada regularización de acuerdo. Con este método la traducción puede ser generada al hacer que el sistema lea de izquierda a derecha o viceversa. Si estas dos técnicas de traducción generan la misma traducción, el resultado se considera más confiable que si no consiguen los mismos resultados. El método es utilizado para invitar a los sistemas a generar una traducción consensada.

Zhou comentó que él espera que estos métodos y técnicas sean útiles también para mejorar la traducción automática en otros idiomas y situaciones. Mencionó que también podrían ser utilizados para conseguir otros avances en IA más allá de la traducción.

“Existe un área donde la investigación en traducción automática puede aplicar a todo el campo de la investigación en IA”, comentó.

No hay una respuesta ‘correcta’

El conjunto de pruebas que el equipo utilizó para alcanzar el logro de la paridad humana incluye cerca de dos mil enunciados de una muestra de periódicos en línea que han sido traducidos de manera profesional.

Microsoft realizó múltiples rondas de evaluación en el conjunto de pruebas, además de seleccionar cada vez, de manera aleatoria, cientos de traducciones para evaluarlas. Para verificar que la traducción automática de Microsoft era tan buena como la de una persona, la empresa fue más allá de las especificaciones del conjunto de pruebas y contrató a un grupo de consultores externos en lenguaje bilingüe para comparar los resultados de Microsoft contra las traducciones humanas producidas de manera manual.

El método de verificar los resultados resalta la complejidad de enseñar a los sistemas a traducir de manera precisa. Con otras tareas, como el reconocimiento del habla, es muy sencillo decir si un sistema se desempeña tan bien como lo haría una persona, porque el resultado ideal será el mismo para una persona y una máquina. Los investigadores llaman a esto una tarea de reconocimiento de patrón.

Con la traducción, existen más matices. Incluso dos traductores humanos expertos podrían traducir el mismo enunciado con algunas diferencias, y ninguno de los dos estaría equivocado. Esto es debido a que hay más de una manera “correcta” de decir la misma cosa.

“La traducción automática es mucho más compleja que sólo una tarea de reconocimiento de patrón”, comentó Zhou. “La gente utiliza diferentes palabras para la misma cosa, pero no siempre puedes decir cuál es la mejor”.

Los investigadores comentan que esta complejidad es la que hace de la traducción automática un problema tan desafiante, pero a la vez gratificante.

Liu mencionó que nadie sabe si los sistemas de traducción automática llegarán a ser tan buenos para traducir cualquier texto en cualquier idioma con la precisión y lirismo de un traductor humano. Pero, comenta, estos avances recientes permiten a los equipos dar los siguientes grandes pasos hacia esa meta y hacia otros grandes logros en IA, como alcanzar la paridad humana en traducción de habla en habla.

“Lo que podemos predecir es que, en definitiva, lo haremos cada vez mejor”, mencionó Liu.

Contenido relacionado: