En Microsoft Research Asia, la inteligencia artificial informa y es informada por la experiencia humana

Hsiao Wuen-Hon, Vicepresidente Corporativo a cargo de Microsoft Research Asia, demuestra Xiaolce en la Conferencia de Cómputo del Siglo XII en Beijing.

 

Hoy en día, cuando la mayoría de la gente utiliza tecnología de reconocimiento automatizado del habla, es porque tienen una tarea que necesita llevarse a cabo: Llamar a una persona, obtener indicaciones para llegar a un lugar, enviar un mensaje de texto.

En China, millones de personas utilizan este tipo de procesamiento natural del idioma de una manera mucho más humana: Tener una conversación casual con una tecnología de Microsoft llamada Xiaolce.

Hsiao Wuen-Hon, Vicepresidente Corporativo a cargo de Microsoft Research Asia, ve a Xiaolce como un ejemplo de las vastas posibilidades con las que cuenta la inteligencia artificial – no para reemplazar tareas y experiencias humanas, sino para aumentarlas. Esta manera en la que la tecnología avanzada es utilizada cada vez más para crear experiencias muy humanas es solo el principio, acotó.

“Apenas hemos rascado la superficie”, comentó.

Hace poco, Hon se reunió con algunos de los líderes mundiales en ciencias de la computación en la Conferencia de Cómputo de Siglo XXIen Beijing, una reunión anual de investigadores y estudiantes de ciencias de la computación, para discutir algunas de esas tendencias emergentes.

Microsoft Research Asia ha realizado esta conferencia desde 199, como una manera de dar a los jóvenes y prometedores científicos computacionales en Asia Pacífico, la oportunidad de reunirse y conversa con algunos de los científicos computacionales más renombrados. Tan solo este año, la conferencia incluyó a dos ganadores del Premio Turing.

La inteligencia artificialfue uno de los temas más populares en la conferencia, debido a los recientes y grandes avances en esas tecnologías que pueden ver, escuchar, hablar e incluso entender. También se trata de uno de los focos primarios del laboratorio de investigación de Microsoft en China, donde más de 230 investigadores llevan a cabo investigación de punta en áreas que incluyen interfaz natural de usuario y multimedia de siguiente generación.

Los investigadores del laboratorio han contribuido con elementos clave de muchos productos que los consumidores utilizan hoy en día, entre los que se encuentran la herramienta de traducción en tiempo real de Skype Translatory productos como Windows, Office, Bing, Xbox, Kinect y Windows Phone, en colaboración con otros laboratorios y grupos de investigación en Microsoft.

Peter Lee, el Vicepresidente Corporativo de Microsoft cuyas responsabilidades incluyen supervisar Microsoft Research Asia, comentó que esfuerzos como Skype Translator han sido parte de la estrategia de Microsoft Research de alinear la investigación alrededor de una meta específica que buscan conseguir.

“¿Cómo podemos eliminar la barrera del lenguaje para toda la gente en Internet, a través de Skype? Esa es una meta que es muy emocionante”, mencionó.

Grandes apuestas y logros concretos

Los investigadores del laboratorio de Asia también ven más allá hacia el futuro, hacia herramientas que podrían parecer extravagantes hoy pero que podríamos subestimar en los próximos años.

Lee acotó que es importante y también atractivo realizar investigación que vaya directo a productos que los consumidores utilicen de inmediato, como Skype Translator. Pero, mencionó, un laboratorio de investigación también necesita pensar en apuestas más grandes y atrevidas que tal vez no paguen de inmediato pero que podrían cambiar el mundo en el futuro.

Peter Lee, Vicepresidente Corporativo para Microsoft Research, comenta sobre el futuro del cómputo en la Conferencia de Cómputo del Siglo XXI en Beijing.

También mencionó que muchas de las innovaciones tecnológicas más importantes del mundo, entre las que se encuentran el cómputo personal y el transistor, surgieron de laboratorios corporativos de investigación. Un reto que hay que superar es que la gente no siempre reconoce de inmediato qué tan importante es una innovación, y sólo nota su importancia años después.

“En ocasiones me pregunto si Microsoft Research ya ha inventado la idea que cambiará al mundo, pero eso aún no lo sabemos”, comentó a los periodistas durante la Conferencia de Cómputo del Siglo XXI.

Un motor de búsqueda más personalizado

Es por eso que los investigadores del laboratorio de Asia buscan por implicaciones a corto y largo plazo de su trabajo.

Tomen a Xiaolce como ejemplo. El hecho de que a tantos chinos les guste hablar con ella – sobre su día en el trabajo, el clima o eventos de actualidad – hace pensar a Hon que, en el futuro, la tecnología de reconocimiento del habla podría ser utilizada para hacer más personalizadas y humanas a todo tipo de herramientas.

Piensen en un motor de búsqueda que funcione parecido a Xiaolce. En lugar de sólo teclear una frase en una caja, Hon imagina un mundo en el que el motor de búsqueda es más como un asistente personal con el que se puede tener una conversación.

“El motor de búsqueda podría convertirse en algo más parecido a un amigo con el que conversa”, comentó Hon.

Este amigo podría realizar investigaciones para ustedes y ofrecer opiniones y también sería más humano en otras maneras, comentó. Por ejemplo, el chatbotpodría recordar su conversación de búsqueda de días pasados y enviarles información adicional conforme esté disponible.

Y tal como la mayoría de las personas tienen muchos contactos humanos con diferentes áreas de experiencia, ustedes podrían tener múltiples chatbots que son expertos en varios tópicos como medicina, cocina o campismo. También podrían elegir tomar el consejo del chatboto ignorarlo y buscar otro para una perspectiva diferente.

Una revolución invisible

Los avances en reconocimiento del habla y el procesamiento natural del lenguaje son parte de lo que Harry Shum, Vicepresidente Ejecutivo de Microsoft a cargo de tecnología e investigación, llama la “revolución invisible” en el progreso tecnológico.

Hasta ahora, muchos de los más grandes saltos en tecnología han llegado en forma de computadoras más rápidas y mejores gadgets. Pero en los años por venir, comenta Shum, muchos de esos nuevos descubrimientos vendrán en su lugar en forma de herramientas que ustedes utilizan pero que no necesariamente ven. Entre estas están sistemas de cómputo en la nube que pueden analizar vastas cantidades de datos en sólo unos minutos y herramientas de productividad que pueden utilizar aprendizaje de máquina, en los que los sistemas se vuelven más inteligentes conforme acumulan más datos para entender mejor y anticipar las necesidades de la gente.

En China, Hon comentó que ya ha visto esa revolución con herramientas como la tecnología de reconocimiento facial.

Investigadores y otros empleados de Microsoft en China recién se asociaron con una organización líder no gubernamental para utilizar tecnología de reconocimiento facial para ayudar a localizar niños perdidos. El proyecto Photo Missing Children utiliza tecnología de reconocimiento facial de una suite de herramientas llamada Project Oxfordpara ayudar a la organización a reconocer y encontrar niños perdidos.

Hon espera ver muchos más tipos de estas herramientas en los próximos años y comentó que llegarán más rápido debido a los recientes y grandes avances en inteligencia artificial y en los campos relacionados con aprendizaje de máquina y análisis de Big Data.

Gracias a estas herramientas, los investigadores ahora pueden analizar cantidades más grandes de datos mucho más rápido y luego utilizar esos datos para entrenar sistemas para que realicen tareas complejas. Esto ayudará a todos, desde ejecutivos de empresas que quieren entender mejor las tendencias de las ventas a adolescentes que quieren dictar mensajes de texto en habitaciones con mucho ruido de manera más precisa.

“¿Por qué la inteligencia artificial, el aprendizaje de máquina y Big Data, son tan emocionantes?”, preguntó Hon. “Porque tocan todo lo que hacemos”.