Los súper poderes del rastreo esquelético de Kinect

El equipo que inventó el sistema de rastreo de esqueletos de Kinect para Xbox 360 nos cuenta la “caída libre” que sintieron cuando empezaron desde cero a crear algo que buscaba rastrear de forma precisa los movimientos del cuerpo humano sin la necesidad de usar un controlador.

Si tienes un problema, si nadie más te puede ayudar, quizá debas llamar al Equipo A.

Sin embargo, ¿qué pasa si tu problema tiene que ver con habilitar un nuevo dispositivo electrónico de consumo que rastree exitosamente las poses de todo tipo de humano en el planeta, sin importar qué ropa estén usando ni en qué lugar se encuentren, con un mecanismo sencillo? Entonces tienes que llamar al equipo de Rastreo de Esqueletos de Kinect (Kinect Skeletal Tracking) (KST, por sus siglas en inglés).

clip_image002

Kinect usa su cámara para tomar imágenes de tu cuerpo, deduce dónde están las articulaciones de tu cuerpo en 3D y después usa la información para manipular objetos en la pantalla.

Lo que el equipo logró en el campo de rastreo de esqueletos en sólo algunos años fue similar a saltar del precipicio sin paracaídas y después trabajar juntos para construir uno antes de tocar el suelo, dijo Alex Kipman, director general de incubación de hardware en la división de Negocio de Entretenimiento Interactivo de Microsoft.

"Parte del aspecto sobresaliente de este proyecto fue que había riesgos”, dijo Robert Craig, quien dirige el equipo KST. "Tener la oportunidad de tratar de dar dichos saltos [tecnológicos] es algo muy poco común. Todo el crédito es de Alex por haber tenido esa visión”.

Un Kinect que pudiera rastrear de forma precisa el cuerpo humano tenía que ser un dispositivo 100 por ciento libre de controladores, lo cual era clave para la “magia” de Kinect, además de fundamental para su éxito. Microsoft rompió un récord mundial al vender 8 millones de dispositivos durante los primeros 60 días que el producto estuvo en el mercado. Eso hizo que Kinect fuera el dispositivo electrónico de consumo de venta más rápida, según los Récords Mundiales Guinness.

Junto con la satisfacción de su éxito comercial, el equipo KST recientemente tuvo otro éxito cuando fue reconocido con el Premio al Reconocimiento Técnico por su Sobresaliente Logro Técnico. Actualmente en su quinta edición, este programa de premios, que es patrocinado por la organización de Excelencia de Ingeniería, reconoce logros técnicos de ingenieros y equipos de ingenieros en todos los niveles dentro de la compañía, que es la gente que ha redefinido los avances tecnológicos tanto en Microsoft como en la industria como una totalidad.

Súper poderes y falta de horas de sueño

Sentarse en la mesa de una sala de juntas con el equipo KST es el equivalente en ingeniería de software de desayunar con Los Vengadores, los principales súper héroes de Marvel.

Craig, el creador del equipo, es muy divertido, mitad atrevido y mitad modesto. Aunque le gusta hablar sobre los “súper poderes” de varios miembros del equipo, también le gusta hacer notar que el éxito del rastreo de esqueletos en Kinect va más allá de sólo los 10 ganadores del Premio al Reconocimiento Técnico.

"Todos sabemos que el rastreo de esqueletos es más que una pieza, una pieza fundamental, para la magia de Kinect", dijo Craig. "También quiero hacer un reconocimiento a muchas personas detrás de este premio en particular, las cuales usaron sus súper poderes para hacer que Kinect fuera el éxito que es hoy”. Esto incluye, según sus palabras, a los cónyuges y las parejas que tuvieron que lidiar con miembros de un equipo obsesionado con el trabajo durante el desarrollo de Kinect.

Pero sin los “súper poderes” de los ganadores—Kipman, Craig, Momin Al-Ghosien, Matt Bronder, Mark Finocchio, Samuel Mann, Parham Mohadjer, Craig Peeper y Jamie Shotton—es posible que Kinect no existiera.

Adam Green, quien también habría sido reconocido si no se hubiera jubilado (sólo los empleados activos pueden recibir el premio), ocupa el puesto honorario no. 10 en el premio. Green ayudó a resolver un molesto problema alrededor de un año antes del lanzamiento: los problemas que tenía Kinect con el rastreo de niños pequeños.

clip_image003El equipo de Rastreo de Esqueletos de Kinect posó para la foto durante una reciente cena de los Premios al Reconocimiento Técnico. Fila de adelante: Momin Al-Ghosien, Samuel Mann, Alex Kipman, Robert Craig y Parham Mohadjer. Fila de atrás: Adam Green (jubilado), Craig Peeper, Matt Bronder, Jamie Shotton y Mark Finocchio.

"Toda la sabiduría convencional sobre cómo resolver el problema no tuvo éxito. Adam, entre muchas de sus contribuciones, nos llevó a esa solución”, dijo Craig. “El súper poder de Adam es que puedes enviarlo por el hoyo más complejo y enrevesado, y siempre regresará con oro”.

Conocer a los héroes sin capa que se sientan alrededor de la mesa significa entender su historia y los retos y triunfos de navegar por aguas tecnológicas desconocidas”.

Kipman, dijo Craig, fue el visionario y líder detrás de Kinect, y cuyo súper poder es “convencer a la gente que lo imposible es posible”.

"Sin Alex, no habría Kinect", dijo Craig.

Matt Bronder, quien usa shorts en el invierno, puede hacer que quepan universos en pequeñas cajas. En otras palabras, el súper poder de Bronder fue tomar una tecnología completamente nueva y ayudarla a caber en la consola Xbox 360 que tenía 10 años de existencia. Si había 89 formas de que una persona moviera su mano izquierda en un escenario dado, Bronder las reducía a ocho.

"Fue interesante tomar una nueva arquitectura y hacerla caber en los mejores lugares dentro del hardware que habíamos desarrollado años antes de que surgiera la idea de rastrear humanos con Xbox”, dijo Bronder.

Samuel Mann puede hacer lo que sea: software, hardware, lo que sea que acabe con ware. Mann observa intimidantes algoritmos, se acomoda y juega con datos complejos. Él hizo la base de datos que venía integrada con Kinect, la cual sigue usando el equipo hasta la fecha.

Parham Mohadjer fue el líder técnico de las primeras pruebas y capacitaciones del equipo, y “el aprendizaje de la máquina depende de sus primeras pruebas”, dijo Craig.

Mark Finocchio es el único que puede igualar la capacidad de Kipman de decir “Sí, creo que puedo hacerlo funcionar” cuando una tarea o una idea parecen imposibles.

Craig Peeper, "el eliminador de cuerpos", tuvo la tarea de eliminar los cuerpos humanos que se veían al fondo de Kinect, el cual fue uno de los problemas más difíciles de resolver en el rastreo de esqueletos.

Momin Al-Ghosien es el "Michael Jordan de la programación", ya que tiene una mezcla de velocidad, precisión y potencia.

"Mientras todos los demás discuten sobre a quién incluir y cómo programar la plática inicial para comenzar con la discusión sobre cómo diseñar una solución para un reto enorme, Momin aparece y dice ‘Yo ya lo codifiqué y funciona bien. Y además resiste la prueba del tiempo’”, dijo Craig.

Jamie Shotton había trabajado en proyectos de visión por computadoras en Microsoft Research Cambridge cuando una noche recibió un correo electrónico de Finocchio preguntándole si podían hablar de su idea secreta.

"Le dije ‘Claro, nos podemos ver el lunes’”, dijo Shotton. “Después me contestó: ‘¿Qué te parece si hablamos ahora mismo?’. Ahora que lo pienso, me da mucho gusto que lo hayamos hecho así”.

Shotton y Finocchio comenzaron a trabajar en una solución de aprendizaje de máquinas llamada Exemplar diseñada para trabajar en conjunto con otra tecnología en desarrollo llamada Bones. Bones fue uno de los primeros prototipos de rastreo de poses que, aunque era innovador, permitía que las imágenes caminaran por la pared y que el suelo se arrugara.

Eventualmente, dijo Craig, el equipo tuvo que tomar una decisión para fijarse un camino y hacer realidad el rastreo de esqueletos, ya fuera Bones o un segundo y nuevo tipo de algoritmo de rastreo para funcionar con Exemplar. "Terminamos eligiendo la opción C, la opción que no existía”, dijo Craig.

clip_image004Robert Craig, quien dijo que desde hace mucho tiempo no le han tomado una foto formal, usó el sensor de imágenes profundas de Kinect para tomarse una autofoto. Craig dirigió al equipo que desarrolló el rastreo de esqueletos en Kinect.

Cada uno de los miembros del equipo tuvo un momento de iluminación donde supieron que el rastreo de esqueletos, y como resultado Kinect, iba a funcionar. Para algunos, este momento tuvo lugar cuando se hizo una demostración de Kinect (después llamado Proyecto Natal) en la Electronic Entertainment Expo (Exposición de Entretenimiento Electrónico). Para otros, tuvo lugar mientras jugaban uno de los primeros juegos, Kinect Adventures.

"Después de ver Kinect Adventures, me sentí mucho mejor”, dijo Mohadjer. "Fue genial. Definitivamente no había estado pensando acerca de todas las distintas aplicaciones”.

Kipman dijo que era un equipo único, formado por ingenieros que también actuaron como investigadores, científicos, artistas e inventores.

"Necesitas tener un nivel de espíritu emprendedor, un nivel de creatividad, un nivel de pasión que sea muy diferente a la norma de la gente súper inteligente. Estás en Microsoft. Todos son súper inteligentes, pero ser súper inteligente ya no marca la diferencia”, dijo Kipman. "Inventar cosas que nunca se han inventado, cosas que otras personas creen que son imposibles, estaba en el ADN del equipo”.

"Mucha gente llegó a Microsoft para cambiar al mundo y hacer una diferencia”, dijo Bronder. "Pero esto es otro nivel. ¿Puedes imaginar tener un producto potencialmente mágico sobre el cual se trabajó tanto, sin saber si se podrían resolver los problemas que representaba, y después lograrlo e ir al centro comercial y ver a niños y adultos jugar Kinect y ver la magia reflejada en sus caras? Uno piensa: ‘Cambié al mundo y puedo verlo en la cara de esa persona’”.