Científicos revelan el misterio de las proteínas y combaten enfermedades con Windows Azure

Microsoft se ha asociado con el Laboratorio Baker de la Universidad de Washington con el fin de ayudar a los científicos a incrementar el poder de cómputo para su investigación sobre proteínas a través de Windows Azure. La capacidad de ayudar a los científicos a obtener resultados más rápidos podrá acelerar la cura de enfermedades como Alzheimer, cáncer, salmonella y malaria.

La computación en la nube está ayudando a los biólogos a revelar uno de los misterios más grandes de la naturaleza: las proteínas.

Microsoft se ha asociado con el Laboratorio Baker de la Universidad de Washington, uno de los laboratorios biológicos mejor equipados del mundo, para brindar a los científicos acceso a poder de cómputo de alto calibre, lo cual, a su vez, les ayudará a explorar y entender las proteínas para poder prevenir enfermedades como Alzheimer, malaria, cáncer y salmonella.

Foto 1

El científico Nikolas Sgourakis (izquierda) comenzó a utilizar Windows Azure para acelerar la investigación sobre proteínas después de que Marlin Eiben y su hijo Chris (centro y derecha) ayudaran a formar la alianza entre Microsoft y el Laboratorio Baker de la Universidad de Washington, el laboratorio biológico con el mejor equipo de cómputo del mundo.

Las proteínas se doblan sobre sí mismas para transformarse de espirales aleatorios en estructuras tridimensionales funcionales. Una vez dobladas, se convierten en los ladrillos y el motor del cuerpo. Algunas de las enfermedades modernas más terribles se relacionan con este proceso y se presentan cuando las proteínas no logran doblarse en forma correcta.

Contar con equipo de cómputo potente, económico y accesible sobre demanda acelera el ritmo al cual los científicos pueden obtener resultados de los experimentos, lo que acelera también el ritmo de los adelantos médicos.

Para Nikolas Sgourakis, eso es tanto su motivación como su objetivo.

“Si logras entender las estructuras proteínicas, con el tiempo podrás comprender e interrumpir las mutaciones que causan las enfermedades”, afirma Sgourakis, un alumno visitante al Laboratorio Baker que utiliza modelado computacional para intentar resolver el misterio del aspecto de las proteínas. “Este proyecto de trabajo dará lugar a otros estudios y abrirá el camino para realizar trabajos muy interesantes en este campo”.

La relación entre Microsoft y el Laboratorio Baker ya ha producido resultados importantes en el área de doblamiento de proteínas gracias a una alianza que inició como un asunto familiar.

A principios de este año, Marlin Eiben, del área de TI de Microsoft, estaba buscando un proyecto para ayudar a demostrar el “impresionante poder de cómputo” de Windows Azure. Después de buscar por todas partes, se le ocurrió la idea de asociarse con el Laboratorio Baker, donde su hijo es tecnólogo de investigación.

“Deseábamos un proyecto que no sólo mostrará la manera en que Azure funciona, sino que también marcara una diferencia importante”, comenta Eiben. “Gracias a mi hijo, pude darme cuenta de que ésta era una ciencia innovadora en la cual se podía aplicar el poder de cómputo masivo”.

Después de que Eiben recibió luz verde en Microsoft, padre e hijo se acercaron a David Baker, el director del laboratorio que recibe su nombre, quien los puso en contacto con Sgourakis. Eiben también se asoció con Dennis Gannon del Grupo de Computación Extrema de Microsoft Research, quien proporcionó los recursos necesarios de Windows Azure a través de su proyecto de investigación sobre cómputo en la nube.

Sgourakis se graduó de la Universidad de Atenas, en Grecia, y se encuentra realizado estudios postdoctorales en la Universidad de Washington. Tanto él como muchos otros en el Laboratorio Baker están intentando utilizar algoritmos complejos para definir la estructura de las proteínas.

Foto 2

La investigación de Sgourakis busca descubrir algunos de los misterios detrás de la estructura de las proteínas y conocer la manera en que bacterias como la salmonella transfieren material a células sanas por medio de una “aguja”. Los espirales que se muestran aquí son un modelo preliminar de una “aguja” de la salmonella. Los científicos están empleando algoritmos y cómputo en la nube para intentar obtener una imagen en alta resolución de su estructura.

La estructura y comportamiento de las proteínas es algo misteriosa, ya que no se “presentan con claridad”, explica Sgourakis. Examinar las proteínas aun con los microscopios más potentes y con rayos X de resonancia magnética nuclear sólo ofrece una idea general de su aspecto, y para poder conocerlas, los científicos necesitan observarlas más de cerca.

Actualmente, Sgourakis se encuentra investigando la salmonella. Cuando la salmonella y otras enfermedades infectan a una persona, lo hacen a través de una estructura llamada “aguja”. La enfermedad utiliza la aguja para abrir una perforación en una célula sana e insertar el material. Sgourakis desea conocer más acerca de la estructura de esa aguja. Existen datos experimentales, pero son escasos. Sin embargo, él y otros han desarrollado algoritmos que les permiten realizar millones de cálculos para resolver el problema y llenar los vacíos.

Entra a Windows Azure.

Para implementar y probar el software del laboratorio en Windows Azure, Eiben acudió a sus colegas de la división de TI de Microsoft, Pankaj Arora y Chris Sinco. Ambos diseñaron, probaron y ayudaron a escalar una solución. Debido a que el laboratorio se encontraba detrás de un firewall y Microsoft de otro, Arora incluso instaló un servidor en su casa, debajo de la cama, para realizar y probar la implementación de Azure.

“Lo interesante de todo esto es que no se trata de una implementación tradicional de Azure. Los casos de implementación más tradicionales consisten en compañías web nuevas, alojamiento de contenido, sitios web y aplicaciones empresariales. Esta implementación realmente demuestra la versatilidad de Azure como plataforma”, dice Arora.

Los científicos por lo general requieren un elevado poder de cómputo durante periodos cortos mientras realizan un experimento, pero ese tipo de poder computacional masivo no siempre se puede obtener, ni siquiera temporalmente. Con frecuencia, deben adquirir una infraestructura costosa o depender del poder de cómputo lento y poco confiable que reciben a través de la donación de computadoras conectadas al Internet en todo el mundo.

Los biólogos, en especial aquellos que estudian el desdoblamiento de las proteínas, han comenzado a adoptar el cómputo voluntario basado en el Internet, donde la gente en todas partes del mundo descarga el software y permite al investigador emplear sus recursos de cómputo para ayudar a conducir los experimentos. Es un modelo similar al utilizado en el proyecto Search for Extraterrestrial Intelligence (En busca de inteligencia extraterrestre, o SETI).

“Normalmente, este trabajo se compartiría entre miles de máquinas privadas de gente que ha donado tiempo de cómputo”, explica Eiben. “Entre esos miles de personas, alguien en Helsinki y otro en Sao Paulo pueden ofrecer tiempo, pero con Windows Azure, Nikolas puede obtener resultados en forma mucho más rápida y confiable, ya que la persona en Helsinki podría apagar su máquina e irse de vacaciones por tres semanas”.

La prueba de desempeño que Sgourakis realizó a Windows Azure utilizó 2.5 millones de cálculos para revisar los algoritmos y el proceso que aplicará. Señaló que su experimento —que empleó el equivalente a 2,000 computadoras en poco menos de una semana— fue todo un éxito. La segunda prueba, que consistió en calcular las propiedades de la “aguja” de la salmonella, se conducirá esta semana con una cantidad similar de cálculos.

foto 3

Pankaj Arora, del área de TI de Microsoft, ayudó al Laboratorio Baker a migrar a la nube, para lo cual incluso instaló un servidor en su casa, debajo de la cama, durante el proceso de evaluación.

“Necesitamos computadoras que sean sumamente potentes para realizar esos cálculos. En cierta medida, hemos rebasado las barreras de lo que se puede hacer hoy día con esa cantidad de datos experimentales”, afirma Sgourakis. “Es sumamente necesario para nosotros, y muy importante para la comunidad, que resolvamos una estructura que muchos laboratorios han intentado descubrir durante muchos años. Será un descubrimiento primordial”.

¿Y Sgourakis y sus compañeros investigadores encontrarán la clave para saber cómo son y cómo se comportan las proteínas?

“Confío en que lo lograremos”, asegura Sgourakis. “Pienso que si haces las preguntas correctas, obtienes las respuestas correctas. Considero que esta es la manera adecuada de hacer las cosas”.

Eiben comentó que la alianza entre Microsoft y el Laboratorio Baker es un buen ejemplo de lo que significa proporcionar una herramienta importante a un “investigador de primer nivel con un problema mundial”.

“Este campo requiere cantidades masivas de poder de cómputo. Aunque ya cuenta con mucho, necesita aún más”, señaló Eiben. “Esto acelerará el conocimiento sobre la manera en que se forman las proteínas. Significa unir las piezas del rompecabezas y, entre más recursos tengas, más rápido avanzarás”.

Sgourakis afirmó que Windows Azure ha sido una parte “indispensable” de esta investigación.

“La interacción con Microsoft me ha demostrado el poder de la nube. La idea detrás del cómputo sobre demanda podría ser muy útil para los científicos como yo, que no tenemos dinero para adquirir tiempo de cómputo sobre demanda, pero que necesitamos respuestas inmediatas”, dijo. “Es una herramienta potente que necesitamos para conducir nuestra investigación. Contar con un recurso como Azure para realizar proyectos innovadores es un gran aliciente”.