Reúnen la historia y la ciencia de datos con Microsoft Azure


Andrea Nanetti es historiador y profesor asociado de la Escuela de Arte, Diseño y Medios de Comunicación en la Universidad Tecnológica de Nanyang (NTU). Algunos podrían pensar que, como historiador sería poco probable que asista a una presentación acerca de la ciencia de datos. Sin embargo, cuando Nenatti aprendió acerca de una conferencia impartida por el Dr. Hsiao-Wuen Hon, de Microsoft Research Asia, sabía que podría aplicarse a sus necesidades únicas.

"Como historiador, todos los días trabajo cada vez más con mayores cantidades de información y datos. Ha sido una tarea difícil para los historiadores el poder componer historias coherentes en una forma eficiente, utilizando todos los datos disponibles. La charla en verdad me emocionó, pues me daba cuenta que los científicos de los datos no solo me podían ayudar, sino que también serían capaces de resolver problemas mediante el uso de las ciencias históricas." –Andrea Nanetti.

La formación de un equipo

En informática, la experiencia del usuario es una parte crucial para el diseño de cualquier programa. Tomemos los motores de búsqueda, por ejemplo. Hoy en día, cualquier frase que entra en un buscador arrojaría innumerables resultados. Pero, mientras que el volumen de resultados es impresionante, la información podría estar algo fracturada, repetitiva o puede estar superpuesta.

Las capacidades de los motores de búsqueda actuales no son lo suficientemente inteligentes como para satisfacer las necesidades de sus usuarios humanos. En teoría, un motor de búsqueda podría organizar la información en una historia coherente, o casi coherente, e incluso proporcionar elementos narrativos como quién, qué, cuándo, dónde, por qué y cómo.

Para crear una búsqueda más inteligente, humana y optimizada, Nanetti y su colega, el profesor Siew Un Cheong, se asociaron con el Dr. Chin-Lin Yew, un científico de la computación en el conocimiento y con Kristin Tolle, experto en minería de datos y científico de datos, ambos del Microsoft Research.

Dr. Chin Yew-Lin y Andrea Nanetti

¡Manos a la obra!

El Dr. Chin-Yew Lin y su equipo de investigadores en minería desarrollaron una entidad de servicio de enlace. Este servicio identifica artículos relacionados y los une. "Las diferentes maneras de hablar de la misma entidad se pueden utilizar muy bien para nuestro servicio. Esto ayudará a abordar la brecha en las actuales herramientas de búsqueda y dejar atrás el servicio. Es como cuando Bing da una visión 'panorámica' de una entidad y cuenta una historia ", dijo Lin.

Al mismo tiempo, Nanetti trabajó con un equipo global de expertos, entre ellos el profesor Angelo Cattaneo, de la Universidad Nueva de Lisboa; Stefano Bertocci, de la Universidad de Florencia; el profesor John Melville Jones, de la Universidad de Australia Occidental y el profesor Gherardo Ortalli, de la Universidad de Venecia Ca 'Foscari. El equipo migró la información incluida en los documentos históricos antiguos en un “agregador” de conocimiento del idioma Inglés en Microsoft Azure. Este tipo de datos sobre Azure proporcionan una manera de enlazar fácil entidades a través de varias bases de datos históricas (o incluso modernas), con lo cual se ayuda a los científicos informáticos a analizar sistemas complejos a través de diferentes bases de datos y descubrir aún más conocimiento por la unión de múltiples conjuntos de datos.

Ver hacia el futuro

La colaboración entre los expertos en historia y ciencia de datos arrojó enormes resultados para todos los involucrados. La primera presentación del proyecto fue galardonada con el premio al mejor documento en la Conferencia Internacional de 2013 de Cultura y Computación, por "Investigación en las fronteras de la cultura y la informática."

Sus resultados académicos fueron revisados por expertos y presentados en las conferencias mundiales de primer nivel en el año 2015, incluyendo: la 3er  Conferencia Internacional Trienal de la Asociación Asiática de historiadores del mundo, la 22av Conferencia Quinquenal Internacional de Ciencias Históricas, y 27av la Conferencia Bienal Internacional de Cartografía.

En el futuro, Nanetti y sus colegas esperan avanzar en sus hallazgos, ampliando su investigación al espacio y el tiempo. Esta investigación ampliada podría revelar nuevas e interesantes posibilidades. Por ejemplo, los resultados de búsqueda podrían generar "películas". Estas películas podrían incluir narrativas que explican una historia completa detrás de los datos de búsqueda. O bien, los mapas pueden ser a la vez espaciales y temporales. Cualquier cosa es posible cuando se es capaz de "ver" las historias en los datos.

–Winnie Cui, Administrador Senior de programas de investigación en Microsoft Research Asia

Skip to main content