El Big Bang: La explosión de Big Data comienza a cambiar el mundo

En la batalla de las nuevas palabras de moda, “Big Data” es el gran ganador.

Eso es algo grande.

“En definitiva, Big Data tiene el potencial de cambiar la manera en que los gobiernos, las empresas y las instituciones académicas negocian y descubren, y lo más seguro es que cambie la forma en que las personas viven su día a día”, dijo Susan Hauser, vicepresidente corporativo del Grupo de Empresas y Socios de Microsoft.

En el mundo ahora existe el doble de datos que litros en el mar, dijo Hauser. Si aprendemos a navegar por este mar de Big Data, será posible reemplazar las corazonadas por perspectivas, identificar las tendencias antes de que caduquen, y tomar acción mientras otros deliberan.

Big Data es un término que se utiliza cada vez más para describir el proceso de aplicar un poder de cómputo extremo —lo último en aprendizaje de máquina y en inteligencia artificial— en conjuntos de información masivos y con frecuencia de gran complejidad.

¿Qué tipo de información? Lo que sea. Big Data puede comparar el costo de los servicios públicos con los datos meteorológicos para identificar las tendencias y las ineficiencias. Puede comparar la información del GPS de las ambulancias con los registros médicos de los pacientes para determinar la correlación entre el tiempo de respuesta y la sobrevivencia. Pero Big Data también puede ser el diminuto dispositivo que llevas contigo para registrar tus movimientos, calorías y horas de sueño y, de esa forma, conocer el estado de tu salud física.

“Nuestra vida diaria genera un cantidad enorme de datos”, dijo Dan Vesset, vicepresidente de programas de investigación de la División de Análisis de Negocios de IDC.

Ya sea que navegues por Internet, vayas de compras, conduzcas tu auto inteligente por la ciudad, te subas a un avión, visites al médico o asistas a clases en la universidad, todos los días generas una variedad de datos”, dijo.

“El beneficio de esos datos depende dónde te encuentres y con quién estés hablando”, dijo Vesset. “Gran parte del potencial yace en la capacidad de descubrir posibles conexiones y predecir posibles resultados en una manera que antes no existía. Antes, solo veías esas cosas en retrospectiva”.

Gracias a la disponibilidad cada vez mayor de datos en formato digital, al precio cada vez menor del almacenamiento de datos y a las computadoras avanzadas equipadas para procesarlo y analizarlo todo, el campo del Big Data ha llegado a un punto en verdad clave, dijo Vesset.

Es un punto para el cual Microsoft está preparado —y para el cual lleva preparándose casi desde que se fundó—, dijo Hauser.

“Microsoft considera que Big Data tiene el poder de generar perspectivas prácticas que antes eran imposibles de obtener”, dijo Hauser. “Todo se reduce a administrar los datos y proporcionar herramientas que permitan a todos responder las dudas —dudas que tal vez ni siquiera sabían que tenían—. Esa es nuestra visión”.

Un “punto de cambio”

La explosión del Big Data —que incluye su pasaje de la industria de alta tecnología a usos más masivos y generalizados— se puede atribuir a varios factores, dijo Dave Campbell, mimbro técnico en Microsoft.

Primero, existe un mar de datos en crecimiento. Antes de las computadoras, una base de datos consistía en poco más que el archivero gris ubicado en una esquina de la oficina. Pero ahora, la información se digitaliza cada vez más —o sólo “nace” en formato digital—.

Luego, los adelantos en inteligencia de máquina han generado algoritmos asombrosamente inteligentes que pueden utilizarse para procesar, comparar y ver esta creciente marea de datos estructurados y desestructurados.

Y albergar esos vastos almacenes de datos es ahora más económico que nunca (hace tres décadas, un terabyte de almacenamiento de datos podía llegar a costar millones de dólares), dijo Campbell. Hoy, cuesta unos $30 dólares en Office Depot.

“Es un punto de cambio. Ya no hay por qué deshacerse de nada”, dijo Campbell. “Vivimos un cambio asombroso en el cual muchas cosas nacen en formato digital, inclusive los datos inherentemente análogos como el correo de voz y las fotografías”.

Otra de las razones por la cual el Big Data ha dado un giro es que hay más datos. Lo sensores, los dispositivos GPS, los teléfonos móviles, los medios sociales, los autos inteligentes, las calles, los puentes, los edificios y más producen un flujo constante de datos listos para analizarse y volverse a analizar.

“En los próximos cinco años, generaremos más datos como seres humanos de lo que hemos generado en los últimos 5,000 años”, dijo Eron Kelly, gerente general de mercadotecnia de producto para Microsoft SQL Server.

“La generación cada vez mayor de datos es una realidad inevitable de nuestro mundo nuevo” dijo Kelly. “Aquellos capaces de extraer perspectivas de esos datos tomarán mejores decisiones y serán más eficientes, además de cumplir sus objetivos mucho más rápido que aquellos que no lo sean”.

Datos y más datos por todas partes

Puede haber un mar de datos allá afuera, pero convertirlos en algo que puedas utilizar es un tema muy diferente.

“El Big Data es un problema grande, y representa una oportunidad extraordinaria”, dijo Kelly. “Lo que nosotros ofrecemos es la herramienta que te permitirá sacar el agua del mar, verterla en un filtro y hacerla potable, en lugar de tener que realizar tú mismo cada uno de esos procesos que recuerdas con dificultad de las clases de química que tomaste en la escuela”.

Uno de los retos del Big Data puede ser tan solo administrar su gigantesco tamaño. Almacenar, buscar, analizar, comparar, refinar, combinar y visualizar conjuntos masivos de datos puede representar un reto para el software tradicional de base de datos. Es en esos procesos donde resultan de gran utilidad las herramientas de bases de datos y de inteligencia de negocios como Microsoft SQL Server, Windows Server, PowerPivot, Microsoft Office y SharePoint, dijo Hauser.

“Las empresas que se están asociando con Microsoft están viendo resultados en forma bastante rápida”, dijo Hauser. “Y lo más emocionante es el impacto que eso produce”.

Además, no tienes que ser un especialista en tecnología de la información ni un científico de datos con doctorado en análisis para obtener resultados, dijo Hauser.

Otro reto para aprovechar el Big Data es obtener el Big Data indicado. Microsoft trabaja con Hadoop, una plataforma de datos de fuente abierta que administra datos no estructurados, para ayudar a los clientes a trabajar con todos los tipos de datos, tanto estructurados como desestructurados.

Los datos estructurados, que por lo general se encuentran en las bases de datos que utilizan el Structured Query Language (SQL), se organizan en tal manera que permiten a los usuarios seleccionar partes, filas o columnas exactas de esa base de datos —quizá selecciones todas las filas con un determinado código postal o las columnas con una fecha específica—. Sin embargo, los datos desestructurados carecen de tal infraestructura y con frecuencia pueden incluir texto o imágenes que no forman parte de los datos de formato libre (por ejemplo, correos electrónicos).

Microsoft también trabaja en la integración de Hadoop en SQL Server y en Windows Azure para asegurar que los clientes puedan combinar todas sus fuentes de datos.

“Intentamos crear una amplia serie de habilidades para mejorar la facilidad de uso en el área del Big Data”, dijo Kelly. “La estrategia de Microsoft a lo largo de los últimos 30 años ha consistido en simplificar los problemas técnicos muy complejos a través de herramientas fáciles de utilizar”.

Una visión para el futuro

Un hospital utiliza secuenciación rápida de genes para detener una epidemia de bacteria resistente al antibiótico, lo que salva vidas. Una compañía ferroviaria recibe una alerta desde el sensor de un tren notificando que requiere una compostura preventiva, lo que ahorra el tiempo y el costo de tener que retirar el tren de las vías más tarde. Una universidad informa que el nivel de actividad de un estudiante ha disminuido casi hasta llegar al nivel de abandono de estudios, y se ofrece a ayudar.

Los datos pueden ser grandes, pero en esencia, el Big Data es bastante personal.

Big Data no es un término muy acertado, pues en realidad no tiene nada que ver con el tamaño”, dijo Campbell”.

Por el contrario, tiene que ver con la perspectiva que ofrece. El Big Data puede ser la clave para construir ciudades más inteligentes, realizar descubrimientos médicos más rápidos, mejorar el aprendizaje académico, utilizar los recursos con mayor eficiencia y establecer compañías más rentables; sin mencionar los trabajos —grandes trabajos—.

“El Big Data es importante, pero la verdadera brecha será en habilidades y capacidades”, dijo Kelly.

En los próximos años, se crearán millones de empleos de TI relacionados con el Big Data a nivel mundial, pero de acuerdo con el McKinsey Global Institute, existe una escasez importante de “talento analítico y administrativo necesario para aprovechar el Big Data”. Tan solo en Estados Unidos, hay una escasez de más de 140 mil trabajadores con habilidades de Big Data, así como de 1.5 millones de gerentes y analistas necesarios para analizar y tomar decisiones con base en los resultados del Big Data.

Kelly afirmó que en los próximos años, las empresas que aprovechen con éxito el poder del Big Data superarán a sus competidores.

Según el MIT Center for Digital Business, las compañías que adopten prácticas orientadas a los datos y utilicen el Big Data para guiar sus decisiones obtendrán resultados y una productividad de 5% a 6% mayor de lo que generarían con otras inversiones y usos de la tecnología de la información.

“No solo tiene que ver con hacer dinero a corto plazo, sino también de sobrevivir. En un mercado global cada vez más competitivo, tienes que hacer todo lo posible para mantenerte un paso delante de la competencia”, dijo Kelly. “Si no aprovechas los datos y la información a tu alrededor para tomar mejores decisiones y ser más eficiente, te quedas atrás. Eso es un hecho para las compañías, los gobiernos, las instituciones de salud y prácticamente todas las industrias. Por eso es algo tan crítico”.