El Big Data: La cadena de oro digital

Todo el mundo habla del Big Data como la estrategia de más alto impacto en las organizaciones de los últimos años con un crecimiento exponencial, que continuará por varias décadas más. Sin embargo, aunque mucho se habla de ello, no siempre queda claro de qué se trata. Sigue leyendo y conoce todo sobre el Big Data.

Unir-BigData

Para entender un poco este fenómeno, supón que un día encuentras una lámpara mágica que al frotarla aparece un genio que puede contestarte cualquier cosa. ¿Qué le preguntarías?

Piénsalo un momento, podrías preguntarle el pasado para comprender mejor el contexto de tus circunstancias y la realidad actual; podrías preguntarle el presente para tomar decisiones inmediatas más certeras que impacten positivamente en tu vida; o quizás te gustaría preguntarle el futuro para actuar hoy y tomar ventaja de ese conocimiento privilegiado.

Suena bien, ¿verdad? ¿Y qué tal si ese genio realmente existiera? ¡Pues ya está aquí y justamente se llama Big Data!

¿Pero realmente qué es? ¿Es un producto? ¿Es un software? ¿Es un slogan? Pues no. Big Data es un término que se usa para referirse a una estrategia de tratamiento de grandes volúmenes de datos de tal manera que permita extraer conocimiento valioso para tomar decisiones basadas en los hallazgos identificados y actuar en consecuencia.

Lo interesante no es en sí mismo el tener muchos datos, lo valioso es lo que se puede hacer con ellos. Veamos algunos ejemplos:

  • Tienes que crear un equipo deportivo con un presupuesto específico. El Big Data sustituye al proceso intuitivo de los buscadores de talento por un sistema de métricas puntuales que te pueden predecir el rendimiento real de cada jugador para la siguiente temporada.

    Esto lo hicieron los atléticos de Oakland hace ya dos décadas transformado lo que era un equipo de muy bajo rendimiento en uno de los más competitivos de la liga incrementando notablemente sus ingresos. Esto modificó totalmente la industria del deporte.

  • Eres un productor de contenido y tienes que decidir cómo distribuir tu presupuesto entre distintas opciones buscando la mayor rentabilidad. El Big Data define cuales son las preferencias del público basado en los hábitos de consumo indicando con precisión la combinación correcta entre diferentes opciones por género y temáticas, dejando atrás las decisiones basadas en la perspectiva de los productores.

Esto lo hizo Netflix para transformar su negocio de ser una compañía de streaming en una productora de contenido exitosa.

  • Es tu responsabilidad abastecer una tienda para maximizar las ventas en función de la demanda de productos por día de la semana, por hora e incluso considerando aspectos diversos como el clima o si el equipo de fútbol de la localidad gana o pierde un partido. 

Esto lo hizo Walmart para programar sus compras, ofertas e incluso la cantidad de personal que debe estar en tienda por hora cada día de la semana. Esto se logra analizando la información de los tiques de venta, cruzándolos con información diversa como el clima o los resultados deportivos.

Hay cientos más de ejemplos y aplicaciones. En el sector público, el gobierno de una localidad puede decidir las inversiones de infraestructura en transporte colectivo a través del análisis de recorridos obtenidos de Google Maps de miles de ciudadanos e identificar las tendencias de traslados, horarios y tiempos, para así identificar las mejores rutas en las cuales invertir.

En los hospitales se hace uso del análisis masivo de datos para el diagnóstico automático, combinando el big data con la inteligencia artificial. En las pymes se puede anticipar la aceptación que tendrá un producto nuevo y cuáles debe descontinuar, así como conocer la reputación e imagen que se tiene de ella.

Una fábrica puede decidir sobre la mejor implementación de su cadena de suministros y logística; en seguridad pública se pueden identificar las zonas de mayor incidencia delictiva por hora y por tipo de delito. Las aplicaciones son prácticamente infinitas.

Una estrategia de Big Data se construye a partir de la cadena de oro digital, que consiste en la transformación sucesiva de datos en elementos más complejos y representativos de los fenómenos. Esta cadena simboliza el viaje de un simple dato, aislado, con poca independencia y bajo significado, a convertirse en información que implica mensajes significativos en un contexto.

La información también se transforma para identificar patrones, tendencias y taxonomías con un entendimiento mucho mayor que finalmente desemboca en la sabiduría cuya principal característica es la acción basada en lo que se sabe, es decir, conocimiento aplicado basado en el entendimiento de principios.

unir-big-data

Uno de los múltiples objetivos que busca el Big Data es facilitar la acción de una organización a través de la denominada Toma de Decisiones Basadas en Datos (Data Driven Decision Making). El principio es que en la medida que una organización tiene más y mejor información (su recurso más valioso), disminuye la incertidumbre, toma mejores decisiones y actúa mejor.

En el pasado, estas decisiones estaban basadas en el análisis de un bajo volumen de datos (Small Data), normalmente generado por la propia organización. En la actualidad el alto volumen de datos generados por las redes sociales y servicios de internet, la velocidad con que se generan, la variedad de formatos, la verificabilidad que permiten, la viralidad que pueden tener y su visualización para la creación de valor, son un recurso que cualquier organización tiene la oportunidad de explotar.

Evidentemente, una estrategia de Big Data implica retos importantes que no son triviales de superar debido a la combinación de elementos que están en juego y por ello la demanda en el mercado laboral de los científicos de datos es tan alta.

Un científico de datos es un experto que combina cuatro grandes áreas del conocimiento para convertir datos en acción.

big-data-unir

  • El área de ciencias y matemáticas incluye temas como la estadística, la inferencia, modelos predictivos, metodología de la investigación e inteligencia artificial.
  • El área de programación y bases de datos incluye habilidades en lenguajes computacionales específicos como Python o R, así como el manejo de bases de datos denominados NoSQL como por ejemplo Mongo, Casandra, Neo4j o Redis, e incluso la concepción de la arquitectura e infraestructura de los sistemas de información.
  • La comunicación y visualización consiste en diseñar la mejor forma de representar información clave a través de cubos de decisiones y tableros de control interactivos con herramientas como son Power BI o Tableau entre otras.
  • El área de negocio tiene que ver con el entendimiento de las particularidades de cada industria y el ciclo de vida de datos que incluye su generación y captura, su almacenamiento, su procesamiento, análisis y su presentación conforme al sector y giro de la organización.

Las grandes consultoras y analistas de la industria concuerdan que los científicos de datos para la implementación de estrategias de Big Data son una de las profesiones que mayor demanda tienen en el mundo y con un crecimiento sostenido. Normalmente estos profesionales son egresados de escuelas de ingeniería.

Debido a la alta demanda de estos especialistas, se ha creado una oferta académica variada. Si quieres especializarte como científico de datos, considera un programa que incluya temáticas de las cuatro áreas de conocimiento explicadas y del ciclo de vida de los datos, como por ejemplo la de Análisis y Visualización de Datos Masivos.

Sin duda, encontrar tu vocación como científico de datos te dará muchas satisfacciones tanto personales como laborales. El futuro está aquí.

Dr. Ricardo Vargas de Basterra

Doctor en Ciencias de la Computación y profesor de la Maestría en Análisis y Visualización de Datos Masivos de UNIR México

Los comentarios están cerrados