Aunque muy posiblemente hoy es más lo que se escucha hablar del tema que lo que se alcanza a entender, el Big Data, de la mano con el internet de las cosas, son dos conceptos que no sólo se han logrado poner de moda recientemente, también, ambos términos hablan de realidades que estamos empezando a vivir y que muy seguramente en adelante los empezaremos a escuchar quizás con mayor frecuencia de lo que los alcanzamos a oír nombrar en la actualidad.
¿Pero cuál es la importancia del Big Data y por qué habría de importarnos este tema cuando en teoría el mismo nombre y su traducción (datos masivos) no son algo raro para una época como la que vivimos, misma que ha sido bautizada como la era de la información?
Big Data, mucho más que grandes datos
Si bien puede que el concepto por sí mismo no diga mucho o al menos no dé indicios de ser algo revelador en la medida que desde el punto de vista de las organizaciones el manejo de grandes cantidades de información no es algo que resulte extraño, cuando hablamos de Big Data nos referimos a una cantidad de datos tan grande, que de ninguna manera es posible analizar bajo los sistemas de software tradicionales. Por tal razón, estos requieren el uso de tecnologías de bases de datos grandes entre las cuales se encuentran NoSQL, Hadoop y MapReduce.
Esta ingente cantidad de datos que comienza a crearse a partir de la gran cantidad de información que se empieza a generar a través de internet y del cada vez mayor número de dispositivos que se han ido conectando a la red en los últimos años (internet de las cosas), es en parte lo que ha dado paso a este big data y a la subsecuente necesidad de sacar provecho de esa enorme cantidad de información en beneficio de todo tipo de organizaciones bien sean públicas o privadas.
Gracias en parte a la disminución en los costos de almacenamiento y procesamiento de datos, asimismo se ha facilitado el desarrollo de software y hardware capaz de suplir las complejas demandas que supone almacenar y procesar una ingente cantidad de información, algo que ha ido permitiendo que cada vez más empresas e instituciones de todo tipo incursionen en este campo y empiecen a explorar el enorme potencial y la gran ventaja que trae explotar la inmensa cantidad de información que generan en su día a día.
De esta forma, a diferencia de los sistemas convencionales, las tecnologías Big Data permiten una gestión y manejo de datos avanzado que se distingue por cumplir con 5 aspectos.
Características del Big Data (las 5 V’s)
En relación al Big Data existen 5 aspectos que se deben tener en cuenta toda vez que forman parte de las características que distinguen las tecnologías que permiten su tratamiento. Tradicionalmente se conocen como las 5 V’s (volumen, variedad, velocidad, veracidad y valor).
- Volumen: Es el primer aspecto y quizás el más obvio en relación al Big Data. Según Eric Schmidt, ex CEO de Google, “entre el nacimiento del mundo y el año 2003, hubo 5 exabytes de información creada mientras que actualmente estamos creando cinco exabytes cada dos días”. Teniendo en cuenta que hoy por hoy apenas el 1% de las cosas se encuentran conectadas a internet y que según lo que plantea el internet de las cosas esta cifra será cada vez mayor, asimismo las tecnologías Big Data gracias a la disminución en los costes de almacenamiento y procesamiento de información, están posibilitando el manejo de un volumen de datos como nunca se había visto antes.
- Variedad: Por su naturaleza, el Big Data debe lidiar con una variedad de datos que pueden ser estructurados, semiestructurados o que no cuentan con ninguna estructura. Cuando hablamos de datos estructurados nos referimos a unos tipos de datos que pueden ser almacenados en tablas y que pueden originarse a partir de encuestas, las transacciones que realizan los usuarios en una tienda online o los movimientos que se producen a diario entre los cuentahabientes de una entidad financiera. Mientras tanto, los datos semiestructurados son aquellos que tienen algún grado de organización aunque no por campos (como es el caso de los archivos XML o HTML) y los no estructurados, aquellos que carecen de formato y no pueden se almacenados en tablas como es el caso de los que se generan a partir de video, audio, imagen, o a través de la web de tipo texto en redes sociales, foros, comentarios en blogs y páginas web, etc. De esta manera independientemente del tipo de datos que estemos hablando, el Big Data logra dar uniformidad a los mismos para facilitar su análisis.
- Velocidad: Además de permitir almacenar y procesar una gran cantidad de información para tomar decisiones en el corto y largo plazo, una de las cosas que caracteriza el Big Data es permitir tomar decisiones en tiempo real. Y es que así como los costos de almacenamiento de información han ido disminuyendo en los últimos años, así también lo han hecho los procesadores, cosa que permite obtener información oportuna en el tiempo preciso para tomar la mejor decisión en el momento justo.
- Veracidad: La fiabilidad y la calidad de la información es otra de las cosas con que debe lidiar el Big Data, de allí que sea necesario que las mismas tecnologías que permiten hacer el tratamiento de estos datos masivos deban incorporar funcionalidades que permitan determinar la veracidad e importancia de la información en medio de un universo que puede presentar todo tipo de datos, muchos de los cuales pueden resultar engañosos o incluso superfluos.
- Valor: Finalmente la quinta consigna del Big Data se refiere al valor que debe aportar todo este manejo de grandes cantidades de información no sólo a las empresas sino en general a la sociedad y a cada persona.
Cómo entender el Big Data en la práctica
Para entender el concepto de Big Data sólo debemos ser conscientes que hoy podemos obtener información de prácticamente todo aquello que nos interese medir. Bien sea que queramos conocer información en profundidad sobre por ejemplo las personas que visitan nuestra página web, las páginas que éstas ven o las acciones que realizan, o bien que queramos obtener información de cosas y personas a través de las conexiones que hoy permiten los sensores, dispositivos wearables o GPS’s, hoy en día gracias a la accesibilidad que brindan los costos de almacenamiento y procesamiento de datos, además del software que se ha ido desarrollando por cuenta de este fenómeno, es posible recopilar datos en una cantidad y nivel de detalle tal que hasta hace poco era difícil de imaginar para cualquier empresa.
Así, toda esta cantidad de información que anteriormente simplemente no se podía medir por simples limitaciones de espacio y almacenamiento (además del costo que ello podía implicar), en la actualidad muchas empresas ya la están pudiendo utilizar para encontrar información oculta, patrones y correlaciones entre variables que finalmente les ayudan a entender mejor a sus clientes, sus hábitos e incluso anticiparse a sus necesidades.
Ejemplos de cómo lo usan algunas empresas
Las siguientes son algunas formas en que las empresas están empezando a usar y sacar provecho del Big Data.
- Walmart: Cruzando información sobre sus datos de ventas y datos meteorológicos (los cuales pueden obtenerse por ejemplo a través de sensores), la compañía encontró cosas tan llamativas como que además de linternas, una marca de galletas llamada Pop-Tarts se vendía muchísimo tras la alerta de un huracán.
- Amazon: Gracias al registro de la información de compra de sus usuarios, las categorías que más les interesan y la detección de patrones que permiten identificar qué otras cosas compran las personas que ya han adquirido un determinado producto, la compañía ha logrado convertirse en la líder indiscutida en venta cruzada mostrando recomendaciones dentro y fuera del sitio que han resultado ser hoy una parte fundamental dentro de su modelo de negocio.
- Macy’s: Han logrado conocer a la perfección el impacto de sus boletines electrónicos y la forma como la gente interactúa con ellos lo cual les ha permitido segmentar mejor su público. De esta manera si bien la compañía ha reducido sus envíos, ha logrado que estos tengan un mayor impacto y al tiempo ha logrado disminuir considerablemente el número de personas que se dan de baja de esta herramienta. También mediante el uso de un algoritmo y un seguimiento constante de los datos de compra, la empresa ajusta precios de forma dinámica (dependiendo por ejemplo el nivel de demanda) y presenta ofertas personalizadas.
El Big Data ya es parte de nuestra realidad
De la mano con el internet de las cosas, que cada vez hará que el conjunto de elementos conectados a la red tienda a ser más amplio, asimismo las tecnologías Big Data se irán haciendo cada vez más necesarias en la medida que se necesite una infraestructura más robusta para brindar soporte a las enormes cantidades de datos que dejarán obsoletas las formas tradicionales de almacenamiento y procesamiento de datos para abrir campo a la era de los datos masivos. Sin embargo, lejos de esperar a dar el paso por la inercia misma que el movimiento Big Data empezará a tomar en los próximos años, es precisamente en estos momentos cuando invertir en este tipo de soluciones puede dar un giro dramático a cualquier negocio y ponerlo fácilmente por encima de sus competidores.
Si bien desde el punto de vista tecnológico implementar tecnologías Big Data podría suponer hacer una inversión importante que a su vez requiera contratar personal capacitado para su manejo y administración, los beneficios que ello puede aportar a una empresa muy seguramente pueden superar con creces cualquier expectativa en un panorama como el actual en donde muchas compañías, a menos que se vean en la obligación, incursionarán en algo semejante.