Carácter Urbano

Telegram : +34 639 048 422

E-Mail: info@oblivionmedia.com

Big data: qué es y para qué sirve

Una explicación sencilla de qué es el big data, cómo funciona este concepto y para qué sirve el análisis de macrodatos y su interpretación.
¿Qué significado tiene el big data? Te ofrecemos una explicación sencilla. | Imagen de: Rawpixel.

 

En la economía moderna surgen nuevos conceptos, normalmente anglicismos, cuyo significado no tenemos del todo claro. Uno de ellos es el big data, un término relacionado con el análisis de datos y que todo analista debe conocer para ser competente. Os explicamos, de forma sencilla, qué significa este término, para qué sirve y en qué casos se aplica.

¿Qué es el big data?

A continuación ofrecemos una definición genérica de big data y analizamos más extensamente su significado.

Definición de big data

El big data hace referencia a «una cantidad de datos tal que supera la capacidad del software convencional para ser capturados, administrados y procesados en un tiempo razonable».

Significado de big data

Por lo tanto, también podemos utilizar “macrodatos”, “datos masivos” o “datos a gran escala” como sinónimos del inglés big data. En este sentido, los analistas que tratan con macrodatos tienden a almacenar una cantidad enorme de información, buscar patrones concretos y hacer predicciones, normalmente económicas, para garantizar beneficios.

Aunque el big data ha sido catalogado dentro de las tecnologías de la información y la comunicación por los software especializados que procesan esos datos, el concepto se puede aplicar a cualquier ámbito. Solo se requiere una estructura informática lo suficientemente avanzada como para almacenar y procesar miles de millones de bytes.

Origen del big data

El origen del big data se remonta a 1993, cuando dos investigadores de la NASA como Michael Cox y David Ellsworth plantearon el problema del big data. Dichos científicos llegaron a la conclusión de que en unos años se podría guardar “toda la información del mundo”, aunque la mayoría de estos datos jamás serían consultados por un ser humano.

Más tarde, surgió la necesidad de analizar un mayor número de datos para extraer conclusiones, aunque los departamentos informáticos de las empresas no eran suficientes. Entonces se crearon las sociedades encargadas de almacenar y procesar macrodatos, con la tecnología suficiente para llevar todo el proceso a una velocidad razonable.

Las 5 características del big data

Antes de analizar el funcionamiento y las diversas utilidades, repasamos las cinco características que pueden presentar los datos masivos, fundamentales para entender qué es el big data.

1. Volumen

La cantidad de datos almacenados en un sistema informático puede variar.

2. Variedad

Los datos en un mismo análisis pueden ser de diferentes tipos.

3. Velocidad

Dependiendo de otros factores, la velocidad con la que se procesan los datos puede cambiar.

4. Veracidad

Referente a la calidad de los datos y su influencia en el análisis.

5. Valor

La utilidad de los datos recogidos.

¿Cómo funciona el big data?

Repasamos ahora el proceso para recoger grandes cantidades de datos y analizarlos para así llegar a conclusiones.

El big data nos permite conocer algunos hábitos de consumo. | Imagen de: Rawpixel.

 

1. Captura

Todos los datos que recogemos se generan continuamente mediante el uso de las tecnologías. Puede ser un estado de Whatsapp, un correo electrónico, las cookies que se almacenan en el navegador, la posición GPS de un individuo, los datos que introduce en un formulario (dirección, correo electrónico o código postal) y un largo etcétera.

En los nuevos modelos online, los webmasters recogen datos sobre los usuarios de una web mediante herramientas como Google Analytics y otras utilidades de comercio electrónico. De igual manera, las interacciones máquina a máquina recogen datos que pueden ser valiosos, expresados en magnitudes físicas o químicas. Algunos ejemplos son la temperatura que recoge un termómetro o el número de redes WiFi que capta un dispositivo.

Las posibilidades del big data son infinitas, y recogeremos unos datos u otros dependiendo nuestras necesidades. La cuestión es recoger una cantidad tal que sean necesarios varios servidores para almacenarlos y un software específico para procesarlos. La tecnología actual lo permite.

2. Transformación

Una vez recogidos los macrodatos tenemos una tablas de origen bastante inconexas. Es necesario extraer únicamente los datos que necesitamos, hacer limpieza de datos sucios y dar formato a las tablas y bases de datos para poder analizarlos correctamente. Aplicaciones como Spoon, de Pentaho Data Integration, son capaces de realizar esta transformación.

3. Almacenamiento

Como hemos señalado, para almacenar grandes estructuras de datos es necesario un sistema flexible. En cuanto al big data, frecuentemente surge el término NoSWL (Not Only SQL), que distingue cuatro grupos de base de datos. Para entender todo esto de forma sencilla: hay diferentes maneras de estructurar una base de datos en función de cómo se conecta toda esa información y cómo se accede a cada dato. Algunas se basan en tablas y otras mantienen una estructura de nodos.

4. Análisis

Ahora pasamos al quid de la cuestión, el análisis de datos. Este punto nos servirá para analizar, con toda la información que hemos recogido, qué está sucediendo y cómo podemos adaptarlo a nuestras necesidades. Distinguimos cuatro técnicas de análisis de datos y aplicaremos una y otra dependiendo de los datos que tenemos y de cuáles son nuestros objetivos.

4.1 Asociación

Esta técnica tiene por objetivo encontrar puntos en común de diferentes variables, mediante la relación de causa y efecto.

4.2 Minería de datos

En esta ocasión, el objetivo es hallar comportamientos predictivos en clientes o consumidores. La técnica utiliza las bondades de la estadística y el aprendizaje automático de algunas tecnologías.

4.3 Clustering

Divide grupos de individuos en grupos más pequeños para encontrar similitudes entre ellos. Existen varias técnicas y algoritmos para formar estos grupos.

4.4 Análisis de texto

Para datos datos textuales como corres, búsquedas o páginas web. Esta metodología permite extraer esos datos para predecir palabras y mejorar contenidos.

5 Visualización

Todo lo anterior no ha servido de nada si la persona que ha de extraer las conclusiones no entiende el resultado. Una presentación bien estructurada de resultados, con un formato agradable y legible, permite que el usuario entienda mucho mejor para qué sirven los datos y qué puede hacer con ellos. Existen multitud de plataformas que permiten visualizar ordenadamente los análisis. Algunos ejemplos son Mondrian o Tableau.

¿Para qué sirve el big data?

Ahora que hemos visto el proceso que recorren los macrodatos y de qué manera podemos analizarlos, recogemos las distintas utilidades del big data en la actualidad.

4 usos y aplicaciones del big data

Como podemos comprobar, muchas empresas manejan grandes cantidades de datos para mejorar en distintos ámbitos. Estos son algunos ejemplos

1. Experiencia de usuario (UX)

Cada vez que un usuario navega en un sitio web deja un rastro de actividad que puede ser medido y cuantificado. Quizás el comportamiento de un único usuario no resulte significativo, pero el estudio de miles de usuarios nos permita llegar a conclusiones importantes. Una de las grandes utilidades del big data en el entorno online es mejorar la experiencia del usuario para que tenga una navegación más cómoda.

2. Automatización del marketing

Otra aplicación útil del análisis masivo de datos en Internet es comprender cómo se comporta el usuario en un proceso de compra. De esta manera podemos mejorar la pasarela de pago, automatizar procesos y ofrecer una experiencia de usuario mucho más personalizada.

3. Conocer a tu público

A través del análisis de macrodatos podemos conocer mejor a nuestro público (una de las grandes respuesta a la pregunta de 'para qué sirve el big data'), adaptar la oferta a sus gustos y, por último, fidelizarlo con el servicio o marca. Conocer al público implica también conocer cuál va a ser su tendencia de consumo. Bien aplicado, el análisis de datos masivos nos permite adelantarnos a la competencia y, por ejemplo, lanzar un nuevo producto que cubra un nicho de mercado.

4. Conocer nuestro estilo de vida

Aunque no todo el mundo está dispuesto a hacer el esfuerzo, podemos aplicar el big data en nuestro día a día. Se trata de conocernos a nosotros mismos mediante el análisis de datos cotidianos, entender nuestros hábitos y mejorarlos. El proceso puede ser mucho más fácil gracias a los dispositivos electrónicos de los que disponemos.

Comentarios