Skip to main content

Por Sergio Arias

Hoy en día, el término Big Data se ha colado en nuestro vocabulario y es bastante frecuente escucharlo en nuestras empresas, bien sea desde el área técnica, ya que representa un nuevo campo de trabajo y desarrollo, como desde las diferentes áreas de dirección, puesto que un buen tratamiento de los datos puede ayudar en la estrategia de toma de decisiones.

Pero… ¿Qué es el Big Data? Desde PUE queremos aportar nuestra experiencia como líderes del sector a través de nuestra figura de Gold Partner de Cloudera, para tratar de dar respuesta a esa pregunta que muchas veces se hace la gente que no está dentro del mundillo.

Para ello, usando nuestro blog como plataforma, vamos a elaborar una serie de artículos de carácter técnico, desgranando los diferentes componentes y proponiendo situaciones reales con el fin de mostrar la potencia de un buen uso de los datos y cómo puede impulsar las nuevas áreas de negocio en el futuro.

¿Cómo surgió el Big Data?

A modo de introducción, hablaremos un poco del escenario antes de que naciera el Big Data. Casi todos los expertos sitúan la explosión del Big Data con el nacimiento de Google y la presentación del procesamiento distribuido Map-Reduce y la no menos importante contribución de los ingenieros de Apache: Doug Cutting y Mike Cafarella que, basando su trabajo en Google, crearon Hadoop, la primera plataforma Big Data Open Source que, aún hoy, es la base fundamental de prácticamente la totalidad de los sistemas de Big Data.

Hadoop-Big-Data

Hay que tener siempre en cuenta que el Big Data nace como respuesta a la necesidad de tratar grandes volúmenes de datos ya que, desde el principio de las civilizaciones, los seres humanos los han generado y estos han ido creciendo exponencialmente a medida que el mundo se ha vuelto más tecnológico y más evolucionado.

Pero… a la vez que la capacidad de generar y almacenar mayores cantidades de datos aumenta, también nace la necesidad de tratarlos ágil y velozmente ya que de poco serviría tener una gran colección de datos si cuando lográramos extraer de ella el “grano”, la información estuviera desactualizada.

Es por ello que se ideó, por un lado, el procesamiento Map-Reduce que ofrece un procesamiento de datos paralelo y distribuido, lo que nos permite tratar grandes volúmenes de datos de una manera mucho más ágil y rápida. Por otro lado, HDFS (Hadoop Distributed File System) que nos ayuda a almacenar los datos de forma distribuida en un clúster de varias máquinas.

Finalmente, en 2014, el Big Data se coló en nuestro día a día siendo ya un término habitual en todos los ámbitos de la empresa. Y no solo eso: se estableció como parte fundamental del futuro de las empresas y corporaciones que afrontan con entusiasmo la transformación digital de sus sistemas pudiendo ser mucho más eficientes en la toma de las decisiones que afectan a su negocio.

¿Qué es el Big Data?

Ahora que tenemos una breve introducción, podemos afrontar el tema que nos ocupa: ¿Qué es el Big Data?

Como definición teórica, el Big Data está considerado por la mayoría de profesionales, analistas y arquitectos de datos como el conjunto de datos, estructurados o no, a partir de los 25-30 teras. Sin embargo, es más interesante la naturaleza de los mismos que su tamaño. Hoy en día, todos los procesos generan datos que pueden ser estudiados: los logs, los sensores que traen prácticamente todos los aparatos electrónicos que usamos diariamente, nuestros teléfonos, las diferentes webs que visitamos, nuestras compras… nuestro día a día es un conjunto de datos susceptible de ser analizado y estudiado.

El crecimiento de este tipo de tecnologías se debe al abaratamiento de los dispositivos de almacenamiento, por lo que desplegar la infraestructura necesaria para almacenar todos esos datos generados, tanto en el ámbito interno de la empresa como por el propio desarrollo del negocio, se vuelve relativamente sencillo y barato. Además, la irrupción de entornos “cloud” ha puesto a disposición de empresas más modestas la infraestructura necesaria para aprovecharse de estas nuevas tecnologías y poder incorporarlas a su gestión del negocio, quedando al alcance de todos: pymes y grandes empresas.

El Big Data se apoya en lo que se conoce como la triple V: volumen, velocidad y variedad.

Volumen:

Cada día se genera un gran volumen de información. Según la revista Forbes, en todo el mundo, se generan unos 2.5 quintillones de bytes al día: desde los clicks que se hacen en una web, hasta los sensores de humedad o de temperatura, pasando por las fotos en Instagram, los minutos y horas de video en Youtube o Twitch, los mensajes en Twitter o las publicaciones en Facebook o LinkedIn. Domo desarrolló este gráfico en 2017 con los datos que se crean cada minuto en el mundo:

Volumen-Datos-Big-Data
Domo: Datos creados en el mundo cada minuto

Velocidad:

Toda esta cantidad de información se genera a una velocidad asombrosa y los sistemas están preparados para dar respuesta a esa celeridad: tratan la información en memoria e, incluso, la analizan en tiempo real agilizando la toma de decisiones y permitiendo actuar en consecuencia.

Variedad:

Puesto que las fuentes son tan variadas y diversas, los juegos de datos disponibles abarcan prácticamente cualquier cosa lo que hace que el Big Data huya de los sistemas de datos estructurados y logre un abanico inmenso de datos disponibles para su estudio y análisis.

¿Cómo ayuda el Big Data?

Ahora que hemos establecido una base y una definición de qué es el Big Data, pasemos a cómo puede ayudarnos en el día a día y en la toma de decisiones. Aunque en futuros artículos intentaremos desgranar más sus posibles usos con casos reales, vamos a dar unas pequeñas nociones generales de cómo toda esta nueva infraestructura puede ayudarnos. También os explicaremos cómo ha logrado ser parte esencial del presente y del futuro de prácticamente todas las empresas del mundo, independientemente del sector en el que se muevan.

Seamos sinceros, almacenar esta cantidad ingente de datos tiene un objetivo claro: su análisis y explotación con el fin de contestar preguntas que aún no nos hemos ni tan siquiera planteado; de poder generar nuevas áreas de negocio, nuevos productos o desarrollar los ya existentes y de proporcionar una toma de decisiones más rápida, veraz y adecuada a la realidad.

Data-analysis
Análisis y explotación de los datos para la toma de decisiones estratégicas

Pongamos por ejemplo una empresa de transporte de personal. Podría analizar en tiempo real las peticiones de los usuarios y la demanda de servicio para adaptarse rápidamente a las diferentes situaciones. Como posible medida, reforzar la presencia de sus servicios en las zonas de mayor demanda con un aumento de los vehículos y conductores disponibles. ¿Cuál sería el resultado de esa decisión? La mejora de la satisfacción de sus clientes y, probablemente, un aumento del negocio.

Pero no hay que olvidar la otra cara de la moneda: el IoT (Internet of Things) y el creciente aumento de sensores y dispositivos inteligentes también suponen un gran valor. Hablamos de mantenimiento predictivo, auto-regulación de ambientes y explotaciones de todo tipo, etc. Imaginemos por un momento un pequeño invernadero. Con un coste mínimo, un pequeño agricultor podría monitorizar la temperatura y la humedad de su explotación y activar el riego tan solo cuando fuera necesario y en la medida adecuada. Todo, de forma totalmente autónoma y automática, lo cual supondría un gran ahorro en energía y recursos naturales, optimizando su cosecha para obtener un mejor producto a un mejor precio, haciéndole mucho más competitivo.

En definitiva, múltiples aplicaciones y alcances orientados a la mejora y rendimiento del negocio. Es por ello que desde PUE tratamos de acercar el Big Data a todo el mundo, porque creemos firmemente que es más importante la calidad de los datos que la cantidad y porque ofrecemos soluciones para que cualquier empresa, no importa lo grande o pequeña que sea, pueda aprovecharse del análisis y la explotación de los datos, pudiendo generar estrategias de negocio que la conduzcan al éxito.

Sobre mí:

Sergio Arias
Big Data Specialist
Sergio Arias
Big Data Specialist

Administrador de Sistemas por descarte, vivo entre pantallas negras y letras blancas y edito con vi. Apasionado del hardware y curioso por naturaleza, acabé por casualidad en este mundillo del Big Data y, ahora, como Big Data Specialist en PUE, trabajo cada día con los mejores productos y las tecnologías más punteras para ayudar a nuestros clientes a lograr sus objetivos en la nueva era digital.

Sobre PUE

PUE es el líder de Big Data, Cloud, Microservicios, NoSQL y DevOps en España. El objetivo principal es siempre ofrecer a sus clientes las mejores soluciones con las últimas tecnologías.   Soluciones innovadoras propuestas por un equipo técnico certificado, expertos en Administración, Analista de Datos, Científico de Datos y Desarrollo.

Para más información sobre los servicios Big Data de PUE:

Servicios y soluciones en Big Data con PUE
Formación y certificación oficial en Big Data con Cloudera

Contacta para saber más en:

mail consulting@pue.es icon-formSolicitud de información para la implantación de proyectos en Big Data

mail training@pue.es icon-formSolicitud de información para formación y certifcación en Cloudera