Skip to main content

El primer paso para abordar un proyecto Big Data es elegir y definir muy bien cómo lo vamos a hacer. A través de qué método y qué tipo de plataforma. ¿Montar la infraestructura en On-Premise o hacerlo en el Cloud? Es entonces cuando nos surgen cuestiones clave como qué opción es más eficiente a nivel económico, cuál es la opción más estable y segura o cuál la más escalable. 

En este post vamos a hablar sobre ello. De los pros y contras de cada alternativa. 

Big data en On-Premise

Si hablamos de On-Premise nos estamos refiriendo a tener Big Data en nuestras instalaciones, es decir, en el hardware propio de la compañía. Esto significa que vamos a tener un hardware dedicado al procesamiento de información de Big Data y, por tanto, preparado para dar respuesta a multitud de procesos al mismo tiempo. Este escenario conlleva riesgos. La dificultad de medir bien el alcance del proyecto y sus necesidades, por exceso o por defecto, en una fase inicial es uno de ellos. También la posibilidad de que en 2 años la infraestructura montada ya no nos sirva, por cambio de tecnología o por cambio de requisitos del proyecto. Veamos, no obstante, las ventajas y desventajas de montar un clúster en On-premise:

Ventajas

  • Se puede mantener todo en local sin que terceros tengan acceso a datos.
  • Con buenos conocimientos, se puede desarrollar de forma exitosa.
  • Es posible la integración con otras plataformas en la Nube, lo que se conoce como cloud híbrida.

Desventajas

  • El coste de hardware puede ser extremadamente alto.
  • Se necesita un amplio conocimiento de los procesos, entornos y ecosistema Big Data.
  • Caída del sistema y/o incidencias causadas por problemas externos que no están bajo nuestro control (fallo de electricidad, por ejemplo).
  • Riesgo de infrautilización del hardware una vez ya hemos realizado la inversión.
  • La escalabilidad, en caso de ser necesaria, implica inversión adicional en hardware.
  • Si el proyecto no rinde lo suficiente o finalmente se abandona, se pierde casi toda la inversión.

En definitiva, montar y gestionar Big Data en On-Premise requiere de mucha experiencia y el riesgo de fracaso en términos de eficiencia y optimización es significativo. 

 

Big Data en la Nube

Si nos subimos a la Nube, parcial o totalmente, empezamos a disfrutar de infinitas funcionalidades, extensiones e, importante, hacemos más fácil el manejo de los datos. 

Destacamos algunas de las ventajas de mantener Big Data alojado en el Cloud: 

Ventajas

  • Es muy fácil iniciar, incluso con poco presupuesto.
  • La inversión de hardware es casi nula.
  • Aumenta la velocidad del procesamiento de datos.
  • Está perfectamente automatizado y puede ser personalizado.
  • Podemos añadir y quitar nodos de forma fácil.
  • Es 100% segura y tiene múltiples formas de accesos.
  • Puede migrar a otra instancia sin necesidad de perder datos.
  • Si las extensiones son correctas, nunca fallan.

Desventajas

  • Posible control de datos a terceros.
  • La salida de un entorno de cloud pública conlleva importantes costes.
  • Dependencia del proveedor de la plataforma.

 

¿Con qué nos quedamos? ¿Big Data en On-Premise o Big Data en el Cloud?

Lo hemos visto. Cada opción tiene sus ventajas pero, si contamos con un buen proveedor de servicios y el expertise necesario, nuestra recomendación es apostar por una solución Cloud o Híbrida. 

Seleccionar bien el proveedor de tu plataforma en la nube es la clave para minimizar o, incluso, anular estas desventajas. Desde nuestra experiencia en muchos proyectos y casos de uso, recomendamos al 100% el binomio: Big Data Cloudera Platform (CDP) integrándose en Google Cloud Platform (GCP). 

La elección final, en cualquier caso, no depende de una única variable. Los objetivos de negocio que tengas, los requisitos y alcance del proyecto, la proyección a futuro y cómo sea tu infraestructura IT, son algunos de los factores que determinarán la forma más adecuada de montar tu clúster Big Data. 

En cuanto a la parte económica, podemos decir que la plataforma en la nube es mucho más eficiente. En On-Premise la inversión inicial es mucho mayor con el inconveniente de que solo puedes proyectar un máximo de dos años. Transcurrido ese tiempo es posible que la infraestructura montada ya no sirva y/o no soporte el proyecto. Por el contrario, si instalas en la Nube, el coste inicial es muy inferior y el rendimiento que obtienes a cambio mucho más alto. 

Con respecto al uso, tratamiento y explotación de los datos, ambos caminos sirven. Ahora bien, el On-Premise no nos da escalabilidad lo que merma, desde el minuto cero, las posibilidades de nuestro proyecto. 

Si hablamos del conocimiento requerido para el éxito de un proyecto Big Data, ya lo hemos comentado anteriormente. El expertise que se necesita en el caso de On-Premise es mayor. La modificación de nodos, por ejemplo, es significativamente más fácil en una plataforma Cloud.

La solución On-Premise tiene su punto de ventaja en lo relativo al control, localidad y almacenamiento de los datos, aspectos, todos, críticos en un proyecto Big Data. Pero como ya hemos comentado en este post, tener esto cubierto con garantía en una plataforma Cloud pasa únicamente por seleccionar bien a nuestro proveedor de servicios. 

 

¿Cómo podemos ayudarte desde PUE? 

Acompañamos a las empresas que quieran emprender una transformación digital orientándose a Big Data y Cloud a través de tecnologías y soluciones innovadoras que buscan incrementar rendimiento, eficiencia, agilidad y resultados.

PUE es Partner oficial de Google Cloud en formación autorizado por dicha multinacional para impartir formación oficial en tecnologías Google Cloud, y ha obtenido la especialización en Infrastructure y Data Analytics. A su vez, está acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Google Cloud en el ámbito empresarial, con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.

Además, como primer Gold Partner Integrator de Cloudera en EMEA y Authorized Training Partner, nuestros servicios y expertise incluyen tanto la consultoría como la formación oficial en tecnologías Cloudera.

 

Enlaces de Interés

Big Data y Cloud frente a los nuevos paradigmas provocados por el COVID-19

Nuestros servicios

Formación y certificación oficial Google Cloud

Formación y certificación oficial Cloudera

 

Datos de contacto

training@pue.es para formación oficial en tecnologías referentes.

exams@pue.es para certificación oficial en tecnologías referentes.

sales@pue.es para servicios profesionales en Big Data y Cloud.