BigData

Las empresas hoy manejan datos enormes: redes sociales, transacciones, sensores IoT, vídeos, logs de servidores… Estamos hablando de terabytes (TB), petabytes (PB) o incluso exabytes (EB) de información.

Un disco duro normal no sirve: se necesitarían millones y sería muy difícil gestionarlos, además de ser caro y propenso a fallos.

La nube como solución: Cuando hablamos de “guardar en la nube”, realmente hablamos de almacenar los datos en servidores de centros de datos gigantes, que pueden estar distribuidos por todo el mundo. Empresas como Amazon Web Services (AWS), Google Cloud o Microsoft Azure ofrecen esto.

Escalabilidad: puedes aumentar el espacio sin límite práctico.
Fiabilidad: los datos se replican en varios servidores para que no se pierdan.
Acceso global: puedes leer/escribir datos desde cualquier lugar.

a) Sistemas de almacenamiento distribuido

HDFS (Hadoop Distributed File System): divide los archivos en bloques y los guarda en muchos servidores. Cada bloque se replica varias veces para que no se pierda. Esto permite leer/escribir paralelamente grandes volúmenes de datos.

b) Bases de datos NoSQL

Ejemplos: Cassandra, MongoDB, DynamoDB. Manejar datos semi-estructurados o no estructurados (JSON, logs, imágenes…).

c) Procesamiento distribuido

No sirve solo almacenar, también hay que procesar los datos.

Estrategia de almacenamiento:

Datos calientes: los más recientes y usados con frecuencia → almacenados en discos rápidos.
Datos tibios: usados ocasionalmente → discos más lentos y baratos.
Datos fríos: históricos, casi nunca consultados → almacenamiento muy barato (tipo Amazon Glacier).

Seguridad y redundancia:

Cifrado: los datos se guardan cifrados para que no puedan ser robados.
Replicación geográfica: si un centro de datos se cae, otro lo puede sustituir.
Backups automáticos: varias copias para asegurar que nunca se pierda información crítica.

a) Servidores virtuales (IaaS)

Se crea un servidor virtual donde subes tu aplicación igual que si fuera un ordenador normal. Puedes instalar tu sistema operativo, bases de datos, librerías… La aplicación queda en el disco del servidor virtual, y se ejecuta allí.

b) Contenedores

Ejemplo: Docker. La aplicación se empaqueta con todo lo que necesita: librerías, dependencias, sistema de archivos mínimo. Se ejecuta en contenedores, que son ligeros y replicables. Permite que la misma aplicación corra en cualquier servidor sin problemas.

Escalabilidad y redundancia: Igual que con los datos, la aplicación puede replicarse en varios servidores. Si un servidor falla, otro toma su lugar automáticamente.

El Futuro es
DATOS

La Base del Conocimiento

DATOS

Materia Prima

INFORMACIÓN

Conocimiento

CÓMO ALMACENAR LOS DATOS

Profundización Teórica

Ecosistema Tecnológico

Big Data

Cloud Computing

Ingeniería de Datos

ESTRATEGIAS MAESTRAS DE DATOS

NETFLIX: El Motor del Streaming

COMPARATIVA: NETFLIX VS ZARA

ZONA GAMER