Archivo de la etiqueta: Hadoop

Desarrollo de Hadoop y Spark

CHULETA DE DESARROLLO DE HADOOP Y SPARK

Introducción A HADOOP

HDFS:


Es el sistema de archivos distribuido que almacena toda la información del cluster

YARN + MapReduce2:


 Asigna los recursos en los nodos, y buscar ordenar, agrupar la Información.

Tez:


Es Tecnología nueva para hacer lo del mapreduce.

Hive:


Interactual a través de sentencias HSQL

HBase:


Base de Datos Columnar incluida en el Ecología del Ecosistema Hadoop

Pig:


Lenguaje scripting para manipular la información

Sqoop:


Me permite Seguir leyendo “Desarrollo de Hadoop y Spark” »