CHULETA DE DESARROLLO DE HADOOP Y SPARK
Introducción A HADOOP
HDFS:
Es el sistema de archivos distribuido que almacena toda la información del cluster
YARN + MapReduce2:
Asigna los recursos en los nodos, y buscar ordenar, agrupar la Información.
Tez:
Es Tecnología nueva para hacer lo del mapreduce.
Hive:
Interactual a través de sentencias HSQL
HBase:
Base de Datos Columnar incluida en el Ecología del Ecosistema Hadoop
Pig:
Lenguaje scripting para manipular la información