Hadoop es un marco de código abierto de Apache escrito en java que permite el procesamiento distribuido de grandes conjuntos de datos en grupos de computadoras utilizando modelos de programación simples. Una aplicación de marco de trabajo de Hadoop funciona en un entorno que proporciona almacenamiento distribuido y cómputo en grupos de computadoras. Hadoop está diseñado para escalar de un solo servidor a miles de máquinas, cada una de las cuales ofrece computación y almacenamiento local.
El mejor entrenamiento en línea de Hadoop en Hyderabad
Arquitectura Hadoop
El marco de Hadoop incluye los siguientes cuatro módulos:
- ¿Puede sugerir buenos institutos de capacitación SAP en Bangalore?
- ¿Cuáles son los mejores institutos de formación de SAP HANA en Bangalore con los mejores formadores y un buen soporte de formación?
- ¿Dónde puedo obtener capacitación en línea .NET en Chennai?
- ¿Qué prefiere para la capacitación empresarial: capacitación en línea o capacitación en el aula?
- ¿Cuáles son los mejores cursos en línea certificados para estudiantes de CSE?
- Hadoop Common: Estas son bibliotecas y utilidades de Java requeridas por otros módulos de Hadoop. Estas bibliotecas proporcionan abstracciones a nivel de sistema de archivos y sistema operativo y contienen los archivos y scripts Java necesarios para iniciar Hadoop.
- Hadoop YARN: este es un marco para la programación de trabajos y la gestión de recursos de clúster.
- Sistema de archivos distribuidos de Hadoop (HDFS ™): un sistema de archivos distribuido que proporciona acceso de alto rendimiento a los datos de la aplicación.
- Hadoop MapReduce: este es un sistema basado en YARN para el procesamiento paralelo de grandes conjuntos de datos.