¿Cómo me preparé para CCA175 y obtuve un puntaje de 10/10?

1. Preparación : He revisado todas las preguntas de CCA175 y practico el código proporcionado por http://www.HadoopExam.com Gracias por sus preguntas y el contenido del código. El contenido fue excelente y me ayudó mucho. (Especialmente, también he revisado todo el módulo de capacitación de Spark Professional )

2. No. de preguntas : generalmente obtendrá 10 preguntas en un examen real: el tema será: Sqoop, Hive, Pyspark y Scala y avro-tools para extraer el esquema (todas las preguntas están cubiertas en el Simulador de certificación CCA175 ).

3. Fragmentos de código : se proporcionarán para Pyspark y Scala. Debe editar los fragmentos de acuerdo con la declaración del problema.

4. Entorno de examen real : se podrá acceder al nodo Gateway para la ejecución de los problemas durante el examen. Tenga en cuenta que no habrá ningún temporizador en pantalla disponible durante el examen. Tienes que seguir preguntando por el tiempo restante. Hay tres secciones para cada problema, es decir

  • Instrucciones
  • Conjunto de datos
  • Requisitos de salida.
  • Lea detenidamente las tres secciones antes de comenzar a desarrollar el código.
  • Nota : Si comenzó a desarrollar código justo después de ver la parte de la instrucción de la pregunta, luego se dará cuenta de que también se mencionan los detalles exactos de la tabla, como el nombre de la tabla y el directorio HDFS. Esto puede desperdiciar su tiempo si tiene que rehacer el código o bien podría costarle una pregunta.

5. Editor : nano, gedit no están disponibles. Entonces, si tiene que editar cualquier fragmento de código, debe usar vi solo. Familiarícese con el editor vi si no lo está.

6. Complete los espacios en blanco : no tiene que escribir el código completo para Python y Scala para Apache Spark, generalmente le pedirán que complete los espacios en blanco.

7. Canal : Muy pocas preguntas sobre canal.

8. Nivel de dificultad : si tienes suficiente conocimiento, sentirás que el examen es bastante fácil. Las preguntas fueron lógicamente fáciles y pueden ser respondidas en el primer intento si lees la pregunta cuidadosamente (las tres secciones).

9. Error común en Sqoop : la gente usa el conector como localhost, lo cual es incorrecto, debe usar el nombre completo en lugar de localhost (evite perder el tiempo). Usar el nombre de host dado

10. Colmena : Tener conocimiento inicial de la colmena también.

11. Spark : uso de funciones básicas de transformación para obtener la salida deseada. Por ejemplo, filtrar según un escenario particular, clasificación y clasificación, etc.

12. Avro-tool : avro-tool para obtener el esquema del archivo avro. ( Muy bien cubierto en CCA175 HadoopExam.com Simulator )

13. Gran error : evite eliminar accidentalmente sus datos: se necesitan buenas prácticas para evitar tales errores. (Una vez que elimine o suelte la tabla de la colmena, debe crearla completamente una vez más). Lo mismo es instruido por www.HadoopExam.com durante su sesión de videos proporcionada en http: //cca175cloudera.training4e… (Por favor revise las sesiones de muestra)

14. Spark-sql : No harán preguntas basadas en Spark Sql. Aprender, agregar, reducir y ordenar es importante.

15. Gestión del tiempo : es muy importante (esa es la razón por la que necesita demasiada práctica, use el simulador CCA175 para practicar todas las preguntas al menos una o dos semanas antes de su examen real).

16. Los conjuntos de datos en el examen real son bastante más grandes, por lo que la ejecución tardará entre 2 y 5 minutos.

17. Intentos : intente intentar todas las preguntas al menos 9/10, por lo tanto, debe ser capaz de obtener un puntaje del 70%.

18. Formato de archivo : en la mayoría de las preguntas había un archivo delimitado por tabuladores para procesar.

19. Python o Scala : Obtendrá un archivo precargado de python o scala para trabajar, por lo que no tiene la opción de intentar una pregunta a través de scala o pyspark. (He revisado todas las sesiones de video proporcionadas por www.HadoopExam.com aquí

20. Problema de conexión : si se desconectó durante el examen, es posible que deba comunicarse con el supervisor de inmediato. Si él / ella no está disponible, vuelva a iniciar sesión en Programar un examen y use su ayuda en línea.

21. Guiones de shell : tenga buena experiencia para usar guiones de shell.

22. Tipos de preguntas como se menciona en el plan de estudios : las preguntas fueron de Sqoop (importación y exportación), Hive (creación de tablas y partición dinámica), Pyspark y Scala (unión, clasificación y filtrado de datos), avro-tools. Se proporcionarán fragmentos de código para Pyspark y Scala. Debe editar los fragmentos en consecuencia según la declaración del problema y puede obtener el archivo de secuencia de comandos (que es otro archivo aparte del fragmento) para obtener los resultados.

23. El examen general es fácil, pero requiere mucha práctica para completar a tiempo y para obtener soluciones precisas del problema. Por lo tanto, revise todo el material a continuación para CCA175 (no tomará más de un mes, si es nuevo y ya conoce Spark y Hadoop, entonces 2-3 semanas son lo suficientemente buenas.

  • · CCA175: preguntas de práctica de certificación de desarrollador de Hadoop y Spark
  • · Formación profesional de Hadoop
  • · Formación profesional de Spark.