¿Cómo aprende un estudiante de primer año Big Data desde cero?

Como Alex ha puesto claramente en qué consiste el Big Data; y cómo el término es realmente como no ir al grano.

Pero, como usted dice que es un estudiante de primer año, me gustaría sugerir un camino de aprendizaje.

1. Mejora tu experiencia en estadísticas. Puede consultar los MOOC de EdX, coursera, MIT openware y Udacity.

2. Simultáneamente, practique programación y algoritmos. Si realmente quiere convertirse en un científico de datos, le sugiero que elija Python y Java.

3. Ahora aprenda programación estadística; Le sugiero que aprenda R, sin embargo, también puede hacerlo en Python.

4. Comience a tomar la clase ML de Coursera del Prof. Andrew Ng. Ella aprendería Matlab y Octave (sin embargo, ambos son lo mismo). Intenta replicar las tareas en Python (funcionó por mi parte).

5. Comience un proyecto interesante, tal vez solo o en Kaggle. (Hay toneladas de datos disponibles).

6. Ahora, comience a aprender bases de datos y aprenda cuándo usar qué; dependiendo de la necesidad, datos y recursos disponibles.

7. Tome el curso “Minería de conjuntos de datos masivos” en coursera.

8. Ahora, comienza a aprender Pig y luego, Hadoop.

A2A -> Sangram Gaikwad.

Big Data es un término de marketing que no tiene una definición viable firme. Para mí, uso una definición similar a “aprender a usar MUCHAS máquinas para resolver problemas demasiado grandes para solteros”.

Podrías aprender a usar una de las bases de datos NoSQL comunes que funcionan en “lotes” de máquinas: cosas como Cassandra, HBase, CouchBase, MongoDB, etc., etc. Hay muchas.
O podría aprender sobre las bases de datos MPP que se parecen mucho a las bases de datos RDBMS antiguas (ya las conoce, ¿verdad?). Sin embargo, la mayoría de ellas son comerciales.
O podría aprender Hadoop, que fue creado para ser una versión de código abierto del software sobre el que escribió Google, pero que no nos dejará ver a los mortales.
(Hay una gran superposición entre estos)

Si tiene una inclinación matemática, entonces podría aprender mucho sobre el aprendizaje automático y luego aprender sobre cómo realizar esos algoritmos en sistemas de grandes datos (como Mahout, Weka o algún trabajo de Python).

Entonces, creo que un estudiante de primer año es un estudiante universitario de primer año, ¿verdad? Vaya a estudiar informática y bases de datos, y software, y matemáticas, y devops, y luego vea lo que le gusta hacer y concéntrese en eso.

Buena suerte.

Hoy es el día de los MOOC. Esa es posiblemente la mejor manera de educarse. Te recomiendo que mires:
Aprendiendo de los datos
Introducción a Big Data

No estoy seguro de cuál sería el mejor curso para ti. Debes investigar un poco para encontrar el mejor curso para comenzar. Entonces puedes sumergirte en cursos de alto nivel en este campo.

Hay muchos sitios que proporcionan MOOC, por ejemplo:
edX
Coursera

Te animo a que eches un vistazo a los cursos relacionados con tu interés en ellos.

Una cosa que me gustaría mencionar aquí es que si tienes suficiente motivación y admiración por el tema, el tiempo no será un problema para ti.

Quédense hambrientos quédense tontos.

¡Todo lo mejor!

Siga las preguntas frecuentes sobre ciencia de datos: ¿Cuál es la pregunta frecuente sobre temas de ciencia de datos?

Es una guía completa que se actualiza periódicamente y que le indica las fuentes en las que puede mejorar su comprensión conceptual y también perfeccionar sus habilidades técnicas.


Fuente: Quora
Esta imagen resume todo lo que necesita para convertirse en un buen científico de datos.

debe tener alguna experiencia previa, cualquier lenguaje de programación sería bueno. Conocimientos básicos de comandos de UNIX, sql scripting y java serán excelentes para usted, entonces puede pasar a Hadoop. Si quieres aprender hadoop te sugiero
Aprenda el curso de hadoop Big data de la capacitación en línea y el tutorial | Intellipaat.com

Aprender bigdata es fácil, pero tener éxito es muy difícil y frustrante cuando no tienes experiencia previa.

Las empresas están pidiendo experiencia previa en proyectos de big data primero y luego ofrecen trabajo, lo cual es un poco raro (si nadie da un trabajo, ¿cómo se obtiene experiencia, eh?).

Pero hay capacitación en proyectos en vivo (como esta a la que estoy asistiendo: solicite la oportunidad de trabajar en proyectos del mundo real en Big Data Analytics).

Son la mejor apuesta para obtener experiencia práctica en proyectos de big data y luego subir al vagón de la industria.

Primero veamos qué es Big Data. ¿Y qué es Business Logic detrás de eso?
Entonces, ¿cómo desenterrar Big data? ¿Cuáles son las herramientas que se deben utilizar para Big Data?
Luego aprenda algunas herramientas prácticas y prepárese para la entrevista.