Al tratar de dominar cualquier disciplina, no hay un mejor curso, pero con un marco rígido para su enfoque y mucho trabajo duro, ¡llegará allí! Dicho esto, comenzaré por detallar (resúmenes cortos pero completos) cuáles son las habilidades y hábitos que debe desarrollar:
La “ciencia de datos” es una mezcla de varias cosas. En esencia, uno necesita poseer habilidades avanzadas de programación y matemática e incluso yo también agregaría fuertes habilidades de comunicación. Muchos profesionales y profesionales incluso argumentan varias otras habilidades a las que he enfatizado, pero creo que eso está más allá del alcance de esta respuesta y discusión.
Comencemos con la programación:
Para que pueda establecer una estructura para usted y para un alumno, ¡este es realmente el mejor momento para comenzar! Varias comunidades y sitios web en línea tienen una estructura para comenzar y familiarizarse un poco con las habilidades de programación que poseen los científicos de datos en la actualidad. Aquí hay algunas habilidades introductorias e intermedias que uno necesita desarrollar:
- ¿Cuáles son los cursos después de Pharm.D.?
- ¿Cuál es el mejor curso que se debe tomar después de completar la ingeniería mecánica?
- ¿Los cursos de Udemy ayudan a conseguir trabajo?
- Ahora tengo mucho tiempo libre mientras estoy en mi tercer año de ingeniería. Quiero tomar algunos cursos adicionales que pueden ayudarme a sacar mi currículum. ¿Qué otros cursos puedo tomar?
- ¿Puedo convertirme en corredor de bolsa después de 12th science? ¿Qué cursos y exámenes debo tomar?
- Introducción a la programación: estructura de código básica, tipos de datos, sintaxis, bucles, funciones, etc. Lo mejor es hacer esto divertido y probablemente crear un juego o resolver algunas preguntas interesantes. Hay varios cursos en Coursera, DataCamp, Udemy, para ayudarte con esto.
- SQL: no exactamente en programación, pero lo pondré aquí, ya que es muy importante almacenar los datos en bases de datos. Sin los datos, no hay avance. PostgreSQL, MySQL son algunos de los más populares. Incluso puede usar Python para escribir consultas SQL a través de paquetes.
- Manipulación de datos: la mayoría de las veces, los datos con los que va a trabajar serán confusos, por lo que debe manipularlos y manipularlos para que sean aptos para el análisis y el aprendizaje automático. Por ejemplo: una columna llamada “Ubicación: puede tener entradas como” Los Ángeles “y” LA “, ¡pero son lo mismo! Por lo tanto, debe cambiar uno a otro para exigir coherencia. Por supuesto, este es solo un tipo de problema específico / limitado que tendrá. Confía en mí, hay varias cosas que podrían funcionar en tu contra en este paso. Por lo tanto, es fundamental poseer habilidades avanzadas de manipulación de datos.
- Visualización de datos: Esto es muy importante para tomar decisiones basadas en datos en varias etapas de un proyecto. Existen varios recursos para ayudarlo con lo mismo. Los gráficos interactivos y la visualización se están imponiendo y también es importante aprender sobre los conceptos básicos.
- Avanzado: una vez que aprende los algoritmos de ML, implementarlos es otra cosa. Debe aprender el código y cómo ajustar exactamente un algoritmo a sus datos. Este es un tema extenso, pero para que sea más fácil para usted, tenga en cuenta que cada curso le enseñará qué hacer para implementar con éxito un algoritmo y también será autosuficiente al mirar la documentación del algoritmo, ya sea en R o Python.
Llegando a las Matemáticas :
- Álgebra Lineal: Muy importante. Si sientes que realmente no tienes una buena comprensión, y hay muchos que no la tienen, mira esta serie de “Esencia de álgebra lineal” en YouTube
- Cálculo: muchos algoritmos usan álgebra y cálculo, y eso es prácticamente todo lo que uno necesita saber. Se utiliza, por lo tanto, aprender es imprescindible.
- Estadísticas: debe tener una buena idea de estadísticas básicas y temas como interacciones, ANOVA, bloqueo, submuestreo, etc.
- Deseo de aprender más: su conocimiento en los 3 subdominios será desafiado y necesitará aprender más a medida que aprende cosas nuevas, especialmente en Deep Learning, ¡así que por favor, anímese a aprender más! Es más fácil decirlo que hacerlo, obviamente.
- Aprendizaje automático: el curso de Andrew Ng sobre aprendizaje automático es una excelente manera de iniciarse en el aprendizaje automático. ¡Ha hecho un trabajo fantástico al explicar cada algoritmo que enseña en detalle! Siento que esto es imprescindible para cualquiera que intente convertirse en Data Scientist y es literalmente uno de los cursos en línea mejor calificados. Udacity también ha hecho un gran trabajo en su clase de Introducción al aprendizaje automático, ¡que también es gratis!
Comunicación :
Ahora, aquí es donde siento que es la cualidad verdaderamente artística que uno debe poseer. La alta inteligencia emocional es clave para saber cuál es el objetivo final de los proyectos que está manejando. ¿Qué vas a lograr o los objetivos de tu organización / cliente / proyecto? ¿Estás tratando de aumentar la tasa de alfabetización de una ciudad a través de los datos? ¿Estás tratando de ganar más clientes? Esto debe entenderse muy bien porque esto gobernará cada paso en su análisis. ¡Necesitas ser técnico, pero desarrollar fuertes habilidades de comunicación no es más que un trabajo duro!
Una vez que te sientas seguro, te recomiendo hacer algunos proyectos y mostrar tu trabajo con datos en plataformas como GitHub, Kaggle, etc.
Puede usar conjuntos de datos de Kaggle, o cualquier otro recurso (¡hay toneladas!) Y aplicar sus habilidades de Machine Learning y también competir. ¡Con una comunidad abierta, aprenderás mucho! Construye tu portafolio y sigue aprendiendo.
Para aprender habilidades en línea, hay varios recursos como DataQuest, DataCamp, Coursera, Udemy, Udacity, Codecademy, ¡y más! Felicitaciones a todos ellos!
Espero su ayuda y feliz aprendizaje!
Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.
El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes desarrollan proyectos sobre conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y está fuertemente orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.
Algunos enlaces rápidos
- Programa – http://www.greyatom.com/full-sta…
- Chatee con un consejero académico: le invitamos a compartir todas sus dudas e inseguridades, a las que haremos todo lo posible para guiarlo hacia su camino profesional hacia el éxito. https://calendly.com/greyatom/co…
- Panel de discusión en GreyAtom – https://www.youtube.com/watch?v=… https://www.youtube.com/watch?v=…