Soy un científico de datos con una Licenciatura en Ciencias en Sistemas de Información. Honestamente, nunca planeé convertirme en científico de datos, y si supiera cuánto trabajo me llevó, tal vez nunca me aventuraría en este camino.
La ciencia de datos es la supervivencia de locos y obsesivos. Obtener una educación de posgrado de instituciones acreditadas es una forma de demostrar esa obsesión. Hacer fila en Disneyland, el lugar supuestamente más feliz del mundo y pensar en la creación de características y el ajuste de hiperparámetros de los modelos de árboles potenciados es otra forma (que fue lo que hice y enfureció mi SO).
Entonces, ¿cómo convertirse en un científico de datos? Tengo fórmulas para eso
Comience con la fórmula 66 mini infierno :
- ¿Cuáles son las próximas grandes tendencias en la ciencia de los materiales?
- ¿Cuáles son algunas de las mejores historias / anécdotas de doctorado que has escuchado?
- ¿Qué puede hacer un estudiante de doctorado para maximizar sus posibilidades de hacer “ciencia revolucionaria” de Kuhn?
- ¿Cómo puedo ingresar a un programa de doctorado superior en informática? Quiero investigar IA (aprendizaje automático y visión por computadora). Al postularse para programas de doctorado de CS, particularmente en las mejores escuelas, ¿qué es lo importante / podría separarlo de otros solicitantes?
- ¿Cuáles son las ventajas y desventajas de hacer un doctorado en arquitectura de Egipto?
- De ahora en adelante, pase 60 minutos todos los días en ciencia de datos . Comience con MOOC de temas amplios de Coursera, edX y otros recursos en línea. que cubre los conceptos básicos de aprendizaje automático y estadísticas. No te avergüences si no entiendes nada. Pregunte en Quora, pregunte en foros, descubra más y continúe.
- Haga esto durante 6 meses , sin parar todos los días. Luego evalúe si todas estas cosas de aprendizaje automático le interesan.
Si incluso después de la 66 mini gira infernal no se inmuta, ahora está listo para enfrentar la fórmula completa 666 del infierno .
- De ahora en adelante, pase 60 minutos todos los días en ciencia de datos . Cubra temas de profundidad que le interesen, como PNL, sistemas de recomendación, aprendizaje profundo y MOOC completos en tecnologías de big data como Spark y Hadoop.
- Hacer 6 proyectos relacionados con la ciencia de datos al año . Puede dar charlas, realizar capacitación en ciencia de datos 101 para otros, competir en Kaggle, crear productos de datos con datos abiertos, iniciar un blog de ciencia de datos o comenzar / unirse a un grupo de reunión de ciencia de datos, ser voluntario con organizaciones de datos, pasante, trabajar en un contrato de datos trabajos.
- Haz (1) y (2) durante 6 años . Eso fue más o menos el tiempo que tardé, aunque honestamente puse más de 60 minutos por día, así que YMMV.
Los 60 minutos que pasas todos los días construyen tu base. Los 6 proyectos que haces muestran tus capacidades (siéntete orgulloso de compartirlos durante las entrevistas). Te sorprenderá cuánto sabes al final de 6 años.
Si lo piensas bien, un doctorado demora entre 5 y 6 años en ganar (más si tomas Masters además de eso). Por lo tanto, la fórmula 666 esencialmente intercambia esos años por autoaprendizaje y una gama más amplia de experiencia.
Edición 1: ¿Soy competitivo con los candidatos a doctorado? Tengo más experiencia práctica y conjuntos de habilidades más amplios, desde habilidades técnicas hasta la comprensión de los procesos comerciales y la contratación. Los doctores en mi equipo tienen un enfoque más láser en su dominio. Aprendo mucho de su profundidad y ellos aprenden sobre mi amplia gama de herramientas. Diré que un buen equipo de datos necesita personas con la amplitud y la profundidad para funcionar. Tengo un gran respeto por la gente de doctorado, simplemente no soy el tipo de persona que puede sentarse y estudiar un tema durante 6 años.
Edición 2: Una pregunta de seguimiento común es: ” Si necesitamos experiencia laboral para ser contratados para roles de ciencia de datos, ¿cómo podemos poner el pie en el lugar ?” Bueno, la buena noticia es que no tienes que esperar 6 años para ser contratado. Mi camino:
Pasante en un proveedor de software de análisis> ingeniero junior en una empresa de hardware de big data> analista de negocios> científico de datos.
Con cierta base en matemáticas y programación, puede comenzar de inmediato, pero puede tomar un tiempo obtener un título de científico de datos; es posible que no pueda trabajar en el equipo de ciencia de datos de Facebook directamente desde la escuela y eso es perfectamente normal.
En definitiva, el mundo es tu ostra. Conocí a varios amigos maestros que comenzaron como pasantes en empresas durante sus estudios. Algunos se unieron a nuevas empresas para el desafío y la exposición. También puede crear una cartera a través de trabajos de contrato de datos en portales como Experfy.com, concursos en Kaggle.com. Muchas empresas más pequeñas están buscando talentos de datos en estos días, pero debe entablar una conversación y contar con una sólida cartera de proyectos de ayuda. Vea mi respuesta a ¿Cuál es la mejor entrevista de ciencia de datos que ha tenido?
Edición 3: ahora estoy haciendo una maestría en informática a través del programa OMSCS de Georgia Tech. Georgia Tech es famosa por su investigación en inteligencia artificial y robótica y espero aprender más sobre la especialización en robótica del programa de maestría.