¿Necesito una maestría / doctorado para convertirme en científico de datos?

No. Hay dos formas de convertirse en un científico de datos sin ningún Master / PhD:

  1. Comience lo antes posible mientras sea estudiante de pregrado. (Esto es lo que hice)
  2. Aprende mientras estás en un trabajo.

Intentaré compartir algunas de mis experiencias mientras era estudiante de pregrado.

2do año de ingeniería

Entonces, mi primer encuentro con la ciencia de datos fue después de mis exámenes finales del segundo año cuando hice una pasantía en Tata Consultancy Services (TCS), Mumbai como pasante analista de datos (ni siquiera ciencia de datos). Gracias a mi conexión, que me ayudó a conseguir un buen proyecto que implicaba trabajar en SAS. En esos 2 meses, aprendí 5 cosas: SAS, tablas dinámicas en Excel, modelos de regresión, me di cuenta de que me encantan los números y el hecho de que no quiero trabajar en el sector indio de TI / Tecnología.

3er año de ingeniería

Para seguir adelante con mi amor, comencé el Curso John Hopkins en Coursera on R Programming en mi tercer año y, mientras lo hacía, envié un correo electrónico a toneladas de CEO de startups con sede en EE. UU. Que les solicitaban trabajo no remunerado desde su hogar / pasantía. Uno de ellos estuvo de acuerdo y durante un mes estuve haciendo limpieza de datos, visualización de datos y análisis de regresión en R para una startup de IoT con sede en Nueva York.

No había tocado el aprendizaje automático hasta entonces.

Después de mi tercer año, envié un correo electrónico a casi 1200 profesores en 10 países para una pasantía de verano en ciencia de datos y finalmente fui a UC Berkeley, California después de mis exámenes finales de tercer año para trabajar con el profesor Bernt Wahl, visualizando los anillos de Saturno usando geometría fractal y programación. Allí, tomé algunos cursos cortos también sobre Estadística y Programación avanzada de R que me hicieron leer este gran libro sobre Estadística de David Freedman (definitivamente recomiendo este libro a cualquiera que esté comenzando).

Esos 2.5 meses en California realmente me abrieron los ojos, ya que me di cuenta de que lo que había hecho hasta entonces no valía nada y el verdadero negocio es el aprendizaje automático (uno de los proyectos en Berkeley fue predecir las trayectorias de los huracanes utilizando los datos de 1850-2010. Había usado regresión lineal en ese entonces y ese fue mi primer proyecto de aprendizaje automático). Después de regresar a la India, comencé el curso de Andrew Ng sobre aprendizaje automático y trabajé para Teach For India como pasante de ciencia de datos durante mis vacaciones de invierno del último año de ingeniería.

4to año de ingeniería

Aunque el requisito de esa pasantía era tener un título de maestría / doctorado, el entrevistador me preguntó muchas cosas sobre el algoritmo de regresión y para entonces supongo que todos los proyectos que había realizado estaban en regresión de una manera u otra. Afortunadamente, mi gerente en Teach For India tenía una Maestría en Estadística de la Universidad de Columbia y sus conceptos en aprendizaje automático eran sólidos como una roca. No podría haber pedido más (puede ser un poco más de estipendio :-)) como pasante. De todos modos, mi proyecto era automatizar el proceso de evaluación de más de 15000 aplicaciones para su famoso programa de becas y, por lo tanto, reducir los costos operativos y el tiempo involucrado. Aprendí muchos algoritmos en esos 2 meses desde diferentes algoritmos de agrupamiento como K-Means hasta algoritmos de clasificación como KNN. Además, me ensucié las manos con un poco de PNL básico con el que pudimos evaluar ensayos de 500 a 1000 palabras de miles de solicitantes con una precisión decente en menos de un minuto. Este fue el momento en que supe con certeza que quería trabajar como científico de datos después de mi graduación.

Después de la graduación

Para entonces, tenía claro que no aprendería nada nuevo si fuera a un curso de maestría en los Estados Unidos. Podría haber trabajado en India, pero casi no hay buenos roles de aprendizaje automático en India e incluso si lo hay, mis posibilidades eran casi cero, ya que era de una universidad con calificación promedio, lo que significa que mis correos electrónicos / aplicaciones ni siquiera se abrirán .

Mientras todo esto sucedía, había crecido una especie de pasión por crear una startup tecnológica que me hizo solicitar este programa acelerador de startups en Londres, Entrepreneur First (construí más de 100 empresas con una valoración de más de $ 750 por ahora). Fue perfecto para mí, ya que podía usar mis habilidades para construir un producto / inicio de aprendizaje automático. Pero solo había un problema: Visa. Afortunadamente, el gobierno del Reino Unido ha comenzado un nuevo esquema de Visa llamado Visa de talento excepcional para personas con conjuntos específicos de habilidades y adivina qué, la ciencia de datos fue una de ellas. Después de 2 meses de procedimiento que incluía el envío de currículum, carta de presentación, toneladas de cartas de recomendación / respaldo, mis repositorios de Github, diagramas de arquitectura de proyectos y muchas otras cosas, pude obtener esta visa que me permite trabajar / estudiar / dirigir una empresa durante aproximadamente 6 años en el Reino Unido (esas pasantías tenían sentido ahora).

Después de trabajar en una idea de inicio en Londres durante 9 meses, se nos acabó el financiamiento inicial y no pudimos recaudar más (estábamos usando el aprendizaje automático para predecir quién venderá su propiedad residencial próximamente en el Reino Unido). A continuación, solicité trabajos de ciencia de datos en las principales startups del Reino Unido y obtuve el empleo en Trainline, que es la aplicación / sitio web de viajes en tren más grande del Reino Unido. Me encanta mi tiempo aquí mientras trabajo a diario en más de mil millones de puntos de datos y uso tecnologías como Spark, EMR. Acabamos de lanzar una nueva función que predice los precios de los boletos de tren utilizando literalmente miles de millones de puntos de datos y ayuda a nuestros usuarios a elegir mejor su viaje.

El aprendizaje automático se está moviendo muy rápido y uno necesita seguir ese ritmo. (Es fácil cuando estás haciendo un doctorado). Entonces, mi equipo y yo pasamos parte de nuestro tiempo diariamente, aprendiendo nuevos temas como el aprendizaje profundo.

Todos en mi equipo aquí en Trainline tienen un MS / PhD de las mejores universidades como UCL, LSE, UBC y es un privilegio trabajar con esas personas a medida que aprendes algo nuevo y sorprendente, cada vez que hablas con ellos. Pero respondiendo a esta pregunta, sí, puede convertirse en un científico de datos sin un MS / PhD.

PD: es posible que hayas notado que he usado la palabra ‘afortunadamente’ varias veces. Así es la vida. 🙂

Puede consultar la experiencia de varios gurús de la ciencia de datos: por ejemplo, Jeff Hammerbacher, vea
http://amiquote.tumblr.com/post/ … y
Página en linkedin.com

Personalmente, siento pasión, una fuerte automotivación y un sinfín de prácticas prácticas para concluir, es el único camino hacia un * buen * científico de datos. Obtener un título de posgrado solo puede brindar una capacitación * clásica * en teoría estadística y análisis de datos, pero muchas de estas capacitaciones no están tan actualizadas. Y solo si puede ir a una escuela superior y trabajar con un asesor muy perspicaz, podría valer su costo de oportunidad en términos de tiempo. Esto es especialmente cierto para un doctorado. De lo contrario, ensuciarse las manos trabajando con algunos datos reales en la industria debería ser una mejor manera de hacerlo.

Respuesta corta: no.

Respuesta más larga: depende de los roles específicos de ciencia de datos que esté buscando. Tiendo a clasificar los roles de la ciencia de datos en dos grandes grupos.

1] Roles de ciencia de datos de ‘producto’
Si desea ser un científico de datos en una empresa o un equipo donde el producto se basa principalmente en la ciencia de datos, entonces la barra tiende a ser mucho más alta, y generalmente se requiere un Master / PhD. Por ejemplo, en mi papel en ciberseguridad, la detección de fraudes se basó principalmente en la ciencia de datos y fue el producto central de la compañía, por lo que cada científico de datos que contraté en mi equipo terminó teniendo un Máster / Doctorado (aunque no necesariamente en ciencia de datos o incluso en informática Ciencias).

Si desea trabajar en el aprendizaje automático principal y los algoritmos de inteligencia artificial en empresas basadas en datos como Google o Facebook, por ejemplo, trabajar en las recomendaciones de anuncios de Google o el reconocimiento facial de Facebook, es mejor que tenga un doctorado de una de las mejores escuelas. Estas tecnologías son responsables de miles de millones de dólares en ingresos, y el listón será realmente alto para que dejen que alguien toque esas piezas de su pila.

2] Roles de ciencia de datos ‘Insight’
Por otro lado, hay muchas empresas en las que la ciencia de datos se utiliza no como el producto principal, sino como formas de proporcionar información a otros equipos o mejorar el producto central. Por ejemplo, los principales productos de MailChimp son herramientas de marketing por correo electrónico, pero tienen un equipo de ciencia de datos que utiliza datos para comprender mejor a sus clientes y sus suscriptores, recomendar varios servicios, identificar correos electrónicos fraudulentos, etc. Si bien la ciencia de datos hace que la empresa sea mucho más eficiente y competitiva, la empresa aún tendría un producto sin él.

En muchas otras empresas, el análisis de datos puede proporcionar información valiosa que ayuda a los equipos de productos, ventas y marketing a ser más eficientes y efectivos. Por ejemplo, una compañía minorista como Target podría usar la ciencia de datos para predecir cuánto inventario almacenar en diferentes tiendas. Incluso compañías como Google y Facebook tienen una amplia variedad de roles de conocimiento, típicamente llamados “análisis de producto”, “análisis de marketing” y demás.

Para muchos de estos roles de conocimiento, la barra de entrada es más baja. Están mucho más dispuestos a probar candidatos que tienen una gran cartera, pero no tienen credenciales oficiales como un MS / PhD.

Resumen
Si no tienes un Máster / Doctorado pero quieres entrar en ciencia de datos, concéntrate en desarrollar habilidades básicas y crear una cartera de proyectos realmente buena. Una vez que tenga eso, concentre su estrategia de trabajo en encontrar roles de “conocimiento” en una amplia variedad de empresas. Eventualmente, si realmente desea trabajar en la vanguardia de la ciencia de datos en un rol de producto, puede decidir regresar a la escuela de posgrado para obtener un Master / PhD especializado.
Echa un vistazo a nuestra publicación de blog sobre cómo aprender ciencia de datos sin un título.


Raj Bandyopadhyay es el Director de Educación de Ciencia de Datos en Springboard . Es responsable de crear y mantener el plan de estudios de ciencias de datos de Springboard y también proporciona apoyo profesional específico para ciencias de datos para los estudiantes. Antes de esto, trabajó como científico de datos durante varios años, principalmente en el sector de ciberseguridad. Tiene una maestría / doctorado en informática de la Universidad de Rice y una licenciatura en informática de IIT Bombay.

No, tampoco lo necesita, pero necesita el fondo correcto.

Hay toneladas de recursos gratuitos para aprender ciencia de datos en línea, muchos de los cuales se enumeran en ¿Cómo me convierto en un científico de datos?

¿Por qué algunos graduados de MS / PhD pueden tener ventajas?

Los candidatos que salen de ciertos programas de MS / PhD pueden tener ventajas en ciencia de datos porque al menos uno de estos es cierto:

Ellos….

  • hacer investigaciones que involucren programación y grandes conjuntos de datos
  • han reunido intuición estadística y de datos a través de su trabajo
  • Mostrar resistencia al hacer / responder preguntas difíciles
  • puede explicar las motivaciones y el razonamiento detrás de su trabajo
  • son capaces de pensar críticamente sobre problemas difíciles
  • puede aprender y adaptarse rápidamente

Lo que puedes hacer como estudiante

Como estudiante universitario, puede explotar sus cursos, trabajar a través de los innumerables recursos disponibles de forma gratuita en línea y hacer todo lo posible para obtener algunas prácticas de ciencia de datos / ofertas de trabajo mientras desarrolla las habilidades anteriores por su cuenta.

Si ya puede obtener pasantías / ofertas de trabajo en ciencia de datos, entonces no hay necesidad de obtener un título adicional para avanzar en su potencial profesional.

Durante cualquier período de tiempo fijo, la experiencia real de la ciencia de datos casi siempre superará el tiempo dedicado a un programa de maestría / doctorado, especialmente dado que años de experiencia en ciencia de datos todavía son bastante raros en este momento.

Si ya está cerca de graduarse y no puede obtener pasantías / ofertas de trabajo en ciencias de datos, le recomendaría uno de los siguientes:

  • conseguir cualquier trabajo que pueda donde pueda trabajar en el desarrollo de sus habilidades de ciencia de datos
  • unirse a un programa de maestría donde puede trabajar en sus habilidades de ciencia de datos.

Entonces puede saltar a la ciencia de datos cuando esté listo.

Tenga en cuenta que habrá menos puestos disponibles para usted si solo tiene una licenciatura

Hay bastantes compañías que solo aceptan candidatos con doctorado para sus puestos de ciencia de datos. Sin embargo, todavía hay un número creciente que aceptará candidatos con títulos de licenciatura para sus vacantes. ¿Qué empresas tienen pasantías en ciencia de datos para estudiantes universitarios? o ¿Qué compañías tecnológicas contratan pasantes de ciencia de datos para el verano de 2016? para listas

¿Por qué recomendaría obtener una maestría sobre un doctorado?

Tenga en cuenta que un programa de doctorado puede ser una rutina muy larga. Si su objetivo principal es saltar a la ciencia de datos dentro de 5 años, estaría más preparado para pasar 1-2 años en un programa de maestría y 3-4 años en un puesto relacionado con datos que 5 años en un doctorado. Solo recomendaría un programa de doctorado si al menos uno de los siguientes es cierto:

  • Has pasado horas tratando de resolver un problema de investigación, ya que no podías comprender dejarlo sin respuesta.
  • Usted no es ciudadano estadounidense y necesita un punto de partida para emigrar a los Estados Unidos y trabajar aquí (si es así, puede intentar ingresar a un programa de doctorado en los estados).

Si todavía está apuntando a un doctorado, debe tener mucho cuidado de que su investigación se alinee muy bien con la ciencia de datos (por ejemplo, implica análisis de datos pesados, mucha programación, no completamente teórico). Muchos doctores están mal preparados para un papel de ciencia de datos porque no tienen el análisis de datos / programación / experiencia práctica. Como candidato a maestría, tendrá más flexibilidad para buscar lo que sea más útil para la ciencia de datos.

¿Por qué espero que ingresen muchos más estudiantes en ciencia de datos en el futuro?

A medida que más recursos y cursos / programas relevantes estén disponibles para estudiantes de pregrado en los próximos 5-10 años, muchos más científicos de datos de nivel de entrada saldrán directamente de un programa de licenciatura. Luego, comenzará a escuchar mucho más sobre los científicos de datos que comenzaron justo después de terminar su licenciatura.

Escribo más sobre esto en ¿Son los científicos de datos de doctorado mejores que los calificados? ¿Son los científicos de datos de doctorado mejores que los calificados?

Realmente depende de qué rol estás buscando. La etiqueta de “científico de datos” se adjunta a muchas descripciones de trabajo diferentes, algunas de las cuales la capacitación de doctorado es más útil que otras.

En el transcurso de un doctorado, es probable que desarrolle una serie de habilidades que a menudo no se enfatizan en los estudios de pregrado (o incluso de maestría):

  • Navegar por la literatura relevante: Encontrar documentos útiles y extraer el significado de ellos es algo en lo que practicarás mucho mientras escribes tu tesis.
  • Definir un problema metodológico claro para resolver : todas las tesis tendrán que responder una pregunta, pero descubrir qué pregunta responder puede ser una de las partes más difíciles de la investigación de doctorado: debe encontrar un problema que sea interesante, relevante y novedoso … pero también solucionable en 2 a 5 años por alguien con (probablemente) relativamente poca experiencia en investigación.
  • Aplicando la teoría para saber cuándo un método es apropiado: hay una gran cita que dice que “saber la diferencia entre la tolerancia estricta y la tolerancia floja es quizás la medida más importante de un artesano” [1]. La capacitación teórica en el transcurso de un doctorado ayuda a desarrollar una comprensión más profunda de por qué ciertos métodos funcionan y qué tan dañino es violar los supuestos de cada modelo. Un título de maestría también te brinda parte de esta capacitación.

Dicho esto, un doctorado generalmente toma de 5 a 7 años después de la licenciatura (o de 3 a 5 post-maestría). También hay habilidades y atributos importantes que es más probable que acumule durante ese tiempo en un entorno industrial:

  • Adoptar un enfoque pragmático de los problemas : no se puede vivir tanto por la regla 80/20 cuando se trata de la academia. Se gasta una gran cantidad de esfuerzo en el pulido final de un trabajo académico, y como tal, los doctores tienden a inclinarse demasiado hacia el perfeccionismo cuando salen de la escuela de posgrado. En la industria, también suele seleccionar un método basado en el problema, mientras que en la academia es a veces (no siempre) el método que viene primero.
  • Conciencia de su industria específica: El conocimiento profundo de los matices de los problemas y las demandas de la industria elegida es (como era de esperar) algo mejor construido en el trabajo.
  • Habilidades de las personas : gran parte del trabajo de doctorado es solitario o solo se realiza con un pequeño número de colegas. Las habilidades blandas como la tutoría, la realización de reuniones de manera efectiva y la creación de consenso se adquieren más fácilmente a través de los entornos más colaborativos que se encuentran en la industria.

Como es de esperar, las habilidades de doctorado son más importantes si está buscando un puesto de ciencia de datos orientado a la investigación que implique el desarrollo de una metodología novedosa. No quiere decir que los doctores tengan el monopolio de estas habilidades, pero son difíciles de adquirir incluso con el apoyo de un departamento académico y un asesor de tesis, por lo que no subestimaría la dificultad de adquirirlos por su cuenta. También vale la pena considerar que algunas empresas tampoco están dispuestas a contratar a postgrado para funciones de ciencia de datos, o promoverlas más allá de cierto nivel en una pista de IC.

Dicho todo esto, hay grandes extensiones de ciencia de datos que no requieren estas habilidades orientadas a la investigación. Hay una gran cantidad de impacto que puede tener al aprovechar las habilidades que se desarrollan mejor a través de la configuración de la industria también. Recomiendo mirar las ofertas de trabajo para el tipo de trabajo que desea hacer y hablar con los científicos de datos con y sin títulos de posgrado para determinar qué dirección es mejor para usted.

Notas al pie

[1] Mis 10 mandamientos para creadores – Probado

No, no necesitas un doctorado. Pero sí necesita tener suficiente conocimiento de matemáticas (específicamente probabilidad y estadística) y ciencias de la computación. Estos a menudo vienen con obtener un título de posgrado en el campo correcto.

Tener un título de posgrado también le brinda el beneficio de la duda cuando los reclutadores y los empleadores potenciales están mirando su currículum. Sin embargo, como señala Wenwen, la experiencia del mundo real es más importante.

Entonces, ¿por qué no trabajar durante unos años y luego decidir obtener una maestría o un doctorado?

También está la cuestión de * dónde * quieres ser un científico de datos. Algunas compañías / grupos insistirán en una maestría o doctorado, pero la mayoría de las nuevas empresas probablemente no.

La forma en que uno de mis gerentes me lo explicó (antes de irme para obtener un doctorado) es que, al menos para las estadísticas: se puede esperar que una persona con un BS sepa qué métodos estadísticos existen. Se puede esperar que una persona con un Máster sepa cómo aplicarlos . Se puede esperar que una persona con un doctorado sepa cómo derivarlos . Si bien creo que es una generalización bastante burda (e incorrecta), muchos doctores probablemente no saben mucho más allá de un título de maestría en sus campos más amplios, y muchas personas con un BS son tan capaces como las personas con más educación, esa es la opinión de algunas personas, y afecta la forma en que contratan.

Un máster o doctorado. en el campo relacionado ciertamente ayuda con el éxito en la ciencia de datos con estadísticas probablemente las más relevantes, pero otros campos como las matemáticas y la física también están bien correlacionados. ¡He visto muchos anuncios de empleo “Unicornio” que buscan títulos avanzados, junto con codificación, ingeniería de software, experiencia en el dominio, además de … habilidades de licencia de piloto, jardinería y lavado de platos !! 😎 …

Una vez asistí a un Data Science Meetup y el anfitrión dijo al principio que “nunca miraría un currículum sin al menos una maestría”. Estaba dando una charla relámpago en ese evento, y tenía un trabajo de Data Scientist, pero aún no tenía mi diploma de pregrado en ese momento. Para ser justos, hay muchas cosas que estoy aprendiendo ahora que habría visto durante un Master / PhD, pero siento que el entorno en el que estoy trabajando hace que el proceso sea mucho más efectivo (mis dos jefes son profesores increíbles) .

Pero en realidad tiene sentido. William Chen describió en su respuesta algunas habilidades básicas adquiridas durante un programa de maestría. Pero eso no significa que sea la única forma de adquirir esas habilidades. Sin embargo, tendrá que encontrar otra forma de demostrar que lo tiene en usted.

Mi fuerte sugerencia para superar esto es SER PARTE DE LA COMUNIDAD . Muéstrales tus habilidades antes de que se den cuenta de tu diploma, y ​​luego, cuando lo vean, se sorprenderán. Meetups, grupos de LinkedIn, blog personal, nómbralo. Lo hice siendo un traductor de Coursera del curso de aprendizaje automático de Andrew Ng. La proactividad es la clave.

He hablado un poco más sobre esta respuesta de Eduardo Bonet a ¿Cómo me convierto en un científico de datos sin una maestría? ¿Hay buenas maneras de demostrar que tengo las habilidades técnicas / de comunicación necesarias para ser un desarrollador web completo?

Fui a Indeed y busqué todos los trabajos con “Data Scientist” en el título. 77 tenían mención de Phd, 177 no tenían mención de Phd,
Por supuesto, esta puede no ser “la” respuesta, ¡pero ciertamente es algo que un científico de datos haría para encontrar la respuesta!

Empleos de Data Scientist, Empleo

Data Scientist PhD Empleo, Empleo

He analizado 350 descripciones de trabajo con el título de trabajo “Científico de datos”, publicado principalmente en el Área de la Bahía, para encontrar la respuesta a esta pregunta. Por lo tanto, tener un doctorado. No es un requisito para muchas empresas. El análisis de datos muestra que

puedes tener una licenciatura y convertirte en científico de datos, aunque podría ser más difícil. Hay muchas compañías que buscan experiencia y habilidades y títulos no son su prioridad.

“¡El mercado determina quién es un científico de datos! ”

Hay algunos trabajos que puede tener Master o PhD, Bachelor o Master o PhD.

La mayoría de los puestos de ciencia de datos que veo en KDnuggets Jobs en Data Mining and Analytics y en otros lugares requieren solo MS o similar, por lo que no necesita un doctorado para un buen trabajo de ciencia de datos. El doctorado generalmente sería necesario para un puesto de nivel superior, como el científico jefe o el director de análisis.

Cuando aumenta la demanda de algo, los requisitos se vuelven fungibles. Dada la aparente demanda del papel de la “ciencia de datos”, incluso si un doctorado fuera deseable o requerido en otro momento, hoy no es un requisito difícil.

En ingeniería de software, un doctorado ciertamente no es necesario para ser muy bueno. Rara vez es útil. Pero en la investigación, un doctorado suele ser bastante necesario para sobresalir.

La ciencia de datos está en algún punto intermedio, y se inclina más hacia la ingeniería. (Tiendo a definirlo de manera bastante operativa, no haciendo que un modelo estático fuera de línea en R en una muestra de los datos del mes pasado). Por lo tanto, tiendo a pensar que es menos importante que importante.

El final matemático y teórico es solo una pequeña parte de cualquier sistema del mundo real en una empresa. La recopilación de datos, la limpieza, la conexión de las tuberías, la depuración de resultados, la explicación, la explicación, la ampliación, son mucho más importantes.

… pero diría esto ya que no tengo un doctorado y mi maestría está en el negocio.

¡Definitivamente no!

Hay dos tipos de científicos de datos: roles de analista e ingeniero. El primero debe conocer muy bien las estadísticas / SQL / SciKit / etc, el segundo – desarrollo de software / aprendizaje automático / etc. No necesitas doctorado o maestría para eso. Contraté a muchos científicos de datos con una licenciatura. Hicieron sus tareas muy bien.

Pero a veces se necesita el puesto de Investigación / Ciencia de datos. Se requiere un conocimiento profundo de la teoría matemática / ML para alguna investigación teórica o la adopción de una teoría a una práctica. Por ejemplo, RecSys – ACM Recomender Systems publicó muchos trabajos de investigación sobre algoritmos de recomendación. Si alguien decidiera implementarlos y probarlos en producción, PhD / Masters sería muy útil para comprender esos documentos en un corto período de tiempo.

No. Nuestro equipo de ciencia de datos en Quora tiene personas con diversos antecedentes, que incluyen física, economía e ingeniería química. De hecho, hay algunos miembros del equipo con títulos en estadística y aprendizaje automático, pero no es un requisito. Sin embargo, cierta familiaridad y comodidad con esos campos (especialmente estadísticas) es importante para el trabajo.

Por cierto, solo unos pocos de nosotros tenemos un Ph.D. en cualquier campo, y definitivamente no necesitas uno para ser un científico de datos productivo.

Un doctorado no es un requisito previo, en el sentido de que probablemente no será excluido de la candidatura a un puesto de ciencia de datos por falta de uno. Yo no tengo más que una licenciatura.

Además de abordar problemas que son puramente de “investigación” en la naturaleza, la ciencia de datos a menudo implica mucho trabajo orientado a diseñar sistemas, idear visualizaciones de datos efectivas y experiencias de usuario intuitivas en las aplicaciones, aprender a usar rápidamente nuevas bibliotecas de software, simplemente depuración y mantenimiento de código, etc. Estas habilidades son típicamente lo suficientemente importantes como para superar las habilidades de investigación por sí solas, y no creo que se encuentren mejor filtrándolas en “¿tiene doctorado?”

Además, un doctorado probablemente habrá contribuido significativamente a la literatura académica sobre su tema. Este nivel de experiencia a menudo no es necesario: ¡hay mucho trabajo de ciencia de datos para implementar hábilmente ideas mucho más básicas!

Pero … si alguien tiene un doctorado en el campo correcto, ciertamente aumenta la probabilidad de que al menos tengan ciertas bases de conocimiento cubiertas o sean lo suficientemente brillantes como para aprender lo que no saben. Al menos cuando hablo con alguien con un doctorado, tengo menos miedo de que no puedan manejar estadísticas básicas o trabajo de codificación.

Me gustó la respuesta de Sean Owen, pero modificaría su definición de “ciencia de datos” agregando el famoso diagrama de Drew Conway: El diagrama de Venn de ciencia de datos. El trabajo de ciencia de datos varía puede inclinarse más hacia uno de esos tres ámbitos de experiencia que otro, pero este diagrama es un buen resumen de lo que las empresas buscan en los científicos de datos, y un doctorado no necesariamente garantizará que los tenga todos.

Si por “importante” quiere decir importante para hacer el trabajo, yo diría: no muy importante en la mayoría de los casos. Si por “importante” te refieres a importante para conseguir el trabajo, creo que depende mucho de dónde postules. A la gente le gusta contratar personas que son como ellos. Por ejemplo, Google emplea muchos doctores en estadística, que tienden a hacer preguntas de entrevista con una inclinación de doctorado en estadísticas, y de esta manera acumula más doctorados en estadísticas. Otros lugares probablemente tienen sesgos en otras direcciones.

No, no lo haces y déjame decirte por qué.

Solo piense en los diversos caminos que podrían conducir a una carrera de ciencia de datos. Tienes astrónomos que son científicos de datos (Jessica Kirkpatrick), biólogos que son científicos de datos (Roger Peng), informáticos que son científicos de datos (Verena Kaynig-Fittkau), físicos que son científicos de datos (Shankar Iyer), estadísticos que son científicos de datos (William Chen) e incluso ingenieros mecánicos que son científicos de datos (yo: P). Consulte ¿Cuáles son las diferentes formas de ingresar al campo de Ciencia de datos?

¿Qué tienen en común estas personas además de ser científicos de datos?

Están trabajando en diferentes campos. Ellos saben cosas diferentes. Un biólogo, astrónomo o físico preferiría tener una maestría en su campo respectivo que una maestría en ciencia de datos y qué valor podría agregar una maestría en física para un científico de datos en una empresa como Amazon. Yo digo Zilch.

La parte principal que debemos entender es que Estas personas han adquirido la habilidad de jugar con datos en algún momento de su carrera .

Algunos de ellos han leído sobre Estadística, Matemáticas, Aprendizaje automático no como parte de su título, sino como algo que sería útil en su trabajo. Un biólogo ha adquirido experiencia observando los datos genéticos, un astrónomo observando los datos del telescopio, etc.

¡Estas habilidades son las que las hacen importantes para compañías como Amazon, no sus títulos de maestría !

Y uno podría adquirir estas habilidades antes mencionadas trabajando con la industria o trabajando con conjuntos de datos disponibles públicamente.

Puedo apostar con seguridad que todas las personas mencionadas anteriormente definitivamente habrían pasado tiempo jugando con el conjunto de datos de Iris .

Y para contarle un secreto, también puede hacerlo sin un MS.

Si le pregunta a wrt los requisitos de calificación que implican las compañías, entonces diría que varía de una compañía a otra. Cada organización tiene su propia demanda de contratar a un candidato para un puesto. Un título de trabajo como un ‘ Científico de datos ‘ puede exigir un empleado de posgrado en ciertas organizaciones.

Un grado más alto solo protege la confianza que tales organizaciones requieren al contratarlo. Sin embargo, una vez que consigas el trabajo; Su futuro y éxito en la organización depende completamente de su conjunto de habilidades y no de su alma-mater.

Si está preguntando a Wrt el conocimiento requerido para convertirse en un científico de datos, entonces he visto a Kagglers (Kaggle es una plataforma competitiva de ciencia de datos bastante decente) que todavía están en su escuela secundaria y son candidatos a doctorados que han estado en el guión. Este campo durante casi una década. Y ten en cuenta que estar entre los 10 primeros puestos de una competencia de Kaggle no es fácil. Pero estos niños han estado haciendo esto antes de que incluso hayan calificado sus SAT.

Entonces, cuando se trata de conocimiento, un título es solo otro pedazo de papel. Todo depende de tu motivación y la cantidad de horas que estés dispuesto a dedicar.

La cantidad de cursos de ciencia de datos en línea disponibles en la actualidad no requiere que un estudiante seriamente motivado obtenga más de un título en términos de adquirir conocimiento. Pero sí, tal entusiasmo es difícil de lograr y es por eso que obtener un título hace que la curva de aprendizaje sea mucho más fácil.

Además, todavía hay empresas, el ejemplo principal es GOOGLE, que no analiza su título o su escuela cuando lo contrata, sino que evalúa su conocimiento.

Entonces, si está lo suficientemente motivado y está listo para dar ‘n’ no. de horas por su cuenta, entonces diría que debe aspirar a lo mejor y dar un ejemplo de cómo convertirse en un científico de datos sin un título de posgrado. 🙂

Es difícil convertirse en un científico de datos, punto. Necesita aprender y practicar (y practicar y practicar) muchos conceptos y habilidades diferentes (estadística, ingeniería de datos, computación, visualización, disputas de datos y más), y poder usarlos todos juntos para resolver problemas reales. También debe aprender cómo aprender rápidamente sobre un nuevo dominio de tareas y formular problemas que puedan resolverse adecuadamente en ese dominio.

La educación de posgrado puede ayudarlo a aprender esas habilidades y brindarle oportunidades estructuradas (y tutoría) para practicarlas, pero es posible hacerlo fuera de la escuela de posgrado (aunque será aún más difícil). Si no vas a ir a la escuela, te aconsejo encarecidamente que encuentres un buen mentor, al menos.

Es difícil encontrar datos sobre este tipo de cosas, así que lo que sigue es mi propia opinión algo informada.

No es necesario tener un doctorado para obtener un puesto de científico de datos, pero ciertamente no duele, y probablemente haya una ventaja bastante significativa al tener uno. Espero que la ventaja disminuya con el tiempo, a medida que más programas de maestría entren en línea y comiencen a colocar a sus graduados.

Creo que los titulados de maestría tendrán una ventaja bastante significativa sobre las personas que no tienen títulos de posgrado en el futuro previsible. Es difícil incluir los cursos relevantes más todos sus requisitos previos en un programa de cuatro años.