¿El aumento de las especializaciones en ciencia de datos refleja la demanda real del lugar de trabajo?

Si. No debería haber científicos de datos desempleados que quieran trabajar. La tendencia debería durar al menos 5 a 7 años hasta que la próxima ola de graduados en ciencias de la información llegue al mercado, pero aún debe haber un montón de empleos, ya que la demanda también está aumentando. Hacen cubos de dinero junto a un profesor universitario.

Sin embargo, el título es uno de los más difíciles, ya que incluye estadísticas y codificación a nivel de máster, incluidos los lenguajes y códigos estándar más ‘R’ y otros lenguajes de codificación, así como el software de estadísticas ‘enlatadas’.

También debe conocer el diseño de investigación particularmente para uso comercial. Sin embargo, estos tipos (Data Scientists) son los magos maravillosos que hacen crecer las ganancias de la compañía, por lo que están bien compensados ​​con salarios iniciales de hasta 120,000; más alto que muchos profesores de fin de carrera!

Algunos otros tipos de desarrolladores comienzan en el rango de 80 a 110k, pero mucho es un trabajo por contrato y depende del mercado. Vivíamos en una ciudad más pequeña que quería desarrolladores full stack por 40k pero a 1 1/2 horas de distancia pagaban 80 + k.

Una advertencia: el campo es para pensadores muy brillantes y solucionadores de problemas, no solo técnicos y programadores de pasatiempos. Incluso los codificadores experimentados y las personas de Comp Sci no pueden transferirse fácilmente: el problema es que no todos los estadísticos conocen la codificación, y pocas personas de Comp Sci conocen estadísticas a un nivel avanzado. ¡El “Jack-of-All-Trades” se va con la olla de oro! Sin embargo, un último pensamiento: ¡te tiene que gustar o se convierte en una pesadilla alucinante que no vale la pena! Si eres capaz y te gusta, encontrarás el trabajo bien remunerado y gratificante.

A continuación se muestra una estimación de puerta de vidrio basada en trabajos en esta área. NO soy un científico de datos, por lo que la información que ingresé era hipotética basada en otros en ese campo. En su lugar, elegí estudiar Psicología de la personalidad antes de que dejara de existir. Con mi menor en Stat puedo compartir esta información de forma gratuita.

P original: ¿El aumento de las especializaciones en ciencia de datos refleja la demanda real en el lugar de trabajo?

Yo diría que sí, pero con las advertencias gemelas de

  1. Cada nueva disciplina pasa por una fase de moda y la ciencia de datos puede estar en este momento.
  2. Los científicos de datos siempre estarán en competencia con expertos en el dominio en términos de quién es la persona más efectiva para resolver un problema dado en un momento específico.

Descargo de responsabilidad personal: actualmente estoy cursando una Maestría en Ciencia de Datos, por lo que no puedo afirmar que soy 100% imparcial.

En lugar de intentar volver a analizar de qué se trata realmente la ciencia de datos, recomendaría a cualquiera que esté interesado en mirar el libro de Zumel y Mount llamado ” Ciencia práctica de datos con R”. Hacen un trabajo muy efectivo al explicar lo que hace un científico de datos real, en comparación con lo que un investigador científico o informático / desarrollador cuantitativo podría hacer en la misma situación.

En esencia, comienzan con la necesidad (o vaga) amplia o problema planteado por una empresa u organización. Luego observan los diferentes sistemas y fuentes de datos que están disponibles para resolver el problema y elaboran un plan de investigación y un objetivo medible, a través de un algoritmo implementable, que la organización puede acordar que resolverá el problema (ahora definido).

Si esto se parece mucho a lo que una organización ya puede lograr internamente, entonces no lo ha pensado desde el punto de vista de la altitud. Un científico de datos necesita poder “volar” a 35,000 pies y hablar con conocimiento con el CEO y el CFO sobre sus objetivos comerciales generales. También deben ser capaces de lograr iterativamente que estas mismas personas acuerden un objetivo medible, en función de su experiencia de lo que es práctico, dados los datos disponibles, combinados con métodos estadísticos y / o aprendizaje automático.

Al mismo tiempo, necesitan poder volar a 500 pies y hablar con los desarrolladores sobre cuál sería un repositorio de datos apropiado para el proyecto: podría ser hadoop, podría ser Mysql.

También deben poder mostrar al personal de investigación interno que los métodos que proponen son estadísticamente significativos y qué suposiciones se deben hacer para “hacer el trabajo”. Esta es probablemente la parte más difícil, porque estas personas pueden deshacer fácilmente todo el proyecto simplemente quejándose de la metodología a través de canales secundarios.

A medida que las organizaciones inevitablemente recopilan más y más datos y comienzan a comprender su valor latente, creo que las personas comprenderán el valor integral de tener un científico de datos que maneje iniciativas importantes, en lugar de solo tener el experto / desarrollador senior de dominio más adecuado / especialista en productos que maneja una tarea matemática + de datos potencialmente compleja que necesita producir un resultado reconocible para todas las partes.