Hay un puesto de científico de datos para ser ocupado. Tengo la opción de elegir entre matemático, informático y físico. ¿A quién debo contratar?

Hmm Dependería de la función que está tratando de cumplir en el equipo de ciencia de datos. Recuerde que la ciencia de datos no se trata de una sola estrella de rock que hace todo el trabajo. La ciencia de datos fusiona varios conjuntos de habilidades, que incluyen ingeniería de software, ciencias de la computación, matemáticas / estadísticas y conocimiento del dominio. Tiende a encontrar personas que favorecen un conjunto de habilidades u otro basado en la experiencia laboral y / o la educación.

El matemático y el estadístico tendrán una base de conocimientos y capacidades similares, sin embargo, los estadísticos obviamente tendrán más exposición a las estadísticas. Probablemente serían mejores para diseñar estudios y detectar problemas de datos que el matemático.

Los matemáticos pueden tener más exposición a métodos numéricos (algoritmos para resolver varias ecuaciones) o tipos generales de matemáticas que pueden funcionar para ciertos problemas. Serían muy adecuados para resolver problemas de optimización o problemas que requieren un cálculo eficiente. Sin embargo, hay estadísticos con conjuntos de habilidades similares.

Acabo de ver al matemático como un conjunto de habilidades más generales, y lo que saben por fuera depende de en qué se especializaron en la escuela. Las matemáticas tienen múltiples subespecialidades con diferentes aplicaciones.

El informático puede tener más exposición a Linux, la programación y el diseño de software. Puede encontrar informáticos especializados en aprendizaje automático, o puede encontrar algunos especializados en bases de datos, etc. Al igual que el matemático, las habilidades que tengan dependerán de la especialización que tengan.

En pocas palabras, necesitaría más información sobre las personas y los requisitos del rol. Cada campo es igualmente capaz de ciencia de datos, pero cada uno favorecerá una parte ligeramente diferente del espectro de habilidades de ciencia de datos.

Presentaré otra perspectiva, no es que las otras respuestas no sean acertadas. Tenga en cuenta el tamaño de los datos en su pregunta. ¿Por qué? Porque en el extremo superior de los tamaños de datos, la importancia de comprender cómo interactúan los datos con el hardware se vuelve más crítica. Entonces, si está en el extremo superior del tamaño de los datos, me aseguraré de que la persona que contrate tenga un buen conocimiento en diseño de redes y sistemas informáticos. Saber cómo se enrutan los conjuntos de datos de 100 TB y cómo las consultas afectan el movimiento de datos es a menudo la diferencia entre los tiempos de ejecución de 5 minutos y 5 horas. He visto a las personas más inteligentes escribir algunos de los peores códigos de big data en términos de rendimiento. El método de análisis más creativo no es mejor que el peor si no se completa en un período de tiempo razonable.

Esto no responde directamente a su pregunta, pero potencialmente le brinda otra forma de comparar candidatos si sus datos son grandes.

Depende en gran medida del tipo de pregunta que necesita que responda y qué tipo de matemático. Sin embargo, debo señalar que todo esto es irrelevante si uno de los científicos de datos en cuestión tiene experiencia real en métodos relacionados con su pregunta.

Si lo que necesita es alguien que pueda escribir un código realmente bueno y conozca algunas estadísticas, contrate al informático.

Si lo que necesita es alguien que resuelva problemas complejos que involucren el modelado de procesos (esto sucede, entonces sucede una de estas cosas, luego sucede algo más, etc., etc., etc., cuáles son los posibles resultados y sus probabilidades asociadas) Un físico es probablemente el mejor.

Si está buscando una muy amplia gama de problemas que no se centran en nada en particular, un matemático aplicado es su mejor opción. (Un matemático teórico podría funcionar, teóricamente. Pero una no sería mi primera opción para este tipo de trabajo).

Sus puntos fuertes reales no necesariamente se corresponderán con sus campos de estudio, pero si está buscando una heurística, esto es lo que haría:

¿La posición se centra en construir nuevos modelos, implementar los antiguos o interpretar el significado del análisis ya ejecutado?

Para construir nuevas ideas, elija al matemático.

Para implementar los viejos, el informático.

Para interpretar el análisis, el físico.

¡Esta es una heurística muy dura y es mucho mejor entrevistarlos!

Elegiría al que más me convenció

/ TL; DR desplazarse hacia abajo para obtener detalles details /

Recluté matemáticos, estadísticos, programadores y biólogos para el puesto de científico de datos.

  1. Algunos estadísticos (probablemente preferiría) tenían un poco de experiencia en el análisis de datos. Eran buenos para conocer las fórmulas y hablar sobre distribuciones y teorías estadísticas (o contarme historias sobre la guerra entre Fisher y Pearson), pero eso fue todo. Algunos de ellos tuvieron problemas con el uso de herramientas informáticas y software diferentes a los conocidos en la universidad. Fueron brillantes al enseñarme la teoría, pero su práctica dejó mucho que desear.

    Significa que a veces el hecho de que uno sea estadístico puede no ser suficiente.
    Creo que tienen la mejor base, pero depende de cómo la usen.
  2. Algunos matemáticos (probablemente también debería preferirlos) tenían un conocimiento muy limitado sobre la inferencia estadística y los métodos. Conocían muchos teoremas, pruebas, pero carecían de los conocimientos analíticos. Por supuesto, estoy hablando de un pequeño subconjunto. Algunos de mis mejores mentores son matemáticos (pocos de ellos ni siquiera tienen una orientación estadística 🙂.
  3. Algunos científicos informáticos (probablemente no preferiría estar lejos de la clase de matemáticas) desataron una muy buena comprensión de los antecedentes matemáticos, la inferencia estadística y un conocimiento impresionante sobre varios consejos y trucos en el análisis de datos. También fueron buenos para combinar varias herramientas estadísticas e informáticas. El buen conocimiento de la teoría de algoritmos, así como la capacidad “natural” de escribir programas fueron un beneficio significativo.

    Nuevamente, no significa que los programadores sean buenos analistas de datos por definición. Solo estoy señalando que depende de la experiencia y pasión de uno, no solo del tipo de educación o diploma.

  4. Recluté para ese puesto también a psicólogos y biólogos (bueno, ¿dónde están en la escala?), Siendo analistas de datos autodidactas, que expusieron la experiencia más sólida en el análisis de datos de dominio específico que he visto .

Las fórmulas están en los manuales. Si tuvieran un conocimiento y experiencia similares, elegiría al que expone mejor / más:

  1. experiencia en el dominio me interesante , que es el resultado de:
  1. suficiente fondo teórico (y realmente no me importa, si uno no puede calcular la integral compleja o recitar el teorema de Radón-Nikodym cuando no es necesario),
  2. experiencia pasada, definida por el número de intentos y … falla
  3. capacidad natural para resolver y comprender cierto tipo de problemas.
  • conciencia de posibles trampas y trampas : esto es el resultado de la experiencia y la capacidad de “sentir” el problema
  • flexibilidad en la combinación de herramientas
  • compromiso y disposición para aprender cosas nuevas
  • las mejores habilidades de comunicación: si no puede describirlo en palabras (relativamente) simples, realmente no lo entiende …
  • el conocimiento sobre dónde buscar respuestas, fórmulas y teoremas, cuando sea necesario.
  • Nota: No puse el tipo de educación o diplomas en ningún punto.

    Por supuesto, esta es solo mi opinión y es posible que no esté de acuerdo. Pero piénsalo.

    Si todos tienen las mismas habilidades y experiencia en los campos en los que se entrenaron, así como la misma cantidad de habilidades de codificación y análisis, entonces realmente no importa demasiado, aunque la única persona que probablemente evitaría es científico de la computación. Raramente veo científicos informáticos que sepan suficientes matemáticas para que funcione. De hecho, es por eso que terminé obteniendo un postgrado en Matemáticas, simplemente porque las Ciencias de la Computación e Ingeniería de Software simplemente no son suficientes, a veces incluso en ciencias de la computación.

    Luego se reduce a si el matemático tiene suficiente experiencia práctica o tiene experiencia en matemática aplicada para comprender los datos que está leyendo en términos reales. Si bien las matemáticas puras son una excelente asignatura, y casi todos los que conozco que son programadores excepcionales han estudiado matemáticas como licenciatura, su conocimiento de estadísticas puede ser variable y esto puede dificultarles comprender la investigación y la experimentación, así como el significado y Curiosamente, las limitaciones de los enfoques estadísticos utilizados (lo sé, eso también me sorprendió), a pesar de que te sorprenderán con el tipo de soluciones elegantes que pueden encontrar.

    Los físicos, siempre que sus matemáticas aplicadas sean sólidas, tienden a ser los mejores de los 3 en términos prácticos. Su resolución de problemas es excelente (no tan elegante en términos irrestrictos como los matemáticos), toman menos tiempo para llegar a conclusiones prácticas y significativas y, mejor aún, entienden la investigación, la experimentación y las estadísticas de forma inmediata (los términos covariable, inferencia bayesiana, la paradoja de Simpson) , error tipo 1 y tipo 2, etc. no los asuste).

    Entonces, fuera de su lista, la persona más adecuada, si el matemático no es un matemático aplicado, es el físico.

    Sin embargo, si obtiene un investigador de operaciones o un estadístico, suponiendo que no se aplique un científico de datos, entonces sería más adecuado aún.

    En primer lugar, esto suena como el comienzo de un chiste malo jaja.

    Más en serio, olvídate de sus currículums similares o marcas similares, etc. Idealmente, el proceso debería consistir en destacar la experiencia práctica y la capacidad de resolución de problemas de un candidato. Tal vez refine sus técnicas de entrevista para ayudar a diferenciar cómo los candidatos abordan un problema, luego elija el candidato que se ajuste a sus criterios. Esto podría ir de varias maneras diferentes.

    Además, como muchos otros probablemente han mencionado, la ciencia de datos es MUY específica del dominio. En su posición, buscaría un solicitante que haya demostrado resolver desafíos similares a los que enfrenta o alguien que haya demostrado la capacidad de aprender rápidamente y adaptarse.

    Espero que esto ayude. Avísame si tienes más preguntas.

    Según yo, un matemático debería ser la opción preferida.

    La razón: un científico de la computación puede sobresalir en computación, pero requeriría una formulación adecuada y técnicas de implementación en caso de dificultades de cálculo y errores.

    Un físico definitivamente tendría una mejor comprensión de las soluciones a estas dificultades, pero como el perfil del trabajo se centra más en el análisis estadístico y el pronóstico en un período de tiempo muy corto y en el manejo de grandes cantidades de datos con complejidades, la mente inquisitiva lógica no sería más cómodo para adaptarse a procedimientos de esfuerzo monótonos.

    En el mejor lado, un matemático junto con experiencia en el campo, habituado a tales técnicas y procesos de resolución de problemas, será la persona más adecuada para el puesto. Como mencionas que la persona es lo suficientemente capaz de manejar lenguajes de computación, la mayoría de las casillas están marcadas a favor del matemático.

    Hay un puesto de científico de datos para ser ocupado. Tengo la opción de elegir entre matemático, informático y físico. ¿A quién debo contratar?

    Ok, si suponemos, que teóricamente los tres tienen el mismo nivel de conocimiento de aprendizaje automático, visualización de datos y programación; casi hasta el punto de triplicar a la persona en los diferentes dominios, diría el físico.

    ¿Por qué? Debido a que tiene un dominio experto en algo más pragmático y eso le da una ventaja, por lo que es más fácil traducir ese conocimiento a campos aún más aplicados como las finanzas. Tener un dominio experto aparte de la ciencia de datos siempre le da una ventaja en el diagnóstico de problemas y en hacer las preguntas correctas.

    Me encantan las respuestas cortas y útiles, así que espero que esta respuesta sea breve y útil también.

    Creo que tienes que elegir a alguien con experiencia en CS y fundamentos matemáticos

    Y lo más importante, tener buenas habilidades en análisis

    Para no perder el tiempo tienes que elegir a alguien como yo 🙂 #fun