¿Qué clases debería tomar en BITS Pilani si estoy interesado en Data Science?

Solo he estado trabajando en este campo durante algún tiempo al sur de 3 años, por lo que no puedo dar una lista exhaustiva. Lo que haré es enumerar qué cursos de BITS me han sido útiles en los últimos 3 años, creo que podría ser lo mejor que puedo responder.
Aquí están en orden decreciente de uso:
1. Minería de datos por Poonam Goel mam. Este es probablemente el más útil. De hecho, ayer utilicé un concepto de la clase en un problema. Mantenga el libro a mano.
2. Estructuras de datos y algoritmos (Sundar B señor) / Gráficos y redes. Estos cursos son útiles si escribe código en cualquier lugar, sin embargo, en problemas basados ​​en datos, un algoritmo O (n) y O (n ^ 2) puede tener diferencias en tiempo de ejecución como pocos días / pocos años. Por lo tanto, saber elegir el DS / algoritmo correcto es extremadamente importante. Mi observación común es que la mayoría de los analistas apestan con esto, por lo que los que saben esto tendrán una ventaja demasiado grande.
3. Teoría de la base de datos / Procesamiento de datos: todo el SQL será muy útil, al igual que los modelos de datos y los conceptos de indexación.
4. Opti / OR: Esto se usa MUCHO en Machine Learning, pero no exactamente el que se destaca en el campus. El capítulo 19 en Taha hablando sobre Grad Descent será lo que uno usará más en Machine Learning. La teoría de colas es útil si está creando partes de sistemas distribuidos (como zookeeper) / servidores.
5. Aprendizaje automático: no tomé este curso en el campus mientras leía ML del curso de Ng, pero mis amigos que hicieron esto dijeron que era bastante intuitivo.
6. Maths2: Linear Algebra es útil, ya que la mayoría de ML está en Linear Algebra. pero reaprendo partes importantes. No me gustó el curso en el campus.
7. ProbStat: varias distribuciones y sus aplicaciones / simulación. Estoy más interesado en las redes neuronales y las tareas de aprendizaje automático. Un científico de datos más interesado en el análisis estadístico clasificará este curso muy por encima.
8. Computación paralela: La primera mitad del curso fue básicamente cómo construir un clúster (que nunca uso). El uso en el mundo real es práctico. MPI (SIMD) / Cilk / openMP (Paralelismo de datos), son conceptos que uno usará en el mundo real para paralelizar programas.
OS / CoArch son necesarios para comprender la infraestructura de la nube.
Espero que esto sea útil para aquellos que quieran ocupar el campo.

  • Recuperación de información
  • Reconocimiento de patrones
    Además, se supone que el curso de Machine Learning de Andrew Ng (el actual, no la versión diluida en CourseEra) disponible en YouTube es muy bueno.

Todavía no me he graduado, pero estoy a punto de hacerlo, así que toma mi opinión con la cantidad de sal que consideres necesaria.

Los cursos obvios que debes hacer:
1) aprendizaje automático
2) Minería de datos
3) inteligencia artificial
4) Recuperación de información (recientemente introducido)

También sugeriría encarecidamente Opti. Sentí que Machine Learning era un curso avanzado de Opti, eso es todo. Entonces, sí, es posible que Opti no se enseñe tan bien en BITS, pero puede estudiar los temas correctamente por sí mismo.

Otro curso que puede considerar es la econometría. Solo abordan la regresión en este curso, pero puedes aprender muchas técnicas estadísticas que creo que son importantes para comprender conceptos avanzados en ciencia de datos.

La ciencia de datos también requiere mucha intuición y qué mejor manera de desarrollar su intuición que algunos proyectos. Definitivamente tome una COP / SOP con un profesor que esté dispuesto a trabajar con usted en este campo.