★★★
Completé 8/9 cursos en Johns Hopkins Data Science Specialization y los tomé gratis en su primera oferta. De hecho, tomé el noveno y último curso más detalles a continuación. No completé el proyecto final ya que necesita obtener un certificado verificado en los 9 cursos. Nota final para el contexto, tomé tres clases a la vez, que no recomiendo para los nuevos en Data Science, Statistics, Machine Learning y R.
Estoy de acuerdo con lo que se ha dicho aquí, especialmente en la respuesta de Nishant Gupta a ¿Vale la pena pagar 9 x $ 49 ($ 441) por una especialización en ciencia de datos en Coursera? ¿Alguien puede darme algunos buenos recursos para ciencia de datos, aprendizaje automático o minería de datos?
Mi experiencia : matemática y química en la universidad. Programador autodidacta. Tomé varias clases de estadísticas en línea y la clase de aprendizaje automático de Andrew Ng antes de completar la especialización.
- ¿Cuáles son los factores políticos, ambientales, sociales, tecnológicos o económicos y legales (pestel) que afectarán en el futuro más cercano la vida de los estudiantes universitarios en el Reino Unido?
- ¿Cuáles son las tecnologías típicas y nuevas que están adoptando las instituciones de educación superior para el diseño de instrucción, entrega de contenido, conferencias, tareas, etc., con el objetivo de mejorar la efectividad y el resultado?
- ¿Qué es la tecnología CryptoNote?
- ¿Qué debo buscar en una tableta para usar en el aula?
- ¿Cuáles son las mejores plataformas de evaluación bajo demanda para un inicio de preparación de prueba?
Divulgación completa : actualmente trabajo en Udacity.
VISIÓN DE CONJUNTO
Los cursos enseñan cómo usar R y abordar algunos aspectos de alto nivel de hacer ciencia de datos.
No creo que estos cursos sean “amigables para principiantes”. Del post de Nishant Gupta …
“Si usted es nuevo en el campo de la ciencia de datos o análisis, puede que este no sea el primer recurso que deba buscar. Una comprensión decente de las estadísticas, las técnicas de ML serían útiles para obtener el máximo provecho de estos cursos”.
Los cursos NO son excelentes para aprender los detalles de los algoritmos de Machine Learning o para obtener una comprensión profunda de las estadísticas.
Los primeros tres cursos de la serie son particularmente fáciles, y luego la dificultad comienza a aumentar rápidamente. Si tiene poca o ninguna experiencia en programación, es probable que se quede atascado en pequeños pasos en las tareas de programación (que no siempre se cubren o explican en los materiales del curso). Busqué en los foros y formulé preguntas para despegarme.
Si está buscando aprender R para el análisis de datos, entonces creo que los primeros cuatro cursos de la Especialización pueden ponerlo en funcionamiento.
MEJORES PIEZAS
Encontré que el Análisis Exploratorio de Datos y el Aprendizaje Automático Práctico son clases útiles. Me fui con habilidades y pude compartir el proyecto final como una demostración de esas habilidades.
Realmente disfruté el curso sobre Investigación reproducible también. Es genial pensar cómo puedes colaborar con otros y compartir resultados.
El análisis exploratorio de datos enseña cómo explorar datos a través de visualizaciones. El curso enseña cómo usar el paquete de gráficos base y el paquete de celosía en R. Prefiero el paquete ggplot2 para hacer gráficos, ya que me resulta más fácil de usar.
El aprendizaje automático práctico enseña cómo ejecutar algoritmos de aprendizaje automático en R y cómo evaluarlos. Hay mucho que aprender por tu cuenta en el curso. El proyecto final fue interesante.
PEORES PIEZAS
Dos clases, Inferencia estadística y Modelos de regresión, carecían de instrucción y evaluaciones de calidad. El profesor leyó principalmente de diapositivas con algunos ejemplos trabajados. Los modelos de regresión fueron ligeramente mejores. También esperaba más oportunidades para practicar con los conceptos matemáticos. Hubo tal vez 5 preguntas a la semana en el curso de inferencia estadística.
Para la clase de inferencia estadística, se cubrió demasiado contenido en cuatro semanas. Como señaló acertadamente un estudiante, el curso debería llamarse “Una revisión de la inferencia estadística”. Sería increíblemente difícil aprender el material en esa clase sin haber tomado otros cursos de Probabilidad y Estadística. Me encontré confiando en dos de mis cursos de estadística de nivel universitario para llenar los vacíos.
Finalmente, el ejemplo de la aplicación Shiny en el Desarrollo de productos de datos no fue inspirador. No hice el proyecto final porque no tenía ideas sólidas para una aplicación. Creo que esto también se debió a mi propia falta de motivación, así que no pretendo criticar la instrucción.
ANTES DE TOMAR LA ESPECIALIZACIÓN
1. Obtenga exposición a R.
Recomiendo estas opciones para obtener algo de experiencia con R. Todos son gratuitos.
Prueba R
remolino: Aprenda R, en R.
Análisis exploratorio de datos usando R (creé esta clase con el equipo de ciencia de datos de Facebook)
Curso gratuito de introducción a la programación en línea de R
2. Construya su fondo de estadísticas.
Statisics One [Princeton] de Patrick Conway (enseña cómo hacer pruebas estadísticas y cálculos en R)
Mine Çetinkaya-Rundel’s Análisis de datos e inferencia estadística (o DASI) [Duke] y el curso complementario de Análisis de datos e Inferencia estadística.
Los dos cursos mencionados anteriormente son rigurosos y tienen instrucción y evaluación de alta calidad.
Udacity también ofrece dos cursos de estadística. Si nunca ha tomado estadísticas o necesita un repaso, los dos cursos a continuación son excelentes lugares para comenzar.
Introducción a la estadística descriptiva: Matemáticas para comprender los datos
Estadística inferencial: aprenda análisis estadístico
3. Tome un curso de álgebra lineal. Vea las conferencias de Gilbert Strang sobre MIT OCW y resuelva problemas relacionados en el sitio de OCW.
Álgebra lineal te ayuda a comprender el curso de Modelos de regresión.
4. (Opcional) Tome el curso de aprendizaje automático de Andrew Ng .
El conocimiento de álgebra lineal y cálculo lo ayudará a comprender las matemáticas detrás de los algoritmos y cómo los parámetros de ajuste afectan los algoritmos en tiempo de ejecución y sus resultados.