¿Cuál es su opinión sobre Coursera Data Science Specialization Track?

★★★

Completé 8/9 cursos en Johns Hopkins Data Science Specialization y los tomé gratis en su primera oferta. De hecho, tomé el noveno y último curso más detalles a continuación. No completé el proyecto final ya que necesita obtener un certificado verificado en los 9 cursos. Nota final para el contexto, tomé tres clases a la vez, que no recomiendo para los nuevos en Data Science, Statistics, Machine Learning y R.

Estoy de acuerdo con lo que se ha dicho aquí, especialmente en la respuesta de Nishant Gupta a ¿Vale la pena pagar 9 x $ 49 ($ 441) por una especialización en ciencia de datos en Coursera? ¿Alguien puede darme algunos buenos recursos para ciencia de datos, aprendizaje automático o minería de datos?

Mi experiencia : matemática y química en la universidad. Programador autodidacta. Tomé varias clases de estadísticas en línea y la clase de aprendizaje automático de Andrew Ng antes de completar la especialización.

Divulgación completa : actualmente trabajo en Udacity.

VISIÓN DE CONJUNTO

Los cursos enseñan cómo usar R y abordar algunos aspectos de alto nivel de hacer ciencia de datos.

No creo que estos cursos sean “amigables para principiantes”. Del post de Nishant Gupta …

“Si usted es nuevo en el campo de la ciencia de datos o análisis, puede que este no sea el primer recurso que deba buscar. Una comprensión decente de las estadísticas, las técnicas de ML serían útiles para obtener el máximo provecho de estos cursos”.

Los cursos NO son excelentes para aprender los detalles de los algoritmos de Machine Learning o para obtener una comprensión profunda de las estadísticas.

Los primeros tres cursos de la serie son particularmente fáciles, y luego la dificultad comienza a aumentar rápidamente. Si tiene poca o ninguna experiencia en programación, es probable que se quede atascado en pequeños pasos en las tareas de programación (que no siempre se cubren o explican en los materiales del curso). Busqué en los foros y formulé preguntas para despegarme.

Si está buscando aprender R para el análisis de datos, entonces creo que los primeros cuatro cursos de la Especialización pueden ponerlo en funcionamiento.

MEJORES PIEZAS

Encontré que el Análisis Exploratorio de Datos y el Aprendizaje Automático Práctico son clases útiles. Me fui con habilidades y pude compartir el proyecto final como una demostración de esas habilidades.

Realmente disfruté el curso sobre Investigación reproducible también. Es genial pensar cómo puedes colaborar con otros y compartir resultados.

El análisis exploratorio de datos enseña cómo explorar datos a través de visualizaciones. El curso enseña cómo usar el paquete de gráficos base y el paquete de celosía en R. Prefiero el paquete ggplot2 para hacer gráficos, ya que me resulta más fácil de usar.

El aprendizaje automático práctico enseña cómo ejecutar algoritmos de aprendizaje automático en R y cómo evaluarlos. Hay mucho que aprender por tu cuenta en el curso. El proyecto final fue interesante.

PEORES PIEZAS

Dos clases, Inferencia estadística y Modelos de regresión, carecían de instrucción y evaluaciones de calidad. El profesor leyó principalmente de diapositivas con algunos ejemplos trabajados. Los modelos de regresión fueron ligeramente mejores. También esperaba más oportunidades para practicar con los conceptos matemáticos. Hubo tal vez 5 preguntas a la semana en el curso de inferencia estadística.

Para la clase de inferencia estadística, se cubrió demasiado contenido en cuatro semanas. Como señaló acertadamente un estudiante, el curso debería llamarse “Una revisión de la inferencia estadística”. Sería increíblemente difícil aprender el material en esa clase sin haber tomado otros cursos de Probabilidad y Estadística. Me encontré confiando en dos de mis cursos de estadística de nivel universitario para llenar los vacíos.

Finalmente, el ejemplo de la aplicación Shiny en el Desarrollo de productos de datos no fue inspirador. No hice el proyecto final porque no tenía ideas sólidas para una aplicación. Creo que esto también se debió a mi propia falta de motivación, así que no pretendo criticar la instrucción.

ANTES DE TOMAR LA ESPECIALIZACIÓN

1. Obtenga exposición a R.

Recomiendo estas opciones para obtener algo de experiencia con R. Todos son gratuitos.

Prueba R
remolino: Aprenda R, en R.
Análisis exploratorio de datos usando R (creé esta clase con el equipo de ciencia de datos de Facebook)

Curso gratuito de introducción a la programación en línea de R

2. Construya su fondo de estadísticas.

Statisics One [Princeton] de Patrick Conway (enseña cómo hacer pruebas estadísticas y cálculos en R)

Mine Çetinkaya-Rundel’s Análisis de datos e inferencia estadística (o DASI) [Duke] y el curso complementario de Análisis de datos e Inferencia estadística.

Los dos cursos mencionados anteriormente son rigurosos y tienen instrucción y evaluación de alta calidad.

Udacity también ofrece dos cursos de estadística. Si nunca ha tomado estadísticas o necesita un repaso, los dos cursos a continuación son excelentes lugares para comenzar.

Introducción a la estadística descriptiva: Matemáticas para comprender los datos
Estadística inferencial: aprenda análisis estadístico

3. Tome un curso de álgebra lineal. Vea las conferencias de Gilbert Strang sobre MIT OCW y resuelva problemas relacionados en el sitio de OCW.

Álgebra lineal te ayuda a comprender el curso de Modelos de regresión.

4. (Opcional) Tome el curso de aprendizaje automático de Andrew Ng .
El conocimiento de álgebra lineal y cálculo lo ayudará a comprender las matemáticas detrás de los algoritmos y cómo los parámetros de ajuste afectan los algoritmos en tiempo de ejecución y sus resultados.

★★

Soy un desarrollador de software sin experiencia en R o en ciencia de datos. No necesito estos cursos para mi trabajo, pero pensé que los tomaría solo por aprender algo nuevo.

Completé con éxito los dos primeros cursos “Programación R” y “La caja de herramientas del científico de datos”. Ambos con distinción (ganados 100%).

Los cursos dieron una introducción general al campo y a R. En mi humilde opinión, no fueron lo suficientemente buenos. Específicamente, el curso R fue muy ecléctico y poco profundo. Gran parte del material requerido para los ejercicios se mencionó brevemente en las conferencias en video, pero lo que realmente me molestó es que las conferencias parecían describir un conjunto de temas poco relacionados en lugar de construir un conjunto de conocimientos desde cero, que es Mi forma preferida de aprender un idioma.

Después de completarlo, sigo sin sentir que tengo un buen conocimiento de los principios básicos y la filosofía del idioma, que es lo que esperaba de un curso de introducción de idiomas.

Decidí no continuar con la pista por ahora, no porque el campo no sea interesante sino porque los cursos no eran lo suficientemente buenos.

He terminado 5/9 cursos en la especialización hasta ahora.

Aspectos positivos: es relativamente barato 49 dólares al mes. Conozco a un científico de datos que obtuvo su trabajo en gran parte porque completó la especialización.

Negativos: todo está estrictamente en R. Hay muy poco aprendizaje automático. Más de una especialización de analista de datos.

Curso 1 Caja de herramientas del científico de datos:

Básicamente, solo asegurándome de que todos sepan cómo instalar R y usar github. La especialización ha cambiado a un modelo de suscripción, por lo que ya no está tirando 49 dólares por el desagüe, pero si solo está tomando este curso, puede ser un desperdicio de su dinero. Este curso se puede completar en una hora. El video a continuación es un enlace a cuál fue el proyecto final para el curso.

Revisión: La caja de herramientas del científico de datos (JHU Coursera, Curso 1) – Hacia la ciencia de datos

Curso 2 Programación R:

Curso muy útil para aprender R. Probablemente demasiado difícil para principiantes en R.

Revisión: Programación R (JHU Coursera, Curso 2) – Hacia la ciencia de datos

Curso 3 Obtención y limpieza de datos:

El proyecto fue muy útil ya que hace que alguien descargue archivos, descomprima, limpie y organice un archivo de datos. Irónicamente, estaba haciendo algo similar en el trabajo la misma semana, haciéndome pensar muy bien sobre el curso.

Revisión: Obtención y limpieza de datos (JHU Coursera, Curso 3) – Hacia la ciencia de datos

Curso 4 Análisis de datos exploratorios:

Esta clase consistía principalmente en trazar en R. Ploteo básico y ggplot.

Revisión: Análisis de datos exploratorios (JHU Coursera, Curso 4) – Hacia la ciencia de datos

Curso 5 Investigación reproducible

Esta clase solo estaba aprendiendo R Markdown. Tenga en cuenta que todavía no he hablado sobre el aprendizaje automático ni nada por el estilo.

Revisión: Investigación reproducible (JHU Coursera, Curso 5) – Hacia la ciencia de datos – Medio

¿Qué tal construir los cimientos?

Coursera no es un libro donde puedes obtener todo de él. Simplemente construye bases en los estudiantes, lo cual es una de las mejores cosas de Coursera.

Hablando de la ruta / pista de especialización, las rutas dadas son correctas PERO nuevamente depende de las universidades que imparten los cursos. Lograr el objetivo se puede hacer de muchas maneras, ya sea que sigas de una forma u otra, eventualmente obtendrás lo que has intentado.

Puedes convertirte en científico de datos de muchas maneras, pero sigamos con una hoja de ruta / ruta. Seguir múltiples caminos solo te confundirá y no te llevará a ninguna parte.

Hablando sobre la certificación, según un informe reciente publicado en (Comunidad de Tecnología e Informática en India), el 57% dice que no importa si tiene una certificación o no. Su conocimiento y experiencia realmente supera la certificación. No creo que necesites un recibo de nadie para demostrar tus habilidades. Realmente no tengo ningún tipo de certificación, pero aún así estoy muy bien.

Nota al pie: Intente terminar los cursos de coursera que construirán los cimientos necesarios para trabajar en conceptos más avanzados. Los libros son realmente verdaderos amigos de los humanos. Si realmente está buscando algún tipo de guía sobre la carrera en ciencia de datos y cuáles son los libros disponibles para consultar, lea este artículo: la respuesta de Akash Dugam a ¿Cuáles son los buenos libros para “científico de datos” y “análisis de datos” para ¿principiante?

He creado la hoja de ruta basada en mi experiencia para convertirme en científico de datos. Aquí puede encontrarlo: la respuesta de Akash Dugam a ¿Dónde empiezo y cuál es el proceso paso a paso para convertirse en un Científico de Datos?

¿Te gustan las tecnologías de big data? quiere probar suerte en big data, esto es lo que está buscando, la respuesta de Akash Dugam a ¿Cuáles son las habilidades necesarias para los trabajos de big data?

Gracias por A2A,

Gracias.

PD: Puedes enviarme un mensaje si necesitas más ayuda.

★★★★

Estoy a más de la mitad del camino de especialización y siento que me ha dado una buena base para Data Science. Sin embargo, no puedo decir que tendré las habilidades necesarias para seguir Data Science como carrera.

Está centrado en R y me encanta R, pero a medida que practico con él fuera de los cursos, encuentro que faltan algunas cosas (fuera de Estadística y Matemáticas en general), en cuyo caso recurro a Python o Ruby.

Hay un curso en particular, inferencia estadística, que tuve muchas dificultades para afrontar y las conferencias parecen apresuradas, pero encontré otro curso de Coursera, el curso de análisis de datos e inferencia estadística de la Universidad de Duke, un gran complemento ya que abordaba los mismos conceptos mucho mejor y más en profundidad.

Diría que ha valido la pena hasta ahora (ya que soy nuevo en este campo), aunque iría por otros cursos y pistas más avanzados relacionados con la ciencia de datos una vez que termine esto, ya que siento que esta pista en particular es no es suficiente.

Editar (1 de diciembre de 2015): He completado los nueve cursos, y tomaré el Capstone en unos días.

Editar (6 de febrero de 2016): Pasé el Capstone y ya obtuve mi Certificado de Especialista. La experiencia de Capstone fue principalmente de bricolaje con muy poca orientación de conferencias y notas. Estás bastante solo.

★★★

Mi experiencia: soy un estudiante de maestría en informática y tengo algunos conocimientos de R.

Hay muchos buenos recursos para aprender R, pero creo que la especialización de ciencia de datos de John Hopkin en Coursera simplemente no es una de ellas.

El contenido de algunos cursos no tiene una sensación estructurada, tal vez porque tuvieron que fragmentar su oferta anterior de análisis de datos en Coursera en una serie de 9 cursos. Por ejemplo, durante la clase “Análisis de datos exploratorios”, se mencionaron algoritmos de agrupamiento y análisis de componentes principales que se describieron en detalle. Puedo ver cómo eso puede ser discordante y confuso para las personas que se inscribieron para aprender sobre el análisis exploratorio de datos.

Las tareas de programación para el “curso de programación R” también fueron muy ingeniosas. Sentí que estaba tratando de simular consultas SQL usando un código R bastante torpe en lugar de familiarizarme con las estructuras de datos y los aspectos de programación funcional de R

Navegué por el curso práctico de aprendizaje automático que introdujo muy brevemente árboles de decisión y algunos métodos de conjunto como embolsado, refuerzo y bosque aleatorio. Lo que me llamó la atención fue la introducción bastante exhaustiva del uso de la biblioteca Caret para dividir datos, ajustar y comparar modelos. Creo que esta es definitivamente una gran inclusión para un curso práctico de aprendizaje automático, ya que realmente simplifica el preprocesamiento, ajuste y validación de datos. Las personas interesadas en saltar a Kaggle definitivamente deberían echarle un vistazo. El profesor también señala algunos excelentes recursos como “Introducción al aprendizaje estadístico” para aprender más sobre la aplicación de algoritmos de aprendizaje automático en R.

(Aquellos que estén interesados ​​en aprender más sobre el paquete Caret deben consultar el libro de Modelado predictivo aplicado que fue escrito por el autor del paquete de cuidados Max Kuhn)

No he tomado los 9 cursos, pero por lo que he visto, probablemente no recomendaré esta pista de especialización de ciencia de datos a nadie que no esté familiarizado con R.

★★★

He completado los 9 cursos y me han gustado la mayoría. Creo que son el punto de partida para aprender ciencia de datos. Intentaron cubrir todo lo que pudieron pero no lo hicieron profundamente.

Nunca trabajé en el curso de Programación R y R, me dio una idea básica de usar R. Aunque no cubrieron mucho sobre R, pero haciendo pruebas y tareas aprendí muchas cosas sobre R y luego hubo un curso sobre Obtención y limpieza de datos y cubrió a R profundamente. El próximo curso Análisis de datos exploratorios también le enseña a usar R para crear diferentes tablas / gráficos, pero nuevamente tendrá que aprender por sí mismo para una comprensión más profunda.

Solo dos cursos que menos me gustaron fueron los modelos de inferencia estadística y de regresión, tal vez no proporcionaron los fundamentos básicos. Era importante para mí porque no había estado en contacto con las teorías de probabilidad, etc. desde hace mucho tiempo.

Estos dos cursos me dieron dificultades porque tuve que ir a varios sitios web para aprender conceptos básicos. Te sugiero que recorras los videos en Khan Academy si estás fuera de contacto antes de tomar los dos cursos anteriores.

Practical Machine Learning no le enseñará los algoritmos de Machine Learning desde cero, sino que simplemente le enseñará cómo usar diferentes paquetes R para realizar tareas de Modelado y Machine Learning en sus datos.

Desarrollar productos de datos, investigación reproducible y caja de herramientas de científicos de datos son fáciles. No son los más importantes, pero después de estos cursos conocerá diferentes paquetes / herramientas / sitios web para presentar de manera efectiva su trabajo de ciencia de datos.

Un científico de datos representa una evolución desde el rol comercial o analista de datos. La capacitación formal es similar, con una base sólida típicamente en informática y aplicaciones, modelado, estadística, análisis y matemáticas Big Data y capacitación de Hadoop con certificación en línea.

Lo que distingue al científico de datos es la perspicacia empresarial fuerte, junto con la capacidad de comunicar los hallazgos a los líderes empresariales y de TI de una manera que puede influir en la forma en que una organización aborda un desafío empresarial. Los buenos científicos de datos no solo abordarán los problemas comerciales, sino que elegirán los problemas correctos que tengan el mayor valor para la organización.

El rol del científico de datos ha sido descrito como “analista en parte, artista en parte”. Un científico de datos es alguien que es inquisitivo, que puede observar los datos y detectar tendencias. Es casi como un individuo del Renacimiento que realmente quiere aprender y aportar cambios a una organización “.

Mientras que un analista de datos tradicional puede mirar solo los datos de una sola fuente, por ejemplo, un sistema CRM, un científico de datos probablemente explorará y examinará datos de múltiples fuentes dispares. El científico de datos examinará todos los datos entrantes con el objetivo de descubrir una información previamente oculta, que a su vez puede proporcionar una ventaja competitiva o abordar un problema empresarial urgente. Un científico de datos no solo recopila e informa sobre los datos, sino que también los mira desde muchos ángulos, determina lo que significa y luego recomienda formas de aplicar los datos.

Los científicos de datos son inquisitivos: exploran, hacen preguntas, hacen análisis de “qué pasaría si”, cuestionan los supuestos y procesos existentes

Los datos se duplican cada dos años, y todos han oído hablar de los números de crecimiento absurdos indicados en los informes. En este contexto, el resultado inevitable es la aparición del Data Scientist. Un científico de datos necesita analizar grandes cantidades de datos y proyectar el mapa tecnológico para hacer posible la transición de datos a ideas. El alcance del trabajo de un científico de datos incluye la identificación de las fuentes de datos, la calidad de los datos, las correlaciones entre los puntos de datos y la difusión a los usuarios de la información.

Por el momento, el papel de un científico de datos lo desempeña una combinación de personas en el equipo de BI, como el arquitecto del almacén de datos, el analista de negocios y otros de esa clase. A medida que la situación evoluciona, el científico de datos trabajará por encima de estos profesionales para descubrir nuevas tendencias y asociaciones que puedan estar más allá del ámbito de los modelos actuales y los problemas comerciales. El analista de negocios trabajaría en los datos que ha recopilado el científico de datos. James Kobielus, un analista senior de Forrester, en su negocio, llega a comparar el trabajo de un científico de datos con el trabajo de científicos en ciencias naturales y ciencias sociales, afirmando que necesitarían datos de observación y datos experimentales para trabajar con. “Históricamente ( los científicos de datos ) han tenido que contentarse con meros ejemplos”. Con el surgimiento de una carrera de pleno derecho, esto pronto cambiará.

Las discusiones sobre quién está calificado exactamente para ser un científico de datos no difieren demasiado del debate que se sostuvo anteriormente sobre si, sin embargo, al principio, los expertos de la industria han indicado que un científico de datos debe tener una maestría en matemáticas o estadísticas. Mientras tanto, el CTO del grupo en Shoppers Stop dice: “Hay una escasez de profesionales a los que se les puede llamar científicos de datos. Por el momento, quien tiene pasión por trabajar con datos está llenando el vacío ”.

Un científico de datos trabajará en el desarrollo de nuevos algoritmos y presentará nuevos patrones e ideas sobre los datos que de otro modo permanecerían ocultos. “Junto con las estadísticas, un científico de datos puede tener una calificación en economía, y definitivamente necesita una docena o más de experiencia trabajando con diez a quince herramientas de BI”, dice Chuck Hollis, vicepresidente de marketing global y CTO, EMC.

un proveedor de servicios de análisis y ciencia de decisiones dice que “los científicos de datos también incursionarán en psicología experimental, antropología y ciencias sociales”. Con la necesidad de establecer centros de excelencia de BI (CoE), los análisis se institucionalizarán.

Con el advenimiento de las redes sociales impactando la mayoría de las facetas de los negocios, las organizaciones esperan integrar la tecnología, el software social y el BI para crear un ambiente agradable para la toma de decisiones. El científico de datos será responsable de proporcionar un contexto social a la información. BI y análisis bailan a una nueva melodía cuando adoptan nuevos enfoques como Hadoop. No esperan datos estructurados, limpios y prístinos, sino que trabajan con una mezcla de datos para proporcionar un análisis en tiempo real o cercano. La analítica descriptiva, la analítica inquisitiva, la analítica predictiva y prescriptiva son parte del nuevo paradigma, con el científico de datos en el centro.

Tomar la especialización de JHU Data Science en Coursera fue mi primer paso para convertirme en científico de datos. El 25 de abril de 2016, 13 meses después de comenzar la especialización, completé el Proyecto Capstone y obtuve mi certificado, ¡aquí está!

Antes de comenzar, trabajé durante un año como analista financiero después de graduarme en economía. En ese momento, sabía que eventualmente quería comenzar una carrera en ciencia de datos. los JHU Data Science Specialization fue el lugar perfecto para comenzar mi viaje, y lo recomendaría a cualquiera que esté considerando inscribirse.

Aquí hay algunas razones para inscribirse …

  • Desea aprender sobre ciencia de datos, aprendizaje automático y estadísticas .
  • Desea aprender a usar el lenguaje de programación R para el análisis de datos .
  • Desea analizar conjuntos de datos grandes ( gigabytes, no megabytes ) en sus análisis.
  • Deseas flexibilidad en tus estudios.
  • $ 500 parece más razonable que $ 3,700 o más por una oferta comparable.
  • La posibilidad de hacer productos de datos como estos es emocionante para ti
  • Competiciones de datos como Kaggle y CrowdAnalytix parecen increíbles, pero no tienes idea de por dónde empezar.
  • Desea un proyecto tangible con el que pueda hablar en una entrevista de trabajo. Aqui esta el mio
  • Desea obtener una credencial que puede guardar en su perfil de LinkedIn.

  • Desea comenzar una carrera en ciencia de datos, pero no cree que sea necesario, o al menos no piense que debería ser necesario, gastar $ 60,000 en una maestría en ciencia de datos o tener un doctorado en un oscuro subcampo de matemáticas. como 5 años de experiencia laboral como ingeniero de software.
  • Tienes una sensación de vértigo cuando resuelves un problema con datos cuantitativos. Aquí hay un momento de euforia que tuve después de completar mi proyecto para el curso Practical Machine Learning .

Estoy en el quinto curso del programa (Análisis de datos exploratorios), tengo dos títulos de posgrado en Investigación Económica y Negocios y tengo experiencia en herramientas de BI (Qlikview, Tableu), Bases de datos (T-SQL, MySQL) y estadísticas software (SAS, SPSS, R). No me llamaría Científico de Datos y tampoco lo haría después de completar este programa. Mi principal motivación para tomar el programa de especialización fue expandir mi conocimiento de R, que para el quinto curso del programa creo que he logrado mi objetivo principal. Tengo una sólida formación en estadística / economía / bases de datos, y en toda la experiencia empresarial en la implementación de soluciones relacionadas con procesos de información en entornos profesionales. Habiendo establecido mi perfil, permítame darle mi opinión personal sobre la calidad de los cursos ofrecidos. Recomiendo encarecidamente este curso a profesionales que quieran aprender más sobre la codificación R (actualmente a nivel de principiantes) y quieran tener una exposición inicial a los cursos de estadística y aprendizaje automático. Por lo tanto, probablemente sería bueno para una especialización reciente en negocios de posgrado (u otras especialidades no científicas) que trabajen en procedimientos de datos en el sector privado y quieran una introducción más formal a estos temas. Sin embargo, el programa carece de la base teórica necesaria para hacer un análisis más avanzado sobre modelos estadísticos y procedimientos de LD. Puede encontrar más útil tomar otros cursos MOOC mejor revisados ​​disponibles sobre estos temas o libros relacionados. Esté preparado para tener una buena base de álgebra lineal, cálculo, estadística / problema y programación para este propósito, algo que es imprescindible ya que el lenguaje se vuelve técnico muy rápido. Los manuales de SAS, por ejemplo, son excelentes para estadísticas avanzadas, he usado mucho sus procedimientos STAT y, a menudo, me refiero a ellos para obtener información, también lo señalan a los documentos académicos y la teoría en la que se basan los procedimientos.

Creo firmemente que la habilidad más útil después de completar estos cursos sería la gestión de datos, ya que R es un entorno realmente flexible y eficiente donde manipular sus datos de muchas fuentes, y tiene la conectividad incorporada para llamar datos desde API, Java, bases de datos relacionales, etc. También ayuda a almacenar procedimientos para la automatización posterior de los procesos de informes y es GRATUITO, por lo que democratiza el acceso a los datos.

Vería que las estadísticas y el LD funcionan con la sospecha de alguien que “solo” ha tomado este programa como fondo ya que esto requiere conocimiento sobre cómo las suposiciones “ideales” de la ruptura de datos en el mundo real, y este es el punto donde los antecedentes teóricos ayuda mucho. En mi experiencia, he visto a personas que utilizan este tipo de procedimientos de manera negligente y superficial, perdiendo una gran oportunidad de generación de valor dentro de las organizaciones en el proceso.

Un título más apropiado para este programa sería “R-Programming y casos funcionales”. Creo que la descripción del título “Ciencia de datos” es engañosa en ese sentido.

★★★★ (más de 5)

Después de haber completado 9 cursos y esperando la culminación, creo que es integral, riguroso, informativo, pero terrible en términos de pedagogía. La mayoría de los temas de DS están cubiertos, lo que lo convierte en uno de los más “completos” en términos de entrega de una tubería de DS. Sin embargo, debido a que intentaron tener una tubería completa, la mayoría de los cursos no son muy profundos. Entonces, a menos que ya esté bastante familiarizado con los temas de DS y tenga la voluntad de estudiar más cosas en paralelo a esa especialización, es probable que tenga pensamientos muy confusos sobre el nivel de competencia después de pasar por la serie DS. Elaboraré más por curso:

  • Caja de herramientas : no hablemos de esto, es demasiado introductorio.
  • Programación R : para un principiante completo, este curso es demasiado difícil. Para una persona familiarizada con R, esto es demasiado fácil. Si eres bueno con R, sientes que esta clase es un desperdicio. Si eres nuevo con R, sentirás que esta clase es demasiado compacta.
  • Obtención y limpieza de datos : la clase más bien enseñada, útil e importante de toda la serie DS, debo decir. Este curso tiene de todo, desde cargar datos (no es trivial hasta transformar y discutir datos. También enseñan expresiones regulares, muy buenas. Dplyr , un paquete de discusión de datos muy popular, y tidyr , están bien cubiertos. Esta clase es imprescindible y muy útil Por su nombre, puede adivinar que le enseña a hacer el trabajo más fundamental en DS: obtener y procesar los datos sin procesar.
  • Análisis exploratorio de datos : no está mal, pero tampoco es genial. Te enseña a trazar, pero realmente no enseñas las intuiciones o la lógica detrás de esto, cuándo usar qué gráficos, cuándo y cómo usar colores, bla, bla. Le sugiero que empareje esta clase con la visualización de datos de Illinois.
  • Investigación reproducible : esta clase es otra clase bien enseñada y muy útil en esta serie. Te enseña cómo producir documentos de rebajas y publicar tus trabajos.
  • Inferencia estadística : bueno, considero esta clase como un “solo pase por el bien de la serie”. Es demasiado codicioso con los conceptos enseñados pero no es exhaustivo en las explicaciones. Entonces, si eres nuevo con las estadísticas, te sugiero que tomes más clases de estadísticas para compensar esta.
  • Modelos de regresión : una clase bien enseñada que realmente puede ponerlo en un nivel intermedio de comprensión para los modelos de regresión. Este curso me parece más completo para enseñar este tema que muchas de las clases equivalentes. Las conferencias son súper secas, pero útiles.
  • Aprendizaje automático práctico : bueno, es una clase divertida. Pero es demasiado fácil, por lo que limita entre una broma de una clase de aprendizaje automático y una buena experiencia de aprendizaje.
  • Productos de datos de desarrollo : clase muy útil, puede destacarse si puede ofrecer productos de datos increíbles. Bueno, tenga en cuenta que necesita tener alguna voluntad para ir más allá del requisito muy indulgente del curso.
  • Capstone : otra oportunidad de ser bueno en el desarrollo de productos de datos. Sin embargo, no lo convertirá en un experto clave rápido, teniendo en cuenta que el algoritmo principal es N-gram (que se enseña en muchas clases de programación para principiantes). Creo que Swift key algo es 1000 veces más complicado y personalizado que el desarrollado en este capstone.

Entonces, mi conclusión es: si solo cumple con los requisitos básicos para aprobar todas las clases, esta serie solo puede colocarlo en un nivel de principiante y probablemente se desperdicie dinero. Sin embargo, si aprovecha los proyectos de cursos abiertos y aprende más cosas para producir trabajos que valgan la cartera (una o dos muescas por encima de los requisitos básicos), puede sentir que esta serie es un viaje bastante valioso. Dicho esto, la pedagogía causará mucha frustración.

★★★★★

Tomé la versión gratuita de los cursos y me encantaron.

Estoy completamente de acuerdo con los demás en que los cursos iniciales fueron realmente fáciles y para alguien que sabe incluso un poco, puede parecer aburrido. Sin embargo, recuerdo haber tomado el curso de aprendizaje de Andrew Ng Machine años atrás y me resultó demasiado difícil continuar. Desde esa perspectiva, encontré estos cursos motivadores ya que sentí que podía completarlos.

Entonces, ¿serás maestro de Data Science después de este curso? ¡NO! Es más probable que tenga el conocimiento suficiente para comenzar a aprender ciencia de datos después de eso. Aunque le dará pequeños pasos, le quitará el miedo. Y para mí eso es lo suficientemente bueno como para recomendar este curso a cualquiera.

Ah, y por supuesto, siempre he visto el video en 1.5x o 2x

Positivos:

  • Puede ayudarlo a aprender varias herramientas / tecnologías necesarias para explorar el campo de la ciencia de datos de una manera temporal
  • Curso como análisis exploratorio, investigación reproducible, programación R, aprendizaje automático práctico son buenos.
  • Realmente me gustan los ejercicios Swirl (una herramienta de enseñanza interactiva)
  • El proyecto Capstone es realmente bueno
  • Los foros de discusión son un gran lugar. Hay personas increíbles por ahí sin ellos Capstone es imposible.

Sugerencias de mejoras:

  • Las clases del profesor Roger Peng son buenas. Me ha dado base para una parte posterior de la especialización y pegado a la pista hasta el final. Otros profesores también son buenos pero un poco difíciles de seguir en algunos de los cursos debido a un gran programa de estudios o probablemente debido a muchas matemáticas involucradas.
  • Cursos como inferencia estadística, modelos de regresión a veces no son fáciles de seguir con un amplio programa de estudios. Creo que se necesita una reestructuración junto con diapositivas y videos.
  • El proyecto Capstone es bueno pero no hay una ayuda sólida.
  • Creo que debería haber al menos una clase sobre procesamiento del lenguaje natural. Capstone se basa en gran medida en PNL y no hay mención de PNL en 9 cursos.
  • Es posible que deberían introducir un nuevo lenguaje como Python, etc. R está bien, pero a veces puede alcanzar el límite de memoria principalmente cuando se trata de grandes corpus, esto se debe a que contiene todos los objetos en la memoria virtual

Bueno, aprendí mucho durante la pista de las fuentes internas y externas. Tomé cursos sobre álgebra lineal y probabilidad antes de comenzar el curso. También tomé la clase de aprendizaje automático Andrew NG , que me ayudó mucho a comprender temas como la regresión lineal, las regresiones logísticas, las redes neuronales artificiales, la creación de modelos de aprendizaje automático, etc.

La especialización general es en general buena. Puede ayudar a uno a introducirse en un nuevo campo de manera oportuna.

Me llevó poco más de 9 meses completar el curso. Por lo tanto, requiere mucha dedicación, enfoque y gestión del tiempo con su trabajo actual.

Mi proyecto final de Capstone se ejecuta en https://ppant.shinyapps.io/nextWordPredict/

y abajo está mi certificado:

https://www.coursera.org/account

★★

Tomé los primeros 3 cursos. Graduado con distinción en todos los 3. Al mismo tiempo estoy tomando Machine Learning por Andrew Ng.

3 palabras sobre los cursos de JHU: No calidad universitaria.

La mayoría de las diapositivas están siendo “leídas” por los instructores. Compare eso con el estilo de Andrew en ML, donde Andrew realmente explica y agrega más valor que lo que está escrito en las diapositivas.

Después de 3 cursos de John Hopkins y 7 semanas de ML de Andrew, puedo afirmar con seguridad que conozco a Octave mucho mejor que R.

Si quieres que aprenda a patinar sobre hielo, hazme jugar hockey, no expliques la mecánica del patinaje.

La especialización en ciencia de datos de John Hopkins es bastante buena. pero no es para principiantes, que no tienen información básica de R. pero siempre puedes enseñarte a ti mismo y dado que R es el lenguaje de programación creado específicamente para estadísticos y tiene muchas más capacidades que otro lenguaje como Python (aunque me encantó trabajando con python, ya que es más como un cuchillo suizo para el desarrollo de software, muy versátil y práctico).

Comencé la especialización en enero de 2018 y hasta ahora he completado los cursos 1 a 3.

A continuación se presenta una breve introducción del sofá de los cursos.

1.La caja de herramientas del científico de datos

el curso introductorio 1 no puede considerarse un curso 1, ya que era demasiado fácil y tenía una introducción a las herramientas que usaremos en los cursos que siguieron.

2.R Programación

El curso de programación R le presenta los conceptos básicos de R, en conceptos como:

  • objetos atómicos
  • matriz, lista de marcos de datos.
  • Funciones de bucle
  • Funciones de control, función definida por el usuario
  • Alcance
  • Depuración
  • Funciones de bucle: las infames funciones de aplicación
  • Simulaciones, Perfiladores

Pasarlo no es tarea fácil si no te sientes cómodo con “R”.

Los paneles de discusión en curso son de gran ayuda y le darán una idea de los problemas que enfrenta.

Obtener y limpiar datos

Este capítulo da una idea de los conceptos de

  • Datos ordenados
  • Obtener datos en formatos diff (excel, texto, MySQL, web, Api, json, etc.)
  • introduce conceptos en la biblioteca Dplyr en funciones como seleccionar, filtrar, resumir, organizar, agrupar, etc., son útiles cuando se trata de la limpieza y transformación de datos.
  • introducir conceptos en la biblioteca Reshape que también es útil. Una de las ventajas de R es que obtienes más funcionalidad con menos código y la mayoría de las funciones ya están compiladas y disponibles, pero debes saber qué biblioteca elegir.
  • Expresión regular: este es un capítulo importante para la recuperación de datos, la configuración y la transformación de datos, da más importancia a este capítulo.

Si al principio no comprende algunos conceptos, no tema, vuelva a visitarlos. Para practicar estos conceptos, puede usar la biblioteca de remolinos, que es una serie de capítulos de aprendizaje que está disponible con todos estos cursos.

En una nota separada, si desea obtener más información, puede acceder al contenido gratuito de Datacamp para practicar estos conceptos, lo que consolidará aún más su comprensión.

Todavía tengo que completar los cursos restantes y me he propuesto completarlos en los próximos 60 días.

PD:

Aprender y comprender estas nuevas habilidades aprendidas solo rascará la superficie de la ciencia de datos. Sin embargo, debe aprenderlo, y lo más importante es aprender, aplicar y mostrar sus nuevos conceptos aprendidos.

Dado que la ciencia de datos es un dominio bastante nuevo (aunque ha estado allí durante más de 4 décadas), es importante aprender y comprender los conceptos básicos.

Por favor, siéntase libre de comentar y dar su opinión. Para cualquier pregunta, me complacerá devolver una respuesta.

Feliz aprendizaje.

Estoy de acuerdo con la respuesta de Chris de muchas maneras.

Sin embargo, incluso sin los requisitos previos, seguiría alentando a las personas interesadas en aprender de qué se trata Data Science al menos para auditar los cursos.

Realmente no sabía mucho sobre cómo aplicar la ciencia de datos a los datos con los que trabajé antes de tomar los cursos. Por mi experiencia, he estado trabajando en el almacenamiento de datos y el espacio de inteligencia empresarial durante muchos años.

Dando los siguientes pasos en Data Science, necesitaba un lugar para comenzar. Esta especialización me permitió avanzar en mi camino para convertirme en Data Scientist.

Aumenté gran parte del material del curso con otras cosas como:

Academia Khan.

MIT OCW cursos centrados.

Cursos en línea de YouTube que cubren detalles del material. (Busque en YouTube videos de regresión). Escuche una variedad de explicaciones para ciertos temas, luego regrese y escuche nuevamente las explicaciones en video en el material del curso si no está claro la primera vez.

Estaba en la primera cohorte, lo que significa que tomé la primera oferta. Espero que muchos de los problemas que tuvimos con el curso hayan mejorado. El curso de regresión necesitaba mucha mejora.

También busque cosas como DataCamp para aprender R.

El curso R de Roger Peng realmente me ayudó a comenzar a hacer cosas en R.

Otra cosa que sugeriría hacer como parte de tomar este curso. Si ya está familiarizado con una forma de resolver un problema en SQL o Excel. Aprenda a resolver ese mismo problema en R, antes de profundizar demasiado en la especialización. Una vez que pueda traducir mentalmente en problemas R, ya está familiarizado con esto, lo ayudará.

★★★★

Puede echar un vistazo a mi revisión de la especialización de ciencia de datos en: la respuesta de Nishant Gupta a ¿Vale la pena pagar 9 * $ 49 por una especialización de ciencia de datos en Coursera?

Hola,

Estoy más que parte del camino a través de toda la pista de especialización y siento que me ha dado un establecimiento decente para la ciencia de la información. Sin embargo, no puedo afirmar que tendré suficientes aptitudes necesarias para buscar la Ciencia de la Información como vocación.

Es impulsado por R y adoro a R, sin embargo, mientras practico con él fuera de los cursos, encuentro un par de cosas (fuera de Insights y Math en general) que faltan, en cuyo caso dependo de Python o Ruby.

Hay un curso específico (derivación fáctica) al que me costó mucho adaptarme y las direcciones parecen estar aumentadas, pero encontré otro curso Coursera: el curso de investigación de información e inducción fáctica de Duke College, un complemento increíble como manejó ideas similares mucho mejor y más por dentro y por fuera.

Diría que se ha justificado independientemente de mi tiempo hasta ahora (ya que soy nuevo en este campo), sin embargo, iría por otros cursos y pistas más propulsados ​​relacionados con las Ciencias de la Información una vez que complete esto, ya que siento que esto La pista específica es insuficiente.

Formación en ciencia de datos en Kukatpally | cursos de ciencias de datos en hyderabad

Coursera, udacity, MOOC y muchos más proporcionan contenido fantástico en línea. Y han revolucionado el ecosistema de muchas maneras más. Pero todavía hay un vacío que debe llenarse para garantizar que sea lucrativo en cualquier mercado laboral.

Siempre recomendaría ir a un curso que proporcione un verdadero aprendizaje combinado.

Cuando su enfoque es la habilidad única, aprender de los cursos en línea funciona mejor. Pero el dominio que exige habilidades donde uno tiene que orquestar herramientas, técnicas, procesos en múltiples niveles (matemático, computacional, algorítmico), aprender en línea sin tutoría activa sería un desafío. Los programas basados ​​en persona sin conexión son más adecuados.

Nosotros en la escuela GreyAtom brindamos una verdadera experiencia de aprendizaje combinado a nuestros estudiantes con características como:

  • Combina los medios digitales en línea con el aprendizaje tradicional en el aula.
  • Instrucciones digitales, tutoriales, chats en línea, clases en línea y proyectos combinados / combinados con el aprendizaje individualizado en el aula.
  • Contribuye principalmente en la satisfacción y el éxito del curso de aprendizaje inmersivo.
  • Aprendizaje en línea de softwares, proyectos, conjuntos de herramientas, etc., donde el estudiante tiene la libertad de controlar
  • Aprendizaje fuera de línea basado en el aula donde hay interacción con los maestros y compañeros
  • Capacitación en línea que ayuda a obtener experiencia de primera mano y aumentar la confianza
  • Aprendizaje sin conexión que ayuda a mejorar las habilidades de trabajo en equipo y la comunicación.
  • Experiencia en el campus y fuera del campus experiencia basada en la industria
  • Altera fundamentalmente el proceso de aprendizaje haciéndolo adecuado y beneficioso para los estudiantes.

En la escuela GreyAtom , alineamos la educación con la realidad . GreyAtom se enfoca en crear ingenieros de ciencia de datos de Full Stack y le brinda todas las herramientas, técnicas y conceptos básicos necesarios para lograr un impacto. En solo 14 semanas, aplicará la resolución de problemas y el pensamiento creativo a conjuntos de datos del mundo real, ganando experiencia en toda la pila de ciencia de datos.

Tendrá un historial de contribuciones de código abierto y ayudará a la comunidad más amplia de ingeniería de software (a través de Github, StackOverflow, un blog o similar).

Puede consultar los detalles del curso haciendo clic en este enlace Full Stack Data Science Engineering | Greyatom

Los datos realmente impulsan todo lo que hacemos. Si le apasiona la ciencia de datos y desea redefinir su carrera, visítenos en los programas in situ de GreyAtom: ciencia de datos, Big Data, aprendizaje automático

Creemos en “Datos reales – Industria real – Socios de reclutamiento reales – Real Office (Classroom)”

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudar a las personas a encontrar carreras sostenibles en Data Science es mi pasión.

★★★★★

Estoy empezando a encontrar que Quora es bastante útil. Es diferente de solo Google para obtener información. Las ideas sobre el curso de Data Science son bastante interesantes. Actualmente he tomado 2 módulos del curso de Ciencia de Datos y encuentro que la Programación R es bastante desafiante. Sé que necesito mejorar mis conceptos básicos de R antes de continuar. Es un largo camino hacia el campo de la ciencia de datos.