Las leyendas en la historia de las estadísticas / matemáticas nunca habrían pensado que la corriente en la que están investigando se convertirá en uno de los trabajos más populares del siglo XXI. O incluso el padre de la computadora nunca hubiera imaginado que su invención podría ser de esta ayuda en el mundo contemporáneo. Las raíces de esta ciencia se han convertido en un árbol hecho y derecho con flores en ciernes de análisis de datos, minería de datos y los frutos del aprendizaje automático y el análisis de big data.
En palabras de RANJAN RAMAKRISHNAN, CIO, SIR GANGARAM HOSPITAL
“Gracias a Big data, Hadoop y otras técnicas de administración de datos que hicieron que el análisis de datos en la atención médica sea una nueva tendencia, ahora está ayudando a estabilizar y estandarizar el servicio de atención médica de calidad. La herramienta Good Analytics puede cambiar la tendencia de la organización de personas centradas en procesos, evitando pérdidas inesperadas y errores en la toma de decisiones, ahorrando gastos y aumentando las ganancias. “
- ¿Qué debo saber sobre el SharePoint Training Institute en Kolkata o los buenos institutos de capacitación en línea para el mismo?
- ¿Cuál es el mejor instituto para la certificación de capacitación en línea Tibco BW?
- ¿Cuál es la diferencia entre un http://freecodecamp.com y otros campamentos de programación costosos? ¿Vale la pena probar freecodecamp?
- ¿Cuál es la mejor capacitación en línea de SAP HANA?
- ¿Hay clases en línea u otras formas que le enseñen a un adulto la importancia de la higiene personal y cómo practicarla?
Entonces, no lo llevemos al aburrimiento de la historia de la ciencia de datos, y esto podría no interesar a todos los lectores, por supuesto. La ciencia de datos es un campo diverso y no se puede explicar en solo unos pocos versos de esta publicación y, por supuesto, mis palabras solo podrían ayudarlo a conocer el desembolso de la ciencia de datos.
Entonces, para un novato en ciencia de datos, la comprensión de las disciplinas que usted ha premeditado como su especialización en sus licenciaturas o maestrías debería ser penetrante.
Aparte de esto debes saber:
- Nitidez de los datos y su organización.
- Modelado estadístico: – algoritmos de clasificación y búsqueda; modelos gráficos básicos; programación vivaz; programación lineal; aritmética de coma flotante; Valores propios, descenso de gradiente estocástico y la lista continúa.
- Algoritmos matemáticos: – modelos de regresión lineal generalizada, regresión no paramétrica, modelos gráficos, modelos ocultos de Markov, métodos de kernel y máquinas de vectores de soporte, red bayesiana e inferencia.
- Descripción general de los lenguajes de programación: – como R python, C, C ++.
Debe ser muy resistente y autosuficiente con sus conceptos. En aras de una mejor comprensión de cómo comenzar a aprender ciencia de datos, puede consultar este ENLACE: https://www.slideshare.net/sheshratnala/data-analytcisfirststeps .
Aparentemente, los conceptos teóricos no pueden hacer que obtenga un buen trabajo en su trabajo y no puede convertirlo en un profesional en ciencia de datos; necesita ciertas herramientas para ser diestro en esta secuencia. Es muy simple de aprehender; cuanto mejor conozca el juego de números, más dinero ganará y más aspirará.
Las herramientas que debes saber son; –
Programación R
- Puede convertirte en un experto en trabajar en R studio, funciones DPLYP, visualización de datos, modelos de regresión.
Pitón
- Le ayudará a trabajar como un profesional en procedimientos estadísticos, análisis avanzado, numpy, scipy, Matplotlib
- Tome clases de capacitación en línea para aprender ciencia de datos con Python
SAS
- SAS significa sistema de análisis estadístico. Esta herramienta le hace comprender mejor los conceptos de estadística, prueba de hipótesis, agrupación, árboles de decisión.
Hadoop
- La biblioteca de software Apache Hadoop es un marco que permite el procesamiento distribuido de grandes conjuntos de datos en grupos de computadoras utilizando modelos de programación simples . Está diseñado para escalar desde servidores individuales hasta miles de máquinas, cada una de las cuales ofrece computación y almacenamiento local.
Stata
- Stata es un poderoso software estadístico que permite a los usuarios analizar, administrar y producir visualizaciones gráficas de datos. Es utilizado principalmente por investigadores en los campos de economía, biomedicina y ciencias políticas para examinar patrones de datos.
Matlab
- Un lenguaje de programación patentado desarrollado por mathworks, MATLAB permite manipulaciones matriciales, trazado de funciones y datos, implementación de algoritmos, creación de interfaces de usuario e interfaz con programas escritos en otros lenguajes, incluidos C, C ++, Java.
Además de la experiencia en lenguaje de programación como R y Python, otros lenguajes como Java, SQL, C, C ++ son de gran utilidad para convertirse en un maestro en ciencia de datos. Y según la necesidad de diferentes organizaciones, el conocimiento de MINITAB, SPSS, MAPREDUCE se suma a su valor.
Debes asegurarte de utilizar todas estas herramientas de forma ágil, es decir, con habilidad prodigiosa. Para el curso en línea de Data Science, puede consultar Digital Vidya y asistir a una sesión de demostración gratuita sobre Big Data & Analytics para saber cómo puede comenzar su carrera en Data Analytics o Big Data. Obtendrá una guía adecuada sobre cómo comenzar a aprender análisis de datos con Python, SAS, R o Excel.
¿Tiene usted alguna pregunta?
Si aún quieres orientación, puedes enviarme un mensaje. Te ayudaré con tus dudas.