El aprendizaje automático es un subcampo de la inteligencia artificial.
Ramas de Inteligencia Artificial:
- Aprendizaje automático: ¿cómo aprenden las máquinas?
- Inteligencia evolutiva: selección natural de máquinas
- Inteligencia de enjambre: ¿Cómo aprenden las máquinas como sociedad de grupos?
- Procesamiento del lenguaje natural: ¿cómo leen las máquinas?
- Visión por computadora: ¿cómo ven las máquinas?
- Procesamiento del habla: ¿cómo escuchan las máquinas?
- Robótica: ¿cómo se mueven las máquinas? ¿Cómo se localizan las máquinas para saber dónde está en el mundo?
- Problema de satisfacción de restricciones: ¿Cómo planifican las máquinas?
- Representación del conocimiento: ¿Cómo representan las máquinas el conocimiento y lógicamente razonan a partir de él?
- Gráficos por computadora: ¿cómo se imaginan las máquinas? Inverso de la visión por computadora (opuesto a ver)
Enfoques de aprendizaje automático.
Por ejemplo, ¿cómo modelamos:
- ¿Cuáles son las perspectivas de carrera después de hacer un doctorado en India? ¿Vale la pena hacer un doctorado?
- Mirando la información a la que el presidente de una nación tiene acceso, ¿puede un doctorado ser aún más inteligente que él o ella?
- ¿Es un buen momento para comenzar a trabajar a tiempo parcial al escribir una tesis doctoral?
- ¿Se puede conseguir trabajo en Qualcomm o NASA después de completar un doctorado en comunicación inalámbrica con una buena investigación en los Estados Unidos?
- Como estudiante de doctorado, ¿cómo se entrena a un buen asistente de laboratorio de pregrado?
- Aprendizaje instantáneo: ¿Cómo entrenamos un modelo para aprender de ejemplos correctos? Ideas de optimización matemática, muestreo, inferencia variacional
- Aprendizaje retrasado: ¿Cómo aprendemos mediante recompensas y castigos? Ideas del aprendizaje animal, aprendizaje por refuerzo, teoría de control óptima, programación dinámica
- Asignación de crédito: después de que finalmente tengamos éxito, ¿cómo asignamos crédito a qué camino a lo largo de nuestro éxito fue más importante para nuestro éxito?
- Inferencia: ¿Cómo calculamos la probabilidad de eventos dados las evidencias? Ideas de modelos gráficos probabilísticos.
- Planificación: ¿Cómo planificamos qué hacer dada nuestra información disponible? Ideas de los procesos de decisión de Markov, árboles de decisión.
- Información: ¿Cómo calculamos cuánta información hemos recopilado o podríamos recopilar? Ideas de la teoría de la información, incertidumbre, distribución de creencias posteriores bayesianas, mejora esperada.
- Incertidumbre: ¿Cómo sabemos si un modelo es incierto en sus predicciones?
- Procesamiento de señal: ¿Cómo decidimos si una entrada o datos son información útil o ruido? Ideas de la teoría de detección de señales.
- Memoria: ¿Cómo recordamos u olvidamos la información? ideas desde circuitos secuenciales en lógica digital hasta procesamiento retrasado.
- Atención: la idea de enfoque. ¿Dónde enfocarnos? ¿Cuándo concentrarse? ¿Cuánto tiempo debemos enfocarnos? Ideas de recuperación de información
- Aprendizaje activo: decidir activamente qué aprender, ya que es imposible aprender todo.
- Aprendizaje curricular: crear un programa de aprendizaje para que el modelo aprenda de problemas fáciles a difíciles.
- Transferir el aprendizaje: ¿Cómo transferimos información aprendida útil de un modelo a otro?
- Destilación del conocimiento: ¿Cómo transferimos la información central de un modelo grande a un modelo más pequeño?
- Pocos disparos de aprendizaje: ¿Cómo aprendemos de la menor cantidad de ejemplos posible?
- Exploración vs Agotamiento: ¿Cómo decidimos si debemos explorar otras decisiones o sumergirnos en las que ya conocemos?
- Aprendizaje semi-supervisado: ¿Cómo aprendemos acerca de la población que recibe una muestra?
- Aprendizaje desequilibrado: ¿Cómo aprendemos sobre etiquetas raras cuando nuestro conjunto de datos está desequilibrado?
- Aprendizaje generativo: ¿Cómo aprendemos a generar datos realistas?
La investigación de Machine Learning se puede dividir en 4 pasos:
- Paso 1: ¿Cuál es el problema? ¿Cuál es el tipo de datos con los que estamos trabajando?
- Paso 2: modelado. ¿Qué modelo debemos usar? ¿Cuáles son las habilidades potenciales y los inconvenientes de este modelo?
- Paso 3: ¿Cómo podemos entrenar el modelo de acuerdo con nuestros datos?
- Paso 4: Evaluación. ¿Cómo evaluamos qué tan bien este modelo ha aprendido y ejecutado sus habilidades potenciales?
Modelos de aprendizaje automático: (no mutuamente excluyentes)
- Vecino más cercano: Agrupa cualquier cosa similar.
- Máquinas Kernel, Máquinas de vectores de soporte: Estar lo más lejos posible del límite de decisión.
- Deep Learning, NN, CNN, RNN: dispara cuando detectas una señal útil.
- Aprendizaje de refuerzo: Aprender de la retroalimentación retrasada mientras se planifica.
- Modelos gráficos probabilísticos, BN, HMM, CRF: capacidad de realizar inferencia.
- Procesos no paramétricos bayesianos, procesos gaussianos: la complejidad del modelo crece con los datos
- Modelos de mezclas: síntomas y observaciones
Aplicaciones de aprendizaje automático:
- Recuperación de información: Google, Yahoo, motores de búsqueda
- Sistemas de recomendación: Amazon, Netflix, Spotify
- Autos sin conductor (incluye robótica + visión por computadora): Uber, Waymo
- Bioinformática: diagnóstico médico
- Traducción automática: Traducir mandarín a Inglés
- Preguntas y respuestas: responda las preguntas de los clientes.
- Segmentación de imagen: Amazon Go
- Detección de objetos: Amazon Go
- Detección de rostros: Facebook, Snapchat
- Transferencia de estilo: pintura
- Detección de anomalías: NSA (chistes), detección de fraude
- Juego: Google DeepMind, OpenAI
- Sport Analytics: NBA, Microsoft Xbox