¿Cómo se usan exactamente los vectores en inteligencia artificial?

Los vectores se usan ampliamente (muy, muy ampliamente) en el aprendizaje automático estadístico, que es en lo que ha evolucionado la mayor parte de la inteligencia artificial.

Hace dos décadas (o quizás tres), el foco principal de la inteligencia artificial estaba en los sistemas para la manipulación simbólica de conceptos abstractos. Estos enfoques simbólicos a menudo usaban el lenguaje lisp, y una de las arquitecturas populares era el sistema de producción, que priorizaba los pasos intermedios para resolver problemas complejos. En el procesamiento del lenguaje natural, se utilizaron estructuras de datos simbólicos para representar gramáticas del lenguaje, analizar árboles y relaciones semánticas entre palabras.

Todo eso cambió con la llegada del aprendizaje automático estadístico como un enfoque alternativo a las estrategias de encuadre para la resolución inteligente de problemas y especialmente la coincidencia de patrones y el “aprendizaje”.

En lugar de tratar de codificar estrategias “inteligentes”, el aprendizaje automático estadístico busca modelar las frecuencias de ocurrencia probabilística en grandes conjuntos de datos. La idea es que si observa un patrón, no necesita comprenderlo, solo necesita poder detectarlo, replicarlo y predecirlo.

El aprendizaje automático estadístico depende en gran medida de las relaciones probabilísticas entre variables abstractas en espacios multidimensionales. La base de todo en el aprendizaje automático estadístico son las distribuciones de probabilidad y los espacios de parámetros, que se representan mediante vectores. (Cada elemento de un vector es un parámetro o dimensión de datos diferente en el problema que se está modelando).

En el desarrollo de algoritmos estadísticos de aprendizaje automático, los vectores y el álgebra lineal se usan ampliamente, especialmente usando el entorno matemático matricial MatLab. El álgebra lineal a menudo se puede evitar al usar algoritmos estadísticos de aprendizaje automático, especialmente bibliotecas preparadas. Pero si desea comprender cómo, y especialmente por qué , funcionan los algoritmos, necesitará álgebra lineal.

El uso de vectores es ubicuo no solo en la inteligencia artificial, sino también en la informática en su conjunto.

  1. Representación de datos: los vectores se utilizan para representar datos; por ejemplo, los datos del mercado de valores pueden representarse como un vector unitario dimensional de los precios de las acciones a lo largo del tiempo, los datos de imágenes pueden representarse como vectores 2D o matrices, etc.
  2. Representación del modelo: los vectores también se utilizan para almacenar las representaciones internas de los modelos de IA, como las redes de aprendizaje profundo y los clasificadores lineales. Los vectores también son muy útiles para simplificar la interacción entre modelos y datos para hacer predicciones.
  3. Aprendizaje y capacitación: los vectores pueden facilitar significativamente el diseño de algoritmos como los de reducción de dimensionalidad, clasificación, etc. También hacen que sea muy conveniente realizar un análisis de estos sistemas con respecto a las garantías de rendimiento.

Si está siguiendo un curso de IA, entonces debe haber realizado un curso de programación de computadoras en el que se habría encontrado con una matriz. La mayoría de los lenguajes como C, C ++, Java, Python, ofrecen implementaciones de matriz y son extremadamente versátiles en las formas en que se pueden usar. Puede usar matrices para almacenar datos de manera organizada, iterar a través de datos de manera sistemática, así como datos de referencia de manera sólida. Los vectores son los equivalentes matemáticos de las matrices y ofrecen todos estos servicios y más en inteligencia artificial y aprendizaje automático.

Malas noticias: hay muchas razones por las que necesitas dominar el álgebra lineal. Estoy de acuerdo con Paul King en que debes aprender álgebra lineal para saber por qué.

Buenas noticias: no es necesario saber álgebra lineal para utilizar la inteligencia artificial.

Los vectores son críticos para solo una clase de inteligencia artificial. Sí, hay muchas formas de IA, y el aprendizaje automático de estadística es el estándar dominante de la industria (en este momento).

Los enfoques de vectorización, como la frecuencia de documentos inversa de frecuencia de término coseno (COS tf-idf), pueden ser computacionalmente caros ya que requieren que se calculen funciones de suma en todo el corpus tanto en el aprendizaje inicial como en el incremental.

Aquí hay un buen artículo en International Journal of Knowledge Management que describe uno (de muchos) enfoques alternativos para el aprendizaje automático estadístico:
http://www.igi-global.com/viewti