¿Cuál es la diferencia entre el modelo de aprendizaje automático lineal y no lineal?

La respuesta de Robby Goetschalckx hace un gran trabajo del “qué”. Me gustaría probar el “por qué”. Los modelos lineales se ocupan de la correlación de modelos, es decir, observando qué cosas ocurren juntas y haciendo inferencias acerca de cuán probable o improbable sucederán las cosas dado lo mucho que han sucedido juntas en el pasado. El modelado lineal de segundo orden incorpora información sobre relaciones indirectas a través de una cadena de coincidencias. Algunos modelos (como LSA) incorporan inferencias basadas en muchos órdenes de concurrencia.

Sin embargo, como dice el viejo dicho, la correlación no es causalidad, y hay situaciones que no pueden modelarse mediante una simple correlación. Los modelos lineales también fallan cuando el orden en que ocurren las cosas es importante (es decir, cuando la probabilidad de A, B no está relacionada con la probabilidad de B, A). La vida está llena de tales situaciones, y muchos investigadores se centran en el modelado no lineal debido a las limitaciones del modelado lineal.

Por otro lado, mucha vida es lineal, y el modelado lineal es mucho más simple desde el punto de vista computacional que el modelado no lineal. Entonces, aunque adoptar el modelado no lineal le permite resolver problemas que el modelado lineal no puede tocar, la complejidad computacional limita drásticamente el tamaño de los problemas en los que puede trabajar.

Para hacer algunos números completamente indefendibles, el modelado lineal puede ayudarlo a resolver el 90% del 80% de los problemas que necesita resolver, mientras que el modelado no lineal puede ayudarlo a resolver el 75% del 95% de los problemas que necesita resolver. Si lo que necesita una solución es en ese 15% que los modelos no lineales pueden resolver pero los modelos lineales no pueden, y si el tamaño del problema permite la aplicación de la técnica de modelado, entonces su elección se hace evidente.

¿Cómo podría encontrar x en a ^ x = bx + c usando álgebra?

Como ingeniero eléctrico, ¿debo tomar álgebra lineal?

Matemáticas: ¿Cómo pruebo la independencia / dependencia lineal de las siguientes funciones en un intervalo dado?

¿Para qué se usan las matrices dispersas? ¿Cuál es su aplicación en el aprendizaje automático?

¿Por qué tantos libros de texto muestran que debemos calcular [math] \ mathrm {det} (A- \ lambda I) [/ math] en lugar de [math] \ mathrm {det} (\ lambda I – A) [/ math] cuando ¿Quiere averiguar el valor propio de la matriz [matemática] A [/ matemática]?

Al determinar el espacio de columna de una matriz dada, ¿cuál es la base?

Un modelo lineal utiliza una función lineal para su función de predicción o como una parte crucial de su función de predicción.

Una función lineal toma un número fijo de entradas numéricas, llamémoslas [matemáticas] x_1, x_2, \ ldots, x_n [/ matemáticas] y devuelve [matemáticas] w_0 + \ sum_ {i = 1} ^ n w_i x_i [/ matemáticas ] donde los pesos [math] w_0, \ ldots, w_n [/ math] son los parámetros del modelo.

Si la función de predicción es lineal, podemos realizar una regresión , es decir, predecir una etiqueta numérica. También podemos tomar una función lineal y devolver el signo del resultado (ya sea que el resultado sea positivo o no) y realizar la clasificación binaria de esa manera: todos los ejemplos con una salida positiva reciben la etiqueta A, todos los demás reciben la etiqueta B. Hay varios otros (más complejas) opciones para una función de respuesta en la parte superior de la función lineal, la función logística se usa con mucha frecuencia (lo que conduce a una regresión logística , prediciendo un número entre 0 y 1, generalmente utilizado para aprender la probabilidad de un resultado binario en un entorno ruidoso).

Un modelo no lineal es un modelo que no es un modelo lineal. Por lo general, estos son más potentes (pueden representar una clase más amplia de funciones) pero mucho más difíciles de entrenar.

Kashif Ali Siddiqui

Bueno, la diferencia principal proviene de sus respectivos nombres.

Un modelo lineal utiliza una función lineal para sus aplicaciones predictivas (más de un modelo correlativo), mientras que un modelo no lineal es un modelo que utiliza una función no lineal junto con complejidades computacionales (que desafortunadamente limita su uso).

Kashif Ali Siddiqui

More Interesting

Aproximadamente, ¿cuántas personas en el mundo conocen el álgebra lineal?

Probabilidad (estadísticas): supongamos que tenemos una matriz de bits de tamaño NXM. ¿Cuál es el número estimado de filas en la matriz que tienen un número distinto de 1 en ellas?

¿Por qué la velocidad de convergencia del descenso del gradiente depende de los valores propios máximos y mínimos de A para resolver AX = b a través de mínimos cuadrados?

¿Cuáles son las diferencias básicas entre SVD (Descomposición de valor singular) y EVD (Descomposición de valor de Eigen)?

¿Abandonamos el orden de las operaciones al resolver problemas de álgebra de dos pasos?

En el aprendizaje automático, ¿cómo podemos determinar si un problema es lineal / no lineal?

¿Por qué las matrices ortogonales representan rotaciones / reflexiones e isometrías y qué representan las matrices unitarias en la teoría de grupos?

¿Podemos hacer una transformación lineal del espacio vectorial unidimensional al espacio vectorial tetradimensional cuando la dimensión del espacio de rango es 2?

Una matriz cuadrada puede tener un inverso izquierdo o derecho, pero ¿qué queremos decir con inverso izquierdo y derecho?

¿Es cada campo un espacio vectorial sobre sí mismo?