¿Cuál es la diferencia entre el modelo de aprendizaje automático lineal y no lineal?

La respuesta de Robby Goetschalckx hace un gran trabajo del “qué”. Me gustaría probar el “por qué”. Los modelos lineales se ocupan de la correlación de modelos, es decir, observando qué cosas ocurren juntas y haciendo inferencias acerca de cuán probable o improbable sucederán las cosas dado lo mucho que han sucedido juntas en el pasado. El modelado lineal de segundo orden incorpora información sobre relaciones indirectas a través de una cadena de coincidencias. Algunos modelos (como LSA) incorporan inferencias basadas en muchos órdenes de concurrencia.

Sin embargo, como dice el viejo dicho, la correlación no es causalidad, y hay situaciones que no pueden modelarse mediante una simple correlación. Los modelos lineales también fallan cuando el orden en que ocurren las cosas es importante (es decir, cuando la probabilidad de A, B no está relacionada con la probabilidad de B, A). La vida está llena de tales situaciones, y muchos investigadores se centran en el modelado no lineal debido a las limitaciones del modelado lineal.

Por otro lado, mucha vida es lineal, y el modelado lineal es mucho más simple desde el punto de vista computacional que el modelado no lineal. Entonces, aunque adoptar el modelado no lineal le permite resolver problemas que el modelado lineal no puede tocar, la complejidad computacional limita drásticamente el tamaño de los problemas en los que puede trabajar.

Para hacer algunos números completamente indefendibles, el modelado lineal puede ayudarlo a resolver el 90% del 80% de los problemas que necesita resolver, mientras que el modelado no lineal puede ayudarlo a resolver el 75% del 95% de los problemas que necesita resolver. Si lo que necesita una solución es en ese 15% que los modelos no lineales pueden resolver pero los modelos lineales no pueden, y si el tamaño del problema permite la aplicación de la técnica de modelado, entonces su elección se hace evidente.

Un modelo lineal utiliza una función lineal para su función de predicción o como una parte crucial de su función de predicción.

Una función lineal toma un número fijo de entradas numéricas, llamémoslas [matemáticas] x_1, x_2, \ ldots, x_n [/ matemáticas] y devuelve [matemáticas] w_0 + \ sum_ {i = 1} ^ n w_i x_i [/ ​​matemáticas ] donde los pesos [math] w_0, \ ldots, w_n [/ math] son ​​los parámetros del modelo.

Si la función de predicción es lineal, podemos realizar una regresión , es decir, predecir una etiqueta numérica. También podemos tomar una función lineal y devolver el signo del resultado (ya sea que el resultado sea positivo o no) y realizar la clasificación binaria de esa manera: todos los ejemplos con una salida positiva reciben la etiqueta A, todos los demás reciben la etiqueta B. Hay varios otros (más complejas) opciones para una función de respuesta en la parte superior de la función lineal, la función logística se usa con mucha frecuencia (lo que conduce a una regresión logística , prediciendo un número entre 0 y 1, generalmente utilizado para aprender la probabilidad de un resultado binario en un entorno ruidoso).

Un modelo no lineal es un modelo que no es un modelo lineal. Por lo general, estos son más potentes (pueden representar una clase más amplia de funciones) pero mucho más difíciles de entrenar.

Bueno, la diferencia principal proviene de sus respectivos nombres.

Un modelo lineal utiliza una función lineal para sus aplicaciones predictivas (más de un modelo correlativo), mientras que un modelo no lineal es un modelo que utiliza una función no lineal junto con complejidades computacionales (que desafortunadamente limita su uso).