En el aprendizaje automático, ¿cómo podemos determinar si un problema es lineal / no lineal?

Antes de ejecutar cualquier clasificador así, necesitamos entender qué es un problema de clasificación lineal. Mira los datos 2D a continuación. En los datos A, los puntos azules y verdes se pueden clasificar fácilmente dibujando una línea simple. La línea que se muestra es una de las muchas soluciones posibles y obtendrá la máxima precisión. Una advertencia es que, si la línea de separación se dibuja de forma incorrecta, incluso en un caso lineal simple podemos equivocarnos. Por lo tanto, la optimización adecuada de los parámetros para encontrar una línea / plano / hiperplano óptimos es muy importante. En los datos B no podemos dibujar una línea que pueda clasificar los puntos verdes y azules. Por lo tanto, los datos A representan un problema de clasificación lineal y los datos B representan un problema de clasificación no lineal.

(Fuente: Naive Bayes I de Sebastian Raschka)

La mayoría de los datos en el mundo real no son 2D y es difícil visualizar más que los datos 3D fácilmente. Entonces, uno debe comenzar a usar algunas técnicas de clasificación. La regla del pulgar es usar primero los métodos simples (de acuerdo con la navaja de Occam) para, por ejemplo, un clasificador de distancia mínima, árboles de decisión, bahías ingenuas, y puede ser SVM con núcleo lineal (si comprende SVM). Si sus resultados no son buenos, es posible que su problema no pueda resolverse mediante métodos de clasificación lineal y que tenga que pasar a clasificadores no lineales más complejos, como SVM con núcleos gaussianos, bosque aleatorio, perceptrón multicapa, etc. .

¿Por qué encontramos inversa de una matriz? ¿Es simplemente por el bien de las operaciones matemáticas?

¿Qué significa exactamente tener un espacio vectorial sobre un campo?

¿Qué tipo de prerrequisito matemático necesito saber para estudiar álgebra exterior?

¿Cómo giraremos (en sentido antihorario o horario) un vector desde la regla de la mano derecha?

¿Por qué las matrices ortogonales representan rotaciones / reflexiones e isometrías y qué representan las matrices unitarias en la teoría de grupos?

¿Abandonamos el orden de las operaciones al resolver problemas de álgebra de dos pasos?

Una forma muy aproximada es comparar el número de dimensiones en sus datos y el número de puntos. Cuantas más dimensiones tenga o menos puntos, más probable será que sus datos sean linealmente separables.

Piense 1: en 2d es muy fácil separar linealmente 2 puntos, pero si tiene 20 millones de puntos se vuelve menos probable.

Piense 2: si fija el número de puntos, a medida que tenga más dimensiones, es más probable que tenga un conjunto de datos separable linealmente.

Pero, por supuesto, esto no le dirá si los datos son realmente linealmente separables o no, una buena manera de hacerlo es ejecutar un Perceptron (es muy rápido) y ver si puede llegar a 0 errores, entonces sus datos son linealmente separables . Pero a veces los datos son altamente lineales pero no 100% linealmente separables, ya que puede haber un poco de ruido o valores atípicos. Luego puede ejecutar Perceptron o Linear SVM y ver si tiene un gran éxito en ese caso, puede llamar a sus datos lineales.

Subham Tiwari ST

A menos que comencemos a ver espacios de alta dimensión (> 3d), decidir si un problema es lineal es empírico:

Entrene SVM sin trucos del núcleo y vea cómo funcionan. Si funcionan de manera razonable (de acuerdo con sus métricas) no hay necesidad de probar métodos no lineales, ya que son computacionalmente más caros y más lentos para entrenar / probar

Subham Tiwari ST

Esa es la primera pregunta que me llamó la atención cuando estaba estudiando SVM lineal y SVM no lineal . Entonces, el método más intuitivo y mejor para identificar si las muestras de datos son linealmente separables o no es trazar la muestra usando las bibliotecas matplotlib en python. Por supuesto, es muy difícil visualizar la muestra de datos si la dimensión del espacio de características es más de tres.

Entonces, una cosa que es factible hacer es que si la precisión de los clasificadores no lineales es mucho mejor que la de los clasificadores lineales, entonces podemos inferir que el conjunto de datos no es linealmente separable. De lo contrario, es al revés.

Shehroz Khan

Una práctica es entrenar el clasificador perceptrón en el conjunto de datos y ver si proporciona una precisión del 100% o no. Esto funciona ya que el perceptrón es un método matemáticamente probado que puede dividir datos correctamente a menos que sea no lineal.

Subham Tiwari ST

More Interesting

¿Cuál es la diferencia entre una transformación lineal y una transformación no lineal? ¿Alguien puede dar alguna explicación intuitiva?

¿Por qué las matrices son rectangulares?

Cómo encontrar el rastro de la matriz [matemática] B [/ matemática] tal que [matemática] AB + BA = 0 [/ matemática] donde [matemática] A, B [/ matemática] son matrices regulares de orden [matemática] n [ /matemáticas]

¿Pueden las condiciones para un espacio vectorial condensarse razonablemente para ayudar a recordar?

¿Es una matriz 1 x 1 un escalar?

¿Pueden las matrices tener valores propios y vectores propios?

¿Cuáles son algunas preguntas simples de álgebra que pueden usarse para introducir la configuración y la resolución de ecuaciones?

¿Cada operación de fila elemental es un operador?

¿Cómo se relaciona la forma escalonada reducida con las variables libres en álgebra lineal?

¿Cuáles son algunos ejemplos intuitivos de un espacio vectorial que ampliarán mi comprensión?