¿Cuáles son las ventajas de los clasificadores lineales?

Para mí, la explicabilidad es la principal ventaja de los clasificadores lineales. Y no debemos subestimar la importancia de la explicabilidad en el aprendizaje automático aplicado (que también es un tema en una sesión de ciencia de datos en Strata 2014).

Los clasificadores lineales también dan lugar al análisis de la selección de características.

Ahora, si los clasificadores lineales son rápidos de entrenar y probar, es verdad a medias.

  • Para los problemas que son inherentemente clasificables linealmente o que están bien caracterizados (por ejemplo, las características ya están linealizadas utilizando la sabiduría humana), los clasificadores lineales son ciertamente más simples y rápidos de entrenar y probar. Tenga en cuenta que hay toneladas de problemas aparentemente tan simples en la práctica.
  • Para otros problemas más difíciles (por ejemplo, visión por computadora o reconocimiento de voz), los clasificadores lineales simplemente no funcionan bien. Dada una pequeña tolerancia al error, los clasificadores lineales tardarían una eternidad en converger.

La respuesta clara y obvia en mi mente de por qué los clasificadores lineales (y los modelos lineales en general) son una herramienta útil es que siempre se puede ver la relación entre sus variables predictivas y los resultados. Con datos numéricos, tiene una contribución cuantificable.

Si bien facilita las explicaciones del modelo, el uso de clasificadores lineales también hace que el modelo sea fácil y RÁPIDAMENTE operativo con las habilidades de programación tradicionales. Obtiene ecuaciones o límites definidos que hacen que el filtrado booleano sea fácil de aplicar.

Y una característica deliciosa de los clasificadores lineales es que aceptan todas las transformaciones para hacer que sus datos sean lineales.

Y en mi experiencia, son relativamente rápidos de ejecutar en comparación con algunos de los métodos de “caja negra” más complicados.

Basado en mi experiencia con la implementación de modelos para empresas minoristas como Tesco.

Agregando una perspectiva adicional a las excelentes respuestas ya escritas a continuación, aquí hay 3 escenarios más en los que tiendo a preferir los modelos lineales.

  1. al resolver lo que realmente es un problema de SELECCIÓN DE FUNCIONES
  1. preguntas como esta son comunes en los negocios ‘¿cuáles son los principales factores X que impulsan mis ventas / ganancias / lealtad del cliente’
  2. los modelos lineales producen tanto “dirección de influencia” como “interpretabilidad global”. Las empresas realmente se preocupan por si mover X mueve Y hacia arriba o hacia abajo en promedio.
  3. consideraría Lasso GLM (con características polinómicas) para esto
  • robustez al RUIDO DE ETIQUETAS
    1. En la vida real, las etiquetas a menudo son ruidosas, es decir, mal etiquetadas (por ejemplo, etiquetas humanas, cuando la brecha entre 2 clases en la clasificación de varias clases es pequeña y subjetiva, cuando Y mide la intención / preferencia de un cliente como se indica en una encuesta o haciendo clic en un botón en línea )
    2. Los modelos más simples tienden a sobreajustarse menos a etiquetas ruidosas, también conocidos como valores atípicos
  • cuando su COMPORTAMIENTO DE EXTRAPOLACIÓN es más sensible
    1. Es posible que Model necesite hacer predicciones sobre un nuevo rango de valores en Feature Space (que no había visto antes en los datos de Training).
    2. En la vida real, esta brecha entre datos de capacitación y producción es bastante común (pero no es sorprendente porque tendemos a modelar clientes reales en un mundo real que está cambiando más rápido que nunca)
    3. Modelos lineales extrapolados linealmente
    1. … que parece más alineado a cómo los humanos extrapolarían bajo incertidumbre
    2. Los modelos basados ​​en árboles como Random Forest casi no se extrapolan (lo que puede ser insensible) Y_pred de cada árbol es un valor inevitable que había visto en los datos de entrenamiento
    3. Los modelos estructurales no lineales, como las redes neuronales, se extrapolan de forma no lineal (lo que puede ser demasiado arriesgado).
    4. Este punto se aplica más a los problemas de regresión.

    Los clasificadores lineales son simples, con todas las ventajas que trae. Son:

    • Fácil de implementar.
    • Barato para entrenar.
    • Fácil de explicar y entender.
    • Buenos generalizadores.
    • No es propenso a sobreajustar.
    • Bueno para describir fenómenos lineales.

    Una ventaja de los clasificadores lineales es que son menos propensos al sobreajuste que sus contrapartes no lineales, especialmente cuando se usan en grandes dimensiones.

    1. El ajuste excesivo no es tanto un problema.

    2. Da una buena ‘guía’ para mejores clasificadores.

    3. Es súper efectivo con RANSAC, pero esa es la ventaja de RANSAC, ¡elimina los valores atípicos como un profesional!

    4. Fácil de usar e implementar en su aplicación diaria.

    5. La mayoría de las veces, los datos pueden transformarse para ajustarse a un problema de clasificación lineal. Esto proporciona simplicidad.

    Los clasificadores lineales son una aplicación de linealidad.

    Nuestro mundo es intrínsecamente no lineal y nuestros primeros intentos de comprender partes de él se originan a partir de la observación. Para nuestra ventaja, el mundo no lineal se comporta linealmente (aunque monotónicamente sería la palabra que elegiría) cuando se observa en segmentos estrechos; la linealidad subyace a los enfoques confirmatorios más simples que también son capaces de proporcionar respuestas verificables (replicables) y de estructurar preguntas nuevas y complejas.

    El clasificador lineal constituye tal enfoque. Ya sea generativo o discriminatorio, se deriva de matemáticas intuitivas, se somete a algoritmos de entrenamiento intuitivos y ofrece respuestas claras y cuantificables.

    Cuando se levantan en espacios abstractos infinitos o multidimensionales, los clasificadores lineales permanecen operativos.