¿Cuándo es la disminución de peso L2 mejor que L1 y cuándo es mejor la norma máxima?

Bueno, sé que no te gustará mi respuesta: depende.

En primer lugar, desde un punto de vista matemático, si estás en una dimensión finita (supondré aquí que estás en [math] \ mathbb {R ^ {d}} [/ math]) todas las normas son equivalentes tal como se describen La misma topología del espacio.

Ahora hay razones lógicas para usar una más que la otra.

Lo más probable es que desee utilizar la norma natural del espacio en el que se encuentra.

Probablemente, tiene variables aleatorias que forman parte del espacio L1 pero no del espacio L2, por lo que aquí es natural que use esta norma L1.

L2 es la norma natural asociada con la distancia euclidiana, por lo que si está trabajando en un espacio euclidiano, es posible que desee utilizar este. Otra razón por la que es posible que desee utilizar L2 es el siguiente teorema:

Teorema de Gauss-Markov

La norma máxima puede ser sabia si solo desea limitar su error en “cada punto”.

Leí una vez que la norma Lp podría ser útil cuando se observa cierto espacio complejo (espacios no lineales) donde es posible que desee ver la penalización en derivadas de diferentes órdenes.

Salud.

ACTUALIZAR:

Encontré esta publicación que toma mis puntos, así como otros ejemplos:

¿Qué norma elegir cuando?