La estimación del lazo es una estimación que minimiza la suma del cuadrado y satisface la restricción a continuación.
Para P = 2 caso,
[matemáticas] Min \ sum_ {i = 1} ^ N (y_i – \ beta_0 + \ beta_1 x_ {1i} + \ beta_2 x_ {2i}) ^ {2} \ tag {1} [/ matemáticas]
sujeto a
- ¿Una matriz similar de una matriz ermitaña es también una ermitaña?
- ¿Cuál es la diferencia entre un campo vectorial y un espacio vectorial?
- ¿Cuál es la relación entre los pesos de borde de un gráfico y el vector propio de laplaciano de ese gráfico?
- ¿Cuáles son las cosas más importantes que uno debe entender sobre álgebra lineal?
- ¿Qué es una matriz de coincidencia?
[matemáticas] \ sum_ {j = 1} ^ 2 | \ beta_j | <= s \ tag {} [/ math]
Al usar el multiplicador de Lagrange, la ecuación anterior se convierte en,
[matemáticas] Min \ sum_ {i = 1} ^ N (y_i – \ beta_0 + \ beta_1 x_ {1i} + \ beta_2 x_ {2i}) ^ {2} + \ lambda (\ sum_ {j = 1} ^ 2 | \ beta_j | – s) \ tag {2} [/ math]
Tanto [math] \ lambda [/ math] como s son constantes, por lo que la ecuación anterior se convierte en
[matemáticas] Min \ underbrace {\ sum_ {i = 1} ^ N (y_i – \ beta_0 + \ beta_1 x_1i + \ beta_2 x_2i) ^ {2}} _ \ text {suma del término de error cuadrado} + \ underbrace {\ lambda (\ sum_ {j = 1} ^ 2 | \ beta_j |)} _ \ text {Término de penalización} \ tag {3} [/ math]
Plazo de penalización de lazo
No necesitamos tratar esos dos parámetros ([math] \ lambda [/ math] y s) por separado porque están estrechamente relacionados. Consulte la función de optimización de regresión de lazo (ecuación 1). Si s toma un valor [math] \ infty [/ math], entonces \ lambda será cero. Si [math] \ lambda [/ math] toma un valor [math] \ infty [/ math] o un valor muy grande, entonces todos los coeficientes serán cero. Significa que s será cero. Muestra que [math] \ lambda [/ math] ys están inversamente relacionados. Entonces, solo necesitamos controlar uno de los parámetros para encontrar el mejor estimador para una regresión Lasso. También entendimos que un tamaño óptimo de s depende del parámetro ([math] \ lambda [/ math]). Podemos encontrar el valor óptimo [math] \ lambda [/ math] usando la validación cruzada K-fold.