¿Cuál es la diferencia entre la pendiente de una línea de regresión en un diagrama de dispersión y el valor promedio de Y de cada punto dividido por su X?

La respuesta de Bob es correcta. Sin embargo, incluso si corrigió la intersección, encontrará que la media de Y / X casi nunca es la misma que la línea de regresión de mínimos cuadrados ordinarios.

Esta pregunta toca la motivación para inventar la regresión de mínimos cuadrados ordinarios en primer lugar. Fue creado, en parte, porque otras técnicas de estimación, como tomar la media, generalmente son estimadores deficientes.

No profundizaré demasiado en las matemáticas porque no creo que la pregunta lo justifique.

La media de cualquier conjunto es la suma de todos sus elementos dividida por el número de sus componentes. En tu caso, esto es

[matemáticas] \ mu_ \ frac {Y} {X} = \ frac {\ frac {y_1} {x_1} + \ frac {y_2} {x_2} +… + \ frac {y_n} {x_n}} {n}, x_i \ neq 0 [/ matemáticas]

Pero una línea de regresión no está definida por la misma ecuación. Una regresión encuentra [math] \ hat {y} [/ math], que es la línea de regresión. Tienes la definición de la línea de regresión allí mismo en tu pregunta, así que te dejaré jugar con las ecuaciones hasta que estés satisfecho de que [matemáticas] \ hat {y} \ neq \ mu_ \ frac {Y} {X} [/matemáticas].

¿Porque la intersección y de la línea de regresión no está cerca de 0? Está asumiendo que la línea de mejor ajuste pasa por el origen, lo que casi nunca será el caso.