Si las varianzas de dos variables aleatorias (X e Y) son iguales, es decir Var (X) = Var (Y), ¿cuál es la covarianza de X e Y, que es Cov (X, Y)?

Sabemos que, en general, la correlación entre [matemáticas] X [/ matemáticas] y [matemáticas] Y [/ matemáticas] cae en el intervalo [matemáticas] [- 1, 1] [/ matemáticas]. Con un poco de álgebra, podemos reorganizar esto para decir que [math] | \ operatorname {Cov} (X, Y) | \ leq \ sqrt {\ operatorname {Var} (X) \ operatorname {Var} (Y)} [/ math]. Aquí tenemos [math] \ operatorname {Var} (X) = \ operatorname {Var} (Y) [/ math], por lo que podemos concluir que [math] | \ operatorname {Cov} (X, Y) | \ leq \ operatorname {Var} (X) [/ math].

Sin embargo, eso es todo lo que puede reducir sin más información. Si [matemática] X [/ matemática] y [matemática] Y [/ matemática] son ​​variables aleatorias normales estándar, su covarianza es igual a su correlación, y usted puede construir explícitamente una distribución gaussiana bivariada con cualquier correlación en el rango [matemática] [-1, 1] [/ matemáticas]. Por lo tanto, el conjunto de valores posibles para [math] \ operatorname {Cov} (X, Y) [/ math] es el intervalo [math] [- \ operatorname {Var} (X), \ operatorname {Var} (X)] [/matemáticas].

Como otros han dicho correctamente, Cov (X, Y) podría ser cualquier cosa. Pero me gustaría agregar algo de intuición aquí.

La varianza mide cuánto se desvía una variable aleatoria de su valor medio. Una varianza cercana a cero significa que casi siempre, la variable aleatoria toma valores muy cercanos a la media. Una variación mayor implica que puede estar más lejos de la media con mayor frecuencia.

Ahora todo lo que se le da aquí es que Var (X) y Var (Y) son iguales, lo que significa que tanto X como Y tienen la misma tendencia a estar lejos de la media.

La covarianza entre dos variables dice cuán correlacionada está una variable aleatoria con otra. Si dos variables aleatorias tienen una covarianza muy alta, entonces conocer una variable aleatoria le indica con alta probabilidad qué valor (o rango de valores) tomaría la otra variable aleatoria. Covarianza baja significa que si conoce una variable aleatoria, sabrá poco sobre el valor de la otra variable aleatoria.

Ahora, volviendo a la pregunta, verá que X e Y, que varían con la misma frecuencia con respecto a sus respectivos medios, no tienen absolutamente ninguna relación con cómo el conocimiento de uno afecta a otra variable.

No hay respuesta posible. Considere XY independiente, y XY siempre igual.

Cov (x, y)
= Corr (x, y) sqrt (var (x) var (y))

Entonces todo depende de la correlación de x e y.