¿Debería concentrarse en P (y | x) sobre P (y, x) si la inferencia causal no es importante?

Si [matemática] P (y | x)> P (y | \ neg {x}) [/ matemática] es alguna evidencia de que [matemática] x [/ matemática] causa [matemática] y [/ matemática], [matemática] y [/ math] causa [math] x [/ math] o algo más causa tanto [math] x [/ math] como [math] y [/ math]. En sí mismo es una evidencia extremadamente débil, pero puede ser parte de un argumento más amplio que respalda la causalidad.

[matemática] P (y, x)> P (y) P (x) [/ matemática] significa que [matemática] y [/ matemática] y [matemática] x [/ matemática] tienen correlación positiva, tienden a ocurrir juntas más de lo que lo harían si fueran independientes. Esta no es una mejor o peor indicación de causalidad que [matemáticas] P (y | x)> P (y | \ neg {x}) [/ matemáticas], excepto que utiliza todos los datos, no solo las observaciones en las que [ se produjo matemática] y [/ matemática].

La razón por la cual la forma condicional te parece una evidencia más fuerte de causalidad es cuantitativa, no lógica. Si [math] y [/ math] es raro, entonces la evidencia de las observaciones sin [math] y [/ math] no es muy significativa. Si crees que ser alto hace que las personas se conviertan en multimillonarios, no sirve de mucho medir las alturas de los no multimillonarios. Lógicamente, podría hacer eso, y decir que cada persona que no sea multimillonaria es una evidencia a favor de su teoría. Podría estudiar un millón de no multimillonarios y descubrir que el 49.9998% eran altos y el 50.0002% eran bajos y no sabría mucho más que cuando comenzó, aunque técnicamente tiene observaciones confirmadoras.

Es mucho más eficiente medir las alturas de los multimillonarios y decir que cada multimillonario alto es evidencia a favor. Si descubrieras que 8 de cada 10 multimillonarios eran más altos que la mediana de la población, eso sería una evidencia mucho mejor que tu muestra de millones de no multimillonarios.

[matemática] P (y / x) [/ matemática], significa probabilidad de evento y dado que el evento x ha ocurrido.

[matemática] P (y, x) = P (y \ cap x) [/ matemática], significa que la probabilidad de evento y y x han ocurrido juntos.

[matemáticas] P (y / x) = \ frac {P (y, x)} {P (x)} [/ matemáticas]