¿Cuál es la intuición detrás de la propiedad sin memoria de las variables aleatorias geométricas y exponenciales?

Distribución Geometrica

Una distribución geométrica con el parámetro p puede considerarse como el número de ensayos de variables aleatorias independientes de Bernoulli (p) hasta el primer éxito. Considere una moneda que aterriza con probabilidad p. Un lanzamiento de moneda es un ensayo de Bernouilli (p). El número de vueltas hasta que vea la primera cabeza se distribuye como Geométrico (p).

Entonces, ¿por qué muestra esto la propiedad Memoryless?

De manera simple e intuitiva, si recojo mi moneda injusta ahora y comienzo las pruebas para generar una variable Geométrica, ¿lo que hice con la moneda antes de comenzar, hace alguna diferencia? Si lanzo la moneda cien veces antes de que comience mi prueba, ¿obtendré una respuesta diferente una vez que comience las pruebas? ¡Diría que esto es intuitivamente un obvio no!

Distribución exponencial

El “salto intuitivo” un poco más grande es cuando pensamos en la distribución exponencial. La distribución exponencial es continua, por lo que no podemos hablar de eventos discretos como el lanzamiento de una moneda.

Sin embargo, podemos pensar en la distribución exponencial como un límite de una distribución geométrica donde dividimos el dominio continuo en intervalos más pequeños.

Primero, dividamos el dominio en segmentos de longitud 1, y tratemos cada segmento como una prueba con probabilidad p. El tiempo hasta nuestro primer éxito se distribuye geométricamente con el parámetro p, y también lo tiene la propiedad Memoryless.

Ahora dividamos el dominio en segmentos más pequeños de longitud x, y tratemos cada uno como una prueba con probabilidad x * p. El tiempo hasta nuestro primer éxito ahora se distribuye como una distribución geométrica con el parámetro x * p, multiplicado por (1 / x). Esto es solo un múltiplo constante de la distribución geométrica, por lo que nuevamente no tiene memoria.

Esta x puede ser tan pequeña como queramos, y como tiende a cero obtenemos la distribución exponencial (¡la prueba se deja al lector!). Esperemos que sea intuitivo ver que este límite retendrá la propiedad Sin memoria.

Solo me enfocaré en la distribución exponencial interpretada como una distribución de supervivencia. Los modelos de supervivencia son tratados, por ejemplo, por Germán Rodríguez en el Capítulo 7 de sus notas de la conferencia GLM: http://data.princeton.edu/wws509

Un concepto clave es el de la función de peligro h (t). Si f (t) es una función de densidad para toda la vida T y F (t) es el cdf de T, entonces h (t) = f (t) / (1 – F (t)) es proporcional a la tasa de mortalidad en el momento t.

Puede imaginar por qué h (t) podría aumentar con t en algunas situaciones, ya que la tasa de mortalidad de un individuo puede tender a aumentar a medida que el individuo envejece. Por otro lado, si considera una población de fragilidad / robustez variable, la razón de riesgo puede disminuir con el tiempo, ya que los miembros de peor calidad pueden fallar temprano dejando atrás unidades más robustas.

Puede imaginar una población donde ambos efectos están presentes y tal vez se cancelen exactamente produciendo una relación de riesgo constante. No es difícil demostrar que tales poblaciones tienen vidas distribuidas exponencialmente.

Con geométrica no es demasiado difícil de describir. Los ensayos son independientes, los ensayos tienen la misma probabilidad y no hay restricción en el número de ensayos. Con base en esos 3 hechos, no importa cuántos intentos haya realizado, porque sus intentos anteriores no cambiarán los intentos futuros, la probabilidad de los intentos no cambia a medida que realiza más intentos, y no tiene que preocuparse por alcanzar un número máximo de intentos ya que los intentos podrían continuar infinitamente.

La distribución exponencial es algo así como la versión continua de la distribución geométrica. Geometric te da el número de intentos hasta el primer éxito cuando los intentos son de probabilidad constante. Exponencial es la cantidad de tiempo hasta el primer éxito cuando hay una tasa constante de éxitos.