Cómo encontrar una matriz de transición

Hola 🙂

Una matriz de transición describe una cadena de Markov [matemática] {\ displaystyle {\ boldsymbol {X}} _ {t}} [/ math] sobre un espacio de estado finito S.

Si la probabilidad de pasar de [matemática] {\ displaystyle i} [/ matemática] a [matemática] {\ displaystyle j} [/ matemática] en un solo paso de tiempo es [matemática] {\ displaystyle Pr (j | i) = P_ {i, j}} [/ math], la matriz de transición [math] {\ displaystyle P} [/ math] se da usando [math] {\ displaystyle P_ {i, j}} [/ math] como [ matemática] {\ displaystyle i ^ {th}} [/ math] fila y [math] {\ displaystyle j ^ {th}} [/ math] elemento de columna, por ejemplo,

[matemáticas] {\ displaystyle P = \ left ({\ begin {matrix} P_ {1,1} & P_ {1,2} & \ dots & P_ {1, j} & \ dots \\ P_ {2,1} & P_ {2,2} & \ dots & P_ {2, j} & \ dots \\\ vdots & \ vdots & \ ddots & \ vdots & \ ddots \\ P_ {i, 1} & P_ {i, 2} & \ dots & P_ {i, j} & \ dots \\\ vdots & \ vdots & \ ddots & \ vdots & \ ddots \ end {matrix}} \ right).} [/ Math]

Dado que el total de la probabilidad de transición de un estado [matemático] {\ displaystyle i} [/ matemático] a todos los demás estados debe ser 1, esta matriz es una matriz estocástica derecha, de modo que

[matemáticas] {\ displaystyle \ sum _ {j} P_ {i, j} = 1. \,} [/ matemáticas]

El producto de dos matrices de transición correctas también es la transición correcta. En particular, la [matemática] {\ displaystyle k} [/ math] -th power [math] {\ displaystyle P ^ {k}} [/ math] de una matriz de transición derecha [math] {\ displaystyle P} [/ matemáticas] también es correcto estocástico. La probabilidad de transición de [matemáticas] {\ displaystyle i} [/ matemáticas] a [matemáticas] {\ pantalla estilo j} [/ matemáticas] en dos pasos viene dada por [matemáticas] {\ pantalla estilo (i, j) ^ {th}} [/ math] elemento del cuadrado de [math] {\ displaystyle P} [/ math]:

[matemáticas] {\ displaystyle \ left (P ^ {2} \ right) _ {i, j}.} [/ math]

En general, la transición de probabilidad de pasar de cualquier estado a otro estado en una cadena de Markov finita dada por la matriz [matemática] {\ displaystyle P} [/ math] en k pasos viene dada por [math] {\ displaystyle P ^ {k }}[/matemáticas].

Una distribución inicial se da como un vector de fila.

Un vector de probabilidad estacionario [math] {\ displaystyle {\ boldsymbol {\ pi}}} [/ math] se define como una distribución, escrita como un vector de fila, que no cambia bajo la aplicación de la matriz de transición; es decir, se define como una distribución de probabilidad en el conjunto [matemática] {\ displaystyle \ {1, …, n \}} [/ matemática] que también es un vector propio de fila de la matriz de probabilidad, asociado con el valor propio 1:

[matemáticas] {\ displaystyle {\ boldsymbol {\ pi}} P = {\ boldsymbol {\ pi}}.} [/ math]

El radio espectral derecho de cada matriz estocástica derecha es claramente como máximo 1. Además, cada matriz de transición derecha tiene un vector propio de columna obvio asociado al valor propio 1: El vector [matemáticas] {\ displaystyle {\ boldsymbol {1}}} [/ matemática], cuyas coordenadas son todas iguales a 1. Como los valores propios izquierdo y derecho de una matriz cuadrada son iguales, cada matriz estocástica tiene, al menos, un vector propio de fila asociado al valor propio 1 y el valor absoluto más grande de todos sus valores propios es también 1. Finalmente, el teorema del punto fijo de Broouwer (aplicado al conjunto convexo compacto de todas las distribuciones de probabilidad del conjunto finito [matemáticas] {\ displaystyle \ {1, …, n \}} [/ matemáticas]) implica que hay algún vector propio izquierdo que también es un vector de probabilidad estacionario.

Por otro lado, el teorema frobenioso de Perron también asegura que cada matriz de transición irreducible tenga un vector estacionario, y que el mayor valor absoluto de un valor propio sea siempre 1. Sin embargo, este teorema no puede aplicarse directamente a tales matrices porque no necesitan ser irreducible

En general, puede haber varios de tales vectores. Sin embargo, para una matriz con entradas estrictamente positivas (o, más generalmente, para una matriz de transición aperiódica irreducible), este vector es único y puede calcularse observando que para cualquier [matemática] {\ displaystyle i} [/ matemática] tenemos el siguiente límite,

[matemáticas] {\ displaystyle \ lim _ {k \ rightarrow \ infty} \ left (P ^ {k} \ right) _ {i, j} = {\ boldsymbol {\ pi}} _ {j},} [/ matemáticas]

donde [math] {\ displaystyle {\ boldsymbol {\ pi}} _ {j}} [/ math] es el elemento [math] {\ displaystyle j ^ {th}} [/ math] del vector fila [math] {\ displaystyle {\ boldsymbol {\ pi}}} [/ math]. Entre otras cosas, esto dice que la probabilidad a largo plazo de estar en un estado [math] {\ displaystyle j} [/ math] es independiente del estado inicial [math] {\ displaystyle i} [/ math]. Que ambos cálculos den el mismo vector estacionario es una forma de un teorema ergódico que generalmente es cierto en una amplia variedad de sistemas dinámicos disipativos: el sistema evoluciona, con el tiempo, a un estado estacionario.

Intuitivamente, una matriz de transición representa una cadena de Markov; La aplicación de la matriz estocástica a una distribución de probabilidad redistribuye la masa de probabilidad de la distribución original al tiempo que conserva su masa total. Si este proceso se aplica repetidamente, la distribución converge a una distribución estacionaria para la cadena de Markov.

Ejemplo: el gato y el ratón

Suponga que tiene un temporizador y una fila de cinco cuadros adyacentes, con un gato en el primer cuadro y un mouse en el quinto cuadro en el momento cero. El gato y el ratón saltan a una casilla adyacente aleatoria cuando avanza el temporizador. Por ejemplo, si el gato está en el segundo cuadro y el mouse en el cuarto, la probabilidad es un cuarto de que el gato estará en el primer cuadro y el mouse en el quinto después de que el temporizador avance . Si el gato está en el primer cuadro y el ratón en el quinto, la probabilidad es que el gato esté en el cuadro dos y el ratón en el cuadro cuatro después de que el temporizador avance. El gato se come al ratón si ambos terminan en la misma casilla, momento en el que termina el juego. La variable aleatoria K da el número de pasos de tiempo que el mouse permanece en el juego.

La cadena de Markov que representa este juego contiene los siguientes cinco estados especificados por la combinación de posiciones (gato, ratón):

  • Estado 1: (1,3)
  • Estado 2: (1,5)
  • Estado 3: (2,4)
  • Estado 4: (3,5)
  • Estado 5: juego terminado: (2,2), (3,3) y (4,4).

Utilizamos una matriz de transición para representar las probabilidades de transición de este sistema (las filas y columnas de esta matriz están indexadas por los posibles estados enumerados anteriormente),

[Matemáticas] {\ displaystyle P = {\ begin {bmatrix} 0 & 0 & 1/2 & 0 & 1/2 \\ 0 & 0 & 1 & 0 & 0 \\ 1/4 & 1/4 & 0 & 1/4 & 1/4 \\ 0 & 0 & 1/2 & 0 & 1/2 \\ 0 & 0 & 0 & 0 & 1 \ end {bmatrix}. }[/matemáticas]

Espero que esto ayude 🙂