¿Cómo puedo demostrar que el algoritmo Pagerank es correcto y funciona?

PageRank calcula una aproximación iterativa al vector propio principal de la matriz de adyacencia para un gráfico, con un par de modificaciones para hacer que se asuma que un nodo sin bordes de salida se vincula a todo. La última propiedad y el factor de “aburrimiento” incorporado en el modelo aseguran la ergodicidad, esto asegura que el proceso de Markov resultante esté bien definido y no sea periódico.

Para demostrar que es correcto, puede salir y estudiar cómo funcionan las cadenas de Markov. Hay mucho trabajo disponible en este espacio para construir.

Pero verifique más libremente un vector propio calculado por PageRank en particular, demuestre que si comienza en una página aleatoria con probabilidad proporcional a su rango de página y realiza la transición a uno de los objetivos a los que enlaza o vuelve a intentar este proceso si no tiene enlaces salientes, entonces el la probabilidad de que aterrice en una página determinada debería coincidir también con el rango de la página, al igual que la selección de la página anterior.

Una prueba más rigurosa de que el PageRank es correcto procede mostrando que las probabilidades de transición del proceso de Markov que describe satisfacen el equilibrio detallado.

La prueba de que este vector propio es útil para su propósito declarado es otra cuestión. En la práctica, Google utiliza muchos ajustes al algoritmo de PageRank sin procesar al decidir qué mostrar a los usuarios. Estos se utilizan para combatir el correo no deseado, granjas de enlaces, compensar las limitaciones conocidas del algoritmo, ya que favorece el material antiguo, etc.

Dicho esto, el tipo de proceso de Markov sobre el que se basa se ha utilizado para todo, desde la representación de películas hasta las constantes determinantes que fueron necesarias para desarrollar la primera bomba atómica, ¡por lo que los principios subyacentes son bastante sólidos!

Si no me equivoco, lo que quieres probar es la convergencia de la cadena de Markov con los puntajes de PageRank.
La matriz de transición del gráfico es una matriz estocástica. Los puntajes del PageRank forman el vector propio principal de la matriz de transición. La convergencia de la cadena de Markov con las puntuaciones de PageRank significa que el vector principal es invariante bajo la acción de la matriz de transición, es decir, el vector propio principal es el vector propio con valor propio 1.
Ahora el teorema de Perron-Frobenius garantiza la existencia de dicho vector propio.

Hay otras aplicaciones del mundo real para las que se puede usar el algoritmo PageRank:

  • Negociación bursátil
  • Sistemas de reputación para el comercio electrónico.
  • Las encuestas de opinión
  • Muchos otros

Intente aplicar el algoritmo a estos a mano para mostrar qué tan bien puede funcionar.

Construya algunos gráficos pequeños para los que pueda calcular la respuesta correcta a mano.

Creo que esto es una prueba de que funciona.

More Interesting

¿Por qué es cierto que si los rectángulos p se cruzan entre sí debe haber una región (tal vez tan pequeña como un punto) donde todos se superponen?

¿Cómo puedo encontrar el número de pares de enteros positivos [matemática] x, y [/ matemática] de modo que [matemática] x ^ 2 + 3y [/ matemática] y [matemática] y ^ 2 + 3x [/ matemática] son ​​ambos números cuadrados perfectos?

¿Cuál es la forma intuitiva más fácil de resolver problemas de valor esperado como “Determinar el número esperado de caras en n lanzamientos de monedas”?

Descubrí que hay un polinomio (nk) -gree (con propiedades interesantes), que puede darnos un número de Stirling del segundo tipo, en cualquier valor de ny k. ¿Vale la pena explorar el descubrimiento?

Suponga que el peso de 1 es cuatro y el peso de 0 es uno, ¿cómo puedo transformar una secuencia de 0s y 1s en otra secuencia, posiblemente con diferentes longitudes, de modo que exista una forma de retroceder y la nueva secuencia tenga la menor? posible peso?

¿Cuál es el número de disposición de N personas de diferentes alturas de modo que a lo sumo K de ellas sean visibles desde el frente de la línea? …

¿Por qué factorizar números en números primos es un problema difícil?

¿Cuál es el objeto matemático más genial que se puede visualizar?

Experimentos de pensamiento: ¿Cuáles son algunas formas interesantes, no necesariamente viables, de atacar la conjetura de la optimización dinámica?

¿Cuál es el propósito de probar el caso base en la inducción matemática?