PageRank calcula una aproximación iterativa al vector propio principal de la matriz de adyacencia para un gráfico, con un par de modificaciones para hacer que se asuma que un nodo sin bordes de salida se vincula a todo. La última propiedad y el factor de “aburrimiento” incorporado en el modelo aseguran la ergodicidad, esto asegura que el proceso de Markov resultante esté bien definido y no sea periódico.
Para demostrar que es correcto, puede salir y estudiar cómo funcionan las cadenas de Markov. Hay mucho trabajo disponible en este espacio para construir.
Pero verifique más libremente un vector propio calculado por PageRank en particular, demuestre que si comienza en una página aleatoria con probabilidad proporcional a su rango de página y realiza la transición a uno de los objetivos a los que enlaza o vuelve a intentar este proceso si no tiene enlaces salientes, entonces el la probabilidad de que aterrice en una página determinada debería coincidir también con el rango de la página, al igual que la selección de la página anterior.
Una prueba más rigurosa de que el PageRank es correcto procede mostrando que las probabilidades de transición del proceso de Markov que describe satisfacen el equilibrio detallado.
- Dado un número N <10 ^ 100, ¿cuántos números cuyos dígitos son una permutación de dígitos en N que son divisibles por 11? Gracias por adelantado.
- Trigonometría (matemática): ¿Cómo puedo obtener un triple pitagórico de una hipotenusa dada (si existe)?
- ¿Cómo puedo generar 8 números (aleatorios) que deberían oscilar entre 0 y 80 y la suma de esos 8 números generados debería ser 80.?
- Combinatoria: Sea el conjunto de {(1,1), (1, -1), (-1,1)} -trayecto de red que comienza en (1,1), no use el mismo vértice dos veces, y nunca toque el eje x o el eje y. ¿Cuántos caminos terminan en el punto (4,8)?
- ¿Cómo puedo determinar el límite superior más ajustado para el problema 30 en el Proyecto Euler?
La prueba de que este vector propio es útil para su propósito declarado es otra cuestión. En la práctica, Google utiliza muchos ajustes al algoritmo de PageRank sin procesar al decidir qué mostrar a los usuarios. Estos se utilizan para combatir el correo no deseado, granjas de enlaces, compensar las limitaciones conocidas del algoritmo, ya que favorece el material antiguo, etc.
Dicho esto, el tipo de proceso de Markov sobre el que se basa se ha utilizado para todo, desde la representación de películas hasta las constantes determinantes que fueron necesarias para desarrollar la primera bomba atómica, ¡por lo que los principios subyacentes son bastante sólidos!