Asumiré que cada entrada tiene una probabilidad p de ser 1 y que todas las entradas son independientes. Luego, dado que hay N columnas, cada una de las M filas tiene varias que siguen una distribución binomial ( N, p ) y cada uno de estos binomios es independiente.
Ahora, encontremos la probabilidad de que las dos primeras filas no tengan el mismo número de unidades. Usaré q para esta probabilidad.
[matemática] q = \ sum_ {k = 0} ^ N \ izquierda (\ binom Nk p ^ k (1-p) ^ {Nk} \ derecha) ^ 2 [/ matemática]
Luego, notamos que cualquier par de filas tiene la misma probabilidad de coincidencia y hay \ frac {[math] M (M-1)} {2} [/ math] pares distintos. Creamos una variable aleatoria indicadora para cada par que toma el valor 1 si el par coincide y cero en caso contrario. Agregar estos indicadores da el número total de coincidencias. Por linealidad, el valor esperado de su suma es la suma de sus valores esperados. Como cada uno es un indicador, su valor esperado es solo q . Entonces, el número esperado de pares de partidos es
- ¿Por qué la velocidad de convergencia del descenso del gradiente depende de los valores propios máximos y mínimos de A para resolver AX = b a través de mínimos cuadrados?
- ¿Cuáles son las diferencias básicas entre SVD (Descomposición de valor singular) y EVD (Descomposición de valor de Eigen)?
- ¿Abandonamos el orden de las operaciones al resolver problemas de álgebra de dos pasos?
- En el aprendizaje automático, ¿cómo podemos determinar si un problema es lineal / no lineal?
- ¿Por qué las matrices ortogonales representan rotaciones / reflexiones e isometrías y qué representan las matrices unitarias en la teoría de grupos?
\ frac {[matemáticas] M (M-1) q} {2} [/ matemáticas]
Eso no es exactamente lo que pides, pero podría ayudarte a pensarlo detenidamente. Como es el momento del examen final, no intentaré dar una solución al problema de las distintas filas en este momento.