¿Qué es una matriz de coincidencia?

Contestaré a modo de ejemplo simple. Supongamos que tenemos una fila dedicada a cada lanzador que alguna vez lanzó un lanzamiento en Major League Baseball y una columna dedicada a cada bateador que alguna vez tuvo una aparición en el plato en Major League Baseball. Ahora, en el elemento matriz con la fila Sandy Koufax y la columna Willie Mays, almacenamos el valor que es igual al número de apariciones en placa en las que Willie Mays se enfrentó a Sandy Koufax.

Ahora, completamos la matriz completa (enorme) de esa manera. En cualquier elemento en particular, almacenamos el número de veces que la masa de su columna se enfrentó al lanzador de su fila. Lo que hemos construido es una matriz de coincidencia que representa a todos los bateadores en la historia del béisbol. Por supuesto, la mayoría de la matriz está poblada por ceros, ya que la mayoría de los lanzadores y bateadores no jugaron en la misma época, pero los elementos distintos de cero nos dicen con qué frecuencia los competidores jugaron entre sí.

Eso es realmente todo lo que es una matriz de coincidencia. Es una herramienta para almacenar el recuento de la frecuencia con la que un par de cosas en particular ocurrieron juntas.

  • La matriz de coincidencia tiene entidades específicas en filas y entidades en columnas.
  • Número de veces que cada entidad en filas aparece en el mismo contexto que cada entidad en columnas.

Ejemplo

matriz de coincidencia palabra-palabra