¿Cuáles son algunas formas de estandarizar los datos recopilados de diversas fuentes para un gran departamento de educación del gobierno?

La estandarización de datos es una molestia. A menudo, los elementos de datos se recopilan para un propósito específico (y, como resultado, se unen a un formato y sistema en particular). En lo que te encuentras es en todo el dominio de la reconciliación semántica de datos. http://jeffjonas.typepad.com/jef…

Este artículo “Por qué sus datos no se mezclarán” explica los problemas y enfoques con este dominio. http://queue.acm.org/detail.cfm?…

Intentar cambiar simultáneamente todos los sistemas escolares es una solución tentadora, pero podría no ser posible por varias razones (el gasto de mudarse a un ‘nuevo’ sistema, crear cambios en las organizaciones es difícil, etc.).

Le recomiendo que concentre su esfuerzo en crear una especificación simple para describir todos los datos de la escuela en un formato abierto neutral (valores separados por comas, JSON, XML). Una vez que haya definido esa especificación de datos, puede establecer una fecha objetivo para todos los más de 200 proveedores para crear exportaciones de información que admitan el formato unificado.