¿Cuáles son los desafíos en la medición de la educación?

El primer desafío es saber lo que desea medir; ¿Qué es importante sobre el plan de estudios que se enseñó? ¿Desea evaluar el conocimiento (ejemplo: ¿en qué año se firmó la Carta Magna?), O la comprensión (ejemplo: defender la declaración, “La Carta Magna es uno de los documentos más importantes de la historia”) o la capacidad del estudiante para evaluar materiales y sintetizar una pieza original (ejemplo: Dados 10 documentos, lea el material y escriba un ensayo que: Tiene una tesis relevante y respalda esa tesis con evidencia de los documentos. Utiliza todos los documentos. Analiza los documentos agrupándolos como muchas formas apropiadas como sea posible. No simplemente resume los documentos individualmente. Toma en cuenta tanto las fuentes de los documentos como los puntos de vista de los autores. Explica la necesidad de un tipo de documento adicional.) [1]

El segundo desafío es la validez. ¿Las preguntas están bien escritas sin direcciones ambiguas, sesgos culturales / de género o múltiples respuestas posibles que no se tienen en cuenta en la rúbrica de puntuación? (¿La prueba realmente mide lo que crees que estás midiendo? (Una prueba de papel-lápiz no sería una medida válida de la capacidad del estudiante para reparar un pequeño motor de gas). ¿Se utilizan los resultados de manera consistente con ¿El diseño de la prueba? (Sería inválido usar los puntajes AP como calificación final del curso 3 = C, 4 = B, 5 = A).

La tercera pregunta es la fiabilidad. ¿El examen ofrece el mismo resultado cuando se emite varias veces o en forma paralela? El AP da sus exámenes a principios de mayo y luego un maquillaje a fines de mayo. ¿Los dos exámenes darán el mismo resultado o fue uno más difícil? Si doy un examen a mi clase de primer período y luego a mi clase de último período, ¿puedo confiar en que los resultados sean las habilidades de los estudiantes o podrían otros factores afectar el resultado?

Finalmente, la seguridad debe ser considerada. Hacer trampa es rampante y afecta en gran medida los resultados de las pruebas. La seguridad del sitio de prueba no debe tomarse a la ligera. El CollegeBoard tiene algunas de las mejores prácticas vigentes y deben modelarse. Por ejemplo: recolecte todos los dispositivos electrónicos cuando los estudiantes ingresen (a menos que se requiera una calculadora, luego verifique que se borre la memoria), cree un búfer a la izquierda y a la derecha del estudiante (ya sea al tener tres pies a cada lado), con múltiples colores codificados formas de los exámenes, asientos asignados al azar para el examen, todos terminan al mismo tiempo, se recoge todo el papel de desecho, etc. Si la seguridad no es una prioridad, todos los demás puntos que se hacen aquí son discutibles.

Notas al pie

[1] http://elpaso.episd.org/UserFile…

Depende de qué medidas esté hablando. La medición como para determinar la efectividad del personal docente en una escuela generalmente se basa en pruebas estatales anuales de “alto riesgo”. Estas pruebas miden una nueva clase de estudiantes cada año, por lo que las pruebas son una medida ineficaz. El desafío es medir el crecimiento de cada estudiante individualmente de año en año. Los datos agregados simplemente proporcionan una “instantánea” del nivel de conocimiento en un tema de ese grupo de estudiantes en ese momento. No refleja el crecimiento de cada estudiante individual desde la última prueba.