¿Por qué los maestros de California no permiten evaluaciones, a diferencia de casi cualquier otro estado en los Estados Unidos?

No estoy en California, no he enseñado en California, ni tengo una gran comprensión de los educadores de California; sin embargo, puedo hablar sobre los problemas que rodean los procesos de evaluación promulgados por el gobierno federal actual, y sus fortalezas y debilidades.

El sistema actual nace de la desesperación, en realidad. El Congreso, en su incapacidad para hacer algo efectivo, ha derogado cualquier obligación de actualizar la Ley de Educación Primaria y Secundaria (ESEA, por sus siglas en inglés) o, como se conoce más comúnmente en su iteración actual, la Ley No Child Left Behind. Esta ley se ha actualizado muchas veces a lo largo de la historia, por lo que no sería revolucionario redefinirla o volver a autorizarla.

La ley estableció que todas las escuelas mantengan un “progreso anual adecuado” (AYP) que se determinó mediante pruebas estandarizadas. Para fines del año escolar 2013-2014 (el año pasado), se requería que todas las escuelas del país que recibían fondos del Título I tuvieran el 100% de sus estudiantes evaluados con una calificación “competente” en las materias básicas como matemáticas, artes del lenguaje y Ciencias.

Desafortunadamente, esto es matemáticamente imposible debido a la forma en que se estructuran las pruebas estandarizadas. Para una revisión más completa, sugiero leer textos excelentes como The Truth about Testing , de James Popham. Robert Marzano es otro excelente recurso en esta área. La explicación breve es que estas pruebas son lo que llamamos norma referenciada , lo que significa que solo juzgan a los estudiantes unos contra otros, no contra un estándar. La única forma de clasificar a estos estudiantes de manera efectiva es que una prueba tenga una “distribución de puntaje” lo suficientemente grande como para definir claramente qué estudiantes están en qué percentil. Para crear una distribución de puntaje adecuada, a cada pregunta se le asigna un “valor P”, que es el porcentaje de personas que rinden el examen y se equivocan . Para que una pregunta sea válida a efectos de la distribución del puntaje, un buen valor de P está entre 40-60%. Si muchos examinados responden bien o mal a la pregunta, no se puede usar de manera efectiva para diferenciar a los estudiantes.

En otras palabras, estas pruebas están estructuradas matemáticamente para crear una distribución de curva de campana al 50% y clasificar artificialmente a los estudiantes entre sí, no contra un estándar fijo de competencia.

Esto ha sido un desastre, por supuesto, ya que las escuelas que no pueden cumplir con AYP pierden sus fondos. Varios estados ajustaron artificialmente las barras para sus exámenes para que pareciera que más estudiantes eran competentes al crear esencialmente una mejor distribución cada año donde la curva alcanzaba su punto más alto.

Cuando quedó claro que NCLB iba a ser un fracaso absoluto, y el Congreso se negó a cambiar la ley, la administración actual ofreció un programa de exención e incentivos llamado Race to the Top . Exigió a los estados que firmen los relativamente nuevos (en ese momento) Estándares Estatales Básicos Comunes (que ya estaban ganando una gran popularidad y tenían significativamente más estados firmando incluso sin los incentivos RttT) y también que los estados adoptaron un Nuevo modelo de evaluación del educador que utilizó el progreso del estudiante como una medida de la efectividad del educador.

Ahora, eso parece una propuesta decente, ¿verdad? En su mayor parte, lo es. Los requisitos de exención en realidad ni siquiera especifican que se requieren pruebas estandarizadas para mostrar el progreso del estudiante. Eso fue dejado a un estado por decisión del estado. Desafortunadamente, la gran mayoría de los estados interpretaron que incluye pruebas .

Los investigadores educativos nos dicen que la forma más auténtica de evaluación se basa en la cartera. En mis experiencias, estoy de acuerdo. Sin embargo, las carteras son prácticamente imposibles de cuantificar objetivamente y ubicar en números ordenados que pueden ser fácilmente compilados por los administradores y publicados en el periódico local. Las pruebas son mucho más eficientes para eso.

Incluso aquellos estados que han adoptado un enfoque más equilibrado aún se encuentran con el gran problema de cómo evaluar el progreso de ese estudiante. Un modelo muy popular que se está adoptando en todo el país es el Marco Danielson. Es un instrumento razonablemente eficiente que trata de dividir la línea entre la evaluación objetiva y subjetiva, y requiere una gran cantidad de capacitación para los evaluadores. La desventaja de esto es que un modelo de evaluación de este tipo requiere literalmente decenas de horas de observaciones, evaluaciones de cartera, evidencia en video, tutoriales, datos de estudiantes y más que deben pasar por cada educador. Miles de escuelas en todo el país están contratando administradores por lo general para duplicar o triplicar el salario inicial promedio de un educador, cuyo único propósito es el evaluador del distrito. Esto les quita recursos sustanciales a las escuelas que ya tienen poco dinero para cumplirlas.

Incluso entonces, ese evaluador tiene una enorme cantidad de autoridad para crear esos datos de observación, y puede interpretar y observar las cosas a través de su propio lente personal. Un maestro que es políticamente impopular puede encontrar sus manos en el destino de una persona con un hacha para aplastarlas. Muchas escuelas están promoviendo a estos evaluadores de sus equipos administrativos actuales o de educadores dispuestos a capacitarse. De repente, puede encontrar todo su destino descansando en manos de una persona con la que anteriormente no se llevaba bien. Del mismo modo, tal vez ese ex educador sea tu amigo. ¿Te da una evaluación un poco más agradable, esquiva un poco las cosas, porque sabe que tiendes a ser un mejor maestro de lo que está viendo en el día? ¿Favorece a sus amigos, incluso si ese sesgo es inconsciente o implícito? Si bien el Marco Danielson intenta eliminar eso lo más posible, es imposible erradicarlo por completo, y eso es con administradores honestos .

Más allá de todo esto está el hecho de que los factores externos tienden a influir en el éxito del estudiante tanto como cualquier maestro. El estado socioeconómico es el factor correlativo más grande con el éxito de los estudiantes, y California tiene una gran población de estudiantes que viven en la pobreza. Estos factores pueden tener un gran impacto en los resultados de los estudiantes y están completamente fuera del control de los educadores.

Dado todo esto, los modelos evaluativos que están siendo presionados por Arne Duncan y la administración actual se envían con muchas zanahorias y un enorme problema financiero. No culpo por completo a California por cuestionar la validez de estas métricas utilizadas para medir a los educadores, que pueden o no ser realmente un reflejo del trabajo real que está haciendo el educador.

Casi todos los estados han recibido exenciones y California está trabajando en ello (y, probablemente, trabajando en una exención). El artículo que cita no cita a ningún funcionario que exprese “rechazo desafiante”.