Los puntajes de los exámenes de los estudiantes nos dicen más sobre la comunidad en la que viven que lo que saben

Cada año, los legisladores de los EE. UU. Toman decisiones que cambian la vida según los resultados de las pruebas estandarizadas. Estas decisiones de alto riesgo incluyen, entre otras, la promoción del estudiante al siguiente nivel de grado, la elegibilidad de los estudiantes para participar en los cursos avanzados, la elegibilidad para graduarse de la escuela secundaria y la permanencia de los maestros. En estados 40, los maestros son evaluados en parte, se basa en los resultados de las pruebas estandarizadas de los estudiantes, al igual que los administradores escolares en casi los estados de 30.

Sin embargo, la investigación muestra que los resultados de las pruebas estandarizadas no reflejan la calidad de la instrucción, como se pretende. Colegas y yo hemos realizado estudios en New Jersey, Connecticut, Massachusetts, Iowa y Michigan.

Los resultados muestran que es posible predecir los porcentajes de estudiantes que obtendrán una calificación de competente o superior en algunas pruebas estandarizadas. Podemos hacer esto solo mirando algunas de las características importantes de la comunidad, en lugar de factores relacionados con las mismas escuelas, como la relación alumno-maestro o la calidad del docente.

Esto plantea la posibilidad de que haya serios defectos incorporados en los sistemas de responsabilidad educativa y las decisiones sobre educadores y estudiantes dentro de esos sistemas.

Pruebas estandarizadas

Los puntajes de los estudiantes en pruebas estandarizadas obligatorias se han utilizado para evaluar a los educadores, estudiantes y escuelas de los Estados Unidos desde que el presidente George W. Bush firmó el Ley Que Ningún Niño Se Quede Atrás (NCLB) en 2002.

Aunque más de los estados de 20 habían instituido anteriormente pruebas estatales en algunos niveles de grado por los 1990 tardíos, NCLB exigió pruebas estandarizadas anuales en todos los estados de 50. Se requirieron exámenes estandarizados de matemáticas y artes del idioma inglés en los grados tres a ocho y una vez en la escuela secundaria. Los funcionarios estatales de educación también tuvieron que administrar un examen de ciencias estandarizado en cuarto grado, octavo grado y una vez en la escuela secundaria.


gráfico de suscripción interior


La administración de Obama amplió las pruebas estandarizadas a través de los requisitos en el programa de subvención Race to the Top y financiando el desarrollo de dos pruebas nacionales estandarizadas relacionadas con Estándares Estatales Comunes: Smarter Balanced Assessment Consortium (SBAC) y el Asociación para la evaluación de la preparación de la universidad y las carreras profesionales (PARCC).

Cuarenta y cinco estados inicialmente adoptaron el Common Core de alguna forma. Aproximadamente 20 es actualmente parte de los consorcios PARCC o SBAC. Las partes clave de las aplicaciones Race to the Top requieren que los estudiantes utilicen los resultados de las pruebas para evaluar a los maestros y a los directores.

Puntajes de predicción

Han pasado ya bien establecido que las variables fuera de la escuela, demográficas de la comunidad y nivel familiar influyen fuertemente en el rendimiento estudiantil en las pruebas estandarizadas a gran escala.

Por ejemplo, ingreso familiar mediano es un fuerte predictor de resultados SAT. Otros factores fuertemente vinculados al rendimiento en las pruebas estandarizadas estatales incluyen los niveles de educación de los padres, el porcentaje de padres solos en la comunidad escolar y el porcentaje de familias que viven en la pobreza en la comunidad.

Decidimos ver si podíamos predecir puntuaciones de exámenes estandarizados en función de factores demográficos relacionados con la comunidad donde vivía un alumno. Al observar de tres a cinco variables demográficas de la comunidad y la familia a partir de los datos del censo de EE. UU., hemos sido capaces de predecir con precisión los porcentajes de estudiantes que obtienen una calificación de competente o superior en los puntajes de las pruebas estandarizadas para los grados tres a 12. Estas predicciones se realizan sin tener en cuenta los factores de datos del distrito escolar, como el tamaño de la escuela, la experiencia del docente o el gasto por alumno.

Nuestros modelos pueden identificar cuánto afecta una variable en particular los puntajes de los estudiantes. Eso nos permite identificar las características demográficas más importantes según se relacionan con los resultados de las pruebas. Por ejemplo, al observar solo una característica, el porcentaje de familias en una comunidad dada que vive en la pobreza, podemos explicar casi el 58 por ciento del puntaje de la prueba en artes del lenguaje inglés del octavo grado.

Nuestro estudio más reciente exploró tres años de puntajes de exámenes del sexto al octavo grado en más de las escuelas de 300 New Jersey. Analizamos el porcentaje de familias en la comunidad con ingresos superiores a US $ 200,000 por año, el porcentaje de personas en una comunidad en pobreza y el porcentaje de personas en una comunidad con títulos de licenciatura. Descubrimos que podíamos predecir el porcentaje de alumnos que obtuvieron una calificación de competente o superior en el porcentaje de 75 de las escuelas que analizamos.

Un estudio anterior que se centró en los resultados de las pruebas de quinto grado en Nueva Jersey predijo los resultados con precisión para 84 por ciento de las escuelas en un período de tres años.

Evaluaciones más inteligentes

Para ser claros, esto no significa que el dinero determine cuánto pueden aprender los estudiantes. Eso no podría estar más lejos de la verdad. De hecho, nuestros resultados demuestran que las pruebas estandarizadas realmente no miden cuánto aprenden los estudiantes, o qué tan bien los maestros enseñan, o qué tan efectivos los líderes escolares dirigen sus escuelas. Tales pruebas son instrumentos contundentes que son altamente susceptibles de medir los factores fuera de la escuela.

Aunque algunos defensores de la evaluación estandarizada afirman que los puntajes se pueden usar para medir la mejora, descubrimos que simplemente hay demasiado ruido. Los cambios en los puntajes de las pruebas de un año a otro pueden atribuirse al crecimiento normal durante el año escolar, ya sea que el estudiante haya tenido un mal día o se sienta enfermo o cansado, mal funcionamiento de la computadora u otros factores no relacionados.

De acuerdo con los manuales técnicos publicados por los creadores de las evaluaciones estandarizadas, ninguna de las pruebas actualmente en uso para juzgar la efectividad del administrador de maestros o la escuela o el rendimiento del estudiante han sido validadas para esos usos. Por ejemplo, ninguna de las investigaciones de PARCC, como provisto por PARCC, aborda estos problemas directamente. Las pruebas simplemente no están diseñadas para diagnosticar el aprendizaje. Simplemente son dispositivos de monitoreo, como lo demuestran sus informes técnicos.

El resultado final es el siguiente: Si está tratando de medir la competencia o el crecimiento, las pruebas estandarizadas no son la respuesta.

Aunque nuestros resultados en varios estados han sido convincentes, necesitamos más investigación a nivel nacional para determinar la cantidad de puntajes de las pruebas que están influenciados por factores fuera de la escuela.

Si estos resultados de pruebas estandarizadas pueden predecirse con un alto nivel de precisión por factores comunitarios y familiares, tendría importantes implicaciones políticas. En mi opinión, sugiere que debemos descartar toda la base de políticas que usa los resultados de estas pruebas para tomar decisiones importantes sobre el personal de la escuela y los estudiantes. Después de todo, estos factores están fuera del control de los estudiantes y el personal de la escuela.

Aunque hay disputas ideológicas sobre los méritos de los resultados de las pruebas estandarizadas, la ciencia se ha vuelto más clara. Los resultados sugieren que los resultados de las pruebas estandarizadas cuentan más sobre la comunidad en la que vive un alumno que sobre la cantidad que el alumno ha aprendido o sobre el crecimiento académico, social y emocional del alumno durante el año escolar.

Aunque algunos quizás no quieran aceptarlo, con el tiempo, evaluaciones hechas por los maestros son mejores indicadores del rendimiento estudiantil que las pruebas estandarizadas. Por ejemplo, el GPA de la escuela secundaria, que se basa en las evaluaciones del aula, es un mejor predictor del éxito del estudiante en el primer año de la universidad que el SAT.

La conversaciónEste cambio contribuiría en gran medida a proporcionar información importante sobre la enseñanza efectiva, en comparación con un puntaje de prueba que tiene poco que ver con el docente.

Sobre la autora

Christopher Tienken, Profesor Asociado de Gestión y Política de Liderazgo Educativo, Universidad Seton Hall

Este artículo se publicó originalmente el La conversación. Leer el articulo original.

Libros de este autor

at InnerSelf Market y Amazon