Also known as validity
extent to which a test measures what it is supposed to measure
La validez de la prueba es la medida en que una prueba (como una prueba química, o escolar) mide con precisión lo que se supone que debe medir. En los campos de las pruebas psicológicas y las pruebas educativas, "la validez se refiere al grado en que la evidencia y la teoría respaldan las interpretaciones de los puntajes de las pruebas que conllevan los usos propuestos de las pruebas". Aunque los modelos clásicos dividen el concepto en varias "validaciones" (como la , la y la validez de constructo), la visión dominante actual es que la validez es una construcción unitaria única. La validez generalmente se considera el tema más importante en las pruebas psicológicas y educativas porque se refiere al significado otorgado a los resultados de las pruebas. Aunque muchos libros de texto presentan la validez como una construcción estática, varios modelos de validez han evolucionado desde las primeras recomendaciones publicadas para construir pruebas psicológicas y educativas. Estos modelos se pueden clasificar en dos grupos principales: modelos clásicos, que incluyen varios tipos de validez, y modelos modernos, que presentan la validez como una sola construcción. Los modelos modernos reorganizan las "validaciones" clásicas en "aspectos" de validez o "tipos" de evidencia que respalda la validez. La validez de la prueba se puede probar / validar utilizando pruebas de , , repetibilidad (confiabilidad de prueba-prueba) y otros rasgos, generalmente a través de múltiples ejecuciones de la prueba cuyos resultados se comparan. El análisis estadístico ayuda a determinar si las diferencias entre los diversos resultados son lo suficientemente grandes como para ser un problema o son aceptablemente pequeñas.
Abstract from DBpedia / Wikipedia · CC BY-SA
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).