Also known as validity
extent to which a test measures what it is supposed to measure
صلاحية الاختبار هي المدى الذي يقيس فيه الاختبار (مثل الاختبار الكيميائي أو الفيزيائي أو الدراسي) ما يُفترَض قياسه بدقة. في مجالات الاختبار النفسي والاختبار التعليمي، «تشير الصلاحية إلى الدرجة التي تدعم بها الأدلة والنظريات تفسيرات درجات الاختبار الناجمة عن الاستخدامات المقترحة للاختبارات». على الرغم من أن النماذج الكلاسيكية قسمت المفهوم إلى «صلاحيات» مختلفة (مثل صلاحية المحتوى، وصلاحية المعيار، وصلاحية الإنشاء)، فإن الرأي السائد حاليًا هو أن الصلاحية بنية أحادية مفردة. تعتبر الصلاحية بشكل عام أهم قضية في الاختبار النفسي والتربوي لأنها تتعلق بالمغزى الموضح في نتائج الاختبار. على الرغم من أن العديد من الكتب المدرسية تقدم الصلاحية كمنشأة ثابتة، تطورت نماذج مختلفة من الصلاحية منذ أول توصيات منشورة لبناء اختبارات نفسية وتعليمية. يمكن تصنيف هذه النماذج في مجموعتين أساسيتين: النماذج الكلاسيكية، والتي تشمل عدة أنواع من الصلاحية، والنماذج الحديثة، التي تقدم الصلاحية كمنشأة واحدة. تعيد النماذج الحديثة تنظيم «الصلاحيات» الكلاسيكية إمّا إلى «جوانب» الصلاحية أو «أنواع» الأدلة الداعمة للصلاحية. يمكن اختبار / التحقق من صلاحية الاختبار نفسه باستخدام اختبارات الموثوقية بين التصنيفات، والموثوقية ضمن التصنيفات وقابلية التكرار (موثوقية إعادة الاختبار)، وغيرها من السمات، وعادةً ما يتم ذلك من خلال عمليات تشغيل متعددة للاختبار تُقارَن نتائجها. يساعد التحليل الإحصائي في تحديد ما إذا كانت الاختلافات بين النتائج المختلفة كبيرة بما يكفي لتكون مشكلة أو صغيرة بشكل مقبول.
Abstract from DBpedia / Wikipedia · CC BY-SA
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).