الفصل الثالث: فهم جودة الاختبار - مفاهيم الموثوقية والصلاحية
اختبار الموثوقية والصحة هي اثنين من الخصائص التقنية للاختبار التي تشير إلى جودة وفائدة الاختبار. فهما أهم سمتين للاختبار. و يجب عليك فحص هذه السمات عند تقييم ملاءمة الاختبار للاستخدام الخاص بك. و يقدم هذا الفصل شرحًا مبسطًا لهذه الأفكار المعقدة. هذه التفسيرات سوف تساعدك على فهم الموثوقية وصحة المعلومات الواردة في كتيبات الاختبار والمراجعات، لذا استخدام تلك المعلومات لتقييم مدى ملاءمة الإختبار للاستخدام الخاص بك.
العناوين الرئسية للفصل
1. ما الذي يجعل الإختبار جيدًا؟
2. اختبار الموثوقية.
3. تفسير معلومات الموثوقية من كتيبات الاختبار والاستعراضات.
4. أنواع تقديرات الموثوقية.
5. خطأ القياس المعياري.
6. إختبار الصلاحية.
7. طرق إجراء دراسات التحقق.
8. استخدام أدلة الصحة من الدراسات الخارجية.
9. كيفية تفسير معلومات الصلاحية من كتيبات الاختبار والاستعراضات المستقلة.
تستخدم مبادئ التقييم التي تمت مناقشتها أدوات و إجراءات تقييم موثوقة فقط. فإنها تستخدم فقط إجراءات التقييم والأدوات التي ثبت أنها صالحة للغرض المحدد الذي تستخدم من أجله. لذا، استخدم أدوات التقييم المناسبة للسكان المستهدفين.
ما الذي يجعل الإختبار جيدًا؟
يعتبر اختبار التوظيف جيدًا، إذا أمكن ذكر ما يلي
· يقيس الإختبار ما يدعي أنه يقيسه بصورة متسقة أو موثوقة. و هذا يعني أنه إذا قام شخص ما بإجراء الإختبار مرة أخرى، فإنه سيحصل على نفس درجة الإختبار.
· يقيس الاختبار ما يدعي قياسه. على سبيل المثال، اختبار القدرة العقلية في الواقع يقيس القدرة العقلية، وليس بعض السمات الأخرى.
· الاختبار ذو صلة بالوظيفة. وبعبارة أخرى، يقيس الاختبار واحدة أو أكثر من الخصائص المهمة للعمل.
· باستخدام الاختبار، يمكن اتخاذ قرارات توظيف أكثر فعالية حول الأفراد. على سبيل المثال، قد يساعدك الاختبار الحسابي على اختيار العمال المؤهلين للعمل الذي يتطلب معرفة العمليات الحسابية.
و يشار إلى درجة الإختبار التي تمتلك هذه الصفات بواسطة اثنين من الخصائص التقنية: الموثوقية و الصلاحية.
موثوقية الاختبار أو صدق الاختبار (Test reliability)
تشير الموثوقية إلى الطريقة التي يقيس بها الإختبار الصفة المميزة بشكل موثوق أو ثابت. إذا أجرى الشخص الإختبار مرة أخرى، سيحصل على نتيجة اختبار مماثلة، أو على درجة مختلفة تماما؟ ويقال أن الاختبار الذي يعطي درجات مماثلة للشخص الذي يكرر الاختبار لقياس سمة أو صفة يعتبر اختبار موثوق به.
إذن، فكيف نفسر موضوع الفرد الذي لا يحصل على نفس نتيجة الإختبار بالضبط في كل مرة يأخذ فيها الإختبار؟ و من الأسباب المحتملة ما يلي:
· الحالة النفسية أو الجسدية المؤقتة للمتقدم. ويمكن أن يتأثر أداء الاختبار بحالة الشخص النفسية أو البدنية في وقت الاختبار. على سبيل المثال، قد تؤثر المستويات المختلفة من القلق، والتعب، أو الدافع على نتائج اختبار المتقدم للوظيفة.
· العوامل البيئية. فالاختلافات في بيئة الاختبار، مثل درجة حرارة الغرفة، والإضاءة، والضوضاء، أو حتى مدير الاختبار، يمكن أن تؤثر على أداء اختبار الفرد.
· نموذج الاختبار. العديد من الاختبارات لديها أكثر من نسخة أو نموذج واحد. فالعناصر و البنود تختلف في كل شكل، ولكن كل شكل من المفترض أن يقيس نفس الشيء. وتعرف الأشكال المختلفة للاختبار بالأشكال المتوازية أو الأشكال البديلة. تم تصميم هذه النماذج لتكون لها خصائص قياس مماثلة، ولكنها تحتوي على عناصر مختلفة. لأن النماذج ليست هي نفسها تماما، قد يؤدي الشخص في اختبار بشكل أفضل من اختبار أخر.
· المقيميين المتعددين. في بعض الاختبارات، يتم تحديد النقاط من خلال الأحكام التي يصدرها المقييم من أداء أو استجابة المتقدم. فالاختلافات في التدريب والخبرة والإطار المرجعي بين المقيميين يمكن أن تنتج درجات اختبار مختلفة للمتقدم.
مبدأ التقييم: استخدام أدوات وإجراءات تقييم موثوقة فقط. وبعبارة أخرى، استخدم فقط أدوات التقييم التي توفر معلومات موثوقة ومتسقة.
و تعتبر هذه العوامل هى مصادر الفرصة أو خطأ القياس العشوائي في عملية التقييم. إذا لم تكن هناك أخطاء عشوائية في القياس، فإن الفرد يحصل على نفس درجة الاختبار، ونتيجة الفرد ستكون صحيحة، في كل مرة. و يعد مدى عدم تأثر درجات الاختبار بأخطاء القياس هي مؤشر على موثوقية الاختبار.
و تنتج أدوات التقييم الموثوقة معلومات يمكن الاعتماد عليها، قابلة للتكرار، ومتسقة عن الناس. و من أجل تفسير دقيق لدرجات الإختبار و القيام بعمل توظيف مفيد أو قرارات متعلق بالحياة المهنية، فإن بحاجة إلى أدوات موثوقة. وهذا يقودنا إلى مبدأ التقييم التالي.


تفسير معلومات الموثوقية من كتيبات الاختبار والمراجعات
توفر أدلة الإختبار و المراجعة و الإستعراض المستقل للإختبارات معلومات عن موثوقية الإختبار. و ستساعدك المناقشة التالية على تفسير معلومات الموثوقية حول أي اختبار.
و يشار إلى موثوقية الاختبار بمعامل الموثوقية. ويشار إليه بالحرف "r"، ويعبر عنه بعدد يتراوح بين 0 و 1.00، مع r = 0 مما يشير إلى عدم الموثوقية، و r = 1.00 مما يدل على الموثوقية الكاملة. لا تتوقع أن تجد اختبارا مع موثوقية مثالية. بشكل عام، سترى موثوقية الاختبار كعشرية، على سبيل المثال، r = .80 أو r = .93. وكلما زاد معامل الموثوقية، زادت درجات الاختبار أو يمكن الاعتماد عليها. الجدول 1 بمثابة مبادئ توجيهية عامة لتفسير موثوقية الاختبار. ومع ذلك، لا تقم باختيار أو رفض اختبار يستند فقط إلى حجم معامل الموثوقية. لتقييم موثوقية الاختبار، يجب عليك النظر في نوع الاختبار، ونوع تقدير الموثوقية الواردة، والسياق الذي سيتم استخدامه للاختبار.
قيمة معامل الموثوقية التفسير
.90 و أكثر ممتاز
.80 - .89 جيد
.70 - .79 ملائم
أقل من.70 قد يكون لها تطبيق محدود


أنواع تقديرات الموثوقية
وهناك عدة أنواع من تقديرات الموثوقية، تتأثر كل منها بمصادر مختلفة لخطأ القياس. وتقع على عاتق مطوري الاختبار مسئولية الإبلاغ عن تقديرات الموثوقية ذات الصلة باختبار معين. و قبل اتخاذ قرار باستخدام اختبار، اقرأ دليل الاختبار وأي مراجعات مستقلة لتحديد ما إذا كانت موثوقيتها مقبولة. ويختلف مستوى الموثوقية المقبول تبعًا لنوع الاختبار وتقدير الموثوقية المستخدم.
ومن شأن المناقشة في الجدول 2 أن تساعدك على تطوير بعض المعرفة مع أنواع مختلفة من تقديرات الموثوقية الواردة في كتيبات الاختبار والمراجعات.

الجدول 2. أنواع تقديرات الموثوقية
· موثوقية اختبار إعادة الإختبار يشير إلى تكرار درجات الإختبار مع مرور الوقت. ويعكس هذا التقدير أيضا استقرار السمة أو البناء المقاس بالاختبار.
و بعض التركيبات أثر استقرارًا من غيرها. على سبيل المثال، قدرة الفرد على القراءة أكثر استقرارًا على مدى فترة معينة من الزمن من مستوى قلق هذا الفرد. لذلك، فإنك تتوقع مستوى أعلى موثوقية في اختبار القراءة مما كان في اختبار قياس القلق. بالنسبة للتركيبات التي یتوقع أن تتغیر بمرور الوقت، قد یکون معامل موثوقیة اختبار الاختبار وإعادة الاختبار أقل مما ھو مقترح في الجدول 1.
· موثوقية النموذج البديل أو الموازية تشير إلى كيف يمكن أن تكون درجات الاختبار متسقة إذا كان الشخص يأخذ اثنين أو أكثر من أشكال الاختبار.
و يشير معامل موثوقية النموذج الموازي العالي إلى أن الأشكال المختلفة للإختبار متشابهة للغاية مما يعني أنه لا يكاد يون هناك أي اختلافات في اصدار الإختبار الذي يتخذه الشخص. و من ناحية أخرى، يشير نموذج معامل الموثوقية الموازي المنخفض إلى أن الأشكال المختلفة ربما لا تضاهى؛ فإنها قد تكون قياس أشياء مختلفة، وبالتالي لا يمكن استخدامها بالتبادل.
· تشير الموثوقية بين المقيميين إلى مدى احتمال أن تكون درجات الاختبار متسقة إذا سجل الاختبار اثنين أو أكثر من المقيميين.
في بعض الإختبارات، يقيم المقيميين الردود على الأسئلة و تحديد النتيجة. ومن المرجح أن تؤدي الاختلافات في الأحكام بين المقيميين إلى حدوث اختلافات في درجات الاختبار. ويشير معامل الموثوقية العالية بين المتغيرات إلى أن عملية الحكم مستقرة وأن النتائج موثوقة.
وعادة ما تكون معاملات الموثوقية بين المقيميين أقل من الأنواع الأخرى من تقديرات الموثوقية. ومع ذلك، فمن الممكن الحصول على مستويات أعلى من الموثوقية بين المقيميين إذا تم تدريب المقيم بشكل مناسب.
· موثوقية الاتساق الداخلي تشير إلى مدى قياس العناصر في الاختبار لنفس الشيء.
ويشير معامل موثوقية الاتساق الداخلي العالي للاختبار إلى أن العناصر الموجودة في الاختبار متشابهة جدا لبعضها البعض في المحتوى (متجانس). و من المهم أن نلاحظ أن طول الاختبار يمكن أن يؤثر على موثوقية الاتساق الداخلي. على سبيل المثال، الاختبار الطويل جدا يمكن أن يضخم بشكل مفرط معامل الموثوقية.
وعادة ما تنقسم الاختبارات التي تقيس خصائص متعددة إلى مكونات متميزة. وتقدم كتيبات هذه الاختبارات عادة معامل موثوقية تناسق داخلي منفصل لكل مكون بالإضافة إلى واحد للاختبار بأكمله.

و توفر أدلة الاختبار والمراجعات تقرير عن عدة أنواع من تقديرات موثوقية الاتساق الداخلية. وكل نوع من التقديرات مناسب في ظل ظروف معينة. ینبغي أن یشرح دلیل الاختبار سبب الإبلاغ عن تقدیر معین.
الخطأ المعياري للقياس
و يوفر تقرير كتيبات الاختبار إحصائية تسمى الخطأ المعياري للقياس.و يعطي هامش الخطأ الذي يجب أن تتوقع في درجة اختبار الفردية بسبب موثوقية الكمال من الاختبار. ويمثل الخطأ المعياري للقياس درجة الثقة بأن النتيجة "الحقيقية" للشخص تقع ضمن نطاق معين من الدرجات. على سبيل المثال، يشير الخطأ المعياري للقياس 2 إلى أن النتيجة الصحيحة للمتقدم ربما تقع في نقطتين في أي من الاتجاه من النتيجة التي يتلقاها على الاختبار. وهذا يعني أنه إذا تلقى الفرد 91 في الاختبار، هناك فرصة جيدة أن درجة "صحيح" للشخص تقع في ما بين 89 و 93.
يعتبر الخطأ المعياري للقياس مفيد لدقة درجات الإختبار الفردية. و لما كان الخطأ المعياري للقياس أصغر، كلما كانت القياسات أكثر دقة.
عند تقييم المعاملات الموثوقية للإختبار، من المهم مراجعة التفسيرات الواردة في الكتيب لما يلي:
· أنواع الموثوقية المستخدمة. وينبغي أن يبين الكتيب سبب الإبلاغ عن نوع معين من معامل الموثوقية. وينبغي أن يناقش الدليل أيضا مصادر خطأ القياس العشوائي ذات الصلة بالاختبار.
· كيفية إجراء دراسات الموثوقية. وينبغي أن يبين الدليل الشروط التي تم بموجبها الحصول على البيانات، مثل طول الفترة الزمنية التي مرت بين إدارات الاختبار في دراسة موثوقية لإعادة اختبار الاختبار. وبصفة عامة، تميل الثغرات إلى الانخفاض مع زيادة الوقت بين إدارات الاختبار.
· خصائص مجموعة العينة. یجب أن یشیر الدلیل إلی الخصائص الھامة للمجموعة المستخدمة في جمع معلومات الموثوقیة، مثل مستوى التعلیم، والمھنة، وما إلی ذلك. وھذا سوف یسمح لك بمقارنة خصائص الأشخاص الذین ترغب في اختبارھم مع مجموعة العینة. إذا كانت متشابهة بما فيه الكفاية، فإن تقديرات الموثوقية الواردة ربما تكون صحيحة لموظفيك أيضًا.
لمزيد من المعلومات حول موثوقية، راجع معايير APA، ومبادئ SIOP، أو أي كتاب كبير على القياس النفسي أو اختبار التوظيف. ويسرد الملحق أ بعض المصادر المحتملة.
صلاحية الاختبار (Test validity)
تعتبر الصلاحية هي أهم قضية في اختيار الاختبار. تشير الصلاحية إلى ما يميز اختبار التدابير ومدى قياس اختبار تلك السمة.
· تخبر الصلاحية إذا كانت السمة التي قيسها الإختبار تتعلق بالمؤهلات الوظيفية والمتطلبات.
· صلاحية يعطي معنى لدرجات الاختبار. وتشير أدلة الصلاحية إلى وجود صلة بين أداء الاختبار والأداء الوظيفي. يمكن أن تخبركم ما قد تستنتجه أو تتنبأه عن شخص من نتيجة اختباره. إذا ثبت أن الاختبار مؤشرا صالحا للأداء على وظيفة معينة، يمكنك استنتاج أن الأشخاص الذين سجلوا درجات عالية في الاختبار هم أكثر عرضة لأداء جيدا في العمل من الأشخاص الذين يسجلون درجات منخفضة في الاختبار، وكل شيء آخر يتساوى.
· تصف الصلاحية أيضًا الدرجة التي يمكن من خلالها أن تقوم باستنتاجات محددة أو تنبؤات حول الناس على أساس درجات الاختبار الخاصة بهم. وبعبارة أخرى، فإنه يشير إلى فائدة الاختبار.
مبدأ التقييم: يستخدم فقط إجراءات وأدوات التقييم التي ثبت أنها صالحة للغرض المحدد الذي تستخدم من أجله.
من المهم فهم الإختلافات بين الموثوقية و الصلاحية. و ستخبرك الصلاحية عن مدى جودة الإختبار لموقف معين. و ستخبرك الموثوقية عن كيف ستكون النتيجة الجديرة بالثقة في هذا الإختبار. فلا يمكنك استخلاص استنتاجات صحيحة من نتيجة الاختبار ما لم تكن متأكدا من أن الاختبار موثوق به. و حتى عندما يكون الاختبار موثوقًا به، فقد لا يكون صالحًا. يجب أن تكون حذرًا من أن أي اختبار اخترته على حد سواء موثوق به وصالح لحالتك.
وتحدد صلاحية الاختبار بالرجوع إلى غرض محدد؛ قد لا يكون الاختبار صالحا لأغراض مختلفة. على سبيل المثال، قد لا يكون الاختبار الذي تستخدمه لجعل التنبؤات الصحيحة حول الكفاءة الفنية لشخص ما في الوظيفة صالحة للتنبؤ بمهاراته القيادية أو معدل التغيب عن العمل. وهذا يؤدي إلى المبدأ التالي للتقييم.
و بالمثل، يتم تحديد اختبار الصلاحية بالرجوع إلى مجموعات محددة. وتسمى هذه المجموعات المجموعات المرجعية. قد لا يكون الاختبار صالحا لمختلف الفئات. على سبيل المثال، قد لا يسمح لك الاختبار المصمم للتنبؤ بأداء المديرين في الحالات التي تتطلب حل المشكلات بإجراء توقعات صحيحة أو ذات مغزى بشأن أداء الموظفين الكتابيين. إذا كان، على سبيل المثال، نوع من القدرة على حل المشاكل المطلوبة للوظيفتين مختلف، أو مستوى القراءة للاختبار ليست مناسبة للمتقدمين الكتابيين، قد تكون نتائج الاختبار صالحة للمديرين، ولكن ليس للموظفين الكتابيين.
و يتحمل مطوري الإختبار مسئولية وصف المجموعات المرجعية المستخدمة في تطوير الإختبار. يجب أن يصف الكتيب المجموعات التي يكون الاختبار صالحا لها، وتفسير الدرجات للأفراد الذين ينتمون إلى كل من هذه المجموعات. يجب تحديد ما إذا كان يمكن استخدام الاختبار بشكل مناسب مع نوع معين من الأشخاص الذين ترغب في اختبارهم. وتسمى هذه المجموعة من الناس بالسكان المستهدفين أو المجموعة المستهدفة.
مبدأ التقييم: استخدام أدوات التقييم المناسبة للأشخاص المستهدفين.
لا يجب أن تتطابق المجموعة المستهدفة والمجموعة المرجعية مع جميع العوامل؛ يجب أن تكون متشابهة بما فيه الكفاية بحيث يؤدي الاختبار إلى نتائج ذات مغزى لمجموعتك. على سبيل المثال، قد يكون اختبار القدرة الكتابة الذي وضع للاستخدام مع طلاب السنه الأخيرة في الجامعة مناسب لقياس قدرة كتابة العمال المهنيين أو المديرين، على الرغم من أن هذه المجموعات ليس لها خصائص متطابقة. و عند تحديد مدى ملاءمة اختبار المجموعات المستهدفة، ضع في الاعتبار عوامل مثل المهنة ومستوى القراءة والاختلافات الثقافية والحواجز اللغوية.
تذكر بأن المبادئ التوجيهية الموحدة تتطلب أدوات تقييم للحصول على أدلة داعمة كافية للاستنتاجات التي تصل إليها معهم في حالة حدوث تأثير سلبي. و الأداة الصالحة للموظفين هى التي تقيس السمة المهمة في الوظيفة التي تهتم بها. و سوف تمكنك استخدام الأدوات الصالحة من اتخاذ قرارات أفضل متعلقة بالتوظيف. سواء من كفاءة الأعمال أو وجهات النظر القانونية، من الضروري فقط استخدام الاختبارات التي تكون صالحة للاستخدام المقصود.
من أجل التأكد من أن اختبار التوظيف مفيد وصالح، يجب جمع الأدلة المتعلقة بالاختبار لوظيفة معينة. وتسمى عملية إنشاء علاقة العمل من الإختبار بالتحقق من الصحة.

طرق اجراء دراسات الصلاحية
وتناقش المبادئ التوجيهية الموحدة الطرق الثلاث التالية لإجراء دراسات التحقق. وتصف المبادئ التوجيهية الظروف التي يكون فيها كل نوع من استراتيجيات التحقق مناسبة. وهم لا يعبرون عن تفضيلهم لأي إستراتيجية واحدة لإثبات مدى ارتباط الوظيفة بالاختبار.
· يتطلب التحقق من المعايير المتعلقة بالصحة وجود علاقة ارتباط أو علاقة إحصائية أخرى بين أداء الاختبار والأداء الوظيفي. وبعبارة أخرى، الأفراد الذين يسجلون درجات عالية في الاختبار يميلون إلى أداء أفضل في العمل من أولئك الذين يسجلون درجات منخفضة في الاختبار. إذا تم الحصول على المعيار في نفس الوقت الذي يعطى فيه الإختبار، فإنه يسمى بالصلاحية المتزامنة. إذا تم الحصول على المعيار في وقت لاحق، فإنه يسمى بالصلاحية التنبؤية.
· تتطلب الصلاحية المتعلقة بالمحتوى دليلا على أن محتوى الاختبار يمثل السلوكيات المهمة ذات الصلة بالوظيفة. وبعبارة أخرى، يجب أن تكون عناصر الاختبار ذات صلة وقياس المتطلبات والمؤهلات الهامة مباشرة لهذه الوظيفة.
· تتطلب الصلاحية المتعلقة بالنظم إثبات أن الإختبار يقيس بناء أو الخصائص التي يدعي قياسها، وأن هذه الخاصية هي مهمة لأداء ناجح في العمل.

وينبغي استخدام الأساليب الثلاث المتعلقة بالصلاحية والمعيار والمحتوى والبناء - لتوفير دعم التحقق من الصحة تبعًا للحالة. وكثيرا ما تتداخل هذه الأساليب العامة الثلاث، وقد يكون واحدًا أو أكثر مناسبًا حسب الحالة. (الفرنسية ،1990) يقدم أمثلة الظرفية عندما يمكن تطبيق كل طريقة خاصة بالصلاحية.
كمثال على الصلاحية المتعلقة بالمعيار، اننظر إلى وظيفة ميكانيكي الألات. و يمكن ربط درجات الموظفين (المتنبئين) بالإختبار المصمم لقياس المهارات الميكانيكية مع أدائهم في آلات الخدمة (المعيار) في المطحنة. وإذا كان الترابط مرتفعا، يمكن القول إن الاختبار لديه درجة عالية من دعم الصلاحية، واستخدامه كأداة اختيار سيكون مناسبًا.
ثانيًا، يمكن استخدام طريقة التحقق من صحة المحتوى عندما تريد تحديد ما إذا كانت هناك علاقة بين السلوكيات التي يقاسها الاختبار والسلوكيات التي ينطوي عليها العمل. على سبيل المثال، فإن اختبار الكتابة سيكون دعم عالي الصلاحية لمنصب السكرتارية، على افتراض أنه مطلوب الكثير من الكتابة يوميًا. إذا كانت المهمة المطلوبة فقط هى الحد الأدنى من الكتابة، فبالتالي نفس الاختبار سيكون القليل من صحة المحتوى. و لا تنطبق صلاحية المحتوى على الاختبارات التي تقيس القدرة على التعلم أو المهارات العامة لحل المشكلات (الفرنسية، 1990).
وأخيرا، الطريقة الثالثة هي بناء الصلاحية. هذه الطريقة غالبا ما تتعلق بالاختبارات التي قد تقيس الصفات المجردة لمقدم الطلب. على سبيل المثال، يمكن استخدام صلاحية البناء عندما يرغب البنك في اختبار المتقدمين ل "الكفاءة العددية". في هذه الحالة، الكفاءة ليست سلوكًا يمكن ملاحظته، ولكن مفهوم خلق لشرح السلوكيات المستقبلية الممكنة. لإثبات أن الاختبار يمتلك دعم التحقق من صحة البناء، "... يجب على البنك أن يظهر (1) أن الاختبار قد تقيس فعلا السمة المطلوبة و (2) أن هذه السمة تتوافق مع النجاح في الوظيفة" (الفرنسية، 1990 ، الصفحة 260).
وينبغي أن تأتي الاختبارات التي تم تطويرها مهنيا مع تقارير عن صحة الأدلة، بما في ذلك شرح مفصل لكيفية إجراء دراسات التحقق من الصحة. إذا قمت بتطوير الاختبارات أو الإجراءات الخاصة بك، سوف تحتاج إلى إجراء دراسات التحقق الخاصة بك. كمستخدم الاختبار، لديك المسئولية النهائية للتأكد من أن دليل الصحة موجود للاستنتاجات التي تصل إليها باستخدام الاختبارات. وهذا ينطبق على جميع الاختبارات والإجراءات التي تستخدمها، سواء كانت قد تم شراؤها من المتجر،و وضعت خارجيا، أو داخليًا.
و تعتبر أدلة الصلاحية هامة بشكل خاص للاختبارات التي لها تأثير سلبي. وعندما يكون للاختبار أثر سلبي، تقتضي المبادئ التوجيهية الموحدة تقديم أدلة الصلاحية على قرار التوظيف المحدد.
يجب أن تكون الوظيفة الخاصة التي يتم اختيار الإختبار لها مشابهة جدًّا للوظيفه التي وضع الإختبار من أجلها. ويتطلب تحديد درجة التشابه تحليل الوظائف. و يعد تحليل الوظيفة هو عملية منهجية تستخدم لتحديد المهام والواجبات والمسؤوليات وظروف العمل المرتبطة بالعمل والمعرفة والمهارات والقدرات، وغيرها من الخصائص المطلوبة لأداء هذه المهمة.
ويمكن جمع معلومات التحليل الوظيفي عن طريق الملاحظة المباشرة للأشخاص الموجودين حاليًا في الوظيفة، وإجراء مقابلات مع المشرفين ذوي الخبرة وشاغلي الوظائف، والاستبيانات، وسجلات الموظفين والمعدات، و كتيبات العمل. ومن أجل تلبية متطلبات المبادئ التوجيهية الموحدة، من المستحسن أن يجري التحليل الوظيفي بواسطة مهني مؤهل، على سبيل المثال، أخصائي نفسي صناعي وتنظيمي أو غيره من المهنيين المدربين تدريبًا جيدًا على تقنيات تحليل الوظائف. و تعد معلومات تحليل الوظيفة هي المركزية في تقرير ما هى الاختبارات التي تستخدم و التي لا تستخدم.
استخدام أدلة الصحة و الصلاحية من الدراسات الخارجية
تعتبر إجراء دراسة الصلاحية الخاصة بك أمر مكلف، و في كثير من الحالات قد لا يكون لديك عدد كافي من الموظفين في فئة الوظائف ذات الصلة لجعل من الممكن إجراء دراسة. لذلك، قد تجد أنه من المفيد استخدام أدوات التقييم المتقدمة مهنيا والإجراءات التي توجد بالفعل لتوثيق الصحة و الصلاحية. ومع ذلك، يجب توخي الحذر للتأكد من أن أدلة الصلاحية التي تم الحصول عليها لدراسة الاختبار يمكن "نقلها" بشكل مناسب إلى الحالة و الموقف الخاص بك.
و تنص المبادئ التوجيهية الموحدة، والمعايير، ومبادئ SIOP على أن الأدلة القابلة للنقل مطلوبة. لذا، ضع في اعتبارك ما يلي عند استخدام الاختبارات الخارجية:
· أدلة الصلاحية. يجب أن تكون إجراءات التحقق المستخدمة في الدراسات متسقة مع المعايير المقبولة.
· التشابه الوظيفي. ينبغي إجراء تحليل للوظائف للتحقق من أن وظيفتك والوظيفة الأصلية متشابهة إلى حد كبير من حيث متطلبات القدرة وسلوك العمل.
· أدلة الإنصاف و العدالة. يجب النظر في تقارير اختبار العدالة من الدراسات الخارجية لكل مجموعة محمية تشكل جزءا من سوق العمل. وفي حالة عدم توفر هذه المعلومات لاختبار مؤهل على نحو آخر، ينبغي إجراء دراسة داخلية للإنصاف في الاختبار، إن أمكن.
· المتغيرات الهامة الأخرى. وهي تشمل نوع مقاييس الأداء والمعايير المستخدمة، وأنشطة العمل الأساسية المنجزة، وتشابه مجموعتك المستهدفة مع العينات المرجعية، فضلا عن جميع العوامل الظرفية الأخرى التي قد تؤثر على تطبيق الاختبار الخارجي لاستخدامك.
للتأكد من أن الاختبار الخارجي الذي تشتريه أو تحصل عليه يستوفي المعايير المهنية و القانونية، يجب عليك استشارة المتخصصين في الاختبار. انظر الفصل الخامس للحصول على معلومات حول تحديد موقع الاستشاريين.

كيفية تفسير معلومات الصلاحية من كتيبات الاختبار والاستعراضات المستقلة
لتحديد ما إذا كان اختبار معين صالحًا للاستخدام المقصود، راجع كتيب الاختبار والمراجعات المستقلة المتاحة. ( يقدم الفصل 5 مصادر لمراجعات الاختبار). و يمكن أن تساعدك المعلومات أدناه على تفسير أدلة الصلاحية و الصحة المذكورة في هذه المنشورات.
وعند تقييم معلومات الصلاحية، من المهم تحديد ما إذا كان يمكن استخدام الاختبار بالطريقة المحددة التي تريدها، وما إذا كانت المجموعة المستهدفة مشابهة لمجموعة المراجع الاختبارية.
و يجب أن تصف كتيبات الاختبار والمراجعات
· أدلة التحقق المتاحة تدعم استخدام الاختبار لأغراض محددة. وينبغي أن يتضمن الكتيب وصفًا دقيقًا للإجراءات المستخدمة في دراسات التحقق ونتائج تلك الدراسات.
· الاستخدامات الصحيحة المحتملة للاختبار. وينبغي وصف الأغراض التي يمكن أن يستخدم فيها الاختبار بصورة مشروعة، فضلا عن معايير الأداء التي يمكن التنبؤ بها على نحو سليم.
· مجموعة العينة التي تم تطوير الاختبار عليها. على سبيل المثال، هل تم تطوير الاختبار على عينة من خريجي المدارس الثانوية أو المديرين أو العاملين الكتابيين؟ ما هو المزيج العنصري والعرقي والعمري والنوعي للعينة؟
· المجموعة التي يمكن استخدام الاختبار من اجلها.
تقاس صلاحية الاختبار ذات الصلة بالمعيار بمعامل الصلاحية. وتفيد التقارير بأنه عدد يتراوح بين 0 و 1.00 يعكس حجم العلاقة "r" بين الاختبار وقياس الأداء الوظيفي (المعيار). وكلما زاد معامل الصلاحية، زادت الثقة التي يمكن أن تحصل عليها في التنبؤات التي تم إجراؤها من نتائج الاختبار. ومع ذلك، فإن الإختبار الواحد لا يمكنه التنبؤ تمامًا بالأداء الوظيفي لأن النجاح في العمل يعتمد على العديد من العوامل المختلفة. لذلك، نادرًا ما تتجاوز معاملات الصلاحية، على عكس معاملات الموثوقية r = .40.
الجدول 3. إرشادات عامة لتفسير معاملات الصلاحية.

Validity coefficient value التفسير
أكثر من .35 مفيد جدًّا
.21 - .35 من المحتمل أن تكون مفيدة
.11 - .20 تعتمد على الظروف
أقل من .11 غير محتمل أن تكون مفيدة



وكقاعدة عامة، كلما زاد معامل الصلاحية كلما كان من المفيد استخدام الاختبار. وتكون معاملات الصلاحية من r = .21 إلى r = .35 نموذجية لاختبار واحد. ربما تكون المصادقة على أنظمة الاختيار التي تستخدم اختبارات متعددة أعلى لأنك تستخدم أدوات مختلفة لقياس / التنبؤ بأوجه مختلفة من الأداء، حيث يكون اختبار واحد أكثر احتمالا لقياس أو التنبؤ بعدد أقل من جوانب الأداء الكلي. الجدول 3 بمثابة دليل عام لتفسير صلاحية الاختبار لاختبار واحد. و تعتبر تقييم صلاحية الاختبار مهمة متطورة، وقد تحتاج إلى خدمات خبير الاختبار. بالإضافة إلى حجم معامل الصلاحية، و يجب عليك أيضًا أن تنظر في الحد الأدنى من العوامل التالية:
· مستوى التأثير السلبي المرتبط بأداة التقييم الخاصة بك.
· نسبة الاختیار (عدد المتقدمین مقابل عدد الفتحات).
· تكلفة خطأ التوظيف.
· تكلفة أداة الإختيار.
· احتمال توظيف موظف مؤهل بناءًا على الفرصة وحدها.
في ما يلي ثلاثة سيناريوهات توضح لماذا يجب عليك مراعاة هذه العوامل، بشكل فردي وبالاشتراك مع بعضها البعض، عند تقييم معاملات الصلاحية:
السيناريو الأول
أنت الآن في عملية توظيف المتقدمين حيث لديك نسبة اختيار عالية و تقوم بشغل الوظائف التي لا تتطلب قدرًا كبيرًا من المهارة. في هذه الحالة، قد تكون على استعداد لقبول أداة التحديد التي لها صلاحية تعتبر "من المرجح أن تكون مفيدة" أو حتى "تعتمد على الظروف" لأنك بحاجة لشغل الوظيفة، وليس لديك العديد من المتقدمين للاختيار من بينها، و مستوى المهارة المطلوبة ليست عالية.
الآن، دعنا نغيير الحالة و الوضع.
السيناريو الثاني
أنت تقوم بالتوظيف للوظائف التي تتطلب مستوى عالي من الدقة، و يمكن أن يكون الخطأ الذي قام به العامل خطير و مكلف. مع هذه العوامل الإضافية، فإن الإنخفاض الطفيف في معامل الصلاحية ربما لن يكون مقبولًا بالنسبة لك لأن توظيف عامل غير مؤهل سيكون لأمرًا محفوفًا بالكثير من المخاطر. و في هذه الحالة قد تحتاج على الأرجح إلى استخدام أداة التحديد التي أبلغت عن الصلاحيات التي تعتبر "مفيدة جدًّا" لأن الخطأ في التوظيف سيكون مكلفًا جدًّا لشركتك.
وهنا سيناريو آخر يوضح لماذا تحتاج إلى النظر في عوامل متعددة عند تقييم صحة أدوات التقييم.
السيناريو الثالث
تفكر الشركة التي تعمل لديها في استخدام نظام اختيار مكلف جدًّا مما يؤدي إلى مستويات عالية إلى حد ما من التأثير السلبي. عليك أن تقرر تنفيذ أداة الاختيار لأن أدوات التقييم التي اكتشفتها كان لها تأثير سلبي منخض أقل بكثير من الصلاحية، و كانت مكلفة بنفس القدر، والخطأ في قرارات التوظيف ستكون أكثر بكثير من المخاطر لشركتك. قررت شركتك تنفيذ التقييم نظرا لصعوبة التوظيف لمناصب معينة، وتعتبر الصلاحية "مفيدة جدا" للتقييم، و هناك محاولات فاشلة للعثور على أدوات بديلة مع تأثير أقل سلبية. ومع ذلك، ستواصل الشركة جهودها لإيجاد سبل للحد من التأثير السلبي للنظام.
ومرة أخرى، تبين هذه الأمثلة مدى تعقيد تقييم صلاحية التقييمات. وهناك عوامل متعددة تحتاج إلى النظر فيها في معظم الحالات. قد ترغب في طلب المساعدة من خبير اختبار (على سبيل المثال، أخصائي نفسي صناعي / تنظيمي) لتقييم مدى ملاءمة تقييمات معينة لحالة التوظيف الخاصة بك.
عند تطبيقه بشكل صحيح، فإن استخدام أدوات تقييم صالحة وموثوق بها ستساعدك على اتخاذ قرارات أفضل. و بالإضافة إلى ذلك، فباستخدام مجموعة متنوعة من أدوات التقييم كجزء من برنامج التقييم، يمكنك تقييم مهارات وقدرات الأفراد بشكل أكثر اكتمالًا ، مع الحد من آثار الأخطاء المرتبطة بأي أداة واحدة على اتخاذ القرار الخاص بك.