جمع وعرض البيانات الإحصائية
-1-1 جمع البيانات الإحصائية :
تعتبر عملية جمع البيانات الإحصائية أهم مراحل العملية الإحصائية حيث تعتبر عملية جمع البيانات بمثابة الأساس الذي تبني عليه باقي مراحل الدراسة الإحصائية للظاهرة ، فإذا ما حدث خلل ما في عملية جمع البيانات ترتب على ذلك التوصل إلى نتائج مضللة عن تلك الظاهرة.
وقبل أن نبدأ بعملية جمع البيانات فإنه يجب أولاً التعرف على العناصر الأساسية التالية:
-2-1 مصادر البيانات الإحصائية :
يمكن أن نميز بين نوعين أساسيين من مصادر العمليات الإحصائية:
I ـ المصادر الأصلية أو المباشرة :
وهي عبارة عن الوحدات الأصلية التي نتلقى منها المعلومات أو البيانات، مثال ذلك جمع البيانات الخاصة بالدخل والانفاق مباشرة من الأسر عن طريق الاستبيان.
وتمتاز عملية جمع البيانات بالطريقة المباشرة بإمكان مراجعتها والتحقيق من دقتها مع مصدر البيان نفسه. ولكن يعاب عليها كثرة الجهد والتكاليف.
II ـ المصادر التاريخية أو غير المباشرة :
وهي عبارة عن تلك السجلات التي تقوم هيئات رسمية أو شبه رسمية بإصدارها بصفة دورية، حيث يمكن الرجوع إليها للحصول على تلك البيانات أو المعلومات الإحصائية دون الرجوع إلى الوحدات الأصلية ومن أمثلتها: (سجلات السكان، سجلات المواليد والوفيات، السجلات المالية، سجلات الطلبة....)
وتمتاز هذه الطريقة بالسهولة والتوفير في الجهد والتكاليف والوقت بينما يعاب عليها عدم إمكان التحقق من صحة البيانات .
-3-1 أساليب جمع البيانات الإحصائية :
إذا ما تقرر جمع البيانات الإحصائية من مصادرها الأصلية أو المباشرة فإن عملية جمع البيانات يمكن أن تتم باتباع أحد أسلوبين أساسيين هما :
I ـ أسلوب الحصر الشامل : Complete Census
حيث يتم الحصول على البيانات المطلوبة من جميع أفراد المجتمع موضع البحث دون استثناء وفي هذه الحالة يجب دراسة مدى توفر جميع الإمكانيات اللازمة لجمع البيانات من كل وحدة من وحدات المجتمع ولذا فإن هذا الأسلوب يتبع في حالات معينة تقتضيها طبيعة البحث.

II ـ أسلوب العينات : Sampling Method
هو اتباع أسلوب علمي يقتصر بموجبه على بحث عدد محدد من وحدات المجتمع والخروج بنتائج يمكن تعميمها على المجتمع وفق قواعد علمية، ولضمان دقة النتائج التي نحصل عليها باتباع ذلك الأسلوب فإنه يجب أن تمثل العينة المجتمع الأصلي الذي سحبت منه أصدق تمثيل. ويتميز أسلوب العينة بتوفير الجهد والوقت والتكاليف.

أنواع العينات :
أولاً : العينات الاحتمالية وتشمل :
I ـ العينة العشوائية البسيطة Simple Random Sample :
يمكن الحصول على عينة عشوائية بسيطة بإحدى الطرق التالية:
الطريقة الأولى : طريقة القرعة وتتلخص في عمل بطاقة لكل وحدة من وحدات المجتمع ثم نختار بطريقة عشوائية عدداً من تلك الوحدات .
الطريقة الثانية : طريقة جداول الأرقام العشوائية، حيث نعطي مفردات المجتمع المدونة في الإطار أرقاماً مسلسلة ثم نختار أحد الأعمدة أو الصفوف بالجدول العشوائي لاختيار وحدات العينة (انظر جداول الأرقام العشوائية في نهاية الكتاب).
الطريقة الثالثة: دواليب الحظ
الطريقة الرابعة: توليد الأرقام العشوائية بواسطة الحاسوب.
II ـ العينة الطبقية Staratified sample :
وتستخدم في حالة المجتمعات غير المتجانسة حيث يمكن تمييز وحدات المجتمع على شكل مجموعات متجانسة فيما بينهما وتسمى كل مجموعة حينئذٍ طبقة، حيث نقوم بحسب عدد من وحدات كل طبقة بطريقة عشوائية وتكون العينة عبارة عن إجمالي الوحدات التي تم اختيارها من كل طبقة على حدة، وغالباً ما يتناسب عدد الوحدات التي يتم اختيارها من كل طبقة مع حجم الطبقة.
III ـ العينة المتعددة المراحل Multistage Sample :
تستخدم في حالة المجتمعات المنتشرة على مساحات كبيرة، وفيها يقسم المجتمع الأصلي إلى عدد الوحدات الابتدائية حيث نختار عدداً منها بطريقة عشوائية كمرحلة أولى، وهكذا تتعاقب مراحل المعاينة ويستخدم ذلك النوع من العينات لغرض التوفير في تكاليف انتقال الباحثين خاصة في حالة المجتمعات الكبيرة .

V ـ العينة المنتظمة Systematic Sample :
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image002.gif[/IMG]تعتمد على قائمة تتضمن مفردات المجتمع وعلى تحديد فترة السحب
فإذا كان لدينا مجتمع مكون من 90 وحدة ومطلوب اختيار عينة من 10 وحدات فإن فترة السحب = 90/10 = 9، نختار بعد ذلك رقماً عشوائياً بين 9,1 وليكن الرقم 5 فتكون وحدات العينة هي الوحدات ذات الرقم المسلسل بالإطار 5، 14، 23، 41، 50، 59، 68، 77، 86.
وتمتاز طريقة العينة المنتظمة بالسهولة والبساطة في إجرائها ولكن يعاب عليها عدم صلاحيتها إذا ما وجدت علاقة دورية في ترتيب الوحدات الأولية المكونة للمجتمع مع طول فترة المعاينة.
IV ـ العينة العنقودية: تقوم على تقسيم المجتمع إلى مجموعات جزئية والاختيار يكون على شكل عناقيد وليس مفردة مثال : في إحدى المدن (10,000) مسكن وطلب منا إختيار عينة من (500) مسكن في هذه الحالة يتم تقسيم المدينة إلى (1000) منطقة وبكل منطقة (10) مساكن ومن ثم نختار عشوائياً (50) منطقة من المناطق الـ (1000) وتجمع المعلومات اللازمة عن كل مسكن من المساكن بالمناطق المختارة.
ثانياً ـ العينات غير الاحتمالية :
I ـ عينة الحصص حيث تقسم العينة المطلوبة إلى حصص تشمل كل حصة مجموعة من الوحدات يتم جمع البيانات منها على أن تترك عملية اختيار تلك الوحدات للباحث نفسه واعتماد نسبة معينة من المفردات في كل طبقة.
فلو أننا حددنا العينة بـ 400 طالب من كلية الاقتصاد بجامعة دمشق موزعين على التخصصات الأربعة اقتصاد وإدارة ومحاسبة ومصارف فإذا فرض أن نسبة الطلبة من كل تخصص هي : 1:1:5:3 معنى ذلك أننا سنقوم ببحث 120 طالباً من تخصص اقتصاد 200 من تخصص إدارة، 40 من تخصص المحاسبة، 40 من تخصص المصارف.
ونترك عملية اختيار هؤلاء الطلبة للقائمين بعملية جمع البيانات أنفسهم وبالطبع ستتم عملية المقابلة وجمع البيانات مع الطلبة الذين يمكن مقابلتهم أو من السهل جمع المعلومات منهم. وتمتاز هذه العينة بالبساطة وقلة التكاليف والسرعة في الحصول على النتائج.
II ـ العينة العمرية (المنتقاة) : في هذه المعاينة الباحث هو الذي يحدد المفردات التي ستدخل في العينة وجودة النتائج تتوقف على حكمة الباحث ومهارته في الاختيار.
· أخطاء العينة:
1 ـ الأخطاء الشخصية (التحيز) : تنتج عن التقصير في خطوات البحث بالعينة، وأسبابها عدم مراعاة الأساليب العلمية في سحب العينات.
2 ـ الأخطاء الاحتمالية (الخط والصدف): تصاحب عملية الاختيار وناتجة عن دراسة جزء من المجتمع.
-4-1 طرق جمع البيانات الإحصائية :
يمكن جمع البيانات والمعلومات بإحدى طريقتين رئيسيتين :
I ـ الطريقة المباشرة :
وذلك عن طريق الاتصال المباشر بمصدر البيان أو وحدة البحث وذلك بالاتصال الشخصي بين الباحث أو مندوبه والمصدر.
وقد يتم الاتصال المباشر بالهاتف أو بالانترنت كما تشمل أيضاً أسلوب الملاحظة وتسجيل البيانات مباشرة وتمتاز الطريقة المباشرة بإمكان الحصول على بيانات أكثر دقة.
II ـ الطريقة غير المباشرة :
حيث يتم جمع البيانات أو المعلومات من المصدر بطريقة غير مباشرة مثال ذلك عن طريق إرسال صحيفة الاستبيان إليه بالبريد Postal Questionnaire. كما تعتبر عملية جمع البيانات من المصادر التاريخية أو الإحصاءات المنشورة . إحدى الطرق غير المباشرة في جمع البيانات .
ويعيب الطريقة غير المباشرة انخفاض نسبة الردود وعلى عدم إمكان مراجعتها مع مصدر البيان للتحقق من دقة البيانات.
· مكونات الاستمارة الإحصائية :
تتكون الاستمارة من أربعة أجزاء رئيسية هي:
الجزء الأول :
ويعرف باسم صدر الاستمارة وفيه يذكر اسم الجهة المشرفة على البحث كما يتضمن ملخصاً للأهداف المرجوة من البحث.
الجزء الثاني :
ويشمل البيانات المميزة لوحدة البحث (الاسم، الجنس، العمر، مكان الإقامة ....)
الجزء الثالث :
وهو الجزء الهام في الاستمارة ويتضمن مجموعة الأسئلة والاستفسارات المطلوب الإجابة عليها.
الجزء الرابع :
ويشمل ملاحظات جامع البيان إن وجدت كما قد يتضمن بعض التعليمات والإشارات الخاصة بكيفية استيفاء الاستمارة.
· أهم الشروط الواجب مراعاتها عند وضع أسئلة الاستمارة الإحصائية :
1 ـ يجب أن تكون الأسئلة محددة وواضحة.
2 ـ يجب أن الأسئلة بعيدة عن التأويل والتفسير
3 ـ يستحسن تجنب الأسئلة التي تثير الحرج أو التي تحتاج للرجوع بالذاكرة.
-5-1 تفريغ وتبويب البيانات الإحصائية :
بعد عملية جمع البيانات سواء من مصادرها الأصلية باستخدام الاستمارات أو من المصادر التاريخية، يكون من الصعب فهم مدلولها واتجاهها، لذلك يقوم الباحث بتبويب تلك البيانات وعرضها في جداول إحصائية بحيث يمكن باستعراضها تكوين فكرة عامة عن طبيعة الصفة أو الصفات محل الدراسة وهذه الجداول تعتبر أساساً للتحليل الإحصائي .
· تبويب البيانات :
I ـ التبويب اليدوي :
يعتمد على جدول التفريغ الذي يتكون من ثلاثة أعمدة يخصص الأول منها لبيان القيم والعمود الثاني لوضع الإشارات نتيجة فرز الاستمارات واحدة تلو الأخرى ويخصص العمود الثالث لوضع عدد تلك الإشارات مقابل الإجابة المعنية وهذا ما يطلق عليه اسم التكرار ويرمز له بالحرف ( f ) .
II ـ التبويب الآلي :
يعتمد على الحاسب الآلي وفيه تترجم البيانات المدونة في الاستمارات الإحصائية إلى رموز معينة مقسمة إلى عدة أعمدة يحمل كل عمود منها رقماً مسلسلاً ويقسم كل عمود إلى سطور.
مثال : أخذت عينة عشوائية من (93) عاملاً من عمال إحدى الصناعات بهدف دراسة الحالة التعليمية لهؤلاء العمال فكانت النتائج التالية: أمي، أمي، يقرأ ويكتب، اعدادي... وهكذا لبقية العمال.
المطلوب: تفريغ هذه البيانات في جدول تفريغ.
جدول رقم (1) التوزيع التكراري للعمال حسب الحالة التعليمية

العمود الأول والثالث يكونان معاً "جدول التوزيع التكراري" للمتغير وهو يعطينا عدد المرات التي ظهرت فيها كل من قيم المتغير في العينة .
وعندما تكون قيم المتغير كثيرة (سواء أكان كمياً أو وصفياً) أو يكون المتغير كمياً متصلاً فمن الصعب أن نخصص لكل قيمة من قيم المتغير خانة خاصة بها ولذلك نجمع القيم المتقاربة في عدد مناسب من الفئات. وبشكل عام ليس هناك قاعدة ثابتة للحصول على العدد الملائم من الفئات ولو أن بعض الإحصائيين ينصحون باستخدام قاعدة سترجس التالية:
= 1 + 3.322 log (n) عدد الفئات
حيث n = عدد القيم.
وعموماً فإننا نأخذ عادة عدداً من الفئات يتراوح بين (5 وَ 12) فئة طبقاً لحجم العينة وعادة نراعي أيضاً أن تكون حدود الفئات ملائمة ويتم ذلك بأن نحدد طول المدى وهو عبارة عن الفرق بين أكبر قيمة وأصغر قيمة فيها ثم نحدد طول الفئة :
المدى
طول الفئة = ــــــ (يتم تقريب الناتج إلى أقرب رقم صحيح)
عدد الفئات
وكما سبق فإن العمودين الأول والثالث يكونان جدول التوزيع التكراري المطلوب.
في المثال السابق اخترنا فئات متساوية الطول ولكن هذه ليست قاعدة ثابتة، فهناك الجداول التكرارية ذات فئات غير متساوية
وإذا لم يكن هناك الحد الأعلى لفئات الجدول قيل إن الجدول مفتوح من أعلى وبالمثل إذا لم يمكن هناك أصغر فئة قيل إن الجدول مفتوح من أسفل.
أشكال الفئات :
a ) الشكل العام :
60 وأقل من 50 ويمكن كتابتها 50 – 60
وهذه الصورة العامة للفئات سواء أكان المتغير متصلاً أو منفصلاً.

b) الفئات المحددة البداية والنهاية :
30-39
40-49
لاحظ أنه في هذا الشكل من الفئات يعين كل من الحد الأدنى والحد الأعلى لكل فئة ولذلك فإن هذا الشكل يستخدم في حالة المتغيرات المنفصلة (المتقطعة) فقط .


-6-1 عرض البيانات الإحصائية :
تعتبر عملية عرض البيانات الإحصائية امتداداً لعملية التفريغ والتبويب بحيث يصعب الفصل بينهما وكلتا العمليتين تهدفان إلى ترتيب البيانات المجموعة عن الظاهرة محل الدراسة وتنسيقها بطريقة تساعد على فهم مدلولها والاستفادة منها تمهيداً لعرضها وإبراز أهميتها.

· العرض الجدولي للبيانات الإحصائية :
العرض الجدولي هو عبارة عن عرض البيانات على شكل جدول، والجدول الإحصائي عبارة عن ترتيب البيانات العددية في صورة صفوف وأعمدة بحيث يمكن قراءة الجدول بالاتجاهين والهدف منه الاختصار وإبراز أهمية البيانات.
وتسمى العملية التي يتم فيها تجميع البيانات في مجموعات مميزة ومتجانسة عملية التصنيف وبوجه عام تصنف البيانات الإحصائية طبقاً لإحدى القواعد التالية :

I ـ تصنيف جغرافي :
وعلى أساس هذا هذا التصنيف تجمع الوحدات التي تشترك في صفة مكانية واحدة في مجموعة مستقلة مثال ذلك: التوزيع النسبي للصادرات والمستوردات السورية حسب الكتل الدولية لعام 2004.

جدول رقم (4)
الكتل الدولية الصادرات المستوردات
البلدان العربية 29.9 16.4
بلدان الاتحاد الأوروبي 53.2 15.2
بلدان أوربية أخرى 2.3 17.1
البلدان الأمريكية 3.5 9.6
بلدان أسيوية مختلفة 10.4 26.5
بلدان أخرى 0.7 15.2

م.م للإحصاء 2004
ومن الأمثلة الأخرى للتنصيف الجغرافي أيضاً توزيع سكان سورية على المحافظات المختلفة.
II ـ تصنيف تاريخي أو زمني:
وفيه تجمع الوحدات المرتبطة بزمن معين في مجموعة واحدة أي أن تقسيم البيانات يتم حسب زمن حدوثها وتسمى بيانات ذلك النوع من الجداول باسم السلسلة الزمنية.
مثال ذلك : نسبة صادرات النفط والقطن من إجمالي الصادرات السورية خلال الفترة (1999-1995).
جدول رقم (5)
السنة النفط الخام القطن حصة النفط والقطن من اجمالي الصادرات
1995 62.5 5.6 68.1
1996 69 4.5 73.5
1997 63.5 6.7 70.2
1998 59 10 69
1999 67.1 4.7 71.8

المصدر: المجموعة الاحصائية السورية ، إعداد 2000-1996
III ـ تصنيف نوعي أو وصفي :
حيث تجمع الوحدات ذات النوع الواحد أو التي تشترك في صفة واحدة في مجموعة واحدة مثال ذلك.
جدول التركيب النسبي للواردات السورية حسب طبيعة المواد خلال الفترة (1996 ـ 1999)
جدول رقم (6)
السنة الواردات %
خام نصف مصنعة مصنعة
1996 8 47 45
1997 10 48 42
1998 10 48 42
1999 11.4 47.8 40.8

المصدر: المجموعة الإحصائية السورية إعداد 2000-1997
V ـ تصنيف كمي :
وفي هذا النوع من التصنيفات تجمع الوحدات المشتركة في درجة الصفة المعينة والتي تأخذ شكلاً رقمياً محدداً في مجموعة واحدة مثال ذلك : توزيع العاملين في إحدى الشركات حسب فئات العمر
جدول رقم (7)
فئات السن أقل من 20 25-20 30-25 35-30 40-35 45-40 50-45 55-50
عدد العاملين 10 18 24 36 60 30 14 5

المصدر: فرضي

أشكال الجداول التكرارية :
يمكن التمييز بين شكلين عامين للجداول الإحصائية هي :
I ـ الجدول البسيط :
وهو الجدول الذي يشمل بياناً واحداً فقط فهو يحتوي على عمود واحد للبيان موضوع الدراسة يقابله عمود آخر بعدد التكرارات المقابلة، مثال ذلك: توزيع موظفي الدولة حسب الفئة.
توزيع 500 موظف بإحدى الوزارات حسب فئات الراتب (بالدولار)
(جدول رقم 9)
فئات الراتب 100-50 150-100 200-150 250-200 300-250 المجموع
عدد الموظفين 42 58 180 140 80 500


II ـ الجدول المزدوج :
وهو الجدول الذي صنفت فيه الوحدات حسب ظاهرتين مثال ذلك الجدول التالي والخاص بتوزيع 600 رجل حسب العمر وعمر الزوجة.
جدول رقم 10
عمر الرجال
عمر الزوجات
30-20 40-30 50-40 60-50 70-60 80-70 90-80 المجموع
20-15 35 63 22 2 - - - 122
25 – 20 25 72 33 13 5 1 - 149
30 – 25 17 51 30 16 8 2 1 125
35-30 2 33 28 19 15 7 3 107
40 – 35 1 18 20 15 7 4 - 65
45 – 40 - 3 12 10 5 1 1 32
المجموع 80 240 145 75 40 15 5 600

· الشروط الواجب مراعاتها عند إنشاء الجداول الإحصائية :
1 ـ كتابة عنوان الجدول بشكل واضح يبين محتواه.
2 ـ كتابة المصدر الذي أخذت منه البيانات (وزارة التعليم العالي، جمع شخصي، مصدر فرضي).
3 ـ تسجل الملاحظات الخاصة في أسفل الجدول مع الإشارة إليها بعلامات خاصة.
4 ـ يجب أن تذكر وحدات القياس ورقم الجدول .
· العرض البياني :
كما سبق وأوضحنا فالهدف الأساسي لعلم الإحصاء هو جمع وعرض البيانات المجموعة عن ظاهرة أو ظواهر معين بأسلوب يسهل معه إدراك اتجاه الظاهرة. ولذلك فإنه إلى جانب العرض الجدولي للبيانات الإحصائية يسعى الباحث غالباً إلى عرض النتائج بعد تجميعها وتبويبها متبعاً أحد أساليب العرض البياني الآتية :
I ـ الأشكال المعبرة :
وفي هذه الحالة تستخدم رسومات أو صور أو أشكال تعبيرية تمثل القيم المختلفة للظواهر المطلوب عرضها، وهذا الأسلوب يقتصر استخدامه على القيم الإجمالية للظاهرة أو الظواهر محل الدراسة ولغرض المقارنات فقط.
II ـ الرسوم الدائرية:
في هذه الحالة نفرض أن القيمة الكلية للظاهرة المدروسة تمثل إجمالي مساحة الدائرة ثم نقسم الدائرة إلى قطاعات جزئية بحيث تناسب مساحات تلك القطاعات مع قيم المجموعات الجزئية التي تم توزيع الظاهرة عليها على أن تميز تلك القطاعات عن بعضها بألوان مختلفة لضمان الإيضاح، وتستخدم هذه الطريقة في إظهار نسب التوزيع الهيكلي للظاهرة.
مثال :
الجدول التالي يوضح طلبة الدراسات في كلية الاقتصاد بجامعة دمشق حسب تخصصهم والمطلوب عرض تلك البيانات باستخدام دائرة مجزأة .
جدول رقم (11)
التخصص عدد الطلبة
اقتصاد 14
إدارة 12
محاسبة 24
تأمين ومصارف 6
إحصاء 4
المجموع 60

الحل :
1 ـ نرسم دائرة باستخدام مقياس رسم مناسب.
2 ـ نحسب مقدار زوايا القطاعات المختلفة حسب ما هو وارد بالجدول التالي:
جدول رقم (12)
التخصص عدد الطلبة النسبة المئوية% قيمة زاوية القطاع
اقتصاد 14 0.23 83
ادارة 12 0.20 72
محاسبة 24 0.40 144
تأمين ومصارف 6 0.10 36
إحصاء 4 0.07 25

وبذلك نقسم الدائرة إلى قطاعات وتأخذ الشكل التالي :

III ـ الأعمدة أو المستطيلات :
تستخدم الأعمدة أو المستطيلات ذات القواعد المتساوية لعرض البيانات الإحصائية والفكرة الأساسية في هذه الحالة تبنى على اساس أعمدة أو مستطيلات متساوية القاعدة يتناسب ارتفاعها مع قيم الظاهرة المعروضة مع استخدام مقياس رسم مناسب يمكن من عرض أكبر القيم المعروضة. وعند استخدام طريقة المستطيلات أو الأعمدة في عرض البيانات الإحصائية فإنه يمكن التمييز بين الحالات الآتية :
الحالة الأولى :
إذا كان الرسم يعرض ظاهرة واحدة في عدة فترات زمنية أو أوجه مختلفة لظاهرة واحدة فيخصص لكل فترة زمنية أو كل وجه عمود مستقل مع ترك مسافات متساوية بين كل عمود وآخر وبذلك نحصل على رسم عبارة عن مجموعة من الأعمدة المتجاورة.
مثال :
البيان التالي يوضح عدد الخريجين (دكتوراه) من الجامعات السورية خلال الفترة (1999 ـ 2004).
جدول رقم (13)
السنة عدد الخريجين (دكتوراه)
1999 38
2000 47
2001 49
2002 79
2003 36
2004 56

المصدر: المجموعة الاحصائية السورية لعام 2005

المطلوب: عرض تلك البيانات باستخدام الأعمدة .
الحل : باستخدام ورقة الرسم البياني للسهولة فإننا نقوم برسم المحورين الأفقي ويخصص
المحور الأفقي للسنوات والعامودي للقيم.


الحالة الثانية : الأعمدة المتلاصقة :
تستخدم عند عرض ظاهرة لعدة فترات زمنية أو عدة أماكن جغرافية، بمعنى آخر عند المقارنة بين ظاهرتين أوأكثر لعدةسنوات، مثال ذلك الصادرات والواردات لنفس الفترة وعدد المواليد وعدد الوفيات لنفس السنة .. الخ وفي هذه الحالة تمثل كل فترة أو كل منطقة بعدد من الأعمدة المتلاصقة يساوي عدد أوجه الظاهرة مع تمييز كل عمود بلون خاص.
مثال : البيان التالي يوضح قيمة الصادرات والواردات بملايين الليرات السورية في الفترة من 1999-1995 ـ والمطلوب عرض تلك البيانات باستخدام الأعمدة .
جدول رقم (14)
السنة الصادرات الواردات
1995 44562 52856
1996 44887 60385
1997 43953 45211
1998 32443 43725
1999 38880 43010

المصدر: المجموعة الإحصائية السورية (2000-1996)
والمطلوب: عرض تلك البيانات باستخدام الأعمدة (المستطيلات).
الحل: يخصص لكل سنة على المحور الأفقي عمودان أحدهما يمثل الصادرات والآخر الملاصق له يمثل الواردات مع ترك مسافات منتظمة بين أعمدة كل سنة.

شكل رقم (14)
تطور قيمة الصادرات والواردات

الحالة الثالثة : الأعمدة المجزأة
إذا كانت القيمة الإجمالية للظاهرة موزعة على مجموعات فرعية مميزة، أي تجزئة القيم الاجمالية وكل جزء يخصص له ارتفاع يتناسب مع حجم الظاهرة بالنسبة إلى الحجم الكلي بمعنى آخر العمود الذي يمثل إجمالي قيمة الظاهرة يقسم بما يتناسب وقيم المجموعات الجزئية مع التمييز بين أقسام كل عمود بألوان مميزة .
مثال :
البيان التالي يوضح أعداد العاملين في إحدى الدوائر الحكومية والوضع الوظيفي لهم في أعوام 2000، 2001، 2002.
والمطلوب : تمثيل تلك البيانات باستخدام أسلوب الأعمدة (المستطيلات) المجزأة.
العاملون حسب الوضع الوظيفي
جدول رقم (15
البيان السنوات
2000 2001 2002
العاملون الدائمون 120 175 255
العاملون بعقود سنوية 130 288 340
العاملون بعقود موسمية 105 90 100
إجمالي 355 553 695

المصدر: فرضي
الحل : لاحظ هنا أن البيان يمثل ظاهرة واحدة وهي عدد العاملين في كل سنة وهذا العدد (الظاهرة) مجزأة إلى مجموعات جزئية .
1 ـ نرسم أعمدة تناسب ارتفاعاتها مع إجمالي قيمة الظاهرة وهي إجمالي عدد العاملين.
2 ـ نقوم بتجزئة كل عمود بما يناسب مع عدد العاملين في كل مجموعة جزئية.
والشكل التالي يوضح ذلك:

V ـ الخطوط البيانية: تستخدم في الغالب لمقارنة البيانات المتجانسة عبر الزمن ويمكن
تمثيل العلاقة بين ظاهرتين أو متغيرين x، y بخط بياني من خلال رسم النقاط والوصل بينها لنحصل على خطوط مستقيمة متصلة.

مثال : الجدول التالي يوضح أعداد الطلبة المسجلين في كلية العلوم الإدارية في إحدى الجامعات الخاصة خلال الفترة من 1999 حتى 2004 :

السنة الدراسية عدد الطلبة
1999 380
2000 445
2001 580
2002 750
2003 930
2004 1230



والمطلوب : عرض تلك البيانات برسم خط بياني يوضح اتجاه الظاهرة.


تطور أعداد الطلبة المسجلين بكلية العلوم الإدارية
كما يمكن أن يشمل الرسم أكثر من خط واحد ، مثال ذلك: عرض البيانات الخاصة بالقمح والشعير على نفس الرسم.

-7-1 التوزيعات التكرارية :
تعتبر جداول التوزيع التكراري للبيانات الكمية أساساً لمعظم العمليات الإحصائية الوصفية والتحليلية وجدول التوزيع التكراري بالتعريف هو عبارة عن فئات متسلسلة وما يقابلها من تكرارات. فمثلاً لو استعرضنا جدول التوزيع التكراري التالي :
توزيع المقترضين حسب فئات القرض من أحد المصارف الخاصة (القيمة بالألف وحدة نقدية).
جدول رقم (17)
فئات القرض 45-35 55-45 65-55 75-65 85-75 95-85 105-95 المجموع
عدد المقترضين 3 4 7 14 15 6 1 50

يتضح من الجدول السابق أن القيمة (3) تكررت ثلاث مرات بينما ظهرت القيمة (4) مرات وهكذا ...
وتجدر الإشارة إلى أنه في حالة الظواهر التي تتغير تغيراً متصلاً كأطوال الأشخاص أو أعمارهم فإن قيمتها تنتشر في المدى بين القميتين الصغرى والكبرى في المجموعة بالتدريج بدون أن تتجمع في بعض النقط دون الأخرى لأن المتغير المتصل معناه أن القيم لاتقفز من قيمة لأخرى أكبر منها وإنما بالتدريج بحيث لاتمر بكل القيم المتوسطة

التكرار التجميعي الصاعد والهابط والتكرار النسبي:
يستخدم هذا النوع من التكرارات لمعرفة عدد المفردات في التوزيع الأكبر أو الأقل من قيمة معينة هي الحدود الدنيا أو العليا للفئات التي يتكون منها جداول التوزيع التكراري الأصلي.
ـ التكرار التجميعي في حالة البيانات المبوبة :
لنعود إلى الجدول السابق والخاص بتوزيع المقترضين حسب فئات القرض فإنه يمكن استنتاج التكرار التجميعي الصاعد والتكرار التجميعي الهابط كالتالي :
جدول التكرار المتجمع الصاعد والهابط
جدول رقم (19)
فئات القروض التكرار
(عدد المقترضين)
f
التكرار التجميعي الصاعد التكرار التجميعي الهابط
الحدود التكرار المتجمع الحدود التكرار المتجمع
45-35 3 أقل من 35 صفر 35 فأكثر 50
55-45 4 أقل من 45 3 45 فأكثر 47
65-55 7 أقل من 55 7 55 فأكثر 43
75-65 14 أقل من 65 14 65 فأكثر 36
85-75 15 أقل من 75 28 75 فأكثر 22
95-85 6 أقل من 85 43 85 فأكثر 7
105-95 1 أقل من 95 49 95 فأكثر 1
أقل من 105 50 105 فأكثر صفر
المجموع 50

وبذلك يمكن استخدام الجدول التكراري التجميعي الصاعد لحساب تقدير لعدد المفردات التي تحمل قيمة الظاهرة عند حدود تقل عن قيمة معينة، فمثلاً نلاحظ أن المقترضين الذين تقل قروضهم عن (45) ألف وحدة نقدية هم ثلاثة مقترضين وبذلك تكون نسبتهم إلى إجمالي المقترضين هي 3/50 = 6% من المقترضين .
وكذلك فإن عدد اقترضوا أقل من (60) ألف وحدة نقدية يساوي (14) مقترضاً ونسبتهم = 14/50 = 0.28 أو (%28) من إجمالي المقترضين .
ـ التكرار النسبي :
يفيد التكرار النسبي في تكوين فكرة استدلالية عن اتجاه الظاهرة ، ويتم تحديد التكرار النسبي الخاص بكل فئة بواسطة قسمة تكرار كل فئة على مجموع التكرارات، [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image015.gif[/IMG]
مثال: الجدول التكراري المرفق يوضح فئات الأسهم وعدد المساهمين في إحدى الجمعيات التعاونية.
المطلوب: حساب التكرارات النسبية
جدول رقم (20)
فئات عدد الأسهم عدد المساهمين التكرار النسبي
15-10 5 0.125
20-15 9 0.225
25-20 11 0.275
30-25 5 0.125
35-30 4 0.100
40-35 4 0.100
45-40 2 0.05
المجموع 40 1.000

من خلال الجدول السابق نجد أن نسبة المساهمين الذين يمتلكون أسهماً مابين 10 إلى 15 سهماً تعادل 0.125 من إجمالي المساهمين، كذلك نجد أن المساهمين الذين يمتلك كل منهم من 15 إلى 20 سهماً تبلغ 0.225 من إجمالي المساهمين أي 22.5% من المساهمين في تلك الجمعية وهكذا.

V ـ التمثيل الهندسي والبياني للجداول التكرارية :
يمكن تمثيل بيانات الجدول التكراري عن طريق رسم كل من :
1) المدرج التكراري .
2) المضلع التكراري
3) المنحني التكراري
ولرسم المدرج التكراري يخصص المحور الأفقي لقيم الظاهرة أما المحور العامودي فيخصص للتكرارات المقابلة ولتوضيح ذلك نعود للتمرين السابق والمتعلق بالمقترضين من أحد المصارف الخاصة.


نرسم الشكل التالي ليوضح المدرج التكراري لتوزيع 50 مقترضاً من أحد المصارف الخاصة

المدرج التكراري لتوزيع المقترضين
ولرسم المضلع التكراري نأخذ مراكز الفئات (مركز الفئة هو نصف مجموع حدي الفئة الأدنى والأعلى)، والتكرارات المناظرة لها، ثم نوصل هذه النقط بخط منكسر فنحصل على المضلع التكراري كما هو موضح في الجدول التالي:
جدل رقم (21)
فئات 45-35 55-45 65-55 75-65 85-75 95-85 105-95
مراكز الفئات 40 50 60 70 80 90 100
التكرارات 3 4 7 14 15 6 1

وبذلك نحصل على الشكل التالي للمضلع التكراري:

كما يمكن رسم كل من المدرج التكراري والمضلع التكراري على نفس الشكل :

وبإجراء عملية تهذيب للمضلع التكراري فإنه يمكن الحصول على المنحني التكراري حيث لايشترط هنا أن يمر المنحني بجميع نقط المضلع التكراري .


المنحني التكراري لتوزيع المقترضين
وفي حالة عرض الجدول التكراري في فئات غير منتظمة فإنه لابد من تعديل التكرارات المقابلة لكل فئة حيث أنه كما سبق القول فإن المساحة المخصصة لكل عمود تعبر عن حجم الظاهرة المقابلة لكل فئة من فئات الجدول مع مراعاة تفاوت أطوال القواعد للأعمدة الناتجة.

التمثيل البياني للجدول التكراري التجميعي الصاعد والهابط :
يمكن تمثيل الجدول التكراري التجميعي الصاعد بيانياً بواسطة تحديد نقط المنحنى بنفس الأسلوب السابق شرحه في حالة رسم المنحنى التكراري حيث يخصص المحور الأفقي لحدود قيم الظاهرة والمحور العامودي للتكرارات المتجمعة، ويمكن تمثيل كل من منحنى التكرار التجميعي الصاعد والهابط على نفس الرسم .
مثال :
المطلوب رسم منحنى التكرار التجميعي الصاعد والمنحنى التكراري التجميعي الهابط للمثال الخاص بتوزيع المقترضين من أحد المصارف .


وفي حالة العدد المناسب من التكرارات فإن المنحنيين يلتقيان في نقطة تقابل منتصف التكرارات.
IV ـ خصائص التوزيعات التكرارية:
1 ـ تظهر المفردات ميلاً للتمركز حول قيمة معينة والتناقص على جانبي هذه القيمة، تدعى هذه القيمة النزعة المركزية وتقاس بالمقاييس التالية: الوسط الحسابي، الوسيط، المنوال، الوسط الهندسي، الوسط التوافقي.
2 ـ تبتعد القيم عن نقطة التمركز هذا الاختلاف يدعى التشتت ويقاس بالمقاييس التالية: المدى، الانحراف الربيعي، الانحراف المتوسط، الانحراف المعياري.
3 ـ تختلف التوزيعات عن بعضها البعض على النحو التالي:
a) ـ منحني متماثل ينطبق على المنحني الطبيعي
b) ـ منحني غير متماثل وبالتالي لاينطبق على المنحني الطبيعي ويكون ملتوي نحو اليمين أو ملتوي نحو اليسار.

2 مقاييس النزعة المركزية:
سنكتفي هنا بثلاثة مقاييس للنزعة المركزية تجمع بين الشيوع وبساطة الحساب ووضوح المعنى في كل منها .
· المنوال Mode :
يعرف المنوال بأنه القيمة الأكثر شيوعاً (أو الأكثر تكراراً) في البيانات.
ففي مجموعة البيانات التالية :
14 15 23 16 15 19 15 18 19
نجد أن المنوال هو القيمة 15 إذ أنها تظهر ثلاث مرات. ولتحديد قيمة المنوال نضع البيانات في جدول تكراري فيكون المنوال هو القيمة المقابل لأعلى تكرار.
أما إذا كانت البيانات مبوبة في جدول تكراري ذي فئات فإنه لايمكن إيجاد قيمة المنوال بمجرد النظر، إذ لايمكن تحديد أي القيم أكثر شيوعاً في البيانات، إلا أنه يمكن افتراض أن قيمة المنوال هي إحدى قيم المتغير داخل الفئة ذات أكبر تكرار والتي تسمى بالفئة المنوالية كما في المثال التالي :
مثال (1-2) : الجدول التكراري التالي يوضح توزيع عينة عشوائية من 200 عضو هيئة تدريسية تبعاً لفئات الأعمار في إحدى الجامعات التابعة لوزارة التعليم العالي في إحدى الدول.
فئات الأعمار 40-35 45-40 50-45 55-50 60-55 65-60 المجموع
عدد الأعضاء 20 35 80 43 16 6 200

نلاحظ أن أكبر تكرار في هذا الجدول هو 80 وهو المقابل للفئة 45 إلى أقل من 50 وتسمى هذه الفئة بالفئة المنوالية ومن ثم يمكن القول أن المنوال هو أحد قيم هذه الفئة ولأنه من الصعب الوصول إلى القيمة الحقيقية للمنوال فإننا نلجأ إلى تقديرها بأي من الطرق التالية:
I ـ مركز الفئة المنوالية : أسهل تقريب لقيمة المنوال هو مركز الفئة المنوالية وفي مثالنا هذا يكون المنوال طبقاً لهذه الطريقة هو 47.5 ولكن هذه الطريقة لا تراعي شكل التوزيع وتفضل عليها طريقة الفروق وطريقة العزوم ونحن سوف نتناول طريقة الفروق باعتبارها الأكثر شيوعاً واستخداماً.
II ـ طريقة الفروق :
تعتمد طريقة الفروق على التكرارين السابق واللاحق وتكرار الفئة المنوالية كأساس لحساب المنوال وفي هذه الحالة فإن بعد المنوال عن بداية الفئة المنوالية يتناسب مع هذه الفروق ويتم حساب المنوال بأسلوب الفروق من خلال العلاقة التالية :
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image002.gif[/IMG]
حيث أن :
L1: الحد الأدنى للفئة المنوالية.
D1 : الفرق بين تكرار الفئة المنوالية وتكرار الفئة التي تسبقها .
D2 : الفرق بين تكرار الفئة المنوالية وتكرار الفئة اللاحقة.
C : طول الفئة .
لو عدنا لبيانات الجدول السابق والمتعلق بأعمار أعضاء هيئة التدريس فإن منوال أعمار هؤلاء الأعضاء هو :
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image004.gif[/IMG]
التفسير: إن العمر الأكثر شيوعاً أو تكراراً بين هؤلاء الأعضاء هو 47.70 وبالتقريب (48) سنة تعطينا هذه الطريقة أحسن تقريب لقيمة المنوال ويمكن الوصول إلى نفس القيمة بيانياً كما يلي :
طريقة الرسم :
عند رسم المدرج التكراري نلاحظ أن الفئة المنوالية هي قاعدة أطول عمود وبتوصيل نقطة الحد الأعلى للفئة السابقة بالحد الأعلى للفئة المنوالية والحد الأدنى للفئة المنوالية بالحد الأدنى للفئة اللاحقة لها فإن العمود النازل من نقطة التقاطع يحدد قيمة المنوال.

وباستخدام هذه الطريقة في التمرين السابق نجد أن :
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image006.gif[/IMG]
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image007.gif[/IMG]







نجد من الرسم أن قيمة المنوال هي 48 سنة تقريباً (وبالدقة تساوي 47.70).
ملاحظة :
عند إيجاد قيمة المنوال من جدول تكراري ذي فئات غير متساوية يجب أولاً التخلص من أثر اختلاف أطوال الفئات أي أنه يجب أولاً الحصول على قيمة التكرارات المعدلة ثم استخدامها لإيجاد المنوال بالطريقة السابقة .
ـ خصائص المنوال :
1 ـ لا يتأثر بالقيم المتطرفة .
2 ـ يمكن حسابه في التوزيعات المفتوحة .
3 ـ طرق حسابه تقريبية .

· الوسيط Med :
الوسيط هو القيمة التي تتوسط البيانات أي هي القيمة التي يكون عدد المفردات الأصغر منها مساوياً لعدد المفردات الأكبر منها. وعلى ذلك فإنه لإيجاد قيمة الوسيط يجب أولاً ترتيب البيانات ترتيباً تصاعدياً أو تنازلياً ثم نحدد مكان المفردة الوسيطية ويسمى ترتيب الوسيط. ثم بعد ذلك نوجد قيمة الوسيط.
لإيجاد الوسيط من مجموعة البيانات التالية :
14 15 23 16 15 19 15 18 19
نبدأ بترتيبها تصاعدياً أي :
14 15 15 15 16 18 18 19 23
ويلاحظ هنا أن ترتيب الوسيط هو (5) حيث أن هناك (4) قيم أصغر منها و (4) قيم أكبر منها وبالتالي فإن قيمة الوسيط هي قيمة المفردة رقم (5) في البيانات المرتبة أي أن: الوسيط=16.
يلاحظ في هذا المثال أن عدد المفردات = 9 وأن ترتيب الوسيط وهو (5) يمكن الحصول عليه على الصورة [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image009.gif[/IMG] وإذا حذفت القيمة الأخيرة وهي (23) من البيانات أصبح عدد المفردات (8) ونجد أنه في هذه الحالة يقع الوسيط بين قيمة المفردتين رقم 5,4 إذ أن ترتيب الوسيط في هذه الحال [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image011.gif[/IMG] أي بين القيمتين (16,15) فيكون الوسيط [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image013.gif[/IMG] ويمكن تلخيص خطوات حساب الوسيط في الخطوات الثلاث التالية:
1 ـ ترتيب القيم تصاعدياً أو تنازلياً.
2 ـ إيجاد ترتيب الوسيط [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image015.gif[/IMG] حيث أن n عدد المفردات .
3 ـ إيجاد قيمة الوسيط وهو قيمة المفردة رقم [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image015.gif[/IMG]

عدد المفردات
2
ويلاحظ أنه إذا كان عدد المفردات كبيراً فإنه يمكن اعتبار ترتيب الوسيط هو :
أي [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image018.gif[/IMG] = [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image020.gif[/IMG]
ـ حساب الوسيط لبيانات مبوبة (جدول تكراري)
ويتم على النحو التالي :
1 ـ تكوين الجدول المتجمع الصاعد (أو الهابط).
2 ـ إيجاد ترتيب الوسيط وهو [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image022.gif[/IMG] ثم البحث عن القيمة [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image024.gif[/IMG] وما يساويها أو أكبر منها مباشرة لتحديد الفئة الوسيطية.
3 ـ إيجاد قيمة الوسيط وذلك بطريقتي الحساب والرسم.
I ـ بطريقة الحساب :
بعد تكوين جدول التكرارات المتجمعة الصاعدة (أو الهابطة) ومن ثم ترتيب الوسيط من خلال
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image026.gif[/IMG]،نبحث عن القيمة [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image024.gif[/IMG] أو أكبر منها مباشرة في عمود التكرارات المتجمعة الصاعدة والفئة المقابلة لها تكون الفئة الوسيطية وأخيراً نطبق العلاقة التالية :
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image029.gif[/IMG]
حيث أن :
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image031.gif[/IMG]: الحد الأدنى للفئة الوسيطية .
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image033.gif[/IMG] : مجموع التكرارات التي تسبق تكرار الفئة الوسيطية fme
fme : تكرار الفئة الوسيطية
C : طول الفئة الوسيطية .
وبالعودة إلى التمرين السابق والمتعلق بأعمار أعضاء هيئة التدريس في إحدى الجامعات نجد أن وسيط أعمار هؤلاء الأعضاء هو :
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image035.gif[/IMG]
الفئات f ت.ت.ص
40-35 20 20
45-40 35 55
50-45 80 135
55-50 43 178
60-55 16 194
65-60 6 200

التفسير : إن نصف الأعضاء كانت أعمارهم أقل من (47.81) سنة وإن نصف الأعضاء الآخر كانت أعمارهم أكبر من هذا العمر .
II ـ طريقة الرسم :
نرسم المنحنى المتجمع الصاعد (أو الهابط) ثم نوجد القيمة المقابلة لترتيب الوسيط من الرسم فتكون هي قيمة الوسيط.
مثال : أوجد الوسيط لبيانات الجدول السابق والمتعلق بأعمار أعضاء هيئة التدريس إحدى الجامعات .

حدودا لفئات التكرار المتجمع الصاعد
أقل من 35 ـ
أقل من 40 20
أقل من 45 55
أقل من 50 135
أقل من 55 178
أقل من 60 194
أقل من 65 200




[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image037.gif[/IMG]












ملاحظة : يمكن تحديد قيمة الوسيط بيانياً أيضاً من خلال رسم منحني التكرار التجميعي الهابط أو الاثنين معاً (الصاعد والهابط) نقطة التقاطع اسقاطها على المحور الأفقي هي قيمة الوسيط .
ثم نوجد ترتيب الوسيط من العلاقة [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image022.gif[/IMG] فيكون ترتيب الوسيط [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image039.gif[/IMG]
من الرسم نوجد القيمة المقابلة لتكرارات 100 فتكون قيمة الوسيط هي (47.81) سنة.
· خصائص الوسيط :
1 ـ يمكن حسابه من الجداول التكرارية المفتوحة .
2 ـ لا يتأثر بالقيم المتطرفة.
3 ـ قيمته غير ثابتة عندما يكون حجم العينة صغيراً.
· الوسط الحسابي :
يعرف الوسط الحسابي لمجموعة من القيم بأنه القيمة التي لو أعطيت لكل مفردة فإن مجموعها لايتغير، أي أن: (عدد المفردات) * (الوسط الحسابي) = مجموع القيم
وبصورة عامة إذا كان المتغير x يأخذ القيم x1, x2, x3, xn فإن الوسط الحسابي لهذه القيم يرمز له بالرمز [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image041.gif[/IMG] ويعبر عنه على أنه :
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image043.gif[/IMG]
ويمكن كتابة ذلك في صورة مختصرة :
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image045.gif[/IMG]
(حيث n عدد قيم المتغير x)
مثال : أوجد الوسط الحسابي لأجور (5) عمال كانت أجورهم الاسبوعية على النحو التالي:
2150 2520 1950 1875 2125 (ليرة سورية)
الأسلوب المباشرة :
ويتم من خلال تطبيق العلاقة التالية : [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image047.gif[/IMG]
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image049.gif[/IMG]
أي الوسط الحسابي لأجر العامل = 2124 ليرة.
ـ حساب الوسط الحسابي لبيانات مبوبة (جدول تكراري):
مثال :
أحسب الوسط الحسابي لأجر العامل إذا علمت أن الأجور الأسبوعية لعينة عشوائية من 200 عامل من عمال إحدى الصناعات كانت وفق الجدول التالي (بمئات الوحدات النقدية):
فئات الأجر الأسبوعي 40-20 60-40 80-60 100-80 120-100 140-120 المجموع
عدد العمال 9 22 68 64 27 10 200

الحل :
من تعريف الوسط الحسابي نعلم أن :
جملة الأجور الأسبوعية
الوسط الحسابي (للأجر الأسبوعي للعامل ) = ـــــــــــــ [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image051.gif[/IMG]
عدد العمال
حيث أن (x) مركز الفئات (f) التكرارات.
من الجدول نلاحظ أن هناك (9) عمال كل منهم يحصل على أجر يتراوح بين (20)، (40) وحدة نقدية أي أن كل منهم يحصل في المتوسط على أجر قدره (30) وحدة [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image053.gif[/IMG] (وهو مركز الفئة الأولى) وبالتالي فإن أجور العمال في هذه الفئة الأولى هي (90)(30)=270 وحدة نقدية كذلك نجد أن هناك (22) عاملاً يحصل كل منهم على أجر يتراوح بين (60),(40) وحدة أي أن أجر العامل منهم هو (50) في المتوسط [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image055.gif[/IMG] أي مركز (الفئة الثانية) فيكون بذلك أجور العمال في الفئة الثانية هو 1100=(50)(22).
وبالمثل يمكن إيجاد أجور العمال في باقي فئات الجدول، وبجمع هذه الأجور نحصل على جملة الأجور. ويمكن ترتيب هذه الحسابات كما في الجدول التالي :
فئات الأجر عدد العمال (f) مركز الفئات (x) fx
40 – 20 9 30 270
60 – 40 22 50 1100
80 – 60 68 70 4760
100-80 64 90 5760
120-100 27 110 2970
140-120 10 130 1300
المجموع 200 16160

ويكون الوسط الحسابي لأجر العامل [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image057.gif[/IMG] وحدة نقدية أي أن أجور هؤلاء العمال بالمتوسط هو (80,8) وحدة نقدية.
ملاحظة : يلاحظ أنه لإيجاد قيمة الوسط الحسابي في حالة جدول تكراري ذي فئات غير متساوية فإننا نتبع نفس الطريقة كما في الأمثلة السابقة (الفئات المتساوية) دون أي اختلاف.
ـ الوسط الحسابي المرجح :
في بعض الأحيان يكون من المهم ترجيح بعض القيم x1, x2, ….xn بأوزان w1, w2, … wn وهذه تعتمد على الأهمية المرتبطة بهذه القيم في الدراسة ويعرف الوسط الحسابي هنا بالوسط الحسابي المرجح ويحسب بالعلاقة التالية:.
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image059.gif[/IMG]
مثال :
إذا أعطى الامتحان النهائي في مقرر ما وزناً يساوي ثلاثة أمثال الامتحانات الشهرية، وإذا حصل طالب في الامتحان النهائي على 85 درجة وفي الامتحانات الشهرية على 90,70 درجة فإن متوسط درجاته يكون :
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image061.gif[/IMG]
· خصائص الوسط الحسابي :
1 ـ يتأثر بالقيم المتطرفة على جانبي التوزيع.
2 ـ صعوبة حسابه من جدول مفتوح .
3 ـ معيار للمقارنة.
3-2 : العلاقة بين المنوال والوسيط والوسط الحسابي :
يلاحظ أنه في التوزيعات التكرارية المتماثلة (الشكل المرفق) تتطابق قيم كل من المنوال والوسيط والوسط الحسابي، ومن الناحية التطبيقية يندر وجود التوزيعات المتماثلة، فقد نحصل على توزيعات ملتوية ناحية اليمين أو ناحية اليسار، وفي التوزيعات التكرارية وحيدة المنوال المتماثلة والقريبة من التماثل تحقق العلاقة التجريبية التالية:
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image063.gif[/IMG]
أما في التوزيعات التكرارية الملتوية التواء شديداً فلا تتحقق هذه العلاقة.
الأشكال المرفقة توضح الموضع النسبي للوسط والوسيط والمنوال للمنحنيات التكرارية الملتوية إلى اليمين والملتوية إلى اليسار على الترتيب.
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image065.jpg[/IMG]
المنوال = الوسيط = الوسط الحسابي

[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image067.jpg[/IMG]
في المنحنيات المتماثلة يتطابق الوسط والوسيط والمنوال أي أن تطابق المقاييس الثلاثة دليل على تماثل التوزيع كما أن التباعد بين هذه المقاييس يعتبر دليلاً على عدم التماثل لذا فإن هذه الفروق يمكن أن تستخدم لقياس الالتواء كما سنوضح فيما بعد.
· الوسط الهندسي :
يعرف الوسط الهندسي لمجموعة من القيم x1, x2…..xn على أنه الجذر النوني لحاصل ضرب هذه القيم .
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image069.gif[/IMG]= الوسط الهندسي
أغلب استخداماته في حساب معدلات النمو ومعدلات الفائدة وحساب الأرقام القياسية .
· الوسط التوافقي :
الوسط التوافي لمجموعة من القيم هو مقلوب الوسط الحسابي لمقلوبات هذه القيم أي أن:
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image071.gif[/IMG]= الوسط التوافقي
أغلب استخداماته في مجال انتاجية العمل والأسعار والعلاقة الثلاثية (السرعة، الزمن، المسافة)
-4-1 مقاييس التشتت :
لقد استعرضنا كيفية تحليل البيانات الإحصائية حسابياً عن طريق المتوسطات وجدير لكن هذه المتوسطات (مقاييس الموضع) لاتعطي وصفاً كاملاً للبيانات إذ أنها تبين القيمة التي تتركز حولها بقية قيم العينة فقط ولا تعطي أي إيضاح عن مدى تباعد أو تقارب باقي القيم من هذه القيمة أي أنها لاتوضح مدى التجانس في البيانات أو مدى تشتتها لذا فإننا نحتاج إلى مقياس آخر يوضح مدى تقارب أو تباعد البيانات وهذه المقاييس تسمى بمقاييس التشتت وهي: المدى المطلق، نصف المدى الربيعي ـ الانحراف المتوسط ـ الانحراف المعياري.
· المدى المطلق (R) :
هو الفرق بين أكبر وأصغر قيمة في مجموعة البيانات.
ومن عيوب هذا المقياس أنه يعتمد على قيمتين فقط من البيانات ويتجاهل باقي القيم وأغلب استخدامات هذا المقياس في وصف الأحوال الجوية وقياس تشتت الأسعار اليومية للسندات والأسهم والأوراق الحالية ومراقبة جودة الإنتاج .
· نصف المدى الربيعي (Q.D) :
يعرف على أنه نصف الفرق بين أكبر وأصغر قيمة من القيم المتبقية بعد استبعاد الربع الأدنى والربع الأعلى من الباينات (الفرق بين الربيع الثالث والربيع الأول مقسوماً على (2)).
وللحصول على نصف المدى الربيعي نتبع الخطوات التالية :
(1) ترتيب البيانات ترتيباً تصاعدياً (أو تنازلياً).
(2) تحديد ترتيب (موضع) القيمة التي تقع في آخر الربع الأول
لبيانات مبوبة [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image073.gif[/IMG]. لبيانات غير مبوبة [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image075.gif[/IMG]
(3) إيجاد قيمة Q1 بالرسم أو بالحساب مع ملاحظة أن Q2 = الوسيط
(4) تحديد ترتيب القيمة التي تقع في آخر الربع الثالث
لبيانات مبوبة[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image077.gif[/IMG]. لبيانات غير مبوبة [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image079.gif[/IMG]
(5) نوجد قيمة Q3 من الرسم أو الحساب (بنفس طريقة إيجاد الوسيط).
(6) [IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image081.gif[/IMG] نصف المدى الربيعي
حساب المدى الربيعي لبيانات مبوبة :
إن حساب الربيعيات لبيانات مبوبة مشابهة تماماً لطريقة حساب الوسيط ويتم ذلك على النحو التالي :
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image083.gif[/IMG]الربيع الأول
حيث أن :
L1 : تشير إلى الحد الأدنى لفئة الربيع الأول .
f/4 : ربع مجموعة التكرارات (ترتيب الربيع الأول ).
åf1 : مجموع التكرارات السابقة لتكرار فئة الربيع الأول .
fQ1 : تكرار فئة الربيع الأول .

[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image085.gif[/IMG]الربيع الثالث
حيث أن :
L3 : تشير إلى الحد الأدنى لفئة الربيع الثالث .
f / 4 : ترتيب الربيع الثالث .
åf1 : مجموع التكرارات السابقة لتكرار فئة الربيع الثالث.
fQ3 : تكرار فئة الربيع الثالث .
وبالتطبيق على المثال السابق المتعلق بأعمار أعضاء هيئة التدريس في إحدى الجامعات (بحث الوسيط) نجد أن:

[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image087.gif[/IMG]

الفئات f ت.ت.ص
40-35 20 20
45-40 30 55
50-45 80 135
55-50 43 178
60-55 16 194
65-60 6 200



الربيع الأول :

التفسير : أن %25 من أعضاء هذه الجامعة أعمارهم كانت أقل (45) سنة وأن %75 من هؤلاء العمال كانت أعمارهم أكبر من (45) سنة.
الربيع الثالث :

التفسير : أن %75 من أعضاء هذه الجامعة أعمارهم كانت أقل من (51.70) سنة وأن %25 من هؤلاء العمال كانت أعمارهم أكبر من (51.70) سنة .
نصف المدى الربيعي :

ـ خصائص الانحراف الربيعي (نصف المدى الربيعي ) :
1 ـ يمكن حسابه من التوزيعات التكرارية المفتوحة
2 ـ مقياس النزعة المركزية المقابل له هو الوسيط .
ـ الانحراف الربيعي النسبي (Q.D%) :
يعتبر من مقاييس التشتت النسبية له أهمية في التحليل الاحصائي لمقارنة تشتت توزيعين مختلفين، ويعطى بالعلاقة التالية :
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image095.gif[/IMG]
أو
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image097.gif[/IMG]
وبالتطبيق على التمرين السابق والمتعلق بأعمار عينة عشوائية من أعضاء هيئة التدريس إحدى الجامعات نجد أن :
Med= 47.81 , Q1= 45 , Q3 = 51.70 , Q.D = 3.35
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image099.gif[/IMG]
وبفرض أخذت عينة عشوائية من حجم مماثل من الأعضاء في جامعة أخرى وكان الوسيط للأعمار (40) سنة وبانحراف ربيعي مقداره (4) سنة والمطلوب :
أيهما يعرض تشتتاً أكبر أعمار الأعضاء في الجامعة الأولى أم أعمار الأعضاء في الجامعة الثانية؟ برر إجابتك إحصائياً. (الجامعة الثانية)
من خلال المقارنة نجد أن Q.D% (10%) > Q.D% (7%)
وبالتالي يمكن القول أن عينة أعضاء الجامعة الثانية تعرض تشتتاً أكبر من أعمار عينة أعضاء الجامعة الأولى .
· الانحراف المتوسط أو متوسط الانحرافات (M.D) :
يعرف الانحراف المتوسط لمجموعة القيم x1, x2, ….xn كالتالي:

أي أنه متوسط القيم المطلقة لانحرافات القيم عن وسطها الحسابي (القيمة المطلقة لرقم هي الرقم بإشارة موجبة ويعبر عنها بخطين حول الرقم فتكون القيمة المطلقة للرقم)
مثال : أوجد الانحراف المتوسط لمجموعة القيم :
11 8 6 3 2
الحل :
الوسط الحسابي
الانحراف المتوسط
إذا كانت القيم x1, x2, …. xn تحدث بتكرارات f1, f2, …. fn فالانحراف المتوسط يمكن كتابته على صورة
الانحراف المتوسط
· الانحراف المعياري (S) :
هو الجذر التربيعي لخارج قسمة مربعات انحرافات القيم عن وسطها الحسابي على عدد القيم.
ويعتبر الوسط الحسابي والانحراف المعياري في أكثر المقاييس الاحصائية أهمية في التحليل الاحصائي ويعتبران الأساس في النظرية الاحصائية على اعتبار أن الوسط الحسابي يحدد لنا مركز التوزيع الطبيعي والانحراف المعياري يحدد لنا كيفية الانتشار على جانبي الوسط الحسابي.


· حساب الانحراف المعياري لبيانات غير مبوبة :
ـ الأسلوب المباشر :

حيث أن :
ويمكن تبسيط العلاقة السابقة فنحصل على الصيغة التالية :
[IMG]file:///C:/Users/hp/AppData/Local/Temp/msohtmlclip1/01/clip_image115.gif[/IMG]
ـ حساب الانحراف المعياري لبيانات مبوبة (جدول تكراري):
1 ـ الأسلوب المباشر :
ويتم من خلال العلاقة التالية :

2 ـ أسلوب استخدام مراكز الفئات :

مع العلم أن جميع هذه الأساليب لحساب الانحراف المعياري تعطي نفس النتائج وبالتطبيق على المثال في بحث الوسط الحسابي والمتعلق بأجور العمال في إحدى الصناعات نجد أن:
فئات الأجر عدد العمال مراكز الفئات (x) fx fx2
40-20 9 30 270 8100
60-40 22 50 1100 55000
80-60 68 70 4760 333200
100-80 64 90 5760 518400
120-100 27 110 2970 326700
140-120 10 130 1300 169000
المجموع 200 16160 (يمنع عرض أرقام الهواتف بدون أذن الإدارة)




· خصائص الانحراف المعياري :
1 ـ لايمكن حسابه من جداول تكرارية مفتوحة .
2 ـ يتأثر بضرب وقسمة المفردات ولا يتأثر بالجمع والطرح.
3 ـ مقياس النزعة المركزية المقابل له هو الوسط الحسابي.
· معامل الاختلاف (الانحراف المعياري النسبي ) (C.D%)
نحن نعلم أن مقياس التشتت يستخدم للمقارنة بين مدى تقارب البيانات من مقاييس النزعة لها، وجدير بالملاحظة هنا أنه إذا تساوت مقاييس النزعة للمجتمعات المختلفة فإنه يمكننا مقارنة درجات التجانس في هذه المجتمعات عن طريق مقاييس التشتت. أما إذا اختلف مقياس النزعة أو وحدة القياس المستخدمة من مجتمع لآخر فإننا لانستطيع مقارنة التجانس عن طريق مقاييس التشتت مباشرة بل لابد وأن نلجأ إلى تعديلها أو إلى مقياس آخر نتلافى فيه هذا الاختلاف، هذا المقياس يسمى بمقياس (أو معامل) الاختلاف ويعرف كالتالي :

يستخدم هذا المقياس بشكل واسع في التحليل الإحصائي لمقارنة تشتت توزيعين مختلفين ولتوضيح ذلك ندرس الأمثلة التالية:

-5-2 الالتواء :
يعرف الالتواء على أنه درجة التماثل أو البعد عن التماثل للتوزيع، ويقاس بالعلاقة التالية:

وفي حالة استخدام الوسيط تصبح العلاقة:

وإذا كان معامل الالتواء مساوياً صفراً كان التوزيع متماثلاً بينما إذا كان : SK>0 هذا يعني أن التوزيع ملتوياً نحو اليمين وبالعكس إذا كان : SK < 0 فإن التوزيع ملتوي نحو اليسار.

-6-2 التفرطح :
يعرف بأنه مقياس لقياس درجة علو أو انخفاض قمة التوزيع بالنسبة للتوزيع الطبيعي ويعطى بالعلاقة الآتية :
حيث أن : m4 : العزم الرابع حول الوسط الحسابي .
S4 : مربع التباين .
وإذا كان (k=3) كان التوزيع متماثلاً بينما إذا كان (k<3) كان التوزيع منبسط أما إذا كان (k>3) فإن التوزيع مدبب.
· الدرجة المعيارية :
تعرّف الدرجة المعيارية بأنها النسبة الناتجة في قسمة انحراف القيمة الخام عن المتوسط الحسابي للتوزيع التكراري مقسوماً على الانحراف المعياري وتعطى بالعلاقة التالية:

ويمكن القول أن الدرجة المعيارية عبارة عن وحدة لقياس الانحراف المعياري عن الوسط الحسابي وتستخدم الدرجات المعيارية المقدرة بوحدات الانحرافات المعيارية لمقارنة قيمتين مأخوذتين من مجموعتين احصائيتين مختلفتين ولا يجوز مقارنة القيمتين على أساس القيم الخام .