إذا كان معامل الارتباط 1 فهذا يعني أن هناك ارتباط. معامل الارتباط والارتباط

7.3.1. معاملات الارتباط وتحديد.يمكن قياسها القرب من الاتصالاتبين العوامل وعواملها ركز(مباشر أو معكوس)، حساب:

1) إذا كان من الضروري تحديد علاقة خطية بين عاملين، - معامل الزوجالارتباطات: في 7.3.2 و 7.3.3 عمليات حساب معامل الارتباط الخطي المزدوج وفقًا لـ Bravais – Pearson ( ص) ومعامل ارتباط رتبة سبيرمان ( ص);

2) إذا أردنا تحديد العلاقة بين عاملين، ولكن من الواضح أن هذه العلاقة غير خطية، إذن علاقة الارتباط ;

3) إذا أردنا تحديد العلاقة بين عامل واحد ومجموعة معينة من العوامل الأخرى، إذن (أو، وهو نفس الشيء، "معامل الارتباط المتعدد")؛

4) إذا أردنا أن نحدد بشكل منفصل ارتباط عامل واحد فقط بعامل آخر محدد، مدرج في مجموعة العوامل المؤثرة على الأول، والتي يتعين علينا أن نأخذ في الاعتبار تأثير جميع العوامل الأخرى دون تغيير - إذن معامل الارتباط الجزئي .

لا يمكن لأي معامل ارتباط (r, r) أن يتجاوز 1 في القيمة المطلقة، أي -1< r (r) < 1). Если получено значение 1, то это значит, что рассматриваемая зависимость не статистическая, а функциональная, если 0 - корреляции нет вообще.

تحدد علامة معامل الارتباط اتجاه الاتصال: علامة "+" (أو لا توجد إشارة) تعني أن الاتصال مستقيم (إيجابي) ، علامة "-" تعني أن الاتصال يعكس (سلبي). العلامة ليس لها علاقة بقرب الاتصال

معامل الارتباط يميز العلاقة الإحصائية. ولكن في كثير من الأحيان يكون من الضروري تحديد نوع آخر من الاعتماد، وهو: ما هي مساهمة عامل معين في تكوين عامل آخر مرتبط به. ويتميز هذا النوع من الاعتماد بدرجة معينة من التقليد معامل التحديد (د ) ، تحددها الصيغة د = r 2 ´100% (حيث r هو معامل ارتباط Bravais-Pearson، انظر 7.3.2). إذا تم أخذ القياسات مقياس الترتيب (مقياس الرتبة)، ثم مع بعض الضرر للموثوقية، بدلاً من القيمة r، يمكنك استبدال القيمة r (معامل ارتباط سبيرمان، راجع 7.3.3) في الصيغة.

على سبيل المثال، إذا حصلنا، كخاصية لاعتماد العامل B على العامل A، على معامل الارتباط r = 0.8 أو r = –0.8، فإن D = 0.8 2 ´100% = 64%، أي حوالي 2 ½ 3. وبالتالي فإن مساهمة العامل A وتغيراته في تكوين العامل B تبلغ حوالي 2 ½ 3 من إجمالي مساهمة جميع العوامل بشكل عام.

7.3.2. معامل ارتباط برافيس-بيرسون.الإجراء الخاص بحساب معامل ارتباط Bravais-Pearson ( ص ) لا يمكن استخدامه إلا في الحالات التي يتم فيها النظر في العلاقة على أساس العينات ذات التوزيع التكراري الطبيعي ( التوزيع الطبيعي ) ويتم الحصول عليها عن طريق القياسات على فترات أو مقاييس النسبة. صيغة الحساب لمعامل الارتباط هذا هي:



å ( سأنا - )( ذأنا - )

ص = .

ن×س×س ذ

ماذا يظهر معامل الارتباط؟ أولاً: إشارة معامل الارتباط تشير إلى اتجاه العلاقة، وهي: إشارة "-" تشير إلى أن العلاقة يعكس، أو سلبي(هناك ميل: مع انخفاض قيم عامل واحد، تزداد القيم المقابلة لعامل آخر، ومع زيادة تنخفض)، ويشير عدم وجود علامة أو علامة "+" مباشر، أو إيجابيالاتصالات (هناك ميل: مع زيادة قيم عامل واحد، تزيد قيم عامل آخر، ومع انخفاض، تنخفض). ثانياً، تشير القيمة المطلقة (المستقلة عن الإشارة) لمعامل الارتباط إلى مدى قرب (قوة) الاتصال. من المقبول عمومًا (بشكل تعسفي إلى حد ما): بالنسبة لقيم r< 0,3 корреляция ضعيف جدا، في كثير من الأحيان لا يؤخذ في الاعتبار، بسعر 0.3 جنيه إسترليني< 5 корреляция ضعيفبسعر 0.5 جنيه استرليني< 0,7) - متوسط، بسعر 0.7 جنيهًا إسترلينيًا و0.9 جنيهًا إسترلينيًا) - قويوأخيرًا، من أجل r > 0.9 - قوي جدا.وفي حالتنا (r » 0.83) العلاقة عكسية (سلبية) وقوية.

دعونا نذكرك: يمكن أن تتراوح قيم معامل الارتباط من -1 إلى +1. إذا تجاوزت قيمة r هذه الحدود، فهذا يشير إلى ذلك في الحسابات تم ارتكاب خطأ . لو ص= 1، هذا يعني أن الاتصال ليس إحصائيًا، ولكنه وظيفي - وهو ما لا يحدث أبدًا في الرياضة أو علم الأحياء أو الطب. على الرغم من أنه مع عدد قليل من القياسات، من الممكن اختيار عشوائي للقيم التي تعطي صورة للاتصال الوظيفي، مثل هذه الحالة أقل احتمالا، كلما زاد حجم العينات المقارنة (n)، أي العدد أزواج من القياسات المقارنة.

تم إنشاء جدول الحساب (الجدول 7.1) وفقًا للصيغة.

الجدول 7.1.

جدول الحسابات لحسابات Bravais-Pearson

× ط ذ ط (سأنا - ) (سط-) 2 (ذأنا - ) (ذط-) 2 (سأنا - )( ذأنا - )
13,2 4,75 0,2 0,04 –0,35 0,1225 – 0,07
13,5 4,7 0,5 0,25 – 0,40 0,1600 – 0,20
12,7 5,10 – 0,3 0,09 0,00 0,0000 0,00
12,5 5,40 – 0,5 0,25 0,30 0,0900 – 0,15
13,0 5,10 0,0 0,00 0,00 0.0000 0,00
13,2 5,00 0,1 0,01 – 0,10 0,0100 – 0,02
13,1 5,00 0,1 0,01 – 0,10 0,0100 – 0,01
13,4 4,65 0,4 0,16 – 0,45 0,2025 – 0,18
12,4 5,60 – 0,6 0,36 0,50 0,2500 – 0,30
12,3 5,50 – 0,7 0,49 0,40 0,1600 – 0,28
12,7 5,20 –0,3 0,09 0,10 0,0100 – 0,03
åx i =137 =13.00 نعم أنا =56.1 =5.1 å( سط - ) 2 = =1.78 å( ذط - ) 2 = = 1.015 å( سأنا - )( ذأنا – )= = –1.24

منذ قس = ï ï = ï ï» 0.42، أ

قص= ï ï» 0,32, ص" –1,24ï (11´0.42´0.32) » –1,24ï 1,48 » –0,83 .

وبعبارة أخرى، عليك أن تعرف بشكل راسخ أن معامل الارتباط لا أستطيع تتجاوز 1.0 في القيمة المطلقة. يتيح لك هذا غالبًا تجنب الأخطاء الجسيمة، أو بشكل أكثر دقة، العثور على الأخطاء التي تحدث أثناء العمليات الحسابية وتصحيحها.

7.3.3. معامل ارتباط سبيرمان. كما ذكرنا سابقًا، لا يمكن استخدام معامل ارتباط Bravais-Pearson (r) إلا في الحالات التي تكون فيها العوامل التي تم تحليلها قريبة من المعدل الطبيعي في توزيع التكرار ويتم الحصول على القيم المتغيرة عن طريق القياسات بالضرورة على مقياس نسبة أو على مقياس فاصل ، وهو ما يحدث إذا تم التعبير عن الوحدات المادية. وفي حالات أخرى يتم إيجاد معامل ارتباط سبيرمان ( ص). ومع ذلك، هذا المعامل يستطيعتنطبق في الحالات التي يُسمح فيها (والمرغوب فيه). ! ) تطبيق معامل الارتباط Bravais-Pearson. ولكن يجب أن يؤخذ في الاعتبار أن الإجراء الخاص بتحديد المعامل وفقًا لـ Bravais-Pearson قد تم قوة أعلى ("حلقدرة")، لهذا السبب صأكثر إفادة من ص. حتى مع عظيم نانحراف صقد يكون في حدود ±10%.

الجدول 7.2 صيغة حساب المعامل

x i y i R x R y |d R | د ص 2 ارتباط سبيرمان

13,2 4,75 8,5 3,0 5,5 30,25 ص= 1 – . فوس

13.5 4.70 11.0 2.0 9.0 81.00 نستخدم مثالنا

12.7 5.10 4.5 6.5 2.0 4.00 للحساب ص، ولكننا سوف نبني

12.5 5.40 3.0 9.0 6.0 36.00 جدول آخر (الجدول 7.2).

13.0 5.10 6.0 6.5 0.5 0.25 لنعوض بالقيم:

13.2 5.00 8.5 4.5 4.0 16.00 ص = 1– =

13,1 5,00 7,0 4,5 2,5 6,25 =1– 2538:1320 » 1–1,9 » – 0,9.

13.4 4.65 10.0 1.0 9.0 81.00 نرى: صتبين أن يكون قليلا

12.4 5.60 2.0 11.0 9.0 81.00 أكثر من صولكن هذا مختلف

12.3 5.50 1.0 10.0 9.0 81.00 وهي ليست كبيرة جدًا. بعد كل شيء، متى

12.7 5.20 4.5 8.0 3.5 12.25 صغير جدًا نقيم صو ص

åd R 2 = 423 تقريبية للغاية، وغير موثوقة للغاية، ويمكن أن تختلف قيمتها الفعلية بشكل كبير، وبالتالي فإن الفرق صو صعند 0.1 غير مهم. عادةصيعتبر بمثابة التناظريةص ، ولكنها أقل دقة فقط. علامات متى صو صيظهر اتجاه الاتصال.

7.3.4. تطبيق والتحقق من ثبات معاملات الارتباط.إن تحديد درجة الارتباط بين العوامل ضروري للتحكم في تطور العامل الذي نحتاجه: وللقيام بذلك، علينا التأثير على عوامل أخرى تؤثر عليه بشكل كبير، كما نحتاج إلى معرفة مدى فعاليتها. من الضروري معرفة العلاقة بين العوامل من أجل تطوير أو اختيار الاختبارات الجاهزة: يتم تحديد محتوى المعلومات للاختبار من خلال ارتباط نتائجه بمظاهر الخاصية أو الخاصية التي تهمنا. وبدون معرفة الارتباطات، فإن أي شكل من أشكال الاختيار مستحيل.

وقد لوحظ أعلاه أنه في الرياضة وبشكل عام الممارسة التربوية والطبية وحتى الاقتصادية والاجتماعية، فإن تحديد ما مساهمة ، أيّ عامل واحد يساهم في تكوين آخر. ويرجع ذلك إلى حقيقة أنه بالإضافة إلى العامل السببي قيد النظر، هدف(العامل الذي يهمنا) يتصرف، ويعطي كل واحد أو آخر مساهمة فيه، والآخرين.

ويعتقد أن مقياس مساهمة كل عامل سبب يمكن أن يكون معامل التحديد د ط = ص 2 ´100%. لذلك، على سبيل المثال، إذا كان r = 0.6، أي. العلاقة بين العوامل A وB متوسطة، ثم D = 0.6 2 ´100% = 36%. مع العلم إذن أن مساهمة العامل A في تكوين العامل B تساوي 1 تقريبًا ½ 3، يمكنك، على سبيل المثال، تخصيص ما يقرب من 1 للتطوير المستهدف لهذا العامل ½ 3 مرات تدريب . إذا كان معامل الارتباط r = 0.4، فإن D = r 2 100% = 16%، أو 1 تقريبًا ½ 6 أقل بأكثر من مرتين، ووفقا لهذا المنطق، وفقا لهذا المنطق، يجب تخصيص 1 فقط لتطويره ½ الجزء السادس من وقت التدريب.

تعطي قيم D i لمختلف العوامل المهمة فكرة تقريبية عن العلاقة الكمية لتأثيراتها على العامل المستهدف الذي يهمنا، ومن أجل تحسينه، نعمل في الواقع على عوامل أخرى (على سبيل المثال، يعمل لاعب الوثب الطويل الراكض على زيادة سرعة عدوه، فكيف هو العامل الذي يقدم أكبر مساهمة في تكوين النتائج في القفز).

أذكر أن التعريف دربما بدلا من ذلك صيضع ص، على الرغم من أن دقة التحديد أقل بالطبع.

مرتكز على انتقائيمعامل الارتباط (المحسوب من بيانات العينة)، لا يمكن استخلاص نتيجة حول موثوقية حقيقة وجود علاقة بين العوامل قيد النظر بشكل عام. من أجل التوصل إلى مثل هذا الاستنتاج بدرجات متفاوتة من الصحة، المعيار معايير أهمية الارتباط. يفترض استخدامها وجود علاقة خطية بين العوامل و التوزيع الطبيعيالترددات في كل منها (بمعنى ليس انتقائيًا، ولكن تمثيلها العام).

يمكنك، على سبيل المثال، استخدام اختبارات الطالب. ديس-

صيغة زوجية: tp= –2 , حيث k هو معامل ارتباط العينة قيد الدراسة، أ ن- حجم العينات المقارنة. تتم مقارنة القيمة المحسوبة الناتجة لمعيار t (t p) بالجدول عند مستوى الأهمية الذي اخترناه وعدد درجات الحرية n = n – 2. للتخلص من العمل الحسابي، يمكنك استخدام خاص طاولة القيم الحرجة لمعاملات ارتباط العينة(انظر أعلاه)، مما يتوافق مع وجود ارتباط موثوق بين العوامل (مع مراعاة ن و أ).

الجدول 7.3.

القيم الحدودية لموثوقية معامل ارتباط العينة

عدد درجات الحرية عند تحديد معاملات الارتباط يساوي 2 (أي. ن= 2) مبين في الجدول. 7.3 القيم لها الحد الأدنى لفترة الثقة حقيقي معامل الارتباط هو 0، أي أنه مع هذه القيم لا يمكن القول بأن الارتباط يحدث على الإطلاق. إذا كانت قيمة معامل ارتباط العينة أعلى من تلك المبينة في الجدول، فإنه يمكن الافتراض، عند مستوى الدلالة المناسب، أن معامل الارتباط الحقيقي لا يساوي الصفر.

لكن الإجابة على سؤال ما إذا كانت هناك علاقة حقيقية بين العوامل قيد النظر تترك مجالا لسؤال آخر: في أي فترة زمنية تحدث هذه العلاقة؟ المعنى الحقيقي معامل الارتباط، كما قد يكون في الواقع، لكبير بلا حدود ن؟ هذا الفاصل الزمني لأي قيمة معينة صو نيمكن حساب العوامل القابلة للمقارنة، ولكن من الأفضل استخدام نظام الرسم البياني ( nomogram)، حيث تم إنشاء كل زوج من المنحنيات لبعض المحدد فوقها ن، يتوافق مع حدود الفاصل الزمني.

أرز. 7.4. حدود الثقة لمعامل ارتباط العينة (أ = 0.05). كل منحنى يتوافق مع المنحنى المشار إليه أعلاه ن.

بالإشارة إلى الرسم البياني في الشكل. في الشكل 7.4، يمكن تحديد الفاصل الزمني لقيم معامل الارتباط الحقيقي للقيم المحسوبة لمعامل ارتباط العينة عند a = 0.05.

7.3.5. علاقات الارتباط.إذا كان الارتباط الزوجي غير خطية، من المستحيل حساب معامل الارتباط وتحديده علاقات الارتباط . متطلب إلزامي: يجب قياس الخصائص على مقياس نسبي أو على مقياس فاصل. يمكنك حساب اعتماد الارتباط للعامل Xمن العامل يوالاعتماد على الارتباط للعامل يمن العامل X- يختلفون. لحجم صغير ن من العينات التي تمثل العوامل، لحساب علاقات الارتباط، يمكنك استخدام الصيغ:

نسبة الارتباط ح س½y= ;

علاقة الارتباط h y ½ س= .

هنا و هي الوسائل الحسابية للعينات X و Y، و - com.intraclass المتوسطات الحسابية. أي الوسط الحسابي لتلك القيم في عينة العامل X الذي القيم المتطابقة مترافقة في عينة العامل Y (على سبيل المثال، إذا كانت هناك قيم 4 و6 و5 في العامل X، والتي ترتبط بها في عينة العامل Y 3 خيارات بنفس القيمة 9، إذن = (4+ 6+5) ½ 3 = 5). وعليه، فهو الوسط الحسابي لتلك القيم في عينة العامل Y، والتي ترتبط بنفس القيم في عينة العامل X. ولنعطي مثالاً ونجري الحساب:

العاشر: 75 77 78 76 80 79 83 82 ; ص: 42 42 43 43 43 44 44 45 .

الجدول 7.4

جدول الحساب

× ط ذ ط س ص س ط - س (س ط - س) 2 س ط - س ص (× طس ص) 2
–4 –1
–2
–3 –2
–1
–3
س = 79 ص = 43 ق = 76 ق = 28

ولذلك ح ص ½ س= "0.63.

7.3.6. معاملات الارتباط الجزئية والمتعددة.لتقييم الاعتماد بين عاملين، عند حساب معاملات الارتباط، نفترض افتراضيًا أنه لا يوجد أي عوامل أخرى لها أي تأثير على هذا الاعتماد. في الواقع هذا ليس هو الحال. وبالتالي، فإن العلاقة بين الوزن والطول تتأثر بشكل كبير جدًا بتناول السعرات الحرارية، وكمية النشاط البدني المنتظم، والوراثة، وما إلى ذلك. عند الضرورة عند تقييم العلاقة بين عاملين تأخذ في الاعتبار التأثير الكبيرعوامل أخرى وفي نفس الوقت، كما كانت، عزل نفسك عنها، معتبرا إياها دون تغييراحسب خاص (خلاف ذلك - جزئي ) معاملات الارتباط.

مثال: نحتاج إلى تقييم التبعيات المقترنة بين 3 عوامل نشطة بشكل ملحوظ X وY وZ. دعنا نشير إلى ذلك ص XY (Z) معامل الارتباط الجزئي بين العوامل X و Y (في هذه الحالة، تعتبر قيمة العامل Z دون تغيير)، ص ZX (Y) - معامل الارتباط الجزئي بين العوامل Z وX (مع قيمة ثابتة للعامل Y)، ص YZ (X) - معامل الارتباط الجزئي بين العوامل Y و Z (مع قيمة ثابتة للعامل X). باستخدام معاملات الارتباط الزوجية البسيطة المحتسبة (برافيه - بيرسون). صس ص، ص XZ و صي ز، م

يمكنك حساب معاملات الارتباط الجزئية باستخدام الصيغ:

ص س ص – ص XZ' ص YZ ص XZ – ص XY' ص ZY ص ZY –r ZX ´ ص YZ

صس ص(ض) = ; ص XZ (Y) = ; ص ZY(X) =

او(1– ص 2XZ)(1– ص 2 يز) أو(1– ص 2 س ص)(1– ص 2 زي) أو(1– ص 2 زكس)(1– ص 2 ص)

ويمكن أن تأخذ معاملات الارتباط الجزئية قيمًا من -1 إلى +1. ومن خلال تربيعهما، نحصل على خارج القسمة المقابل معاملات التحديد ، ويسمى أيضا تدابير اليقين الخاصة(اضرب في 100 وعبر عنه بـ %%). تختلف معاملات الارتباط الجزئي بشكل أو بآخر عن معاملات الزوج البسيطة (الكاملة)، والتي تعتمد على قوة تأثير العامل الثالث (كما لو لم يتغير) عليها. يتم اختبار الفرضية الصفرية (H 0)، أي الفرضية المتعلقة بعدم وجود اتصال (اعتماد) بين العوامل X و Y (مع إجمالي عدد العلامات ك) عن طريق حساب اختبار t باستخدام الصيغة: رف = صس ص (ض) ´ ( ن-ك) 1 ½ 2' (1- ص 2 س ص (ض)) –1 ½ 2 .

لو رر< رأ ن، الفرضية مقبولة (نفترض أنه لا يوجد اعتماد)، ولكن إذا رص³ رأ ن - تم دحض الفرضية، أي أنه يعتقد أن الاعتماد يحدث بالفعل. ريتم أخذ n من الجدول ر-اختبار الطالب، و ك- عدد العوامل المأخوذة بعين الاعتبار (في مثالنا 3) وعدد درجات الحرية ن= n - 3. يتم التحقق من معاملات الارتباط الجزئية الأخرى بالمثل (في الصيغة بدلاً من ذلك صويتم استبدال XY (Z) وفقًا لذلك ص XZ(Y) أو ص ZY(X)).

الجدول 7.5

البيانات الأولية

او (1 – 0.71 2)(1 – 0.71 2) او (1 – 0.5)(1 – 0.5)

لتقييم اعتماد العامل X على العمل المشترك لعدة عوامل (هنا العوامل Y و Z)، احسب قيم معاملات الارتباط الزوجية البسيطة، واستخدمها لحساب معامل الارتباط المتعدد ص× (YZ):

Ö ص 2XY+ ص 2 اكس زد - 2 ص XY' ص XZ' ص YZ

ص X(YZ) = .

او 1 – ص 2 يوز

7.2.7. معامل الارتباط.في كثير من الأحيان يكون من الضروري قياس العلاقة بين جودة عاليةعلامات، أي. مثل هذه الخصائص التي لا يمكن تمثيلها (توصيفها) كميا، والتي لا يقاس. على سبيل المثال، تتمثل المهمة في معرفة ما إذا كانت هناك علاقة بين التخصص الرياضي للمشاركين والخصائص الشخصية مثل الانطواء (تركيز الشخصية على ظواهر عالمها الذاتي) والانبساط (تركيز الشخصية على عالم ما). كائنات خارجية). نقدم الرموز في الجدول. 7.6.

الجدول 7.6.

× (سنوات) ص (مرات) ض (مرات) × (سنوات) ص (مرات) ض (مرات)
التوقيع 1 التوقيع 2 الانطواء الانبساط
العاب رياضية أ ب
الجمباز مع د

من الواضح أن الأرقام الموجودة تحت تصرفنا هنا لا يمكن أن تكون سوى ترددات التوزيع. في هذه الحالة، احسب معامل الارتباط (اسم آخر هو " معامل الطوارئ "). دعونا ننظر في أبسط حالة: العلاقة بين زوجين من الميزات، ويسمى معامل الطوارئ المحسوب رباعي (انظر الجدول).

الجدول 7.7.

أ = 20 ب = 15 أ + ب = 35
ق = 15 د = 5 ج + د = 20
أ + ج = 35 ب + د = 20 ن = 55

نقوم بإجراء الحسابات باستخدام الصيغة:

ميلادي – 100 – 225 – 123 ق

يتضمن حساب معاملات الارتباط (معاملات الاقتران) مع عدد أكبر من الخصائص حسابات باستخدام مصفوفة مماثلة بالترتيب المناسب.

حيث x·y, x,y هي متوسط ​​قيم العينات؛ σ(x), σ(y) - الانحرافات المعيارية.
بجانب، معامل الارتباط الخطي لزوج بيرسونيمكن تحديده من خلال معامل الانحدار b: حيث σ(x)=S(x)، σ(y)=S(y) - الانحرافات المعيارية، b - المعامل قبل x في معادلة الانحدار y=a+bx.

خيارات الصيغة الأخرى:
أو

K xy - لحظة الارتباط (معامل التغاير)

للعثور على معامل ارتباط بيرسون الخطي، من الضروري العثور على متوسطي العينة x وy، وانحرافاتهما المعيارية σ x = S(x)، σ y = S(y):

يشير معامل الارتباط الخطي إلى وجود علاقة ويأخذ القيم من -1 إلى +1 (انظر مقياس تشادوك). على سبيل المثال، عند تحليل مدى قرب الارتباط الخطي بين متغيرين، تم الحصول على معامل ارتباط خطي مقترن يساوي –1. وهذا يعني أن هناك علاقة خطية عكسية دقيقة بين المتغيرات.

يمكنك حساب قيمة معامل الارتباط باستخدام متوسطات العينة المحددة، أو مباشرة.

Xy#x #y #σ x #σ y " data-id="a;b;c;d;e" data-formul="(a-b*c)/(d*e)" data-r="r xy ">احسب قيمتك

المعنى الهندسي لمعامل الارتباط: r xy يوضح مدى اختلاف ميل خطي الانحدار: y(x) وx(y)، ومدى اختلاف نتائج تقليل الانحرافات في x وy. كلما زادت الزاوية بين السطور، كلما زادت r xy.
تتطابق إشارة معامل الارتباط مع إشارة معامل الانحدار وتحدد ميل خط الانحدار، أي. الاتجاه العام للاعتماد (زيادة أو نقصان). يتم تحديد القيمة المطلقة لمعامل الارتباط من خلال درجة قرب النقاط من خط الانحدار.

خصائص معامل الارتباط

  1. |r س س | ≥ 1؛
  2. إذا كان X وY مستقلين، فإن r xy =0، والعكس ليس صحيحًا دائمًا؛
  3. إذا |r xy |=1، إذن Y=aX+b، |r xy (X,aX+b)|=1، حيث a وb ثابتان، a ≠ 0;
  4. |r xy (X,Y)|=|r xy (a 1 X+b 1, a 2 X+b 2)|، حيث a 1، a 2، b 1، b 2 ثوابت.

لذلك ل التحقق من اتجاه الاتصالويتم اختيار اختبار الفرضية باستخدام معامل ارتباط بيرسون مع إجراء مزيد من الاختبارات للتحقق من الثبات باستخدام اختبار t(انظر المثال أدناه).

المهام النموذجية (انظر أيضًا الانحدار غير الخطي)

المهام النموذجية
تتم دراسة اعتماد إنتاجية العمل y على مستوى ميكنة العمل x (٪) وفقًا لبيانات من 14 مؤسسة صناعية. وتظهر البيانات الإحصائية في الجدول.
مطلوب:
1) ابحث عن تقديرات لمعلمات الانحدار الخطي y على x. قم بإنشاء مخطط التشتت ورسم خط الانحدار على مخطط التشتت.
2) عند مستوى الدلالة α=0.05، اختبر الفرضية حول توافق الانحدار الخطي مع نتائج الملاحظة.
3) مع الموثوقية γ=0.95، ابحث عن فترات الثقة لمعلمات الانحدار الخطي.

يتم استخدام ما يلي أيضًا مع هذه الآلة الحاسبة:
معادلة الانحدار المتعددة

مثال. بناءً على البيانات الواردة في الملحق 1 والمتوافقة مع خيارك (الجدول 2)، يلزم ما يلي:

  1. احسب معامل ارتباط الزوج الخطي وأنشئ معادلة لانحدار الزوج الخطي لخاصية من أخرى. ستلعب إحدى الخصائص المقابلة لخيارك دور العامل (x)، وستلعب الأخرى دور المحصلة (y). قم بإنشاء علاقات السبب والنتيجة بين الخصائص بنفسك بناءً على التحليل الاقتصادي. اشرح معنى معلمات المعادلة.
  2. تحديد المعامل النظري للتحديد والتباين المتبقي (غير المفسر بمعادلة الانحدار). استنتج.
  3. قم بتقييم الأهمية الإحصائية لمعادلة الانحدار ككل عند مستوى خمسة بالمائة باستخدام اختبار فيشر F. استنتج.
  4. قم بتنبؤ بالقيمة المتوقعة لسمة النتيجة y حيث تكون القيمة المتوقعة لسمة العامل x 105% من المستوى المتوسط ​​x. قم بتقييم دقة التنبؤ عن طريق حساب خطأ التنبؤ وفاصل الثقة الخاص به باحتمال 0.95.
حل. المعادلة هي ص = الفأس + ب
متوسط ​​القيم



تشتت


الانحراف المعياري



العلاقة بين السمة Y والعامل X قوية ومباشرة (يتم تحديدها بواسطة مقياس تشادوك).
معادلة الانحدار

معامل الانحدار: ك = أ = 4.01
معامل التحديد
ر 2 = 0.99 2 = 0.97 أي في 97% من الحالات، تؤدي التغييرات في x إلى تغييرات في y. بمعنى آخر أن دقة اختيار معادلة الانحدار عالية. التباين المتبقي: 3%.
سذ× 2ذ 2س صص (خ)(ص ط-ص) 2(ص-ص(خ)) 2(س-س ع) 2
1 107 1 11449 107 103.19 333.06 14.5 30.25
2 109 4 11881 218 107.2 264.06 3.23 20.25
3 110 9 12100 330 111.21 232.56 1.47 12.25
4 113 16 12769 452 115.22 150.06 4.95 6.25
5 120 25 14400 600 119.23 27.56 0.59 2.25
6 122 36 14884 732 123.24 10.56 1.55 0.25
7 123 49 15129 861 127.26 5.06 18.11 0.25
8 128 64 16384 1024 131.27 7.56 10.67 2.25
9 136 81 18496 1224 135.28 115.56 0.52 6.25
10 140 100 19600 1400 139.29 217.56 0.51 12.25
11 145 121 21025 1595 143.3 390.06 2.9 20.25
12 150 144 22500 1800 147.31 612.56 7.25 30.25
78 1503 650 190617 10343 1503 2366.25 66.23 143

ملحوظة: تم العثور على قيم y(x) من معادلة الانحدار الناتجة:
ص(1) = 4.01*1 + 99.18 = 103.19
ص(2) = 4.01*2 + 99.18 = 107.2
... ... ...

أهمية معامل الارتباط

ونطرح فرضيات:
H 0: r xy = 0، لا توجد علاقة خطية بين المتغيرات؛
H 1: r xy ≠ 0، هناك علاقة خطية بين المتغيرات؛
من أجل اختبار الفرضية الصفرية عند مستوى الدلالة α بأن معامل الارتباط العام لمتغير عشوائي عادي ثنائي الأبعاد يساوي الصفر في ظل الفرضية المنافسة H 1 ≠ 0، من الضروري حساب القيمة المرصودة للمعيار ( حجم الخطأ العشوائي):

باستخدام جدول الطالب نجد جدول t (n-m-1;α/2) = (10;0.025) = 2.228
بما أن علامة التبويب Tob > t، فإننا نرفض الفرضية القائلة بأن معامل الارتباط يساوي 0. وبعبارة أخرى، فإن معامل الارتباط ذو دلالة إحصائية.
تقدير الفاصل الزمني لمعامل الارتباط (فاصل الثقة)


ص - Δ ص ≥ ص ≥ ص + Δ ص
Δ r = ±t الجدول m r = ±2.228 0.0529 = 0.118
0.986 - 0.118 ≥ ص ≥ 0.986 + 0.118
فترة الثقة لمعامل الارتباط: 0.868 ≥ r ≥ 1

تحليل دقة تحديد تقديرات معاملات الانحدار





س = 0.2152

فترات الثقة للمتغير التابع

دعونا نحسب حدود الفاصل الزمني الذي سيتم فيه تركيز 95% من القيم المحتملة لـ Y مع عدد غير محدود من الملاحظات وX = 7
(122.4;132.11)
اختبار الفرضيات المتعلقة بمعاملات معادلة الانحدار الخطي

1) إحصائيات ر




تم تأكيد الأهمية الإحصائية لمعامل الانحدار
فاصل الثقة لمعاملات معادلة الانحدار
دعونا نحدد فترات الثقة لمعاملات الانحدار، والتي ستكون بموثوقية 95% على النحو التالي:
(أ - ر أ س أ ؛ أ + ر أ س أ)
(3.6205;4.4005)
(ب - ر ب س ب ; ب + ر ب س ب)
(96.3117;102.0519)


معاملات الارتباط

وحتى الآن لم نكتفي بتوضيح حقيقة وجود علاقة إحصائية بين الخاصيتين. بعد ذلك، سنحاول معرفة الاستنتاجات التي يمكن استخلاصها حول قوة أو ضعف هذا الاعتماد، وكذلك حول نوعه واتجاهه. تسمى معايير قياس العلاقة بين المتغيرات بمعاملات الارتباط أو مقاييس الاتصال. يرتبط المتغيران بشكل إيجابي إذا كانت هناك علاقة مباشرة أحادية الاتجاه بينهما. في العلاقة أحادية الاتجاه، تتوافق القيم الصغيرة لمتغير واحد مع القيم الصغيرة لمتغير آخر، والقيم الكبيرة تتوافق مع القيم الكبيرة. يرتبط متغيران بشكل سلبي مع بعضهما البعض إذا كانت هناك علاقة عكسية متعددة الاتجاهات بينهما. في العلاقة متعددة الاتجاهات، تتوافق القيم الصغيرة لمتغير واحد مع القيم الكبيرة لمتغير آخر والعكس صحيح. تقع قيم معاملات الارتباط دائمًا في النطاق من -1 إلى +1.

- معامل الارتباط بين المتغيرات التابعة لـ ترتيبيينطبق المقياس معامل سبيرمان، وللمتغيرات التابعة ل فاصلةحجم - معامل ارتباط بيرسون(لحظة العمل). وينبغي أن يؤخذ في الاعتبار أن كل متغير ثنائي، أي متغير ينتمي إلى مقياس اسمي وله فئتين، يمكن اعتباره متغيرا ثنائي التفرع. ترتيبي.

أولاً، سوف نتحقق مما إذا كان هناك ارتباط بين متغيرات الجنس والنفسية من ملف Studium.sav. في هذه الحالة، المتغير الثنائي الجنسيمكن اعتباره ترتيبيًا. اتبع الخطوات التالية:

    حدد تحليل الجداول الترافقية للإحصائيات الوصفية... من قائمة الأوامر

    حرك المتغير الجنسإلى قائمة السلاسل، ومتغير نفسية- إلى قائمة الأعمدة.

    انقر فوق الزر إحصائيات... (إحصائيات). في مربع الحوار الجدولي: الإحصائيات، حدد خانة الاختيار الارتباطات. قم بتأكيد اختيارك من خلال زر "متابعة".

    في الحوار الجداولرفض عرض الجداول عن طريق تحديد خانة الاختيار "قمع الجداول". انقر فوق موافق.

سيتم حساب معاملات ارتباط سبيرمان وبيرسون واختبار أهميتها:

تدابير متماثلة

قيمة بدون أعراض الأمراض المنقولة جنسيا. الخطأ (أ) (الخطأ المعياري المقارب) تقريبا. T (ب) (تقريبًا T) تقريبا. سيج. (أهمية تقريبية)
الفاصل الزمني بالفاصل الزمني بيرسون ر
(آر بيرسون)
,441 ,081 5,006 .000 (ق)
ترتيبي بواسطة ترتيبي (ترتيبي - ترتيبي) ارتباط سبيرمان ,439 ,083 4,987 .000 (ق)
عدد الحالات الصالحة 106

نظرًا لعدم وجود متغيرات على نطاق الفترات هنا، فسوف ننظر إلى معامل ارتباط سبيرمان. تبلغ 0.439 وهي ذات أهمية قصوى (ص<0,001).

وللحصول على وصف شفهي لقيم معامل الارتباط يتم استخدام الجدول التالي:

بناءً على الجدول أعلاه يمكن استخلاص الاستنتاجات التالية: هناك علاقة ارتباط ضعيفة بين متغيري الجنس والنفس (استنتاج حول قوة الاعتماد)، ترتبط المتغيرات ارتباطاً إيجابياً (استنتاج حول اتجاه الاعتماد).

وفي المتغير النفسي، تتوافق القيم الأصغر مع حالة ذهنية سلبية، والقيم الأكبر تتوافق مع حالة إيجابية. وفي متغير الجنس، فإن القيمة "1" تقابل الجنس الأنثوي، والقيمة "2" تقابل الجنس الذكر.

وبالتالي، يمكن تفسير العلاقة الأحادية الاتجاه على النحو التالي: تقوم الطالبات بتقييم حالتهن العقلية بشكل أكثر سلبية من زملائهن الذكور أو، على الأرجح، أكثر ميلاً للموافقة على مثل هذا التقييم عند إجراء مثل هذه التفسيرات من الضروري أن نأخذ في الاعتبار أن الارتباط بين سمتين لا يعني بالضرورة اعتمادهما الوظيفي أو السببي. لمزيد من المعلومات حول هذا، راجع القسم 15.3.

الآن دعونا نتحقق من العلاقة الارتباطية بين متغيرات التغيير والفصل الدراسي. دعونا نطبق الطريقة الموضحة أعلاه. سنحصل على المعاملات التالية:

تدابير متماثلة

بدون أعراض الأمراض المنقولة جنسيا. خطأ (أ)

الفاصل الزمني بالفاصل الزمني

ترتيبي بواسطة ترتيبي

ارتباط سبيرمان

عدد الحالات الصالحة

أ. عدم افتراض الفرضية الصفرية.

ه. استخدام الخطأ المعياري المقارب بافتراض فرضية العدم.

مع. على أساس التقريب العادي.

وبما أن المتغيرات تتغير والفصل الدراسي متري، فسنأخذ في الاعتبار معامل بيرسون (لحظة المنتجات). هو 0.807. توجد علاقة ارتباطية قوية بين متغيرات التغيير والفصل الدراسي. وترتبط المتغيرات بشكل إيجابي. وبالتالي، يدرس الطلاب الأكبر سنًا في السنوات الأخيرة، وهو في الواقع ليس نتيجة غير متوقعة.

دعونا نتحقق من الارتباط بين المتغيرات الاجتماعية (تقييم الحالة الاجتماعية) والنفسية. سنحصل على المعاملات التالية:

تدابير متماثلة

بدون أعراض الأمراض المنقولة جنسيا. خطأ (أ)

الفاصل الزمني بالفاصل الزمني

ترتيبي بواسطة ترتيبي

ارتباط سبيرمان

عدد الحالات الصالحة

أ. عدم افتراض الفرضية الصفرية.

ب. استخدام الخطأ المعياري المقارب بافتراض فرضية العدم.

مع. على أساس التقريب العادي.

في هذه الحالة، سوف ننظر إلى معامل ارتباط سبيرمان؛ هو -0.703. هناك علاقة متوسطة إلى قوية بين المتغيرات الاجتماعية والنفسية (قيمة القطع 0.7). وترتبط المتغيرات ارتباطا سلبيا، أي أنه كلما زادت قيمة المتغير الأول، انخفضت قيمة الثاني، والعكس صحيح. وبما أن القيم الصغيرة للمتغير الاجتماعي تصف حالة إيجابية (1 = جيد جدًا، 2 = جيد)، والقيم الكبيرة للنفسية تميز حالة سلبية (1 = غير مستقر للغاية، 2 = غير مستقر)، لذلك فإن الصعوبات النفسية ترجع إلى حد كبير إلى مشاكل اجتماعية.

معامل الارتباطهي قيمة يمكن أن تختلف من +1 إلى -1. وفي حالة الارتباط الإيجابي الكامل يكون هذا المعامل يساوي موجب 1 (يقولون أنه عندما تزيد قيمة متغير واحد تزيد قيمة متغير آخر)، وفي حالة الارتباط السلبي الكامل يكون سالب 1 (تشير إلى التغذية الراجعة، أي عندما تزيد قيم أحد المتغيرين، تنخفض قيم الآخر).

المثال 1:

رسم بياني للعلاقة بين الخجل والاكتئاب. وكما نرى فإن النقاط (المواضيع) لا تقع بشكل فوضوي، بل تصطف حول خط واحد، وبالنظر إلى هذا الخط يمكننا القول أنه كلما زاد خجل الشخص، زاد الاكتئاب، أي أن هذه الظواهر مترابطة.

Ex2: مخطط للخجل والتواصل الاجتماعي. ونحن نرى أنه كلما زاد الخجل، انخفضت التواصل الاجتماعي. معامل الارتباط بينهما هو -0.43. وبالتالي، فإن معامل الارتباط الأكبر من 0 إلى 1 يشير إلى علاقة تناسب طردي (كلما زاد... كلما...)، ويشير المعامل من -1 إلى 0 إلى علاقة تناسب عكسيًا (كلما زاد... كلما كان أقل. ..)

إذا كان معامل الارتباط 0، فإن كلا المتغيرين مستقلان تمامًا عن بعضهما البعض.

علاقة- هذه علاقة يظهر فيها تأثير العوامل الفردية فقط كاتجاه (في المتوسط) أثناء المراقبة الجماعية للبيانات الفعلية. يمكن أن تكون أمثلة التبعيات الارتباطية هي التبعيات بين حجم أصول البنك ومبلغ أرباح البنك ونمو إنتاجية العمل ومدة خدمة الموظفين.

يتم استخدام نظامين لتصنيف الارتباطات حسب قوتها: عامة وخاصة.

التصنيف العام للارتباطات: 1) ارتباط قوي أو قريب بمعامل ارتباط r>0.70؛ 2) متوسط ​​بـ 0.500.70، وليس مجرد ارتباط بمستوى عالي من الأهمية.

ويبين الجدول التالي أسماء معاملات الارتباط لأنواع مختلفة من المقاييس.

مقياس ثنائي (1/0) مقياس الرتبة (الترتيبي).
مقياس ثنائي (1/0) معامل بيرسون للارتباط، معامل بيرسون للطوارئ المكون من أربع خلايا. الارتباط البيسري
مقياس الرتبة (الترتيبي). العلاقة الثنائية الرتبة. معامل ارتباط الرتب لسبيرمان أو كيندال.
الفاصل الزمني والمقياس المطلق الارتباط البيسري يتم تحويل قيم مقياس الفترات إلى صفوف ويستخدم معامل الرتبة معامل ارتباط بيرسون (معامل الارتباط الخطي)

في ص=0 لا يوجد ارتباط خطي. وفي هذه الحالة، تتطابق وسائل المجموعة للمتغيرات مع متوسطاتها الإجمالية، وتكون خطوط الانحدار موازية لمحاور الإحداثيات.

المساواة ص=0 يتحدث فقط عن غياب الاعتماد على الارتباط الخطي (المتغيرات غير المرتبطة)، ولكن ليس بشكل عام عن غياب الارتباط، بل وأكثر من ذلك، عن الاعتماد الإحصائي.

في بعض الأحيان يكون اكتشاف عدم وجود ارتباط أكثر أهمية من وجود ارتباط قوي. وقد يشير الارتباط الصفري بين متغيرين إلى عدم وجود تأثير لأحد المتغيرين على الآخر، بشرط أن نثق في نتائج القياس.

في برنامج SPSS: 11.3.2 معاملات الارتباط

وحتى الآن لم نكتفي بتوضيح حقيقة وجود علاقة إحصائية بين الخاصيتين. بعد ذلك، سنحاول معرفة الاستنتاجات التي يمكن استخلاصها حول قوة أو ضعف هذا الاعتماد، وكذلك حول نوعه واتجاهه. تسمى معايير قياس العلاقة بين المتغيرات بمعاملات الارتباط أو مقاييس الاتصال. يرتبط المتغيران بشكل إيجابي إذا كانت هناك علاقة مباشرة أحادية الاتجاه بينهما. في العلاقة أحادية الاتجاه، تتوافق القيم الصغيرة لمتغير واحد مع القيم الصغيرة لمتغير آخر، والقيم الكبيرة تتوافق مع القيم الكبيرة. يرتبط متغيران بشكل سلبي مع بعضهما البعض إذا كانت هناك علاقة عكسية متعددة الاتجاهات بينهما. في العلاقة متعددة الاتجاهات، تتوافق القيم الصغيرة لمتغير واحد مع القيم الكبيرة لمتغير آخر والعكس صحيح. تقع قيم معاملات الارتباط دائمًا في النطاق من -1 إلى +1.

يستخدم معامل سبيرمان كمعامل ارتباط بين المتغيرات التي تنتمي إلى مقياس ترتيبي، ويستخدم معامل ارتباط بيرسون (لحظة المنتجات) للمتغيرات التي تنتمي إلى مقياس فاصل. وينبغي أن يؤخذ في الاعتبار أن كل متغير ثنائي التفرع، أي متغير ينتمي إلى مقياس اسمي وله فئتين، يمكن اعتباره ترتيبيًا.

أولاً، سوف نتحقق مما إذا كان هناك ارتباط بين متغيرات الجنس والنفسية من ملف Studium.sav. وفي الوقت نفسه، سنأخذ في الاعتبار أن الجنس المتغير ثنائي التفرع يمكن اعتباره ترتيبيًا. اتبع الخطوات التالية:

· اختر من قائمة الأوامر تحليل الجداول الترافقية للإحصائيات الوصفية...

· انقل متغير الجنس إلى قائمة الصفوف ومتغير النفس إلى قائمة الأعمدة.

· انقر على زر الإحصائيات.... في مربع الحوار الجدولي: الإحصائيات، حدد خانة الاختيار الارتباطات. قم بتأكيد اختيارك من خلال زر "متابعة".

· في مربع الحوار الجدولي، قم بتعطيل عرض الجداول عن طريق تحديد خانة الاختيار "منع الجداول". انقر فوق موافق.

سيتم حساب معاملات ارتباط سبيرمان وبيرسون واختبار أهميتها:

/ اس بي اس اس 10

المهمة رقم 10 تحليل الارتباط

مفهوم الارتباط

معامل الارتباط أو الارتباط هو مؤشر إحصائي احتماليةالعلاقات بين متغيرين تقاس بمقاييس كمية. على عكس العلاقة الوظيفية التي تتوافق فيها كل قيمة لمتغير واحد محددة بدقةقيمة متغير آخر اتصال احتماليتتميز بحقيقة أن كل قيمة لمتغير واحد يتوافق معاني متعددةمتغير آخر مثال على العلاقة الاحتمالية هو العلاقة بين طول الناس ووزنهم. من الواضح أن الأشخاص ذوي الأوزان المختلفة يمكن أن يكون لهم نفس الطول والعكس صحيح.

الارتباط هو قيمة تتراوح من -1 إلى +1 ويشار إليه بالحرف r. علاوة على ذلك، إذا كانت القيمة أقرب إلى 1، فهذا يعني وجود اتصال قوي، وإذا كانت أقرب إلى 0، فهو ضعيف. تعتبر قيمة الارتباط الأقل من 0.2 ارتباطًا ضعيفًا، والقيمة الأعلى من 0.5 تعتبر ارتباطًا مرتفعًا. إذا كان معامل الارتباط سلبيا، فهذا يعني أن هناك ردود فعل: كلما ارتفعت قيمة أحد المتغيرين، انخفضت قيمة الآخر.

اعتمادا على القيم المقبولة للمعامل r، يمكن تمييز أنواع مختلفة من الارتباط:

ارتباط إيجابي قويتحدده القيمة r=1. مصطلح "صارم" يعني أن قيمة متغير واحد يتم تحديدها بشكل فريد من خلال قيم متغير آخر، والمصطلح " إيجابي" -أنه كلما زادت قيم متغير واحد، زادت قيم متغير آخر أيضا.

الارتباط الصارم هو تجريد رياضي ولا يحدث أبدًا في البحث الحقيقي.

الارتباط الإيجابييتوافق مع القيم 0

لا يوجد ارتباطتحدده القيمة r=0. يشير معامل الارتباط الصفري إلى أن قيم المتغيرات لا ترتبط بأي حال من الأحوال ببعضها البعض.

لا يوجد ارتباط ح س : 0 ص xy =0 صيغت على شكل انعكاس باطلفرضيات في تحليل الارتباط.

الارتباط السلبي: -1

ارتباط سلبي صارمتحددها القيمة r= -1. إنه، مثل الارتباط الإيجابي الصارم، مجرد تجريد ولا يجد تعبيرا في البحث العملي.

الجدول 1

أنواع الارتباط وتعريفاتها

تعتمد طريقة حساب معامل الارتباط على نوع المقياس الذي تقاس عليه قيم المتغيرات.

معامل الارتباط صبيرسونأساسي ويمكن استخدامه للمتغيرات ذات المقاييس الفاصلة الاسمية والمرتبة جزئيًا، حيث يتوافق توزيع القيم مع المعدل الطبيعي (ارتباط لحظة المنتج). يعطي معامل ارتباط بيرسون نتائج دقيقة إلى حد ما في حالات التوزيعات غير الطبيعية.

أما بالنسبة للتوزيعات غير الطبيعية فيفضل استخدام معاملات ارتباط الرتب لسبيرمان وكيندال. ويتم ترتيبها لأن البرنامج يقوم بترتيب المتغيرات المرتبطة مسبقًا.

يقوم برنامج SPSS بحساب ارتباط سبيرمان كما يلي: أولاً، يتم تحويل المتغيرات إلى رتب، ثم يتم تطبيق صيغة بيرسون على الرتب.

يعتمد الارتباط الذي اقترحه M. Kendall على فكرة أنه يمكن الحكم على اتجاه الاتصال من خلال مقارنة الأشخاص في أزواج. إذا كان التغيير في X لزوج من الموضوعات يتزامن في الاتجاه مع التغيير في Y، فهذا يشير إلى وجود اتصال إيجابي. إذا لم يتطابق، فهناك اتصال سلبي. يستخدم هذا المعامل في المقام الأول من قبل علماء النفس الذين يعملون مع عينات صغيرة. نظرًا لأن علماء الاجتماع يتعاملون مع كميات كبيرة من البيانات، فإن تعداد الأزواج وتحديد الفرق في التكرارات والانعكاسات النسبية لجميع أزواج الأشخاص في العينة أمر صعب. الأكثر شيوعا هو المعامل. بيرسون.

وبما أن معامل ارتباط بيرسون r أساسي ويمكن استخدامه (مع بعض الخطأ حسب نوع المقياس ومستوى الشذوذ في التوزيع) لجميع المتغيرات المقاسة على مقاييس كمية، فسوف نأخذ أمثلة على استخدامه ونقارن النتائج تم الحصول عليها من نتائج القياسات باستخدام معاملات الارتباط الأخرى.

صيغة لحساب المعامل ص- بيرسون:

r xy = ∑ (شي-كساف)∙(يي-ياف) / (N-1)∙σ x ∙σ y ∙

حيث: Xi، Yi - قيم متغيرين؛

Xavg، Yavg - متوسط ​​قيم متغيرين؛

σ x، σ y - الانحرافات المعيارية،

N هو عدد الملاحظات.

الارتباطات الزوجية

على سبيل المثال، نود معرفة كيفية ارتباط الإجابات بين أنواع مختلفة من القيم التقليدية في أفكار الطلاب حول المكان المثالي للعمل (المتغيرات: a9.1، a9.3، a9.5، a9.7) ، ثم عن العلاقة الارتباطية بين القيم الليبرالية (أ9 .2، أ9.4.أ9.6، أ9.8). يتم قياس هذه المتغيرات على مقاييس مرتبة مكونة من 5 عناصر.

نستخدم الإجراء: "التحليل"،  "الارتباطات"،  "المقترن". المعامل الافتراضي تم تعيين بيرسون في مربع الحوار. نحن نستخدم المعامل. بيرسون

يتم نقل المتغيرات التي تم اختبارها إلى نافذة الاختيار: a9.1، a9.3، a9.5، a9.7

بالنقر فوق "موافق" نحصل على الحساب:

الارتباطات

أ9.1.ت. ما مدى أهمية أن يكون لديك ما يكفي من الوقت للحياة العائلية والشخصية؟

ارتباط بيرسون

القيمة (وجهان)

أ9.3.ت. ما مدى أهمية ألا تخاف من فقدان وظيفتك؟

ارتباط بيرسون

القيمة (وجهان)

a9.5.t. ما مدى أهمية أن يكون لديك رئيس يتشاور معك عند اتخاذ هذا القرار أو ذاك؟

ارتباط بيرسون

القيمة (وجهان)

أ9.7.ت. ما مدى أهمية العمل ضمن فريق جيد التنسيق والشعور بأنك جزء منه؟

ارتباط بيرسون

القيمة (وجهان)

** الارتباط معنوي عند مستوى 0.01 (ذو جانبين).

جدول القيم الكمية لمصفوفة الارتباط المبنية

الارتباطات الجزئية:

أولاً، دعونا نبني علاقة زوجية بين هذين المتغيرين:

الارتباطات

S8. أشعر بالقرب من أولئك الذين يعيشون بجوارك، الجيران

ارتباط بيرسون

القيمة (وجهان)

s12. تشعر بالقرب من عائلتك

ارتباط بيرسون

القيمة (وجهان)

**. الارتباط مهم عند مستوى 0.01 (ثنائي الاتجاه).

ثم نستخدم طريقة بناء الارتباط الجزئي: "التحليل"،  "الارتباطات"،  "جزئي".

لنفترض أن القيمة "من المهم تحديد ترتيب عملك وتغييره بشكل مستقل" فيما يتعلق بالمتغيرات المحددة تبين أنها العامل الحاسم الذي تحت تأثيره ستختفي العلاقة المحددة مسبقًا أو تصبح كذلك تافهة.

الارتباطات

المتغيرات المستبعدة

S8. أشعر بالقرب من أولئك الذين يعيشون بجوارك، الجيران

s12. تشعر بالقرب من عائلتك

ص16. اشعر بالقرب من الأشخاص الذين لديهم نفس دخلك

S8. أشعر بالقرب من أولئك الذين يعيشون بجوارك، الجيران

علاقة

الأهمية (على الوجهين)

s12. تشعر بالقرب من عائلتك

علاقة

الأهمية (على الوجهين)

وكما يتبين من الجدول، تحت تأثير متغير التحكم، انخفضت العلاقة قليلاً: من 0.120 إلى 0.102، إلا أن هذا الانخفاض الطفيف لا يسمح لنا بالقول أن العلاقة المحددة مسبقًا هي انعكاس لارتباط خاطئ، لأن تظل عالية جدًا وتسمح لنا برفض الفرضية الصفرية بدون خطأ.

معامل الارتباط

الطريقة الأكثر دقة لتحديد القرب وطبيعة الارتباط هي إيجاد معامل الارتباط. معامل الارتباط هو رقم تحدده الصيغة:


حيث r xy هو معامل الارتباط؛

x i - قيم الخاصية الأولى؛

y i هي قيم السمة الثانية؛

الوسط الحسابي لقيم الخاصية الأولى

الوسط الحسابي لقيم الخاصية الثانية

لاستخدام الصيغة (32)، سنقوم ببناء جدول يوفر الاتساق اللازم في إعداد الأرقام للعثور على البسط والمقام لمعامل الارتباط.

وكما يتبين من الصيغة (32)، فإن تسلسل الإجراءات هو كما يلي: نجد المتوسطات الحسابية لكل من الخاصيتين x و y، ونجد الفرق بين قيم السمة ومتوسطها (x i - ) و y i - )، ثم نجد منتجهم (x i - ) ( y i - ) - مجموع الأخير يعطي بسط معامل الارتباط. للعثور على مقامه، يجب تربيع الفرقين (x i - ) و (y i - ) وإيجاد مجموعهما وأخذ الجذر التربيعي لحاصل ضربهما.

فمثلا 31، يمكن تمثيل إيجاد معامل الارتباط وفقا للصيغة (32) على النحو التالي (الجدول 50).

يتيح العدد الناتج لمعامل الارتباط إمكانية إثبات وجود الاتصال وقربه وطبيعته.

1. إذا كان معامل الارتباط صفراً فلا يوجد ارتباط بين الخصائص.

2. إذا كان معامل الارتباط يساوي واحدًا، فإن الارتباط بين الخصائص يكون كبيرًا لدرجة أنه يتحول إلى اتصال وظيفي.

3. القيمة المطلقة لمعامل الارتباط لا تتجاوز الفترة من صفر إلى واحد:

وهذا يجعل من الممكن التركيز على قرب الاتصال: كلما اقترب المعامل من الصفر، كلما كان الاتصال أضعف، وكلما اقترب من الوحدة، كلما اقترب الاتصال.

4. علامة "زائد" لمعامل الارتباط تعني ارتباطا مباشرا، وعلامة "سالب" تعني ارتباطا عكسيا.

طاولة 50

× ط ذ ط (خ ط - ) (و أنا - ) (س ط -)(ص ط -) (خ ط -)2 (ص ط -)2
14,00 12,10 -1,70 -2,30 +3,91 2,89 5,29
14,20 13,80 -1,50 -0,60 +0,90 2,25 0,36
14,90 14,20 -0,80 -0,20 +0,16 0,64 0,04
15,40 13,00 -0,30 -1,40 +0,42 0,09 1,96
16,00 14,60 +0,30 +0,20 +0,06 0,09 0,04
17,20 15,90 +1,50 +2,25 2,25
18,10 17,40 +2,40 +2,00 +4,80 5,76 4,00
109,80 101,00 12,50 13,97 13,94


ومن ثم، فإن معامل الارتباط المحسوب في المثال 31 هو r xy = +0.9. يسمح لنا باستخلاص الاستنتاجات التالية: هناك علاقة بين حجم القوة العضلية لليد اليمنى واليسرى لدى أطفال المدارس المدروسين (المعامل r xy =+0.9 يختلف عن الصفر)، العلاقة قريبة جدًا (المعامل r xy =+0.9 قريب من الواحد) ، يكون الارتباط مباشرًا (معامل r xy = +0.9 موجب)، أي أنه مع زيادة القوة العضلية لإحدى اليدين، تزداد قوة اليد الأخرى.

عند حساب معامل الارتباط واستخدام خصائصه يجب الأخذ في الاعتبار أن الاستنتاجات تعطي نتائج صحيحة عندما تكون الخصائص موزعة بشكل طبيعي وعندما تؤخذ العلاقة بين عدد كبير من قيم كلا الخاصيتين بعين الاعتبار.

في المثال 31 المدروس، تم تحليل 7 قيم فقط لكلتا الخاصيتين، وهو بالطبع لا يكفي لمثل هذه الدراسات. ونذكرك هنا مرة أخرى أن الأمثلة الواردة في هذا الكتاب بشكل عام وفي هذا الفصل بشكل خاص هي من طبيعة الأساليب التوضيحية، وليست عرضًا تفصيليًا لأي تجارب علمية. ونتيجة لذلك، تم أخذ عدد صغير من قيم الميزات في الاعتبار، وتم تقريب القياسات - كل هذا تم حتى لا تحجب الحسابات المرهقة فكرة الطريقة.

ينبغي إيلاء اهتمام خاص لجوهر العلاقة قيد النظر. لا يمكن أن يؤدي معامل الارتباط إلى نتائج بحثية صحيحة إذا تم تحليل العلاقة بين الخصائص بشكل رسمي. دعونا نعود مرة أخرى إلى المثال 31. كلتا العلامتين المدروستين كانتا قيم القوة العضلية لليدين اليمنى واليسرى. لنتخيل أنه بالإشارة x i في المثال 31 (14.0; 14.2; 14.9... ...18.1) نقصد طول السمكة التي يتم اصطيادها عن طريق الخطأ بالسنتيمتر، وبالإشارة y i (12.1 ; 13.8; 14.2... ... 17.4) - وزن الأدوات المعملية بالكيلو جرام. بعد استخدام جهاز الحساب رسميًا للعثور على معامل الارتباط وفي هذه الحالة حصلنا أيضًا على r xy =+0>9، كان علينا أن نستنتج أن هناك علاقة مباشرة وثيقة بين طول السمكة ووزن الأدوات. إن عدم معنى مثل هذا الاستنتاج واضح.

لتجنب اتباع نهج رسمي لاستخدام معامل الارتباط، ينبغي للمرء استخدام أي طريقة أخرى - رياضية، منطقية، تجريبية، نظرية - لتحديد إمكانية وجود ارتباط بين الخصائص، أي لاكتشاف الوحدة العضوية للخصائص. فقط بعد ذلك يمكن البدء في استخدام تحليل الارتباط وتحديد حجم وطبيعة العلاقة.

في الإحصاء الرياضي هناك أيضا هذا المفهوم الارتباط المتعدد- العلاقات بين ثلاث خصائص أو أكثر. وفي هذه الحالات، يتم استخدام معامل الارتباط المتعدد، الذي يتكون من معاملات الارتباط المقترنة الموضحة أعلاه.

على سبيل المثال، معامل الارتباط لثلاث خصائص - x i، y i، z i - هو:

حيث R xyz هو معامل الارتباط المتعدد، مما يعبر عن كيفية اعتماد الميزة x i على الميزات y i وz i؛

r xy - معامل الارتباط بين الخصائص x i و y i؛

r xz - معامل الارتباط بين الخصائص Xi وZi؛

ص - معامل الارتباط بين الميزات y i , z i

تحليل الارتباط هو:

تحليل الارتباط

علاقة- العلاقة الإحصائية بين متغيرين عشوائيين أو أكثر (أو المتغيرات التي يمكن اعتبارها كذلك بدرجة مقبولة من الدقة). علاوة على ذلك فإن التغيرات في واحدة أو أكثر من هذه الكميات تؤدي إلى تغير منهجي في كميات أخرى أو غيرها. المقياس الرياضي للارتباط بين متغيرين عشوائيين هو معامل الارتباط.

يمكن أن يكون الارتباط إيجابيًا وسلبيًا (من الممكن أيضًا عدم وجود علاقة إحصائية - على سبيل المثال، للمتغيرات العشوائية المستقلة). الارتباط السلبي - الارتباط، حيث تكون الزيادة في متغير واحد مرتبطة بانخفاض في متغير آخر، ويكون معامل الارتباط سلبيا. الارتباط الإيجابي - الارتباط، حيث تكون الزيادة في أحد المتغيرات مرتبطة بزيادة في متغير آخر، ويكون معامل الارتباط موجباً.

الارتباط التلقائي - العلاقة الإحصائية بين المتغيرات العشوائية من نفس السلسلة ولكن مأخوذة بإزاحة مثلا لعملية عشوائية - بإزاحة زمنية.

تسمى طريقة معالجة البيانات الإحصائية، والتي تتمثل في دراسة المعاملات (الارتباط) بين المتغيرات تحليل الارتباط.

معامل الارتباط

معامل الارتباطأو معامل الارتباط الزوجيوفي نظرية الاحتمالات والإحصاء، فهو مؤشر على طبيعة التغير في متغيرين عشوائيين. يُشار إلى معامل الارتباط بالحرف اللاتيني R ويمكن أن يأخذ قيمًا تتراوح بين -1 و+1. إذا كانت القيمة المطلقة أقرب إلى 1 فهذا يعني وجود اتصال قوي (إذا كان معامل الارتباط يساوي واحد نتحدث عن اتصال وظيفي)، وإذا كان أقرب إلى 0 فهو ضعيف.

معامل ارتباط بيرسون

بالنسبة للكميات المترية، يتم استخدام معامل ارتباط بيرسون، والذي قدم فرانسيس جالتون صيغته الدقيقة:

يترك X,ي- متغيران عشوائيان محددان في نفس مساحة الاحتمال. ثم يتم إعطاء معامل الارتباط الخاص بهم بالصيغة:

,

حيث يشير cov إلى التباين وD هو التباين، أو ما يعادله،

,

حيث يدل الرمز على التوقع الرياضي.

لتمثيل هذه العلاقة بيانيًا، يمكنك استخدام نظام إحداثي مستطيل ذي محاور تتوافق مع كلا المتغيرين. يتم تمييز كل زوج من القيم برمز محدد. يُسمى هذا الرسم البياني "مخطط التشتت".

وتعتمد طريقة حساب معامل الارتباط على نوع المقياس الذي تنتمي إليه المتغيرات. وبالتالي، لقياس المتغيرات ذات المقاييس الفاصلة والكمية، من الضروري استخدام معامل ارتباط بيرسون (ارتباط لحظة المنتج). إذا كان واحد على الأقل من المتغيرين على مقياس ترتيبي أو لم يتم توزيعه بشكل طبيعي، فيجب استخدام ارتباط رتبة سبيرمان أو كيندال τ (تاو). في الحالة التي يكون فيها أحد المتغيرين ثنائي التفرع، يتم استخدام ارتباط نقطي ثنائي، وإذا كان كلا المتغيرين ثنائي التفرع: يتم استخدام ارتباط رباعي المجالات. حساب معامل الارتباط بين متغيرين غير ثنائيين يكون ذا معنى فقط عندما تكون العلاقة بينهما خطية (أحادية الاتجاه).

معامل ارتباط كيندل

يستخدم لقياس الاضطراب المتبادل.

معامل ارتباط سبيرمان

خصائص معامل الارتباط

  • عدم المساواة بين كوشي وبونياكوفسكي:
إذا اعتبرنا التغاير هو حاصل الضرب القياسي لمتغيرين عشوائيين، فإن قاعدة المتغير العشوائي ستكون مساوية لـ وستكون نتيجة عدم المساواة بين كوشي وبونياكوفسكي: . ك، أين . علاوة على ذلك، في هذه الحالة العلامات و

مباراة: .

تحليل الارتباطتحليل الارتباط الارتباطات- طريقة معالجة البيانات الإحصائية والتي تتمثل في دراسة المعاملات (

) بين المتغيرات. وفي هذه الحالة تتم مقارنة معاملات الارتباط بين زوج واحد أو عدة أزواج من الخصائص لإقامة علاقات إحصائية بينها. هدفتحليل الارتباط - توفير بعض المعلومات حول متغير واحد باستخدام متغير آخر. في الحالات التي يكون فيها من الممكن تحقيق الهدف، يقال أن المتغيرات هيربط . في صورته الأكثر عمومية، يعني قبول فرضية الارتباط أن التغيير في قيمة المتغير A سيحدث في وقت واحد مع تغير تناسبي في قيمة B: إذا زاد كلا المتغيرين، إذنالعلاقة إيجابية فإذا زاد أحد المتغيرين ونقص الآخر،.

الارتباط سلبي يعكس الارتباط فقط الاعتماد الخطي للقيم، ولكنه لا يعكس اتصالها الوظيفي. على سبيل المثال، إذا قمت بحساب معامل الارتباط بين الكميات = قأن(سأنا ) و = جسق(سب قأن 2(س) + جسق 2(س) = 1.

)، فستكون قريبة من الصفر، أي لا يوجد اعتماد بين الكميات. وفي الوقت نفسه، من الواضح أن الكميتين A وB مرتبطتان وظيفيًا وفقًا للقانون



الرسوم البيانية لتوزيعات الأزواج (x،y) مع معاملات الارتباط المقابلة x و y لكل منهم. لاحظ أن معامل الارتباط يعكس علاقة خطية (الخط العلوي)، لكنه لا يصف منحنى العلاقة (الخط الأوسط)، وليس مناسبًا على الإطلاق لوصف العلاقات المعقدة وغير الخطية (الخط السفلي).
  1. التطبيق ممكن إذا كان هناك عدد كاف من الحالات للدراسة: بالنسبة لنوع معين، يتراوح معامل الارتباط من 25 إلى 100 زوج من الملاحظات.
  2. القيد الثاني يتبع من فرضية تحليل الارتباط، والتي تشمل الاعتماد الخطي للمتغيرات. في كثير من الحالات، عندما يكون من المعروف بشكل موثوق أن هناك علاقة، قد لا يؤدي تحليل الارتباط إلى نتائج ببساطة لأن العلاقة غير خطية (يتم التعبير عنها، على سبيل المثال، بالقطع المكافئ).
  3. إن مجرد حقيقة الارتباط لا توفر أساسًا لتأكيد أي من المتغيرات يسبق أو يسبب التغييرات، أو أن المتغيرات ترتبط بشكل عام ببعضها البعض بشكل سببي، على سبيل المثال، بسبب عمل عامل ثالث.

نطاق التطبيق

تحظى هذه الطريقة في معالجة البيانات الإحصائية بشعبية كبيرة في الاقتصاد والعلوم الاجتماعية (خاصة في علم النفس وعلم الاجتماع)، على الرغم من أن نطاق تطبيق معاملات الارتباط واسع النطاق: مراقبة جودة المنتجات الصناعية، وعلم المعادن، والكيمياء الزراعية، وعلم الأحياء المائية، والقياسات الحيوية وغيرها.

ترجع شعبية هذه الطريقة إلى عاملين: من السهل نسبيًا حساب معاملات الارتباط، ولا يتطلب استخدامها تدريبًا رياضيًا خاصًا. وإلى جانب سهولة تفسيره، أدت سهولة تطبيق المعامل إلى استخدامه على نطاق واسع في مجال تحليل البيانات الإحصائية.

الارتباط الزائف

في كثير من الأحيان، تشجع البساطة المغرية لأبحاث الارتباط الباحث على التوصل إلى استنتاجات بديهية خاطئة حول وجود علاقة سبب ونتيجة بين أزواج من الخصائص، في حين أن معاملات الارتباط تحدد العلاقات الإحصائية فقط.

في الواقع، تخلت منهجية العلوم الاجتماعية الكمية الحديثة عن محاولات إنشاء علاقات السبب والنتيجة بين المتغيرات المرصودة باستخدام الأساليب التجريبية. ولذلك عندما يتحدث الباحثون في العلوم الاجتماعية عن إقامة علاقات بين المتغيرات محل الدراسة، فإن ذلك يعني ضمنا إما افتراضا نظريا عاما أو اعتمادا إحصائيا.

انظر أيضا

  • وظيفة الارتباط التلقائي
  • وظيفة الارتباط المتبادل
  • التغاير
  • معامل التحديد
  • تحليل الانحدار

مؤسسة ويكيميديا. 2010.

يتيح لك تحليل الانحدار تقييم مدى اعتماد متغير على آخر وما هو انتشار قيم المتغير التابع حول الخط المستقيم الذي يحدد التبعية. تتنبأ هذه التقديرات وفترات الثقة المقابلة لها بقيمة المتغير التابع وتحدد دقة هذا التنبؤ.

لا يمكن عرض نتائج تحليل الانحدار إلا في شكل رقمي أو رسومي معقد إلى حد ما. ومع ذلك، فإننا غالبًا لا نهتم بالتنبؤ بقيمة متغير واحد بناءً على قيمة متغير آخر، ولكن ببساطة نهتم بتوصيف مدى (قوة) العلاقة بينهما، معبرًا عنها برقم واحد.

وتسمى هذه الخاصية بمعامل الارتباط، ويشار إليه عادة بالحرف g، ويمكن أن يكون معامل الارتباط

يمكن أن تأخذ القيم من -1 إلى +1. وعلامة معامل الارتباط تشير إلى اتجاه الاتصال (مباشر أو عكسي)، والقيمة المطلقة تشير إلى قرب الاتصال. يحدد المعامل الذي يساوي -1 اتصالاً قويًا مثل واحد يساوي 1. وفي حالة عدم وجود اتصال، يكون معامل الارتباط صفرًا.

في الشكل. يوضح الشكل 8.10 أمثلة على التبعيات والقيم المقابلة لـ r. سننظر في معاملي الارتباط.

يهدف معامل ارتباط بيرسون إلى وصف العلاقة الخطية بين السمات الكمية؛ مثل التراجعات
التحليل التحليلي يتطلب التوزيع الطبيعي. عندما يتحدث الناس ببساطة عن "معامل الارتباط"، فإنهم يقصدون دائمًا معامل ارتباط بيرسون، وهو بالضبط ما سنفعله.

يمكن استخدام معامل ارتباط رتبة سبيرمان عندما تكون العلاقة غير خطية - وليس فقط للكمية، ولكن أيضًا للخصائص الترتيبية. هذه طريقة غير معلمية ولا تتطلب أي نوع معين من التوزيع.

لقد تحدثنا بالفعل عن الخصائص الكمية والنوعية والترتيبية في الفصل. 5. الخصائص الكمية هي بيانات عددية عادية، مثل الطول والوزن ودرجة الحرارة. يمكن مقارنة قيم الخاصية الكمية مع بعضها البعض ويمكن القول أي منها أكبر وبكم وكم مرة. على سبيل المثال، إذا كان أحد المريخيين يزن 15 جرامًا والآخر 10 جرامًا، فإن الأول أثقل مرة ونصف من الثاني و5 جرامًا، ويمكن أيضًا مقارنة قيم الميزة الترتيبية بقول أيهما أكبر، لكن من المستحيل تحديد مقدار أو عدد المرات. في الطب، العلامات الترتيبية شائعة جدًا. على سبيل المثال، يتم تقييم نتائج مسحة بابانيكولاو المهبلية على المقياس التالي: 1) طبيعي، 2) خلل التنسج الخفيف، 3) خلل التنسج المعتدل، 4) خلل التنسج الشديد، 5) السرطان في الموقع. يمكن ترتيب كل من الخصائص الكمية والترتيبية بالترتيب - تعتمد مجموعة كبيرة من المعايير غير البارامترية على هذه الخاصية العامة، والتي تتضمن معامل ارتباط رتبة سبيرمان. وسوف نتعرف على الاختبارات اللامعلمية الأخرى في الفصل. 10.

معامل ارتباط بيرسون

ومع ذلك، لماذا لا يمكن استخدام تحليل الانحدار لوصف مدى قرب الاتصال؟ ويمكن للمرء استخدام الانحراف المعياري المتبقي كمقياس لقوة العلاقة. ومع ذلك، إذا قمت بتبديل المتغيرات التابعة والمستقلة، فإن الانحراف المعياري المتبقي، مثل المؤشرات الأخرى لتحليل الانحدار، سيكون مختلفًا.

دعونا نلقي نظرة على الشكل. 8.11. واستنادا إلى عينة من 10 مريخيين معروفين لنا، تم إنشاء خطي انحدار. في حالة واحدة، يكون الوزن متغيرا تابعا، وفي الحالة الثانية يكون متغيرا مستقلا. خطوط الانحدار مختلفة بشكل ملحوظ



20

إذا قمت بتبديل x وy، ستكون معادلة الانحدار مختلفة، لكن معامل الارتباط سيظل كما هو.

قلقون. وتبين أن العلاقة بين الطول والوزن علاقة واحدة، والوزن والطول علاقة أخرى. إن عدم تناسق تحليل الانحدار هو ما يمنع استخدامه مباشرة لوصف قوة الاتصال. أما معامل الارتباط، وإن كانت فكرته تنبع من تحليل الانحدار، فهو خالي من هذا العيب. هنا هي الصيغة.

ص ص(س - س)(ص - ص)

&((- X) S(y - Y)2"

حيث X وY هما متوسط ​​قيم المتغيرين X وY. التعبير عن r هو "متماثل" - من خلال تبديل X وY، نحصل على نفس القيمة. يأخذ معامل الارتباط القيم من -1 إلى +1. كلما اقتربت العلاقة، زادت القيمة المطلقة لمعامل الارتباط. العلامة توضح اتجاه الاتصال. عندما يكون r > 0، فإننا نتحدث عن ارتباط مباشر (مع زيادة في متغير واحد، يزيد الآخر أيضًا)، عندما r لنأخذ المثال مع 10 من سكان المريخ، وهو ما تناولناه بالفعل من وجهة نظر تحليل الانحدار. دعونا نحسب معامل الارتباط. وترد في الجدول البيانات الأولية والنتائج المتوسطة للحسابات. 8.3. حجم العينة ن = 10، متوسط ​​الارتفاع

X = جنيه استرليني X/n = 369/10 = 36.9 والوزن Y = جنيه استرليني Y/n = 103.8/10 = 10.38.

نجد Ш- X)(Y- Y) = 99.9، Ш- X)2 = 224.8، £(Y - Y)2 = 51.9.

دعنا نستبدل القيم التي تم الحصول عليها في صيغة معامل الارتباط:

224.8 × 51.9 بوصة

قيمة r قريبة من 1، مما يشير إلى وجود علاقة وثيقة بين الطول والوزن. لفهم أفضل لمعامل الارتباط الذي ينبغي اعتباره كبيرًا وأي معامل الارتباط غير مهم، قم بإلقاء نظرة عليه

الجدول 8.3. حساب معامل الارتباط
X ي X-X ص-ص(X-X)(ص-ص) (X -X)2 (ص-ص)2
31 7,8 -5,9 -2,6 15,3 34,8 6,8
32 8,3 -4,9 -2,1 10,3 24,0 4,4
33 7,6 -3,9 -2,8 10,9 15,2 7,8
34 9,1 -2,9 -1,3 3,8 8,4 1,7
35 9,6 -1,9 -0,8 1,5 3,6 0,6
35 9,8 -1,9 -0,6 1,1 3,6 0,4
40 11,8 3,1 1,4 4,3 9,6 2,0
41 12,1 4,1 1,7 7,0 16,8 2,9
42 14,7 5,1 4,3 22,0 26,0 18,5
46 13,0 9,1 2,6 23,7 82,8 6,8
369 103,8 0,0 0,2 99,9 224,8 51,9


تلك الموجودة على الطاولة 8.4 - يوضح معاملات الارتباط للأمثلة التي درسناها سابقا.

العلاقة بين الانحدار والارتباط

استخدمنا في البداية جميع أمثلة معاملات الارتباط (الجدول 8.4) لبناء خطوط الانحدار. وبالفعل هناك علاقة وثيقة بين معامل الارتباط ومعايير تحليل الانحدار، وهو ما سنوضحه الآن. إن الطرق المختلفة لعرض معامل الارتباط التي سنحصل عليها ستسمح لنا بفهم معنى هذا المؤشر بشكل أفضل.

تذكر أن معادلة الانحدار تم إنشاؤها بطريقة تقلل مجموع الانحرافات المربعة عن خط الانحدار.


دعونا نشير إلى هذا الحد الأدنى لمجموع المربعات S (تسمى هذه الكمية بالمجموع المتبقي للمربعات). دعونا نشير إلى مجموع الانحرافات التربيعية لقيم المتغير التابع Y من وسطه Y بالرمز S^. ثم:

الكمية r2 تسمى معامل التحديد - وهي ببساطة مربع معامل الارتباط. معامل التحديد يوضح قوة الاتصال وليس اتجاهه.

يتضح من الصيغة أعلاه أنه إذا كانت قيم المتغير التابع تقع على خط الانحدار فإن S = 0، وبالتالي r = +1 أو r = -1، أي أن هناك علاقة خطية بين ال المتغيرات التابعة والمستقلة. بالنسبة لأي قيمة للمتغير المستقل، يمكنك التنبؤ بدقة بقيمة المتغير التابع. على العكس من ذلك، إذا كانت المتغيرات غير مرتبطة ببعضها البعض على الإطلاق، فإن Soci = Sofsisi ثم r = 0.

ويمكن أيضًا ملاحظة أن معامل التحديد يساوي ذلك الجزء من التباين الإجمالي S ^ الذي يحدث أو، كما يقولون، يفسره الانحدار الخطي.

المجموع المتبقي للمربعات S يرتبط بالتباين المتبقي s2y\x بالعلاقة Socj = (n - 2) s^، والمجموع الإجمالي للمربعات S^ مع التباين s2 بالعلاقة S^ = (n - 1) )س2. في هذه الحالة

r2 = 1 _ n _ 2 sy\x n _1 sy

تسمح لنا هذه الصيغة بالحكم على اعتماد معامل الارتباط على نسبة التباين المتبقي في التباين الإجمالي

six/s2y كلما كانت هذه الحصة أصغر، زاد معامل الارتباط (بالقيمة المطلقة)، والعكس صحيح.

وتأكدنا من أن معامل الارتباط يعكس مدى قرب العلاقة الخطية بين المتغيرات. ومع ذلك، إذا كنا نتحدث عن التنبؤ بقيمة متغير واحد من قيمة متغير آخر،
لا ينبغي الاعتماد على معامل الارتباط أكثر من اللازم. على سبيل المثال، البيانات في الشكل. 8.7 يتوافق مع معامل ارتباط مرتفع جدًا (r = 0.92)، ومع ذلك، فإن عرض نطاق الثقة يوضح أن عدم اليقين في التنبؤ مهم جدًا. لذلك، حتى مع وجود معامل ارتباط كبير، تأكد من حساب نطاق الثقة.


وأخيرًا نعرض نسبة معامل الارتباط ومعامل ميل الانحدار المباشر b:

حيث b هو معامل الميل لخط الانحدار، وsx وsY هما الانحرافات المعيارية للمتغيرات.

إذا لم نأخذ في الاعتبار الحالة sx = 0، فإن معامل الارتباط يكون صفرًا إذا وفقط إذا كان b = 0. وسنستخدم الآن هذه الحقيقة لتقييم الأهمية الإحصائية للارتباط.

الأهمية الإحصائية للارتباط

وبما أن b = 0 يعني r = 0، فإن فرضية عدم وجود ارتباط تعادل فرضية المنحدر الصفري لخط الانحدار. لذلك، لتقييم الأهمية الإحصائية للارتباط، يمكننا استخدام الصيغة التي نعرفها بالفعل لتقييم الأهمية الإحصائية للفرق ب من الصفر:

هنا عدد درجات الحرية هو v = n - 2. ومع ذلك، إذا تم حساب معامل الارتباط بالفعل، فمن الأفضل استخدام الصيغة:

عدد درجات الحرية هنا هو أيضًا v = n - 2.

على الرغم من الاختلاف الخارجي بين صيغتين لـ t، إلا أنهما متطابقتان. في الواقع، من حقيقة ذلك


ص 2 _ 1 - ن_ 2 سي]x_

استبدال قيمة sy^x في صيغة الخطأ القياسي

الدهون الحيوانية وسرطان الثدي

أظهرت التجارب التي أجريت على حيوانات المختبر أن ارتفاع نسبة الدهون الحيوانية في النظام الغذائي يزيد من خطر الإصابة بسرطان الثدي. هل لوحظ هذا الاعتماد عند الناس؟ قام ك. كارول بجمع بيانات عن استهلاك الدهون الحيوانية ووفيات سرطان الثدي في 39 دولة. وتظهر النتيجة في الشكل. 8.12 أ. ووجد أن معامل الارتباط بين استهلاك الدهون الحيوانية ووفيات سرطان الثدي كان 0.90. دعونا نقيم الأهمية الإحصائية للارتباط.

0,90 1 - 0,902 39 - 2

القيمة الحرجة لـ t لعدد درجات الحرية v = 39 - 2 = 37 تساوي 3.574، وهو أقل مما حصلنا عليه. وبالتالي، عند مستوى دلالة 0.001، يمكن القول أن هناك علاقة بين استهلاك الدهون الحيوانية والوفيات الناجمة عن سرطان الثدي.

الآن دعونا نتحقق مما إذا كانت الوفيات مرتبطة باستهلاك الدهون النباتية؟ وتظهر البيانات المقابلة في الشكل. 8.12ب. معامل الارتباط هو 0.15. ثم

1 - 0,152 39 - 2

وحتى عند مستوى دلالة 0.10، تكون قيمة t المحسوبة أقل من القيمة الحرجة. العلاقة ليست ذات دلالة إحصائية.