تحليل بيانات الارتباط والانحدار. راجع الصفحات التي تم ذكر حقل الارتباط فيها

للدراسة التجريبية للتبعيات بين المتغيرات العشوائية س و صإجراء عدد من التجارب المستقلة. نتيجة أنا- التجربة تعطي زوج من القيم (x r، ذ ز)، ط = 1, 2,..., ص.

الكميات التي تميز الخصائص المختلفة للأشياء يمكن أن تكون مستقلة أو مترابطة. أشكال مظاهر العلاقات متنوعة للغاية. النوعان الأكثر شيوعًا هما الاتصالات الوظيفية (الكاملة) والارتباطية (غير الكاملة).

عندما تعتمد كميتان وظيفيا على قيمة واحدة -س حيتوافق بالضرورة مع واحدة أو أكثر من القيم المحددة بدقة لكمية أخرى -ي( .في كثير من الأحيان، تظهر الروابط الوظيفية في الفيزياء والكيمياء. في المواقف الحقيقية، هناك عدد لا نهائي من خصائص الكائن نفسه والبيئة الخارجية التي تؤثر على بعضها البعض، لذلك لا يوجد هذا النوع من الاتصال، وبعبارة أخرى، الاتصالات الوظيفية هي تجريدات رياضية.

إن تأثير العوامل العامة ووجود أنماط موضوعية في سلوك الأشياء يؤدي فقط إلى ظهور الاعتماد الإحصائي. الإحصائية هي الاعتماد الذي يترتب فيه تغير في إحدى الكميات تغير في توزيع الكميات الأخرى (أخرى)، وهذه الكميات الأخرى تأخذ قيم معينة باحتمالات معينة. في هذه الحالة، يجب اعتبار الاعتماد الوظيفي حالة خاصة من الاعتماد الإحصائي: قيمة عامل واحد تتوافق مع قيم العوامل الأخرى باحتمال يساوي واحدًا. هناك حالة خاصة أكثر أهمية من الاعتماد الإحصائي وهي الاعتماد على الارتباط، الذي يميز العلاقة بين قيم بعض المتغيرات العشوائية ومتوسط ​​قيمة المتغيرات الأخرى، على الرغم من أنه في كل حالة على حدة يمكن لأي قيمة مترابطة أن تأخذ قيمًا مختلفة.

تظهر علاقة الارتباط (والتي تسمى أيضًا غير كاملة أو إحصائية) في المتوسط، بالنسبة للملاحظات الجماعية، عندما تتوافق القيم المعطاة للمتغير التابع مع عدد معين من القيم المحتملة للمتغير المستقل. التفسير - مدى تعقيد العلاقات بين العوامل التي تم تحليلها، والتي يتأثر تفاعلها بمتغيرات عشوائية غير محسوبة. لذلك، فإن الاتصال بين العلامات يظهر فقط في المتوسط، في كتلة الحالات. في اتصال الارتباط، تتوافق كل قيمة وسيطة مع قيم الوظائف الموزعة عشوائيًا في فترة زمنية معينة.

تم استخدام مصطلح "الارتباط" لأول مرة من قبل عالم الحفريات الفرنسي ج. كوفييه، الذي اشتق "قانون الارتباط بين أجزاء وأعضاء الحيوانات" (يسمح هذا القانون للمرء بإعادة بناء مظهر الحيوان بأكمله من أجزاء الجسم التي تم العثور عليها). تم تقديم هذا المصطلح في الإحصائيات من قبل عالم الأحياء الإنجليزي والإحصائي ف. جالتون (ليس مجرد علاقة، ولكن "كما لو كان هناك اتصال" - الارتباط).

تم العثور على تبعيات الارتباط في كل مكان. على سبيل المثال، في الزراعة، يمكن أن تكون هذه هي العلاقة بين المحصول وكمية الأسمدة المستخدمة. من الواضح أن الأخير يشارك في تكوين المحصول. ولكن بالنسبة لكل حقل أو قطعة أرض محددة، فإن نفس كمية الأسمدة المستخدمة ستؤدي إلى زيادة مختلفة في المحصول، نظرًا لتفاعل عدد من العوامل الأخرى (الطقس، وحالة التربة، وما إلى ذلك)، والتي تشكل النتيجة النهائية. ومع ذلك، في المتوسط، لوحظت هذه العلاقة - زيادة كتلة الأسمدة المستخدمة تؤدي إلى زيادة في الغلة.

إن أبسط طريقة لتحديد الروابط بين الخصائص التي تتم دراستها هي بناء جدول الارتباط؛ تمثيلها البصري هو مجال الارتباط. وهو عبارة عن رسم بياني حيث يتم رسم قيم jq على محور الإحداثي، وعلى طول المحور الإحداثي ذ س.من خلال موقع النقاط وتركيزها في اتجاه معين، يمكنك الحكم نوعيا على وجود اتصال.

أرز. 7.3.

يظهر الشكل 1 وجود علاقة إيجابية بين المتغيرات العشوائية، قريبة من المتغيرات الوظيفية المكافئة. 6.1 ، أ.في الشكل. يظهر في الشكل 6.1، ب مثالاً على الارتباط السلبي الضعيف، وفي الشكل 6.1. 6.1، الخامس -مثال على المتغيرات العشوائية غير المترابطة عمليا. يكون الارتباط مرتفعًا إذا كان الاعتماد "يمكن تمثيله" على الرسم البياني بخط مستقيم (مع ميل إيجابي أو سلبي).

عند إثارة مسألة العلاقة بين خاصيتين إحصائيتين X وY، يتم إجراء تجربة مع التسجيل المتوازي لقيمهما.

مثال 8.1.

تحديد ما إذا كانت نتيجة الوثب الطويل الجاري (علامة X) تعتمد على قيمة سرعة التشغيل النهائية (علامة Y). للإجابة على هذا السؤال، بالتوازي مع تسجيل النتيجة X لكل قفزة لرياضي أو مجموعة من الرياضيين، يتم أيضًا تسجيل قيمة سرعة الإقلاع النهائية Y. فليكنوا هكذا:

الجدول 5

أنا
الحادي عشر (سم)
يي (م / ث) 10,7 10,5 10,1 9,8 10,1 10,5 9,1 9,6

لنقدم الجدول 5 على شكل رسم بياني في نظام إحداثي مستطيل، حيث سنرسم طول القفزة (X) على المحور الأفقي، وقيمة سرعة الإقلاع النهائية في هذه القفزة (Y) على المحور الرأسي.
وظيفة PlayMyFlash(cmd)( Corel_.TPPlay(cmd); )

№1 !!! №2 !!! №3 !!! №4 !!! №5!!! №6 !!! №7 !!! №8!!!

أرز. 8. الرسم البياني الميداني للارتباط.

سوف نسمي مجال الارتباط منطقة التشتت للنقاط التي تم الحصول عليها بهذه الطريقة على الرسم البياني. من خلال تحليل حقل الارتباط بصريًا في الشكل 8، يمكنك أن ترى أنه يبدو ممدودًا على طول خط مستقيم. هذه الصورة نموذجية لما يسمى بعلاقة الارتباط الخطية بين الخصائص. في هذه الحالة، يمكن الافتراض بشكل عام أنه مع زيادة سرعة الإقلاع النهائية، يزداد طول القفزة أيضًا، والعكس صحيح. أولئك. هناك علاقة مباشرة (إيجابية) بين الخصائص قيد النظر.

إلى جانب هذا المثال، ومن بين العديد من مجالات الارتباط المحتملة الأخرى، يمكن تمييز ما يلي (الشكل 9-11):

ويبين الشكل 9 أيضًا علاقة خطية، ولكن مع زيادة قيم إحدى السمات، تنخفض قيم الأخرى، والعكس صحيح، أي. ردود فعل أو سلبية. يمكن الافتراض أنه في الشكل 11 تكون نقاط مجال الارتباط متناثرة حول نوع من الخطوط المنحنية. في هذه الحالة، يقولون أن هناك علاقة منحنية بين الخصائص.

وفيما يتعلق بمجال الارتباط الموضح في الشكل 10، فلا يمكن القول بأن النقاط تقع على طول خط مستقيم أو منحني، وله شكل كروي. في هذه الحالة، يقولون أن الخصائص X و Y لا تعتمد على بعضها البعض.

بالإضافة إلى ذلك، يمكن استخدام حقل الارتباط للحكم تقريبًا على مدى قرب اتصال الارتباط، في حالة وجود هذا الاتصال. وهنا يقولون: كلما قل عدد النقاط المنتشرة حول خط الوسط الوهمي، كلما اقترب الارتباط بين الخصائص قيد النظر.

يساعد التحليل المرئي لحقول الارتباط على فهم جوهر علاقة الارتباط ويسمح لنا بوضع افتراضات حول وجود الاتصال واتجاهه وقربه. ولكن من المستحيل القول على وجه اليقين ما إذا كان هناك اتصال بين العلامات أم لا، اتصال خطي أو منحني، اتصال وثيق (موثوق) أو ضعيف (غير موثوق)، باستخدام هذه الطريقة. الطريقة الأكثر دقة لتحديد وتقييم العلاقة الخطية بين الخصائص هي طريقة تحديد مؤشرات الارتباط المختلفة من البيانات الإحصائية.

3. معاملات الارتباط وخصائصها

في كثير من الأحيان لتحديد مدى موثوقية العلاقة بين خاصيتين (س، ص)يستخدم معامل ارتباط سبيرمان اللامعلمي (الرتبة). ومعامل ارتباط بيرسون البارامترى . يتم تحديد قيمة مؤشرات الارتباط هذه من خلال الصيغ التالية:

(1)

حيث: dx - صفوف البيانات الإحصائية للخاصية x؛

dy - صفوف البيانات الإحصائية للخاصية y.

(2)

حيث: - بيانات إحصائية للخاصية x،

بيانات إحصائية للخاصية y.

تتمتع هذه المعاملات بالميزات القوية التالية:

1. استنادا إلى معاملات الارتباط، يمكن للمرء أن يحكم فقط على وجود علاقة خطية بين الخصائص. لا شيء يمكن أن يقال عن الاتصال المنحني بمساعدتهم.
2. قيم معاملات الارتباط هي كمية لا أبعاد لها ولا يمكن أن تكون أقل من -1 أو أكثر من +1، أي.
3.
4. إذا كانت قيم معاملات الارتباط صفراً أي = 0 أو = 0، ثم العلاقة بين الخصائص x، y غائب.
5. إذا كانت قيم معاملات الارتباط سالبة أي.< 0 или < 0, то связь между признаками Х и Y يعكس.
6. إذا كانت قيم معاملات الارتباط موجبة أي > 0 أو y> 0، ثم العلاقة بين السمات X وY مستقيم(إيجابي).
7. إذا كانت معاملات الارتباط تأخذ القيم +1 أو -1، أي. = ± 1 أو = ± 1، ثم العلاقة بين الخاصيتين X وY خطي (وظيفي).
8. لا يمكن الحكم على موثوقية الارتباط بين الخصائص إلا من خلال حجم معاملات الارتباط. تعتمد هذه الموثوقية أيضًا على عدد درجات الحرية .

حيث: n هو عدد الأزواج المترابطة من البيانات الإحصائية للخاصيتين X وY.

كلما زاد n، كلما زادت موثوقية العلاقة بنفس معامل الارتباط.

بالإضافة إلى الخصائص المشتركة المدرجة، فإن معاملات الارتباط قيد النظر لها أيضًا اختلافات. الفرق الرئيسي بينهما هو أن معامل بيرسون ( لا يمكن استخدامه إلا إذا كان توزيع الخصائص X و Y طبيعيًا، ويمكن استخدام معامل سبيرمان () للخصائص مع أي نوع من التوزيع. إذا كانت الخصائص المعنية لها توزيع طبيعي، فمن الأفضل تحديد وجود اتصال ارتباط باستخدام معامل بيرسون ()، لأنه في هذه الحالة سيكون خطأ أصغر من معامل سبيرمان ().

مثال 8.2.

باستخدام معامل ارتباط الرتب لسبيرمان، حدد ما إذا كانت هناك علاقة بين نتائج الوثب الطويل الجاري (X) وسرعة الجري النهائية (Y) لمجموعة من الرياضيين (البيانات من المثال 8.1، الجدول 5).

في الصيغة (1) dx و dy هما رتب البيانات الإحصائية، أي. خيار الأماكن في مجموعتهم المرتبة. إذا كان هناك العديد من البيانات المتطابقة في المجموع، فإن صفوفها متساوية ويتم تحديدها على أنها متوسط ​​قيمة الأماكن التي تشغلها هذه الخيارات. على سبيل المثال،

البيانات الحادي عشر
صفوف دي إكس 4,5 4,5 4,5 4,5 7,5 7,5
3 + 4 + 5 + 6 7 + 8

باستخدام هذه القاعدة، سنحدد ترتيب البيانات في الجدول 5. وللتيسير، سنكتب كل شيء في شكل جدول 6.

الجدول 6

dx دي dx-dy
9,1 1 - 1 = 0 02 = 0
9,6 2 - 2 = 0 02 = 0
9,8 3 - 3 = 0 02 = 0
10,1 4 - 4 = 0 02 = 0
10,5 6,5 5 - 6,5 = - 1,5 (- 1,5)2 = 2,25
10,5 6,5 6 - 6,5 = - 0,5 (- 0,5)2 = 0,25
10,3 7 - 5 = 2 22 = 4
10,7 8 - 8 = 0 02 = 0
(دكس-دي) = 0

في هذه الحالة لدينا 8 أزواج من القيم، أي. 8 أزواج مترابطة. وهذا يعني أن n = 8. وبالتعويض عن النتيجة في الصيغة (1)، يصبح لدينا:

خاتمة:

(0,92 > 0) ثم بين العلامات X وY ش X)، والعكس صحيح - مع انخفاض سرعة الإقلاع، ينخفض ​​\u200b\u200bطول القفزة. يتم تحديد موثوقية معامل ارتباط سبيرمان من جدول القيم الحرجة لمعامل ارتباط الرتبة.

ب) بسبب فإذا كانت القيمة الناتجة لمعامل الارتباط = 0.9 أكبر من القيمة الجدولية = 0.88 الموافق للمستوى ب = 99%، فإن الثقة في صحة الاستنتاج (أ) أكبر من 99%. تسمح لنا هذه الموثوقية بتوسيع الاستنتاج (أ) ليشمل جميع السكان، أي. لجميع لاعبي الوثب الطويل.

إذا لم يتم إجراء فحص أولي للمجموعات السكانية قيد النظر للتأكد من التوزيع الطبيعي، فإذا كان معامل ارتباط بيرسون غير موثوق به، فيجب أيضًا التحقق من وجود اتصال باستخدام معامل سبيرمان.

مثال 8.3.

يمكن استخدام معامل ارتباط الرتبة لتحديد العلاقات بين المتغيرات التي لها أي توزيع إحصائي. ولكن إذا كان لهذه المتغيرات توزيع طبيعي (غاوسي)، فيمكن إنشاء العلاقة بشكل أكثر دقة باستخدام معامل الارتباط الطبيعي (برافيس-بيرسون).

لنفترض أنه في مثالنا و- يتوافق مع قانون التوزيع الطبيعي، ونتحقق من وجود ارتباط بين نتائج الاختبار X وYباستخدام حساب معامل الارتباط الطبيعي.

من الصيغة (1) يتضح أنه من الضروري للحساب إيجاد متوسط ​​قيم الخصائص اكس، يوانحراف كل بيانات إحصائية عن متوسطها. بمعرفة هذه القيم، يمكنك العثور على المبالغ التي ليس من الصعب حسابها

بناء على البيانات الواردة في الجدول رقم 5، املأ الجدول رقم 7:

الجدول 7

962 = 9216 10,7 0,6 0,62 = 0,36 96 · 0.6 = 57.6
262 = 676 10,5 0,4 0,42 = 0,16 26 · 0.4 = 10.4
10,3 0,2 0,04 5,4
- 4 9,8 - 0,3 0,09 1,2
10,1 0,00 1,0
10,5 0,4 0,16 3,2
- 92 9,1 - 1,0 1,00 9,2
- 64 9,6 - 0,5 0,25 32,0
= 23262 = 2,06 = 201

بالتعويض عن مجموع العمود 7 في بسط الصيغة (1)، ومجموع العمودين 3 و 6 في المقام، نحصل على:

خاتمة:

أ) بسبب قيمة معامل الارتباط إيجابية (0.92>0) ، ثم بين X وYهناك اتصال مباشر، أي. مع زيادة سرعة الإقلاع (علامة ي) يزداد طول القفزة (علامة X) والعكس صحيح - مع انخفاض سرعة الإقلاع، ينخفض ​​\u200b\u200bطول القفزة. من المهم جدًا معرفة الثقة في صحة الاستنتاج الذي تم الحصول عليه.

بيانياً، يتم تصوير العلاقة بين خاصيتين باستخدام مجال الارتباط. في نظام الإحداثيات، يتم رسم قيم خاصية العامل على محور الإحداثيات، ويتم رسم الخاصية الناتجة على المحور الإحداثي. ويشار إلى كل تقاطع للخطوط المرسومة عبر هذه المحاور بنقطة. في حالة عدم وجود اتصالات وثيقة، يوجد ترتيب عشوائي للنقاط على الرسم البياني (الشكل 11.1).  


دعونا نصور الاعتماد الناتج بيانياً بنقاط على المستوى الإحداثي (الشكل 3.1). تسمى هذه الصورة للاعتماد الإحصائي بحقل الارتباط.  

أنشئ مجال الارتباط وصياغة فرضية حول شكل الارتباط.  

عند دراسة العلاقة بين خاصيتين فإن الطريقة الرسومية لاختيار نوع معادلة الانحدار تكون واضحة تماما. لأنه يعتمد على مجال الارتباط. يتم عرض الأنواع الرئيسية للمنحنيات المستخدمة في التقييم الكمي للاتصالات في الشكل 1. 2.1.  

نظرًا لأن جميع نقاط مجال الارتباط لا تقع على خط الانحدار، فهناك دائمًا تشتت، وذلك بسبب تأثير العامل x، أي انحدار y على x، والناجم عن أسباب أخرى (تباين غير مفسر). تعتمد مدى ملاءمة خط الانحدار للتنبؤ على مقدار التباين الإجمالي في السمة y الذي يتم حسابه من خلال التباين الموضح. من الواضح أنه إذا كان مجموع الانحرافات المربعة بسبب الانحدار أكبر من مجموع المربعات المتبقية، فإن معادلة الانحدار تكون ذات دلالة إحصائية ويكون للعامل x تأثير كبير على النتيجة. وهذا يعادل حقيقة أن معامل التحديد r2 سيقترب من الوحدة.  

وفقًا لذلك، بالنسبة للاعتماد الموضح في مجالات الارتباط في الشكل 1. 3.5 ب) و ج)، يتم عرض عدم تجانس المخلفات في الشكل 3. 3.9 و 3.10.  

إذا كانت الكميات مستقلة، فإن "مجال الارتباط" أو pa-  

إذا كان من الممكن تقريب مجال الارتباط بخط مستقيم، وهو ما يسمى خط الانحدار، فانتقل إلى حساب معامل الارتباط الزوجي r، وتكون قيمه العددية في الفترة [-1، 1]. إذا كانت r تساوي 1 أو -1، فهناك علاقة تغذية للأمام أو تغذية راجعة وظيفية. عندما تكون r قريبة من الصفر، لا يكون هناك اتصال بين الظواهر، وعندما تكون r 0.7، يعتبر الاتصال مهمًا. يتم حساب معامل الارتباط باستخدام الصيغة  

بعد تحديد مجموعات مزارع السكك الحديدية المذكورة أعلاه، تم استخدام طريقة تقريبية أخرى للتحليل الأولي لتجانس السكان لكل مجموعة من مزارع السكك الحديدية - بناء مجالات الارتباط لكل عامل من العوامل المدرجة في الدراسة مع تكلفة النقل. كانت العلامة الرئيسية للتجانس أو عدم التجانس بين المجموعات السكانية المختارة هي غياب أو وجود فواصل وقفزات في موقع النقاط في مجالات الارتباط.  

للدراسة، تم اختيار جميع العوامل المحتملة مسبقًا من خلال التحليل المنطقي المهني، وتتوفر بيانات حول التغييرات التي تحدث للمؤسسات في تقارير الوزارة. يجب أن تأخذ هذه العوامل في الاعتبار الحجم الإجمالي للنقل، ومتوسط ​​إنتاجية السيارات والقاطرات للأسطول العامل، وكثافة الشحن، وكثافة رأس المال لوحدة النقل، وإنتاجية العمالة، وما إلى ذلك (11 عاملاً في المجموع). وهكذا، تم إنشاء 44 حقل ارتباط لأربع مجموعات من المؤسسات.  

بعد تحديد الكميات المشار إليها، يتم الحصول على معادلة الاعتماد الزوجي، والتي يسمى تمثيلها الرسومي في محاور الإحداثيات بخط الانحدار النظري. إذا قمنا برسم جميع القياسات في هذا المجال، وليس فقط خط الانحدار النظري، فسنحصل على مجال الارتباط.  

نقوم بتنظيم المادة المصدر في مجال الارتباط وفي جدول الارتباط. في مثالنا، العامل هو تكلفة الآلات Cm، والدالة هي متوسط ​​عدد العمال السنوي R.  

ونتيجة للتقسيم إلى فترات، فإن المستوى بأكمله الذي يتم رسم القياسات عليه لكل من الخاصيتين k وy، والذي يسمى حقل الارتباط، سيمثل الخلايا، ويتميز كل قياس ليس بالقيم الدقيقة لإحداثياته، ولكن فقط من خلال قيم الفاصل الزمني الذي تم تخصيصه له.  

في الشكل. يوضح الشكل 16 حقل الارتباط، حيث يتم إعطاء الفواصل الزمنية لقيم الوسيطة Ci على طول محور الإحداثي، ويتم إعطاء الفواصل الزمنية لقيمة الدالة P على طول المحور الإحداثي الطريقة تسمى ثانوية  

يمكن أيضًا إنشاء حقل الارتباط الأساسي لتحديد الفواصل الزمنية. يتم تحديد جميع النقاط في هذا الحقل مع مراعاة قيم إحداثياتها. يتم تحديد الفواصل الزمنية بناءً على كثافة النقاط.  

جنبا إلى جنب مع إنشاء مجال الارتباط، كما هو مبين أعلاه، يتم تجميع جدول الارتباط الذي يتم فيه تنفيذ جميع الحسابات المتعلقة بتحديد المتوسطات، وبناء خط الانحدار التجريبي والبيانات الأولية لتحديد المعلمات في نظام المعادلات العادية.  

في الجدول 36 يتم توزيع كافة المواد على فترات. وباستخدامه نبني حقل ارتباط ثانوي نرسم عليه جميع قيم المتغيرات، ونحدد متوسط ​​القيم (/، //،...، pn على الفترات. وذلك من خلال ربط متوسط ​​القيم ​​في كل فترة زمنية ذات قطع مستقيمة، نحصل على خط انحدار تجريبي (انظر الشكل 16).  

من خلال إعادة بناء العمودي على المحور السيني من مركز كل فترة، نرسم على كل منها القيم المقابلة للفترات r/، = 1081، 1/2 = 1774، إلخ. ونربط النقاط الناتجة مع كل منها أخرى عن طريق قطع الخط المستقيم. الخط المتقطع الناتج هو خط انحدار تجريبي للعلاقة بين تكلفة الآلات Cm وعدد العمال R. وبالقياس مع الحسابات التي يتم إجراؤها، يمكننا بناء جداول الارتباط وحقول الارتباط لتحديد العلاقة بين عدد العمال P , حجم العمل O , عدد الهياكل الخرسانية الجاهزة والخرسانة المسلحة /Izh.b.  
أرز. 18. جدول الارتباط ومجال الارتباط الثانوي بين عدد العمال وحجم استخدام الهياكل الخرسانية المسلحة /info/5440">تنطبق معادلات الانحدار المزدوج والانحدار المتعدد المشتقة لاحقًا إذا تغيرت المتغيرات ضمن الحدود التالية: عدد العمال - من 850 إلى 7850 شخصًا، تكلفة الآلات - من 0.15 إلى 3.15 مليون روبل يتراوح حجم الهياكل الجاهزة من 10 إلى 230 ألف م2 ويتم رسمها على طول المحور الرأسي، ويتم رسم القيم المستقلة على طول المحور الأفقي. ويستخدم مجال الارتباط لتحديد شكل العلاقة بين المتغيرات. الرسم البياني يعطي الباحث الأول.  

يتطلب الفرض الثالث لـ OLS أن يكون تباين البقايا متجانسًا. وهذا يعني أنه لكل قيمة للعامل Xj، فإن البقايا e، - لها نفس التباين. إذا لم يتم استيفاء هذا الشرط لاستخدام OLS، فستحدث التغايرية. يمكن رؤية وجود التغايرية بوضوح من مجال الارتباط (الشكل 3.5).  

يتم حل مشكلة بحثية نموذجية أخرى - تقييم العلاقة بين الظواهر - باستخدام جهاز نظرية الارتباط، المتطور جيدًا في الإحصاء الرياضي. للقيام بذلك، من الضروري الحصول على عينات من الظواهر المماثلة الموضحة على خرائط لمواضيع مختلفة (على سبيل المثال، D وC). يتم أخذ قيم a و b عند نفس النقاط i، أي. منسقة بدقة، ومن ثم رسم مجال الارتباط.  

حل منهجي للمشاكل لابيجين يوري نيكولاييفيتش

7.3. مجال الارتباط

7.3. مجال الارتباط

المنطق هو قيود الخيال.

هيلمار نهر

تُستخدم الرسوم البيانية عادةً لإنشاء علاقات بين متغيرين.

إذا تغير كلا المتغيرين بشكل متزامن، فقد يعني ذلك أن هناك اتصالات بينهما ويؤثر كل منهما على الآخر. ومن الأمثلة على ذلك ديناميكيات النمو في حصة الأجور في هيكل تكاليف المنتج وديناميكيات إنتاجية العمل. وتبين الملاحظات أنه كلما زاد المتغير الأول، زاد الثاني أيضا.

على الرغم من أنه يجب أن يؤخذ في الاعتبار أنه حتى لو كان هناك درجة معينة من التزامن في التغيرات في المتغيرات، فإن هذا لا يعني الوجود غير المشروط لعلاقة السبب والنتيجة بينهما (ربما هناك متغير ثالث يسبب مثل هذه العلاقة). تأثير).

تظهر أمثلة حقول الارتباط في الشكل. 7.2.

ويرد وصف للتخطيط أدناه.

1. تم اختيار متغيرين للتحليل: أحدهما مستقل والآخر تابع.

2. لكل قيمة من المتغير المستقل، قم بقياس القيمة المقابلة للمتغير التابع. تشكل هاتان القيمتان زوجًا من البيانات يتم رسمه كنقطة على الرسم البياني. عادةً، يجب أن تحصل على 30 نقطة على الأقل، ولكن لإنشاء رسم بياني ذي معنى، يجب أن يكون عدد النقاط 100 على الأقل.

3. يتم رسم قيمة المتغير المستقل الذي يميز السبب المتوقع على طول المحور X، وتكون قيمة المتغير التابع الذي يميز المشكلة على طول المحور في.

4. يتم رسم أزواج البيانات الناتجة كنقاط على الرسم البياني ويتم تحليل النتيجة. إذا لم يظهر الارتباط في الرسم التخطيطي، فيمكنك محاولة إنشاء رسم بياني على مقياس لوغاريتمي.

من كتاب حروب التسويق بواسطة رايس آل

من كتاب نص الإعلان. منهجية التجميع والتصميم مؤلف بيرديشيف سيرجي نيكولاييفيتش

5.2. المجال التسميي أ.ف. سوبرانسكايا، ن.ف. يميل بودولسكايا واللغويون الآخرون إلى تحديد الفئات التالية من الكائنات المسماة والفئات التسمية المقابلة التي تعتبر مهمة للتسمية والتجارة بشكل عام: أسماء الوثائق والقوانين - أسماء المستندات،

من كتاب يجب عليك استخدام هذا المؤلف سلوفتسوفا ايرينا

هل هناك أمان في الأرقام؟ عملت لعدة سنوات في الصحافة الإقليمية وكتبت عن مشاكل الحكومة المحلية. يجب أن أقول إن الجهاز البيروقراطي منظم للغاية، ومبني وفقًا لمخطط هرمي، ويتخلل جميع مجالات حياتنا، لدرجة أن شخصًا واحدًا (حتى

من كتاب حياتي في الإعلان بواسطة كلود هوبكنز

من كتاب iPresentation. دروس في الإقناع من قائد شركة أبل ستيف جوبز بواسطة جالو كارمين

شهد سكالي "مجال تشويه الواقع" ما وصفه نائب رئيس شركة أبل، بود تريبل، ذات مرة بأنه "مجال تشويه الواقع" - القدرة على إقناع أي شخص بأي شيء تقريبًا. كثير من الناس لا يستطيعون مقاومة هذا الجذب المغناطيسي و

من كتاب إدارة المعارض: استراتيجيات الإدارة والاتصالات التسويقية مؤلف فيلونينكو ايجور

9. العلاقات العامة في ميدان المعرض 9.1. أهداف وغايات وأدوات العلاقات العامة في مجال المعارض بالمعنى الواسع، يتم تعريف العلاقات العامة (المشار إليها فيما يلي باسم العلاقات العامة) على أنها "الجهود المخططة والمنفذة التي تهدف إلى إنشاء والحفاظ على حسن النية

من كتاب المدير الملهم مؤلف ليري جويس جوديث

"حقل المعجزات" أعتقد شخصيًا أن هذا احتمال ممتاز: لم أستطع حتى أن أحلم بأي شيء أفضل. في الواقع، لهذا السبب كتبت هذا الكتاب. هل شاهدت فيلم "حقل الأحلام"؟ هناك، تقرر شخصية كيفن كوستنر البناء على مزرعة الذرة الخاصة به

من كتاب وكالة الإعلان: من أين تبدأ وكيف تنجح مؤلف جولوفانوف فاسيلي أناتوليفيتش

"في الميدان!" في هذا الفصل، سننظر في جميع القضايا الرئيسية المتعلقة بالمرحلة الرئيسية للعمل على التفاوض وإبرام العقود الخاصة بالخدمات التي ستبيعها، جميع رواد الأعمال في 80٪ من الحالات متاحون بسهولة للمفاوضات - أعرف ذلك

من كتاب أبل. ظاهرة الإيمان مؤلف فاسيليف يوري نيكولاييفيتش

قال آندي هيرزوايلد، أحد المطورين الرئيسيين لجهاز Mac الأول، ما يلي عن ستيف جوبز: "كان حقل الواقع المتغير مزيجًا مذهلاً من الأسلوب الخطابي الكاريزمي والعناد والرغبة في تحريف أي حقيقة بحيث يمكن تشويهها".

من كتاب الآداب. مجموعة كاملة من قواعد التواصل الاجتماعي والتجاري. كيفية التصرف في المواقف المألوفة وغير العادية مؤلف بيلوسوفا تاتيانا

من كتاب ما الذي لم يقتل شركة LEGO بل جعلها أقوى. لبنة لبنة بواسطة برين بيل

من كتاب دوائر القيادة الثلاث مؤلف سوداركين الكسندر

هناك أمان في الأرقام. إشراك أخصائي الموارد البشرية في العمل منذ بعض الوقت، في منتصف العقد الأول من القرن الحادي والعشرين، تمت مناقشة موضوع "الموارد البشرية كشريك استراتيجي للمدير" بنشاط في منتديات مدير الموارد البشرية. وأفسحت الخلافات المجال لتوافقات مؤقتة بين المدعوين للتحدث

من كتاب إطلاق! بداية سريعة لعملك بواسطة ووكر جيف

من كتاب الكتاب الكبير لمدير المتجر 2.0. تقنيات جديدة بواسطة كروك غلفيرا

من كتاب احتضن عملائك. ممارسة الخدمة المتميزة بواسطة ميتشل جاك

من كتاب مبادئ توجيهية لتنظيم عمل الخدمة الصحفية الأبرشية المؤلف إي جوكوفسكايا إي

تحليل الانحدار والارتباط هي طرق البحث الإحصائية. هذه هي الطرق الأكثر شيوعًا لإظهار اعتماد المعلمة على واحد أو أكثر من المتغيرات المستقلة.

أدناه، باستخدام أمثلة عملية محددة، سننظر في هذين التحليلين اللذين يحظىان بشعبية كبيرة بين الاقتصاديين. وسنقدم أيضًا مثالاً للحصول على النتائج عند الجمع بينهما.

تحليل الانحدار في Excel

يبين تأثير بعض القيم (مستقل، مستقل) على المتغير التابع. على سبيل المثال، كيف يعتمد عدد السكان النشطين اقتصاديًا على عدد المؤسسات والأجور وغيرها من المعالم. أو: كيف تؤثر الاستثمارات الأجنبية وأسعار الطاقة وغيرها على مستوى الناتج المحلي الإجمالي.

تتيح لك نتيجة التحليل تسليط الضوء على الأولويات. واستنادا إلى العوامل الرئيسية، التنبؤ، وتخطيط تطوير المجالات ذات الأولوية، واتخاذ القرارات الإدارية.

يحدث الانحدار:

  • خطي (ص = أ + ب س)؛
  • مكافئ (y = a + bx + cx 2);
  • الأسي (y = a * exp(bx));
  • الطاقة (ص = أ*س^ب)؛
  • الزائدي (ص = ب/س + أ)؛
  • لوغاريتمي (ص = ب * 1ن(س) + أ)؛
  • الأسي (ص = أ * ب ^ س).

دعونا نلقي نظرة على مثال لبناء نموذج الانحدار في برنامج Excel وتفسير النتائج. لنأخذ النوع الخطي من الانحدار.

مهمة. وفي 6 مؤسسات، تم تحليل متوسط ​​الراتب الشهري وعدد الموظفين المغادرين. من الضروري تحديد مدى اعتماد عدد الموظفين المغادرين على متوسط ​​الراتب.

يبدو نموذج الانحدار الخطي كما يلي:

ص = أ 0 + أ 1 × 1 +…+ أ ك × ك.

حيث a هي معاملات الانحدار، x هي المتغيرات المؤثرة، k هو عدد العوامل.

في مثالنا، Y هو مؤشر ترك الموظفين. العامل المؤثر هو الأجور (x).

يحتوي برنامج Excel على وظائف مضمنة يمكنها مساعدتك في حساب معلمات نموذج الانحدار الخطي. لكن الوظيفة الإضافية "حزمة التحليل" ستفعل ذلك بشكل أسرع.

نقوم بتفعيل أداة تحليلية قوية:

بمجرد تفعيلها، ستكون الوظيفة الإضافية متاحة في علامة التبويب "البيانات".

الآن دعونا نقوم بتحليل الانحدار نفسه.



بادئ ذي بدء، ننتبه إلى R-squared والمعاملات.

R-squared هو معامل التحديد. في مثالنا – 0.755، أو 75.5%. وهذا يعني أن المعلمات المحسوبة للنموذج تفسر 75.5% من العلاقة بين المعلمات المدروسة. كلما ارتفع معامل التحديد، كلما كان النموذج أفضل. جيد - فوق 0.8. سيئ – أقل من 0.5 (لا يمكن اعتبار مثل هذا التحليل معقولاً). في مثالنا – "ليس سيئا".

يُظهر المعامل 64.1428 ما ستكون عليه Y إذا كانت جميع المتغيرات في النموذج قيد النظر تساوي 0. أي أن قيمة المعلمة التي تم تحليلها تتأثر أيضًا بعوامل أخرى غير موصوفة في النموذج.

يُظهر المعامل -0.16285 وزن المتغير X على Y. أي أن متوسط ​​الراتب الشهري ضمن هذا النموذج يؤثر على عدد المغادرين بوزن -0.16285 (وهذه درجة تأثير صغيرة). تشير العلامة "-" إلى تأثير سلبي: كلما ارتفع الراتب، قل عدد الأشخاص الذين تركوا العمل. وهو عادل.



تحليل الارتباط في Excel

يساعد تحليل الارتباط في تحديد ما إذا كانت هناك علاقة بين المؤشرات في عينة واحدة أو عينتين. على سبيل المثال، بين وقت تشغيل الآلة وتكلفة الإصلاحات، وسعر المعدات ومدة التشغيل، وطول ووزن الأطفال، وما إلى ذلك.

إذا كان هناك اتصال، فهل تؤدي الزيادة في أحد المعلمات إلى زيادة (ارتباط إيجابي) أو نقصان (سلبي) في الآخر. يساعد تحليل الارتباط المحلل على تحديد ما إذا كان من الممكن استخدام قيمة أحد المؤشرات للتنبؤ بالقيمة المحتملة لمؤشر آخر.

تتم الإشارة إلى معامل الارتباط بواسطة r. يختلف من +1 إلى -1. سيكون تصنيف الارتباطات في المجالات المختلفة مختلفًا. عندما يكون المعامل 0، لا توجد علاقة خطية بين العينات.

دعونا نلقي نظرة على كيفية العثور على معامل الارتباط باستخدام Excel.

للعثور على المعاملات المقترنة، يتم استخدام الدالة CORREL.

الهدف: تحديد ما إذا كانت هناك علاقة بين زمن تشغيل المخرطة وتكلفة صيانتها.

ضع المؤشر في أي خلية واضغط على زر fx.

  1. في فئة "الإحصائيات"، حدد الدالة CORREL.
  2. الوسيطة "الصفيف 1" - النطاق الأول من القيم - وقت تشغيل الآلة: A2:A14.
  3. الوسيطة "المصفوفة 2" - النطاق الثاني من القيم - تكلفة الإصلاح: B2:B14. انقر فوق موافق.

لتحديد نوع الاتصال، تحتاج إلى إلقاء نظرة على العدد المطلق للمعامل (كل مجال من مجالات النشاط له مقياسه الخاص).

لتحليل الارتباط بين العديد من المعلمات (أكثر من 2)، يكون من الملائم أكثر استخدام "تحليل البيانات" (الوظيفة الإضافية "حزمة التحليل"). تحتاج إلى تحديد الارتباط من القائمة وتعيين المصفوفة. الجميع.

سيتم عرض المعاملات الناتجة في مصفوفة الارتباط. مثله:

تحليل الارتباط والانحدار

ومن الناحية العملية، غالبًا ما يتم استخدام هاتين التقنيتين معًا.

مثال:


الآن أصبحت بيانات تحليل الانحدار مرئية.