Вибіркове рівняння регресії.

ЛАБОРАТОРНА РОБОТА № 4

Обчислення вибіркового коефіцієнта кореляції та побудова емпіричної та теоретичної лінії регресії

Мета роботи : ознайомлення із прямолінійною кореляцією; вироблення вміння та навичок обчислення та вибіркового коефіцієнта кореляції та складання рівнянь теоретичних ліній регресії.

Зміст роботи : на основі дослідних даних обчислити вибірковий коефіцієнт кореляції, побудувати для нього довірчий інтервал з надійністю, дати смислову характеристику отриманого результату, побудувати емпіричну та теоретичну лінії регресії. на
за прийменниковою вище методикою.

Метод кореляції

За допомогою методу кореляції математичної статистики визначають взаємозв'язок явищ. Особливість вивчення цього взаємозв'язку у тому, що не можна ізолювати вплив сторонніх чинників. Тому метод кореляції застосовується у тому, щоб за складному взаємодії сторонніх впливів чинників визначити, яка була залежність між ознаками, якби сторонні чинники не змінювалися, т. е. умови проведення досвіду були адекватні.

Теоретично кореляції розглядаються дві задачи:

1) визначення параметра кореляційного зв'язку між ознаками, що обстежуються;

2) визначення тісноти зв'язку. Про характер зв'язку між ознаками
і можна судити з розташування точок у системі координат (кореляційне поле). Якщо ці точки розташовуються біля прямої, то передбачається, що між умовною середньою і
Існує лінійна залежність. Рівняння
на
.

Рівняння
називається рівнянням лінії регресії
на . Якщо обидві лінії регресії - прямі, має місце лінійна кореляція.

Рівняння прямих регресій

і
складаються виходячи з вибіркових даних, наведених у кореляційної таблиці.

- Середні значення відповідних ознак;

- Коефіцієнти регресії на
і
на - обчислюються за формулами

де
- Середнє значення твору
на ;

і
- дисперсії ознак
і .

У прямолінійній кореляції тіснота зв'язку між ознаками характеризується вибірковим коефіцієнтом кореляції. , який набуває значення в межах від «-1» до «+1».

Якщо значення коефіцієнта кореляції негативне, це говорить про зворотної лінійної зв'язок між досліджуваними ознаками; якщо вона позитивна – про прямолінійний зв'язок. Якщо коефіцієнт кореляції дорівнює 0, лінійного зв'язку між ознаками немає.

Вибірковий коефіцієнт кореляції обчислюється за такою формулою:

r в
(1)

де - Середнє значення творів
на

і - Середні значення відповідних ознак;

і - Середні квадратичні відхилення, знайдені для ознаки
і для ознаки .

МЕТОДИКА ВИКОНАННЯ РОБОТИ

Дано статистичні дані температури мастила заднього мосту автомобіля залежно від температури навколишнього повітря
.

1. ВИЧИСЛЕННЯ ВИБІРКОВОГО КОЕФІЦІЄНТА КОРРЕЛЯЦІЇ

Дані умови зведемо до кореляційної таблиці

Таблиця 1.

n y(Частота ознаки у)

n x (частота прихнака х)

Знайдемо числові характеристики вибірки

1.1. Знайдемо середні значення ознак Х та Y

,

1.2. Знайдемо вибіркові дисперсії

1513-1281,64=231,36

1.3. Вибіркове середнє квадратичне відхилення

,

,

1.4. Вибірковий кореляційний момент

1/50(40 + 120+720+480+200+800+900+4200+1120+2160+4500+5280+4400+1320+1560) – 497,62=

1/50(27800) – 497,62 = 556 – 497,62 = 58,38

1.5. Вибірковий коефіцієнт кореляції


0,77

2. Перевіримо значущість коефіцієнта кореляції, при цьому перевіримо статистику:

=
≈ 8,3

Знайдемо
з таблиці розподілу Стьюдента (Додаток) за найбільш застосовуваним у техніці рівнем значущості
і
Y– числу ступенів свободи K= n – 2 = 50 – 2 = 48,
2,02

Оскільки
= 8,3> 2,02, то знайдений коефіцієнт кореляції значно відрізняється від нуля. Це означає, що змінні Х і Y пов'язані лінійною регресійною залежністю виду

Таким чином, коефіцієнт кореляції показує тісний лінійний зв'язок, що існує між температурою мастила заднього моста і температурою навколишнього повітря.

3. Упорядкування емпіричних лінійних рівнянь регресіїYнаХіХнаY.

3.1. Емпіричне лінійне рівняння регресії У Х.

,

3.2. Емпіричне лінійне рівняння регресії Х наY.

,

=35,8+2,34(y-13,9)

4. ПОБУДУВАННЯ ЕМПІРИЧНОЇ ЛІНІЇ РЕГРЕСІЇYНАX.

Для побудови емпіричної лінії регресії складемо таблицю 2.

Таблиця 2

- умовна середня значень ознаки за умови, що набуває певного значення, тобто.

;

;

;

Приймаючи пари чисел
за координати точок, будуємо в системі координат і з'єднуємо відрізками прямий. Отримана ламана лінія буде емпіричною лінією регресії.

Рівняння теоретичної прямої лінії регресії Y на X має вигляд:

;
, де - вибіркова середня ознака ;

- вибіркова середня ознака .

;
;
;
;
.

Рівняння прямої регресії Y на X запишеться так:

або остаточно

Побудуємо обидві лінії регресії (рис.1)

Мал. 1. Емпірична та теоретична лінії регресії

при
; при

5. Зробимо змістовну інтерпретацію результатів аналізу.

Між температурою мастила заднього моста автомобіля і температурою навколишнього повітря існує тісний прямий лінійний кореляційний зв'язок ( r в= 0,77). Це можна стверджувати із ймовірністю 0,95.

Рівняння
характеризує як у середньому температура мастила заднього моста автомобіля залежить від температури навколишнього повітря.

Коефіцієнт лінійної регресії (
) говорить про те, що якщо температуру навколишнього повітря збільшити в середньому на 1 градус, то температура мастила заднього моста автомобіля зросте в середньому на 0,25 градуса.

Рівняння
характеризує те, як температура мастила заднього моста автомобіля залежить від температури навколишнього повітря. Якщо температура мастила заднього моста автомобіля в середньому необхідно збільшити на 1 градус, то температуру навколишнього повітря необхідно збільшити в середньому на 2,34 градуса (
)

ВАРІАНТИ ІНДИВІДУАЛЬНИХ ЗАВДАНЬ

1. Розподіл Х - вартості основних виробничих засобів (млн.руб) та У - середнє місячне вироблення продукції на одного робітника

2. Розподіл 200 циліндричних ліхтарних стовпів за довжиною X (у см) та за вагою Y (у кг) дається в наступній таблиці:

3. Розподіл 100 фірм за виробничими засобами X (у ден. од.) та за добовим виробленням Y (у т) дається в наступній таблиці:

Титульний лист методичних Форма

Міністерство освіти і науки Республіки Казахстан

«

Голова УМЗ _______________ « ___»___________20__ р.

СХВАЛЕНО:

Начальник ОПіМОУП _________________ « ___»___________20__ р.

Схвалена навчально-методичною радою університету

« ___»___________20 __р. Протокол №____

При вивченні теми «Відомості з теорії ймовірностей та математичної статистики» особливу увагу слід звернути способи подання та обробки статистичних даних. Теоретичні та вибіркові характеристики. Загальна схема перевірки гіпотез. Помилки 1 та 2 роду. Точкові та інтервальні оцінки. Статистичні характеристики оцінок. Аналіз залежностей двох випадкових величин.

Тема. Метод найменших квадратів.

h1 , h2 – кроки, тобто різниці між двома сусідніми варіантами.

У цьому випадку вибірковий коефіцієнт кореляції

,

причому доданок зручно обчислювати, використовуючи розрахункову таблицю 1.

Величини можуть бути знайдені за формулами

Для зворотного переходу застосовуються вирази

прикладЗнайти вибіркове рівняння лінійної регресії Y на X виходячи з кореляційної таблиці.

Рішення.Для спрощення розрахунків перейдемо до умовних варіантів, що розраховуються за формулами

,

і складемо перетворену кореляційну таблицю з умовними варіантами

Потім складемо нову таблицю, в яку внесемо пораховані значення правий верхній кут заповненої клітини і в лівий нижній кут, після чого підсумовуємо верхні значення рядків для отримання значень Vj і нижні значення по стовпцях для Ui і підрахуємо величини і .

vjVj

При великій кількості випробувань одне і те ж значення X може зустрітися nx разів, одне і те ж значення може зустрітися ny раз і одна і та ж пара чисел (x; у) може зустрітися nxy разів,

причому зазвичай - обсяг вибірки.

Тому дані спостережень Групують, тобто підраховують nx, ny, nxy. Усі згруповані дані записують як таблиці, яку називають кореляційної.

Якщо обидві лінії регресії на X і X на У — прямі, то кореляція є лінійною.

Вибіркове рівняння прямої лінії регресії У на X має вигляд:

Параметри pyx і В, які визначаються методом найменших квадратів, мають вигляд:

де yx - умовна середня; XВ і Ув - вибіркові середні ознак X і У; -x і -у - Вибіркові середні квадратичні відхилення; гВ - вибірковий коефіцієнт кореляції.

Вибіркове рівняння прямої лінії регресії X на У має вигляд:

Вважаємо, що дані спостережень над ознаками X та У задані у вигляді кореляційної таблиці з рівновіддаленими варіантами.

Тоді переходимо до умовних варіантів:

де С1 - варіанти ознаки X, що має найбільшу частоту; З 2 - варіанти ознаки У, що має найбільшу частоту; h1 - крок (різниця між двома сусідніми варіантами X); h2 - крок (різниця між двома сусідніми варіантами У).

Тоді вибірковий коефіцієнт кореляції

Величини u, v, su, sv можуть бути знайдені методом творів або безпосередньо за формулами

Знаючи ці величини, знайдемо параметри, що входять до рівнянь регресії, за формулами

ТИПОВИХ КОНТРОЛЬНОЇ РОБОТИ З РОЗДІЛУ 6. 12.1. Випадкові події

12.1. Випадкові події

12.1.1. У ящику знаходяться 6 однакових пар рукавичок чорного кольору та 4 однакові пари рукавичок бежевого кольору. Знайти ймовірність того, що дві навмання витягнуті рукавички утворюють пару.

Розглянемо подію А - дві витягнуті навмання рукавички утворюють пару; і гіпотези: B1 - витягнута пара рукавичок чорного кольору, B2 - вилучена пара рукавичок бежевого кольору, B3 - витягнуті рукавички пару не утворюють.

Ймовірність гіпотези B1 за теоремою множення дорівнює добутку ймовірностей того, що перша рукавичка чорного кольору та друга рукавичка чорного кольору, тобто.

Аналогічно, ймовірність гіпотези Bi дорівнює:

Оскільки гіпотези B1, B2 і B3 становлять повну групу подій, то ймовірність гіпотези B3 дорівнює:

За формулою повної ймовірності маємо:

де Pb(A) є ймовірність того, що пару утворюють дві чорні рукавички та Pb1(A) = 1; pB1 (A) - ймовірність того, що пару утворюють дві бежеві рукавички та Pb2 (A) = 1; і, нарешті, РВз(A) - ймовірність того, що пару утворюють рукавички різного кольору і

Таким чином, ймовірність того, що дві навмання витягнуті рукавички утворюють пару дорівнює

12.1.2. В урні знаходяться 3 кулі білого кольору та 5 куль чорного кольору. Навмання по одному витягають 3 кулі і після кожного вилучення повертають назад в урну. Знайти ймовірність того, що серед вилучених куль виявиться:

а) рівно дві білі кулі, б) не менше двох білих куль.

Рішення. Маємо схему з поверненням, тобто щоразу склад куль не змінюється:

а) при вилученні трьох куль дві з них повинні бути білими, а одна чорна. При цьому чорний може бути або першим, або другим, або третім. Застосовуючи спільно теореми складання та множення ймовірностей, маємо:

б) вийняти не менше двох білих куль означає, що білих куль має бути або дві, або три:

12.1.3. В урні знаходяться 6 білих та 5 чорних куль. Три кулі навмання послідовно витягуються без повернення в урну. Знайти ймовірність, що третя за рахунком куля виявиться білою.

Рішення. Якщо третя за рахунком куля має бути білою, то перші дві кулі можуть бути білими, або білим і чорним, або чорним і білим, або чорними, тобто є чотири групи не-

спільних подій. Застосовуючи до них теорему множення ймовірностей, отримаємо:

P = P1(5 . P2(5 . P3(5 + (P1(5 . Р2ч. P3(5 + P14 ) P2(5 . P3(5) + Р1ч. Р2ч. P3(5 =)

A A 4 A A 5 A A 5 A A 6=540 = A

10 . 9 + І. 10 . 9 + І. 10 . 9 + І. 10 . 9 = 990 = ІТ