Середньоквадратичне відхилення формули. Середнє лінійне відхилення

Математичне очікування та дисперсія

Нехай ми вимірюємо випадкову величину Nразів, наприклад, десять разів вимірюємо швидкість вітру та хочемо знайти середнє значення. Як пов'язане середнє значення із функцією розподілу?

Кидатимемо гральний кубик велику кількість разів. Кількість очок, яке випаде на кубику при кожному кидку, є випадковою величиною і може набувати будь-яких натуральних значень від 1 до 6. Середнє арифметичне опал, що випали, підрахованих за всі кидки кубика, теж є випадковою величиною, проте при великих Nвоно прагне цілком конкретного числа – математичного очікування M x. В даному випадку M x = 3,5.

Як вийшла ця величина? Нехай у Nвипробуваннях разів випало 1 очко, разів – 2 очки і так далі. Тоді При N→ ∞ кількість наслідків, в яких випало одне очко, Аналогічно, Звідси

Модель 4.5. Гральні кістки

Припустимо тепер, що ми знаємо закон розподілу випадкової величини xтобто знаємо, що випадкова величина xможе приймати значення x 1 , x 2 , ..., x kз ймовірностями p 1 , p 2 , ..., p k.

Математичне очікування M xвипадкової величини xодно:

Відповідь. 2,8.

Математичне очікування який завжди є розумною оцінкою якоїсь випадкової величини. Так, для оцінки середньої заробітної плати розумніше використовувати поняття медіани, тобто такої величини, що кількість людей, які отримують меншу, ніж медіана, зарплату та більшу, збігаються.

Медіаноювипадкової величини називають число x 1/2 таке, що p (x < x 1/2) = 1/2.

Іншими словами, ймовірність p 1 того, що випадкова величина xвиявиться меншою x 1/2 , і ймовірність p 2 того, що випадкова величина xвиявиться більшою x 1/2, однакові та рівні 1/2. Медіана визначається однозначно задля всіх розподілів.

Повернемося до випадкової величини xяка може приймати значення x 1 , x 2 , ..., x kз ймовірностями p 1 , p 2 , ..., p k.

Дисперсієювипадкової величини xназивається середнє значення квадрата відхилення випадкової величини від її математичного очікування:

Приклад 2

В умовах попереднього прикладу обчислити дисперсію та середньоквадратичне відхилення випадкової величини x.

Відповідь. 0,16, 0,4.

Модель 4.6. Стрілянина в ціль

Приклад 3

Знайти розподіл ймовірності числа очок, що випали на кубику з першого кидка, медіану, математичне очікування, дисперсію та середньоквадратичне відхилення.

Випадання будь-якої грані рівноймовірне, так що розподіл виглядатиме так:

Середньоквадратичне відхилення Видно, що відхилення від середнього значення величини дуже велике.

Властивості математичного очікування:

  • Математичне очікування суми незалежних випадкових величин дорівнює сумі їх математичних очікувань:

Приклад 4

Знайти математичне очікування суми та твори очок, що випала на двох кубиках.

У прикладі 3 ми виявили, що для одного кубика M (x) = 3,5. Значить, для двох кубиків

Властивості дисперсії:

  • Дисперсія суми незалежних випадкових величин дорівнює сумі дисперсій:

D x + y = D x + D y.

Нехай за Nкидків на кубику випало yокулярів. Тоді

Цей результат є вірним не тільки для кидків кубика. Він у багатьох випадках визначає точність виміру математичного очікування досвідченим шляхом. Видно, що при збільшенні кількості вимірів Nрозкид значень навколо середнього, тобто середньоквадратичне відхилення, зменшується пропорційно

Дисперсія випадкової величини пов'язана з математичним очікуванням квадрата цієї випадкової величини наступним співвідношенням:

Знайдемо математичні очікування обох частин цієї рівності. За визначенням,

Математичне ж очікування правої частини рівності за якістю математичних очікувань дорівнює

Середнє квадратичне відхилення

Середньоквадратичне відхиленнядорівнює квадратному кореню з дисперсії:
При визначенні середнього квадратичного відхилення при досить великому обсязі сукупності, що вивчається (n > 30) застосовуються формули:

Подібна інформація.


Дисперсія. Середнє квадратичне відхилення

Дисперсія- це середня арифметична квадратів відхилень кожного значення ознаки від загальної середньої. Залежно від вихідних даних дисперсія може бути незваженою (простою) або зваженою.

Дисперсія розраховується за такими формулами:

· Для несгрупованих даних

· Для згрупованих даних

Порядок розрахунку дисперсії зважену:

1. визначають середню арифметичну зважену

2. визначаються відхилення варіант від середньої

3. зводять у квадрат відхилення кожної варіанти від середньої

4. множать квадрати відхилень на ваги (частоти)

5. підсумовують отримані твори

6. отриману суму ділять на суму ваг

Формула для визначення дисперсії може бути перетворена на таку формулу:

- проста

Порядок розрахунку дисперсії простий:

1. визначають середню арифметичну

2. зводять у квадрат середню арифметичну

3. зводять у квадрат кожну варіанту ряду

4. знаходимо суму квадратів варіант

5. ділять суму квадратів варіант з їхньої число, тобто. визначають середній квадрат

6. визначають різницю між середнім квадратом ознаки та квадратом середньої

Також формула для визначення зваженої дисперсії може бути перетворена в наступну формулу:

тобто. дисперсія дорівнює різниці середньої з квадратів значень ознаки та квадрата середньої арифметичної. При користуванні перетвореною формулою виключається додаткова процедура з розрахунку відхилень індивідуальних значень ознаки від х та виключається помилка у розрахунку, пов'язана із округленням відхилень

Дисперсія має ряд властивостей, деякі з них дозволяють спростити її обчислення:

1) дисперсія постійної величини дорівнює нулю;

2) якщо всі варіанти значень ознаки зменшити на те саме число, то дисперсія не зменшиться;

3) якщо всі варіанти значень ознаки зменшити в те саме число раз (раз), то дисперсія зменшиться в раз

Середнє квадратичне відхилення S- являє собою квадратний корінь з дисперсії:

· Для несгрупованих даних:

;

· Для варіаційного ряду:

Розмах варіації, середнє лінійне та середнє квадратичне відхилення є іменованими величинами. Вони мають самі одиниці виміру, як і індивідуальні значення ознаки.

Дисперсія та середнє квадратичне відхилення найбільш широко застосовуються показники варіації. Пояснюється це тим, що вони входять до більшості теорем теорії ймовірності, яка є фундаментом математичної статистики. Крім того, дисперсія може бути розкладена на складові елементи, що дозволяють оцінити вплив різних факторів, що зумовлюють варіацію ознаки.

Розрахунок показників варіації для банків, згрупованих за розміром прибутку, показано у таблиці.

Розмір прибутку, млн. руб. Число банків розрахункові показники
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Разом: 121,70 17,640 23,126

Середнє лінійне та середнє квадратичне відхилення показують на скільки в середньому коливається величина ознаки у одиниць та досліджуваної сукупності. Так, у разі середня величина коливання розміру прибутку становить: по середньому лінійному відхилення 0,882 млн. крб.; за середнім квадратичним відхиленням - 1,075 млн. руб. Середнє квадратичне відхилення завжди більше середнього лінійного відхилення. Якщо розподіл ознаки, близький до нормального, між S і d існує взаємозв'язок: S=1,25d, або d=0,8S. Середнє квадратичне відхилення показує, як розташована основна маса одиниць сукупності щодо середньої арифметичної. Незалежно від форми розподілу 75 значень ознаки потрапляють в інтервал х 2S, а принаймні 89 всіх значень потрапляють в інтервал х 3S (теорема П.Л.Чебишева).

Програма Excel цінується як професіоналами, так і любителями, адже працювати з нею може користувач будь-якого рівня підготовки. Наприклад, кожен бажаючий з мінімальними навичками спілкування з Екселем може намалювати простенький графік, зробити пристойну табличку і т.д.

Разом з тим, ця програма навіть дозволяє виконувати різноманітні розрахунки, наприклад, розрахунок, але для цього вже необхідний дещо інший рівень підготовки. Втім, якщо ви тільки почали тісне знайомство з цією прогою і цікавитеся всім, що допоможе вам стати більш просунутим користувачем, ця стаття для вас. Сьогодні я розповім, що є середньоквадратичним відхиленням формула в excel, навіщо вона взагалі потрібна і, власне кажучи, коли застосовується. Поїхали!

Що це таке

Почнемо з теорії. Середнім квадратичним відхиленням прийнято називати квадратний корінь, отриманий із середнього арифметичного всіх квадратів різниць між наявними величинами, а також їх середнім арифметичним. До слова, цю величину прийнято називати грецькою літерою "сигма". Стандартне відхилення розраховується за формулою СТАНДОТКЛОН, відповідно програма робить це за користувача сама.

Суть цього поняття у тому, щоб виявити ступінь мінливості інструмента, тобто, це, свого роду, індикатор родом з описової статистики. Він виявляє зміни волатильності інструменту у будь-якому часовому проміжку. За допомогою формул СТАНДОТКЛОН можна оцінити стандартне відхилення під час вибірки, при цьому логічні та текстові значення ігноруються.

Формула

Допомагає розрахувати середнє квадратичне відхилення Excel формула, яка автоматично передбачена в програмі Excel. Щоб її знайти, необхідно знайти в Екселі розділ формули, а вже там вибрати ту, що має назву СТАНДОТКЛОН, так що дуже просто.

Після цього перед вами з'явиться віконце, в якому потрібно буде ввести дані для обчислення. Зокрема, у спеціальні поля слід вписати два числа, після чого програма сама вирахує стандартне відхилення щодо вибірки.

Безперечно, математичні формули та розрахунки – питання досить складне, і не всі користувачі з ходу можуть впоратися з ним. Тим не менш, якщо копнути трохи глибше і трохи детальніше розібратися в питанні, виявляється, що не все так і сумно. Сподіваюся, на прикладі обчислення середньоквадратичного відхилення ви переконалися в цьому.

Відео на допомогу

За даними вибіркового обстеження проведено угруповання вкладників за розміром вкладу в Ощадбанку міста:

Визначте:

1) розмах варіації;

2) середній розмір вкладу;

3) середнє лінійне відхилення;

4) дисперсію;

5) середнє квадратичне відхилення;

6) коефіцієнт варіації вкладів.

Рішення:

Цей ряд розподілу містить відкриті інтервали. У таких рядах умовно приймається величина інтервалу першої групи дорівнює величині інтервалу наступної, а величина інтервалу останньої групи дорівнює величині інтервалу попередньої.

Величина інтервалу другої групи дорівнює 200, отже, і величина першої групи також дорівнює 200. Величина інтервалу передостанньої групи дорівнює 200, отже останній інтервал матиме величину, рівну 200.

1) Визначимо розмах варіації як різницю між найбільшим та найменшим значенням ознаки:

Розмах варіації обсягу вкладу дорівнює 1000 рублів.

2) Середній розмір вкладу визначимо за формулою середньої арифметичної зваженої.

Попередньо визначимо дискретну величину ознаки у кожному інтервалі. Для цього за формулою середньої арифметичної простий знайдемо середини інтервалів.

Середнє значення першого інтервалу дорівнюватиме:

другого - 500 і т.д.

Занесемо результати обчислень до таблиці:

Розмір внеску, руб.Число вкладників, fСередина інтервалу, хxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Разом 400 - 312000

Середній розмір вкладу в Ощадбанку міста дорівнюватиме 780 рублів:

3) Середнє лінійне відхилення є середня арифметична з абсолютних відхилень окремих значень ознаки від загальної середньої:

Порядок розрахунку середнього лінійного відхилення в інтервальному ряду розподілу наступний:

1. Обчислюється середня арифметична зважена, як показано у п. 2).

2. Визначаються абсолютні відхилення варіантів від середньої:

3. Отримані відхилення множаться на частоти:

4. Знаходиться сума зважених відхилень без урахування знака:

5. Сума завислих відхилень ділиться на суму частот:

Зручно користуватися таблицею розрахункових даних:

Розмір внеску, руб.Число вкладників, fСередина інтервалу, х
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Разом 400 - - - 81280

Середнє лінійне відхилення обсягу вкладу клієнтів Ощадбанку становить 203,2 рубля.

4) Дисперсія – це середня арифметична квадратів відхилень кожного значення ознаки від середньої арифметичної.

Розрахунок дисперсії в інтервальних рядах розподілу провадиться за формулою:

Порядок розрахунку дисперсії у разі наступний:

1. Визначають середню арифметичну зважену, як показано у п. 2).

2. Знаходять відхилення варіант від середньої:

3. Зводять квадрат відхилення кожної варіанти від середньої:

4. Помножують квадрати відхилень на ваги (частоти):

5. Підсумовують отримані твори:

6. Отримана сума поділяється на суму ваг (частот):

Розрахунки оформимо до таблиці:

Розмір внеску, руб.Число вкладників, fСередина інтервалу, х
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Разом 400 - - - 23040000

Наближений метод оцінки коливання варіаційного ряду - визначення ліміту та амплітуди, проте не враховують значень варіант усередині ряду. Основною загальноприйнятою мірою коливання кількісної ознаки в межах варіаційного ряду є середнє квадратичне відхилення (σ - сигма). Чим більше середнє квадратичне відхилення, тим ступінь коливання даного ряду вищий.

Методика розрахунку середнього квадратичного відхилення включає такі етапи:

1. Знаходять середню арифметичну величину (Μ).

2. Визначають відхилення окремих варіантів від середньої арифметичної (d=V-M). У медичній статистиці відхилення від середньої позначаються як d(deviate). Сума всіх відхилень дорівнює нулю.

3. Зводять кожне відхилення у квадрат d 2 .

4. Перемножують квадрати відхилень на відповідні частоти d2*p.

5. Знаходять суму творів å(d 2 *p)

6. Обчислюють середнє відхилення за формулою:

При n більше 30,або при n менше або дорівнює 30, де n - число всіх варіантів.

Значення середнього квадратичного відхилення:

1. Середнє квадратичне відхилення характеризує розкид варіант відносно середньої величини (тобто коливання варіаційного ряду). Чим більша сигма, тим ступінь розмаїття даного ряду вищий.

2. Середнє квадратичне відхилення використовується для порівняльної оцінки ступеня відповідності середньої арифметичної величини варіаційному ряду, для якого вона обчислена.

Варіації масових явищ підпорядковуються закону нормального розподілу. Крива, що відображає цей розподіл, має вигляд плавної дзвоноподібної симетричної кривої (крива Гауса). Відповідно до теорії ймовірності в явищах, що підкоряються закону нормального розподілу, між значеннями середньої арифметичної та середнього квадратичного відхилення існує строга математична залежність. Теоретичний розподіл варіантів у однорідному варіаційному ряду підпорядковується правилу трьох сигм.

Якщо системі прямокутних координат на осі абсцис відкласти значення кількісного ознаки (варіанти), але в осі ординат - частоти встречаемости варіант у варіаційному ряду, то сторонам від середньої арифметичної рівномірно розташовуються варіанти з більшими і меншими значеннями.



Встановлено, що за нормального розподілу ознаки:

68,3% значень варіант знаходиться в межах М±1s

95,5% значень варіант знаходиться у межах М±2s

99,7% значень варіант знаходиться в межах М±3s

3. Середнє квадратичне лоняння дозволяє встановити значення норми для клініко-біологічних показників. У медицині інтервал М±1s зазвичай приймається межі норми для досліджуваного явища. Відхилення оцінюваної величини від середньої арифметичної більше, ніж на 1s вказує на відхилення параметра, що вивчається від норми.

4. У медицині правило трьох сигм застосовується у педіатрії для індивідуальної оцінки рівня фізичного розвитку дітей (метод сигмальних відхилень), для розробки стандартів дитячого одягу

5. Середнє квадратичне відхилення необхідне характеристики ступеня різноманітності досліджуваного ознаки і обчислення помилки середньої арифметичної величини.

Величина середнього квадратичного відхилення зазвичай використовується для порівняння коливання однотипних рядів. Якщо порівнюються два ряди з різними ознаками (зростання та маса тіла, середня тривалість лікування в стаціонарі та лікарняна летальність тощо), то безпосереднє зіставлення розмірів сигм неможливе , т.к. середньоквадратичне відхилення - названа величина, виражена в абсолютних числах. У цих випадках застосовують коефіцієнт варіації (Cv), Що являє собою відносну величину: відсоткове відношення середнього квадратичного відхилення до середньої арифметичної

Коефіцієнт варіації обчислюється за такою формулою:

Чим вищий коефіцієнт варіації , тим більша мінливість цього ряду. Вважають, що коефіцієнт варіації понад 30% свідчить про якісну неоднорідність сукупності.