Как найти дисперсию если известно математическое ожидание. Математическое ожидание и дисперсия случайной величины

Следующим по важности свойством случайной величины вслед за математическим ожиданием является ее дисперсия, определяемая как средний квадрат отклонения от среднего:

Если обозначить через то дисперсия VX будет ожидаемым значением Это характеристика „разброса" распределения X.

В качестве простого примера вычисления дисперсии предположим, что нам только что сделали предложение, от которого мы не в силах отказаться: некто подарил нам два сертификата для участия в одной лотерее. Устроители лотереи продают каждую неделю по 100 билетов, участвующих в отдельном тираже. В тираже выбирается один их этих билетов посредством равномерного случайного процесса - каждый билет имеет равные шансы быть выбранным - и обладатель этого счастливого билета получает сто миллионов долларов. Остальные 99 владельцев лотерейных билетов не выигрывают ничего.

Мы можем использовать подарок двумя способами: купить или два билета в одной лотерее, или по одному для участия в двух разных лотереях. Какая стратегия лучше? Попытаемся провести анализ. Для этого обозначим через случайные величины, представляющие размер нашего выигрыша по первому и второму билету. Ожидаемое значение в миллионах, равно

и то же самое справедливо для Ожидаемые значения аддитивны, поэтому наш средний суммарный выигрыш составит

независимо от принятой стратегии.

Тем не менее, две стратегии выглядят различными. Выйдем за рамки ожидаемых значений и изучим полностью распределение вероятностей

Если мы купим два билета в одной лотерее, то наши шансы не выиграть ничего составят 98% и 2% - шансы на выигрыш 100 миллионов. Если же мы купим билеты на разные тиражи, то цифры будут такими: 98.01% - шанс не выиграть ничего, что несколько больше, чем ранее; 0.01% - шанс выиграть 200 миллионов, также чуть больше, чем было ранее; и шанс выиграть 100 миллионов теперь составляет 1.98%. Таким образом, во втором случае распределение величины несколько более разбросано; среднее значение, 100 миллионов долларов, несколько менее вероятно, тогда как крайние значения более вероятны.

Именно это понятие разброса случайной величины призвана отразить дисперсия. Мы измеряем разброс через квадрат отклонения случайной величины от ее математического ожидания. Таким образом, в случае 1 дисперсия составит

в случае 2 дисперсия равна

Как мы и ожидали, последняя величина несколько больше, поскольку распределение в случае 2 несколько более разбросано.

Когда мы работаем с дисперсиями, то все возводится в квадрат, так что в результате могут получиться весьма большие числа. (Множитель есть один триллион, это должно впечатлить

даже привычных к крупным ставкам игроков.) Для преобразования величин в более осмысленную исходную шкалу часто извлекают квадратный корень из дисперсии. Полученное число называется стандартным отклонением и обычно обозначается греческой буквой а:

Стандартные отклонения величины для наших двух лотерейных стратегий составят . В некотором смысле второй вариант примерно на 71247 долларов рискованнее.

Каким образом дисперсия помогает в выборе стратегии? Это не ясно. Стратегия с большей дисперсией рискованнее; но что лучше для нашего кошелька - риск или безопасная игра? Пусть у нас есть возможность купить не два билета, а все сто. Тогда мы могли бы гарантировать выигрыш в одной лотерее (и дисперсия была бы нулевой); или же можно было сыграть в сотне разных тиражей, ничего не получая с вероятностью зато имея ненулевой шанс на выигрыш вплоть до долларов. Выбор одной из этих альтернатив лежит за рамками этой книги; все, что мы можем сделать здесь,- это объяснить, как произвести подсчеты.

В действительности имеется более простой способ вычисления дисперсии, чем прямое использование определения (8.13). (Есть все основания подозревать здесь какую-то скрытую от глаз математику; иначе с чего бы дисперсия в лотерейных примерах оказалась целым кратным Имеем

поскольку - константа; следовательно,

„Дисперсия есть среднее значение квадрата минус квадрат среднего значения"

Например, в задаче про лотерею средним значением оказывается или Вычитание (квадрата среднего) дает результаты, которые мы уже получили ранее более трудным путем.

Есть, однако, еще более простая формула, применимая, когда мы вычисляем для независимых X и Y. Имеем

поскольку, как мы знаем, для независимых случайных величин Следовательно,

„Дисперсия суммы независимых случайных величин равняется сумме их дисперсий" Так, например, дисперсия суммы, которую можно выиграть на один лотерейный билет, равняется

Следовательно, дисперсия суммарного выигрыша по двум лотерейным билетам в двух различных (независимых) лотереях составит Соответствующее значение дисперсии для независимых лотерейных билетов будет

Дисперсия суммы очков, выпавших на двух кубиках, может быть получена по той же формуле, поскольку есть сумма двух независимых случайных величин. Имеем

для правильного кубика; следовательно, случае смещенного центра масс

следовательно, если у обоих кубиков центр масс смещен. Заметьте, что в последнем случае дисперсия больше, хотя принимает среднее значение 7 чаще, чем в случае правильных кубиков. Если наша цель - выбросить побольше приносящих удачу семерок, то дисперсия - не лучший показатель успеха.

Ну хорошо, мы установили, как вычислить дисперсию. Но мы пока не дали ответа на вопрос, почему надо вычислять именно дисперсию. Все так делают, но почему? Основная причина заключается в неравенстве Чебышева которое устанавливает важное свойство дисперсии:

(Это неравенство отличается от неравенств Чебышёва для сумм, встретившихся нам в гл. 2.) На качественном уровне (8.17) утверждает, что случайная величина X редко принимает значения, далекие от своего среднего если ее дисперсия VX мала. Доказательство

тельство необычайно просто. Действительно,

деление на завершает доказательство.

Если мы обозначим математическое ожидание через а стандартное отклонение - через а и заменим в (8.17) на то условие превратится в следовательно, мы получим из (8.17)

Таким образом, X будет лежать в пределах -кратного стандартного отклонения от своего среднего значения за исключением случаев, вероятность которых не превышает Случайная величина будет лежать в пределах 2а от по крайней мере для 75% испытаний; в пределах от до - по крайней мере для 99%. Это случаи неравенства Чебышёва.

Если бросить пару кубиков раз, то общая сумма очков во всех бросаниях почти всегда, при больших будет близка к Причина этого следующая: дисперсия независимых бросаний составит Дисперсия в означает стандартное отклонение всего

Поэтому из неравенства Чебышёва получаем, что сумма очков будет лежать между

по крайней мере для 99% всех бросаний правильных кубиков. Например, итог миллиона бросаний с вероятностью более 99% будет заключен между 6.976 млн и 7.024 млн.

В общем случае, пусть X - любая случайная величина на вероятностном пространстве П, имеющая конечное математическое ожидание и конечное стандартное отклонение а. Тогда можно ввести в рассмотрение вероятностное пространство Пп, элементарными событиями которого являются -последовательности где каждое , а вероятность определяется как

Если теперь определить случайные величины формулой

то величина

будет суммой независимых случайных величин, которая соответствует процессу суммирования независимых реализаций величины X на П. Математическое ожидание будет равно а стандартное отклонение - ; следовательно, среднее значение реализаций,

будет лежать в пределах от до по крайней мере в 99% временного периода. Иными словами, если выбрать достаточно большое то среднее арифметическое независимых испытаний будет почти всегда очень близко к ожидаемому значению (В учебниках теории вероятностей доказывается еще более сильная теорема, называемая усиленным законом больших чисел; но нам достаточно и простого следствия неравенства Чебышёва, которое мы только что вывели.)

Иногда нам не известны характеристики вероятностного пространства, но требуется оценить математическое ожидание случайной величины X при помощи повторных наблюдений ее значения. (Например, нам могла бы понадобиться средняя полуденная температура января в Сан-Франциско; или же мы хотим узнать ожидаемую продолжительность жизни, на которой должны основывать свои расчеты страховые агенты.) Если в нашем распоряжении имеются независимые эмпирические наблюдения то мы можем предположить, что истинное математическое ожидание приблизительно равно

Можно оценить и дисперсию, используя формулу

Глядя на эту формулу, можно подумать, что в ней - типографская ошибка; казалось бы, там должно стоять как в (8.19), поскольку истинное значение дисперсии определяется в (8.15) через ожидаемые значения. Однако замена здесь на позволяет получить лучшую оценку, поскольку из определения (8.20) вытекает, что

Вот доказательство:

(В этой выкладке мы опираемся на независимость наблюдений, когда заменяем на )

На практике для оценки результатов эксперимента со случайной величиной X обычно вычисляют эмпирическое среднее и эмпирическое стандартное отклонение после чего записывают ответ в виде Вот, например, результаты бросаний пары кубиков, предположительно правильных.

Случайные величины помимо законов распределения могут описываться также числовыми характеристиками .

Математическим ожиданием М (x) случайной величины называется ее среднее значение.

Математическое ожидание дискретной случайной величины вычисляется по формуле

где значения случайной величины, р i - ихвероятности.

Рассмотрим свойства математического ожидания:

1. Математическое ожидание константы равно самой константе

2. Если случайную величину умножить на некоторое число k, то и математическое ожидание умножится на это же число

М (kx) = kМ (x)

3. Математическое ожидание суммы случайных величин равно сумме их математических ожиданий

М (x 1 + x 2 + … + x n) = М (x 1) + М (x 2) +…+ М (x n)

4. М (x 1 - x 2) = М (x 1) - М (x 2)

5. Для независимых случайных величин x 1 , x 2 , … x n математическое ожидание произведения равно произведению их математических ожиданий

М (x 1 , x 2 , … x n) = М (x 1) М (x 2) … М (x n)

6. М (x - М (x)) = М (x) - М (М(x)) = М (x) - М (x) = 0

Вычислим математическое ожидание для случайной величины из Примера 11.

М (x) = = .

Пример 12. Пусть случайные величины x 1 , x 2 заданы соответственно законами распределения:

x 1 Таблица 2

x 2 Таблица 3

Вычислим М (x 1) и М (x 2)

М (x 1) = (- 0,1) 0,1 + (- 0,01) 0,2 + 0 · 0,4 + 0,01 · 0,2 + 0,1 · 0,1 = 0

М (x 2) = (- 20) 0,3 + (- 10) 0,1 + 0 · 0,2 + 10 · 0,1 + 20 · 0,3 = 0

Математические ожидания обеих случайных величин одинаковы- они равны нулю. Однако характер их распределения различный. Если значения x 1 мало отличаются от своего математического ожидания, то значения x 2 в большой степени отличаются от своего математического ожидания, и вероятности таких отклонений не малы. Эти примеры показывают, что по среднему значению нельзя определить, какие отклонения от него имеют место как в меньшую, так и в большую сторону. Так при одинаковой средней величине выпадающих в двух местностях осадков за год нельзя сказать, что эти местности одинаково благоприятны для сельскохозяйственных работ. Аналогично по показателю средней заработной платы не возможно судить об удельном весе высоко- и низкооплачиваемых работниках. Поэтому, вводится числовая характеристика – дисперсия D (x) , которая характеризует степень отклонения случайной величины от своего среднего значения:

D (x) = M (x - M (x)) 2 . (2)

Дисперсия –это математическое ожидание квадрата отклонения случайной величины от математического ожидания. Для дискретной случайной величины дисперсия вычисляется по формуле:

D (x) = = (3)

Из определения дисперсии следует, что D (x) 0.

Свойства дисперсии:

1. Дисперсия константы равна нулю

2. Если случайную величину умножить на некоторое число k , то дисперсия умножится на квадрат этого числа

D (kx) = k 2 D (x)

3. D (x) = М (x 2) – М 2 (x)

4. Для попарно независимых случайных величин x 1 , x 2 , … x n дисперсия суммы равна сумме дисперсий.

D (x 1 + x 2 + … + x n) = D (x 1) + D (x 2) +…+ D (x n)

Вычислим дисперсию для случайной величины из Примера 11.

Математическое ожидание М (x) = 1. Поэтому по формуле (3) имеем:

D (x) = (0 – 1) 2 ·1/4 + (1 – 1) 2 ·1/2 + (2 – 1) 2 ·1/4 =1·1/4 +1·1/4= 1/2

Отметим, что дисперсию вычислять проще, если воспользоваться свойством 3:

D (x) = М (x 2) – М 2 (x).

Вычислим дисперсии для случайных величин x 1 , x 2 из Примера 12 по этой формуле. Математические ожидания обеих случайных величин равны нулю.

D (x 1) = 0,01· 0,1 + 0,0001· 0,2 + 0,0001· 0,2 + 0,01· 0,1 = 0,001 + 0,00002 + 0,00002 + 0,001 = 0,00204

D (x 2) = (-20) 2 · 0,3 + (-10) 2 · 0,1 + 10 2 · 0,1 + 20 2 · 0,3 = 240 +20 = 260

Чем ближе значение дисперсии к нулю, тем меньше разброс случайной величины относительно среднего значения.

Величина называется среднеквадратическим отклонением . Модой случайной величины x дискретного типа Md называется такое значение случайной величины, которому соответствует наибольшая вероятность.

Модой случайной величины x непрерывного типа Md , называется действительное число, определяемое как точка максимума плотности распределения вероятностей f(x).

Медианой случайной величины x непрерывного типа Mn называется действительное число, удовлетворяющее уравнению

Математическое ожидание

Дисперсия непрерывной случайной величины X , возможные значения которой принадлежат всей оси Ох, определяется равенством:

Назначение сервиса . Онлайн калькулятор предназначен для решения задач, в которых заданы либо плотность распределения f(x) , либо функция распределения F(x) (см. пример). Обычно в таких заданиях требуется найти математическое ожидание, среднее квадратическое отклонение, построить графики функций f(x) и F(x) .

Инструкция . Выберите вид исходных данных: плотность распределения f(x) или функция распределения F(x) .

Задана плотность распределения f(x) Задана функция распределения F(x)

Задана плотность распределения f(x):

Задана функция распределения F(x):

Непрерывная случайна величина задана плотностью вероятностей
(закон распределения Релея – применяется в радиотехнике). Найти M(x) , D(x) .

Случайную величину X называют непрерывной , если ее функция распределения F(X)=P(X < x) непрерывна и имеет производную.
Функция распределения непрерывной случайной величины применяется для вычисления вероятностей попадания случайной величины в заданный промежуток:
P(α < X < β)=F(β) - F(α)
причем для непрерывной случайной величины не имеет значения, включаются в этот промежуток его границы или нет:
P(α < X < β) = P(α ≤ X < β) = P(α ≤ X ≤ β)
Плотностью распределения непрерывной случайной величины называется функция
f(x)=F’(x) , производная от функции распределения.

Свойства плотности распределения

1. Плотность распределения случайной величины неотрицательна (f(x) ≥ 0) при всех значениях x.
2. Условие нормировки:

Геометрический смысл условия нормировки: площадь под кривой плотности распределения равна единице.
3. Вероятность попадания случайной величины X в промежуток от α до β может быть вычислена по формуле

Геометрически вероятность попадания непрерывной случайной величины X в промежуток (α, β) равна площади криволинейной трапеции под кривой плотности распределения, опирающейся на этот промежуток.
4. Функция распределения выражается через плотность следующим образом:

Значение плотности распределения в точке x не равно вероятности принять это значение, для непрерывной случайной величины речь может идти только о вероятности попадания в заданный интервал. Пусть }