Вероятность и статистика – основные факты. В достижении позитивных результатов не менее важны

2. Основы теории вероятностей

Математическое ожидание

Рассмотрим случайную величину с числовыми значениями. Часто оказывается полезным связать с этой функцией число – ее «среднее значение» или, как говорят, «среднюю величину», «показатель центральной тенденции». По ряду причин, некоторые из которых будут ясны из дальнейшего, в качестве «среднего значения» обычно используют математическое ожидание.

Определение 3. Математическим ожиданием случайной величины Х называется число

т.е. математическое ожидание случайной величины – это взвешенная сумма значений случайной величины с весами, равными вероятностям соответствующих элементарных событий.

Пример 6. Вычислим математическое ожидание числа, выпавшего на верхней грани игрального кубика. Непосредственно из определения 3 следует, что

Утверждение 2. Пусть случайная величина Х принимает значения х 1 , х 2 ,…, х m . Тогда справедливо равенство

(5)

т.е. математическое ожидание случайной величины – это взвешенная сумма значений случайной величины с весами, равными вероятностям того, что случайная величина принимает определенные значения.

В отличие от (4), где суммирование проводится непосредственно по элементарным событиям, случайное событие может состоять из нескольких элементарных событий.

Иногда соотношение (5) принимают как определение математического ожидания. Однако с помощью определения 3, как показано далее, более легко установить свойства математического ожидания, нужные для построения вероятностных моделей реальных явлений, чем с помощью соотношения (5).

Для доказательства соотношения (5) сгруппируем в (4) члены с одинаковыми значениями случайной величины :

Поскольку постоянный множитель можно вынести за знак суммы, то

По определению вероятности события

С помощью двух последних соотношений получаем требуемое:

Понятие математического ожидания в вероятностно-статистической теории соответствует понятию центра тяжести в механике. Поместим в точки х 1 , х 2 ,…, х m на числовой оси массы P (X = x 1 ), P (X = x 2 ),…, P (X = x m ) соответственно. Тогда равенство (5) показывает, что центр тяжести этой системы материальных точек совпадает с математическим ожиданием, что показывает естественность определения 3.

Утверждение 3. Пусть Х – случайная величина, М(Х) – ее математическое ожидание, а – некоторое число. Тогда

1) М(а)=а; 2) М(Х-М(Х))=0; 3) М[(X - a ) 2 ]= M [(X - M (X )) 2 ]+(a - M (X )) 2 .

Для доказательства рассмотрим сначала случайную величину, являющуюся постоянной, т.е. функция отображает пространство элементарных событий в единственную точку а . Поскольку постоянный множитель можно выносить за знак суммы, то

Если каждый член суммы разбивается на два слагаемых, то и вся сумма разбивается на две суммы, из которых первая составлена из первых слагаемых, а вторая – из вторых. Следовательно, математическое ожидание суммы двух случайных величин Х+У , определенных на одном и том же пространстве элементарных событий, равно сумме математических ожиданий М(Х) и М(У) этих случайных величин:

М(Х+У) = М(Х) + М(У).

А потому М(Х-М(Х)) = М(Х) - М(М(Х)). Как показано выше, М(М(Х)) = М(Х). Следовательно, М(Х-М(Х)) = М(Х) - М(Х) = 0.

Поскольку (Х - а) 2 = {(X – M (X )) + (M (X ) - a )} 2 = (X - M (X )) 2 + 2(X - M (X ))(M (X ) - a ) + (M (X ) – a ) 2 , то M [(Х - а) 2 ] = M (X - M (X )) 2 + M {2(X - M (X ))(M (X ) - a )} + M [(M (X ) – a ) 2 ]. Упростим последнее равенство. Как показано в начале доказательства утверждения 3, математическое ожидание константы – сама эта константа, а потому M [(M (X ) – a ) 2 ] = (M (X ) – a ) 2 . Поскольку постоянный множитель можно выносить за знак суммы, то M {2(X - M (X ))(M (X ) - a )} = 2(M (X ) - a )М(X - M (X )). Правая часть последнего равенства равна 0, поскольку, как показано выше, М(Х-М(Х))=0. Следовательно, М[(X - a ) 2 ]= M [(X - M (X )) 2 ]+(a - M (X )) 2 , что и требовалось доказать.

Из сказанного вытекает, что М[(X - a ) 2 ] достигает минимума по а , равного M [(X - M (X )) 2 ], при а = М(Х), поскольку второе слагаемое в равенстве 3) всегда неотрицательно и равно 0 только при указанном значении а .

Утверждение 4. Пусть случайная величина Х принимает значения х 1 , х 2 ,…, х m , а f – некоторая функция числового аргумента. Тогда

Для доказательства сгруппируем в правой части равенства (4), определяющего математическое ожидание, члены с одинаковыми значениями :

Пользуясь тем, что постоянный множитель можно выносить за знак суммы, и определением вероятности случайного события (2), получаем

что и требовалось доказать.

Утверждение 5. Пусть Х и У – случайные величины, определенные на одном и том же пространстве элементарных событий, а и b – некоторые числа. Тогда M (aX + bY )= aM (X )+ bM (Y ).

С помощью определения математического ожидания и свойств символа суммирования получаем цепочку равенств:

Требуемое доказано.

Выше показано, как зависит математическое ожидание от перехода к другому началу отсчета и к другой единице измерения (переход Y =aX +b ), а также к функциям от случайных величин. Полученные результаты постоянно используются в технико-экономическом анализе, при оценке финансово-хозяйственной деятельности предприятия, при переходе от одной валюты к другой во внешнеэкономических расчетах, в нормативно-технической документации и др. Рассматриваемые результаты позволяют применять одни и те же расчетные формулы при различных параметрах масштаба и сдвига.

Основные числовые характеристики дискретных и непрерывных случайных величин: математическое ожидание, дисперсия и среднее квадратическое отклонение. Их свойства и примеры.

Закон распределения (функция распределения и ряд распределения или плотность веро-ятности) полностью описывают поведение случайной величины. Но в ряде задач доста-точно знать некоторые числовые характеристики исследуемой величины (например, ее среднее значение и возможное отклонение от него), чтобы ответить на поставленный во-прос. Рассмотрим основные числовые характеристики дискретных случайных величин.

Определение 7.1. Математическим ожиданием дискретной случайной величины называ-ется сумма произведений ее возможных значений на соответствующие им вероятности:

М (Х ) = х 1 р 1 + х 2 р 2 + … + х п р п. (7.1)

Если число возможных значений случайной величины бесконечно, то , если полученный ряд сходится абсолютно.

Замечание 1. Математическое ожидание называют иногда взвешенным средним , так как оно приближенно равно среднему арифметическому наблюдаемых значений случайной величины при большом числе опытов.

Замечание 2. Из определения математического ожидания следует, что его значение не меньше наименьшего возможного значения случайной величины и не больше наибольше-го.

Замечание 3. Математическое ожидание дискретной случайной величины есть неслучай-ная (постоянная) величина. В дальнейшем увидим, что это же справедливо и для непре-рывных случайных величин.

Пример 1. Найдем математическое ожидание случайной величины Х - числа стандартных деталей среди трех, отобранных из партии в 10 деталей, среди которых 2 бракованных. Составим ряд распределения для Х . Из условия задачи следует, что Х может принимать значения 1, 2, 3. Тогда

Пример 2. Определим математическое ожидание случайной величины Х - числа бросков монеты до первого появления герба. Эта величина может принимать бесконечное число значений (множество возможных значений есть множество натуральных чисел). Ряд ее распределения имеет вид:

Х			…	п	…
р	0,5	(0,5) 2	…	(0,5) п	…

+ (при вычислении дважды использовалась формула суммы бесконечно убывающей геометрической прогрессии: , откуда ).

Свойства математического ожидания.

1) Математическое ожидание постоянной равно самой постоянной:

М (С ) = С. (7.2)

Доказательство. Если рассматривать С как дискретную случайную величину, принимающую только одно значение С с вероятностью р = 1, то М (С ) = С ?1 = С .

2) Постоянный множитель можно выносит за знак математического ожидания:

М (СХ ) = С М (Х ). (7.3)

Доказательство. Если случайная величина Х задана рядом распределения

Тогда М (СХ ) = Сх 1 р 1 + Сх 2 р 2 + … + Сх п р п = С ( х 1 р 1 + х 2 р 2 + … + х п р п ) = СМ (Х ).

Определение 7.2. Две случайные величины называются независимыми , если закон распределения одной из них не зависит от того, какие значения приняла другая. В противном случае случайные величины зависимы .

Определение 7.3. Назовем произведением независимых случайных величин Х и Y случайную величину XY , возможные значения которой равны произведениям всех возможных значений Х на все возможные значения Y , а соответствующие им вероят-ности равны произведениям вероятностей сомножителей.

3) Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий:

M (XY ) = M (X )M (Y ). (7.4)

Доказательство. Для упрощения вычислений ограничимся случаем, когда Х и Y принимают только по два возможных значения:

Следовательно, M (XY ) = x 1 y 1 ?p 1 g 1 + x 2 y 1 ?p 2 g 1 + x 1 y 2 ?p 1 g 2 + x 2 y 2 ?p 2 g 2 = y 1 g 1 (x 1 p 1 + x 2 p 2) + + y 2 g 2 (x 1 p 1 + x 2 p 2) = (y 1 g 1 + y 2 g 2) (x 1 p 1 + x 2 p 2) = M (X )?M (Y ).

Замечание 1. Аналогично можно доказать это свойство для большего количества возможных значений сомножителей.

Замечание 2. Свойство 3 справедливо для произведения любого числа независимых случайных величин, что доказывается методом математической индукции.

Определение 7.4. Определим сумму случайных величин Х и Y как случайную величину Х + Y , возможные значения которой равны суммам каждого возможного значения Х с каждым возможным значением Y ; вероятности таких сумм равны произведениям вероятностей слагаемых (для зависимых случайных величин - произведениям вероятности одного слагаемого на условную вероятность второго).

4) Математическое ожидание суммы двух случайных величин (зависимых или незави-симых) равно сумме математических ожиданий слагаемых:

M (X + Y ) = M (X ) + M (Y ). (7.5)

Доказательство.

Вновь рассмотрим случайные величины, заданные рядами распределения, приведен-ными при доказательстве свойства 3. Тогда возможными значениями X + Y являются х 1 + у 1 , х 1 + у 2 , х 2 + у 1 , х 2 + у 2 . Обозначим их вероятности соответственно как р 11 , р 12 , р 21 и р 22 . Найдем М (Х +Y ) = (x 1 + y 1)p 11 + (x 1 + y 2)p 12 + (x 2 + y 1)p 21 + (x 2 + y 2)p 22 =

= x 1 (p 11 + p 12) + x 2 (p 21 + p 22) + y 1 (p 11 + p 21) + y 2 (p 12 + p 22).

Докажем, что р 11 + р 22 = р 1 . Действительно, событие, состоящее в том, что X + Y примет значения х 1 + у 1 или х 1 + у 2 и вероятность которого равна р 11 + р 22 , совпадает с событием, заключающемся в том, что Х = х 1 (его вероятность - р 1). Аналогично дока-зывается, что p 21 + p 22 = р 2 , p 11 + p 21 = g 1 , p 12 + p 22 = g 2 . Значит,

M (X + Y ) = x 1 p 1 + x 2 p 2 + y 1 g 1 + y 2 g 2 = M (X ) + M (Y ).

Замечание . Из свойства 4 следует, что сумма любого числа случайных величин равна сумме математических ожиданий слагаемых.

Пример. Найти математическое ожидание суммы числа очков, выпавших при броске пяти игральных костей.

Найдем математическое ожидание числа очков, выпавших при броске одной кости:

М (Х 1) = (1 + 2 + 3 + 4 + 5 + 6)Тому же числу равно математическое ожидание числа очков, выпавших на любой кости. Следовательно, по свойству 4 М (Х )=

Дисперсия .

Для того, чтобы иметь представление о поведении случайной величины, недостаточно знать только ее математическое ожидание. Рассмотрим две случайные величины: Х и Y , заданные рядами распределения вида

Х
р	0,1	0,8	0,1

Y
p	0,5	0,5

Найдем М (Х ) = 49?0,1 + 50?0,8 + 51?0,1 = 50, М (Y ) = 0?0,5 + 100?0,5 = 50. Как видно, мате-матические ожидания обеих величин равны, но если для Х М (Х ) хорошо описывает пове-дение случайной величины, являясь ее наиболее вероятным возможным значением (при-чем остальные значения ненамного отличаются от 50), то значения Y существенно отсто-ят от М (Y ). Следовательно, наряду с математическим ожиданием желательно знать, на-сколько значения случайной величины отклоняются от него. Для характеристики этого показателя служит дисперсия.

Определение 7.5. Дисперсией (рассеянием) случайной величины называется математическое ожидание квадрата ее отклонения от ее математического ожидания:

D (X ) = M (X - M (X ))². (7.6)

Найдем дисперсию случайной величины Х (числа стандартных деталей среди отобранных) в примере 1 данной лекции. Вычислим значения квадрата отклонения каждого возможно-го значения от математического ожидания:

(1 - 2,4) 2 = 1,96; (2 - 2,4) 2 = 0,16; (3 - 2,4) 2 = 0,36. Следовательно,

Замечание 1. В определении дисперсии оценивается не само отклонение от среднего, а его квадрат. Это сделано для того, чтобы отклонения разных знаков не компенсировали друг друга.

Замечание 2. Из определения дисперсии следует, что эта величина принимает только неотрицательные значения.

Замечание 3. Существует более удобная для расчетов формула для вычисления дисперсии, справедливость которой доказывается в следующей теореме:

Теорема 7.1. D (X ) = M (X ²) - M ²(X ). (7.7)

Доказательство.

Используя то, что М (Х ) - постоянная величина, и свойства математического ожидания, преобразуем формулу (7.6) к виду:

D (X ) = M (X - M (X ))² = M (X ² - 2X?M (X ) + M ²(X )) = M (X ²) - 2M (X )?M (X ) + M ²(X ) =

= M (X ²) - 2M ²(X ) + M ²(X ) = M (X ²) - M ²(X ), что и требовалось доказать.

Пример. Вычислим дисперсии случайных величин Х и Y , рассмотренных в начале этого раздела. М (Х ) = (49 2 ?0,1 + 50 2 ?0,8 + 51 2 ?0,1) - 50 2 = 2500,2 - 2500 = 0,2.

М (Y ) = (0 2 ?0,5 + 100²?0,5) - 50² = 5000 - 2500 = 2500. Итак, дисперсия второй случайной величины в несколько тысяч раз больше дисперсии первой. Таким образом, даже не зная законов распределения этих величин, по известным значениям дисперсии мы можем утверждать, что Х мало отклоняется от своего математического ожидания, в то время как для Y это отклонение весьма существенно.

Свойства дисперсии.

1) Дисперсия постоянной величины С равна нулю:

D (C ) = 0. (7.8)

Доказательство. D (C ) = M ((C - M (C ))²) = M ((C - C )²) = M (0) = 0.

2) Постоянный множитель можно выносить за знак дисперсии, возведя его в квадрат:

D (CX ) = C ²D (X ). (7.9)

Доказательство. D (CX ) = M ((CX - M (CX ))²) = M ((CX - CM (X ))²) = M (C ²(X - M (X ))²) =

= C ²D (X ).

3) Дисперсия суммы двух независимых случайных величин равна сумме их дисперсий:

D (X + Y ) = D (X ) + D (Y ). (7.10)

Доказательство. D (X + Y ) = M (X ² + 2XY + Y ²) - (M (X ) + M (Y ))² = M (X ²) + 2M (X )M (Y ) +

+ M (Y ²) - M ²(X ) - 2M (X )M (Y ) - M ²(Y ) = (M (X ²) - M ²(X )) + (M (Y ²) - M ²(Y )) = D (X ) + D (Y ).

Следствие 1. Дисперсия суммы нескольких взаимно независимых случайных величин равна сумме их дисперсий.

Следствие 2. Дисперсия суммы постоянной и случайной величин равна дисперсии случайной величины.

4) Дисперсия разности двух независимых случайных величин равна сумме их дисперсий:

D (X - Y ) = D (X ) + D (Y ). (7.11)

Доказательство. D (X - Y ) = D (X ) + D (-Y ) = D (X ) + (-1)²D (Y ) = D (X ) + D (X ).

Дисперсия дает среднее значение квадрата отклонения случайной величины от среднего; для оценки самого отклонения служит величина, называемая средним квадратическим отклонением.

Определение 7.6. Средним квадратическим отклонением σ случайной величины Х называется квадратный корень из дисперсии:

Пример. В предыдущем примере средние квадратические отклонения Х и Y равны соответственно

Среди числовых характеристик случайных величин нужно, прежде всего, отметить те, которые характеризуют положение случайной величины на числовой оси, т.е. указывают некоторое среднее, ориентировочное значение, около которого группируются все возможные значения случайной величины.

Среднее значение случайной величины есть некоторое число, являющееся как бы её «представителем» и заменяющее её при грубо ориентировочных расчетах. Когда мы говорим: «среднее время работы лампы равно 100 часам» или «средняя точка попадания смещена относительно цели на 2 м вправо», мы этим указываем определенную числовую характеристику случайной величины, описывающую её местоположение на числовой оси, т.е. «характеристику положения».

Из характеристик положения в теории вероятностей важнейшую роль играет математическое ожидание случайной величины, которое иногда называют просто средним значением случайной величины.

Рассмотрим дискретную случайную величину , имеющую возможные значения с вероятностями . Нам требуется охарактеризовать каким-то числом положение значений случайной величины на оси абсцисс с учетом того, что эти значения имеют различные вероятности. Для этой цели естественно воспользоваться так называемым «средним взвешенным» из значений , причем каждое значение при осреднении должно учитываться с «весом», пропорциональным вероятности этого значения. Таким образом, мы вычислим среднее случайной величины , которое мы обозначим :

или, учитывая, что ,

. (5.6.1)

Это среднее взвешенное значение и называется математическим ожиданием случайной величины. Таким образом, мы ввели в рассмотрении одно из важнейших понятий теории вероятностей – понятие математического ожидания.

Математическим ожиданием случайной величины называется сумма произведений всех возможных значений случайной величины на вероятности этих значений.

Заметим, что в вышеприведенной формулировке определение математического ожидания справедливо, строго говоря, только для дискретных случайных величин; ниже будет дано обобщение этого понятия на случай непрерывных величин.

Для того, чтобы сделать понятие математического ожидания более наглядным, обратимся к механической интерпретации распределения дискретной случайной величины. Пусть на оси абсцисс расположены точки с абсциссами , в которых сосредоточены соответственно массы , причем . Тогда, очевидно, математическое ожидание , определяемое формулой (5.6.1), есть не что иное, как абсцисса центра тяжести данной системы материальных точек.

Математическое ожидание случайной величины связано своеобразной зависимостью со средним арифметическим наблюденных значений случайной величины при большом числе опытов. Эта зависимость того же типа, как зависимость между частотой и вероятностью, а именно: при большом числе опытов среднее арифметическое наблюденных значений случайной величины приближается (сходится по вероятности) к ее математическому ожиданию. Из наличия связи между частотой и вероятностью можно вывести как следствие наличие подобной же связи между средним арифметическим и математическим ожидание.

Действительно, рассмотрим дискретную случайную величину , характеризуемую рядом распределения:

где .

Пусть производится независимых опытов, в каждом из которых величина принимает определенное значение. Предположим, что значение появилось раз, значение появилось раз, вообще значение появилось раз. Очевидно,

Вычислим среднее арифметическое наблюденных значений величины , которое, в отличие от математического ожидания мы обозначим :

Но есть не что иное, как частота (или статистическая вероятность) события ; эту частоту можно обозначить . Тогда

т.е. среднее арифметическое наблюденных значений случайной величины равно сумме произведений всех возможных значений случайной величины на частоты этих значений.

При увеличении числа опытов частоты будут приближаться (сходиться по вероятности) к соответствующим вероятностям . Следовательно, и среднее арифметическое наблюденных значений случайной величины при увеличении числа опытов будет приближаться (сходится по вероятности) к её математическому ожиданию .

Сформулированная выше связь между средним арифметическим и математическим ожиданием составляет содержание одной из форм закона больших чисел. Строгое доказательство этого закона будет дано нами в главе 13.

Мы уже знаем, что все формы закона больших чисел констатируют факт устойчивости некоторых средних при большом числе опытов. Здесь речь идет об устойчивости среднего арифметического из ряда наблюдений одной и той же величины. При небольшом числе опытов среднее арифметическое их результатов случайно; при достаточном увеличении числа опытов оно становится «почти не случайным» и, стабилизируясь, приближается к постоянной величине – математическому ожиданию.

Свойство устойчивости средних при большом числе опытов легко проверить экспериментально. Например, взвешивая какое-либо тело в лаборатории на точных весах, мы в результате взвешивания получаем каждый раз новое значение; чтобы уменьшить ошибку наблюдения, мы взвешиваем тело несколько раз и пользуемся средним арифметическим полученных значений. Легко убедиться, что при дальнейшем увеличении числа опытов (взвешиваний) среднее арифметическое реагирует на это увеличение все меньше и меньше и при достаточно большом числе опытов практически перестает меняться.

Формула (5.6.1) для математического ожидания соответствует случаю дискретной случайной величины. Для непрерывной величины математическое ожидание, естественно, выражается уже не суммой, а интегралом:

, (5.6.2)

где - плотность распределения величины .

Формула (5.6.2) получается из формулы (5.6.1), если в ней заменить отдельные значения непрерывно изменяющимся параметром х, соответствующие вероятности - элементом вероятности , конечную сумму – интегралом. В дальнейшем мы часто будем пользоваться таким способом распространения формул, выведенных для прерывных величин, на случай непрерывных величин.

В механической интерпретации математическое ожидание непрерывной случайной величины сохраняет тот же смысл – абсцисса центра тяжести в случае, когда масса распределена по оси абсцисс непрерывно, с плотностью . Эта интерпретация часто позволяет найти математическое ожидание без вычисления интеграла (5.6.2), из простых механических соображений.

Выше мы ввели обозначение для математического ожидания величины . В ряде случаев, когда величина входит в формулы как определенное число, её удобнее обозначать одной буквой. В этих случаях мы будем обозначать математическое ожидание величины через :

Обозначения и для математического ожидания будут в дальнейшем применяться параллельно в зависимости от удобства той или иной записи формул. Условимся также в случае надобности сокращать слова «математическое ожидание» буквами м.о.

Следует заметить, что важнейшая характеристика положения – математическое ожидание – существует не для всех случайных величин. Можно составить примеры таких случайных величин, для которых математического ожидания не существует, так как соответствующая сумма или интеграл расходятся.

Рассмотрим, например, прерывную случайную величину с рядом распределения:

Нетрудно убедится в том, что , т.е. ряд распределения имеет смысл; однако сумма в данном случае расходится и, следовательно, математического ожидания величины не существует. Однако для практики такие случаи существенного интереса не представляют. Обычно случайные величины, с которыми мы имеем дело, имеют ограниченную область возможных значений и, безусловно, обладают математическим ожиданием.

Выше мы дали формулы (5.6.1) и (5.6.2), выражающие математическое ожидание соответственно для прерывной и непрерывной случайной величины .

Если величина принадлежит к величинам смешанного типа, то её математическое ожидание выражается формулой вида:

, (5.6.3)

где сумма распространяется на все точки , в которых функция распределения терпит разрыв, а интеграл – на все участки, на которых функция распределения непрерывна.

Кроме важнейшей из характеристик положения – математического ожидания, - на практике иногда применяются и другие характеристики положения, в частности, мода и медиана случайной величины.

Модой случайной величины называется её наиболее вероятное значение. Термин «наиболее вероятное значение», строго говоря, применим только к прерывным величинам; для непрерывной величины модой является то значение, в котором плотность вероятности максимальна. Условимся обозначать моду буквой . На рис. 5.6.1 и 5.6.2 показана мода соответственно для прерывной и непрерывной случайных величин.

Если многоугольник распределения (кривая распределения) имеет более одного максимума, распределение называется «полимодальным» (рис. 5.6.3 и 5.6.4).

Иногда встречаются распределения, обладающие посередине не максимумом, а минимумом (рис. 5.6.5 и 5.6.6). Такие распределения называют «антимодальными». Примером антимодального распределения может служить распределение, полученное в примере 5, n° 5.1.

В общем случае мода и математическое ожидание случайной величины не совпадают. В частном случае, когда распределение является симметричным и модальным (т.е. имеет моду) и существует математическое ожидание, то оно совпадает с модой и центром симметрии распределения.

Часто применяется еще одна характеристика положения – так называемая медиана случайной величины. Этой характеристикой пользуются обычно только для непрерывных случайных величин, хотя формально можно её определить и для прерывной величины.

Медианой случайной величины называется такое её значение , для которого

т.е. одинаково вероятно, окажется ли случайная величина меньше или больше . Геометрически медиана – это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам (рис. 5.6.7).

Теория вероятности - особый раздел математики, который изучают только студенты высших учебных заведений. Вы любите расчёты и формулы? Вас не пугают перспективы знакомства с нормальным распределением, энтропией ансамбля, математическим ожиданием и дисперсией дискретной случайной величины? Тогда этот предмет вам будет очень интересен. Давайте познакомимся с несколькими важнейшими базовыми понятиями этого раздела науки.

Вспомним основы

Даже если вы помните самые простые понятия теории вероятности, не пренебрегайте первыми абзацами статьи. Дело в том, что без четкого понимания основ вы не сможете работать с формулами, рассматриваемыми далее.

Итак, происходит некоторое случайное событие, некий эксперимент. В результате производимых действий мы можем получить несколько исходов - одни из них встречаются чаще, другие - реже. Вероятность события - это отношение количества реально полученных исходов одного типа к общему числу возможных. Только зная классическое определение данного понятия, вы сможете приступить к изучению математического ожидания и дисперсии непрерывных случайных величин.

Среднее арифметическое

Ещё в школе на уроках математики вы начинали работать со средним арифметическим. Это понятие широко используется в теории вероятности, и потому его нельзя обойти стороной. Главным для нас на данный момент является то, что мы столкнемся с ним в формулах математического ожидания и дисперсии случайной величины.

Мы имеем последовательность чисел и хотим найти среднее арифметическое. Всё, что от нас требуется - просуммировать всё имеющееся и разделить на количество элементов в последовательности. Пусть мы имеем числа от 1 до 9. Сумма элементов будет равна 45, и это значение мы разделим на 9. Ответ: - 5.

Дисперсия

Говоря научным языком, дисперсия - это средний квадрат отклонений полученных значений признака от среднего арифметического. Обозначается одна заглавной латинской буквой D. Что нужно, чтобы её рассчитать? Для каждого элемента последовательности посчитаем разность между имеющимся числом и средним арифметическим и возведем в квадрат. Значений получится ровно столько, сколько может быть исходов у рассматриваемого нами события. Далее мы суммируем всё полученное и делим на количество элементов в последовательности. Если у нас возможны пять исходов, то делим на пять.

У дисперсии есть и свойства, которые нужно запомнить, чтобы применять при решении задач. Например, при увеличении случайной величины в X раз, дисперсия увеличивается в X в квадрате раз (т. е. X*X). Она никогда не бывает меньше нуля и не зависит от сдвига значений на равное значение в большую или меньшую сторону. Кроме того, для независимых испытаний дисперсия суммы равна сумме дисперсий.

Теперь нам обязательно нужно рассмотреть примеры дисперсии дискретной случайной величины и математического ожидания.

Предположим, что мы провели 21 эксперимент и получили 7 различных исходов. Каждый из них мы наблюдали, соответственно, 1,2,2,3,4,4 и 5 раз. Чему будет равна дисперсия?

Сначала посчитаем среднее арифметическое: сумма элементов, разумеется, равна 21. Делим её на 7, получая 3. Теперь из каждого числа исходной последовательности вычтем 3, каждое значение возведем в квадрат, а результаты сложим вместе. Получится 12. Теперь нам остается разделить число на количество элементов, и, казалось бы, всё. Но есть загвоздка! Давайте её обсудим.

Зависимость от количества экспериментов

Оказывается, при расчёте дисперсии в знаменателе может стоять одно из двух чисел: либо N, либо N-1. Здесь N - это число проведенных экспериментов или число элементов в последовательности (что, по сути, одно и то же). От чего это зависит?

Если количество испытаний измеряется сотнями, то мы должны ставить в знаменатель N. Если единицами, то N-1. Границу ученые решили провести достаточно символически: на сегодняшний день она проходит по цифре 30. Если экспериментов мы провели менее 30, то делить сумму будем на N-1, а если более - то на N.

Задача

Давайте вернемся к нашему примеру решения задачи на дисперсию и математическое ожидание. Мы получили промежуточное число 12, которое нужно было разделить на N или N-1. Поскольку экспериментов мы провели 21, что меньше 30, выберем второй вариант. Итак, ответ: дисперсия равна 12 / 2 = 2.

Математическое ожидание

Перейдем ко второму понятию, которое мы обязательно должны рассмотреть данной статье. Математическое ожидание - это результат сложения всех возможных исходов, помноженных на соответствующие вероятности. Важно понимать, что полученное значение, как и результат расчёта дисперсии, получается всего один раз для целой задачи, сколько бы исходов в ней не рассматривалось.

Формула математического ожидания достаточно проста: берем исход, умножаем на его вероятность, прибавляем то же самое для второго, третьего результата и т. д. Всё, связанное с этим понятием, рассчитывается несложно. Например, сумма матожиданий равна матожиданию суммы. Для произведения актуально то же самое. Такие простые операции позволяет с собой выполнять далеко не каждая величина в теории вероятности. Давайте возьмем задачу и посчитаем значение сразу двух изученных нами понятий. Кроме того, мы отвлекались на теорию - пришло время попрактиковаться.

Ещё один пример

Мы провели 50 испытаний и получили 10 видов исходов - цифры от 0 до 9 - появляющихся в различном процентном отношении. Это, соответственно: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18%. Напомним, что для получения вероятностей требуется разделить значения в процентах на 100. Таким образом, получим 0,02; 0,1 и т.д. Представим для дисперсии случайной величины и математического ожидания пример решения задачи.

Среднее арифметическое рассчитаем по формуле, которую помним с младшей школы: 50/10 = 5.

Теперь переведем вероятности в количество исходов «в штуках», чтобы было удобнее считать. Получим 1, 5, 2, 7, 1, 9, 3, 8, 5 и 9. Из каждого полученного значения вычтем среднее арифметическое, после чего каждый из полученных результатов возведем в квадрат. Посмотрите, как это сделать, на примере первого элемента: 1 - 5 = (-4). Далее: (-4) * (-4) = 16. Для остальных значений проделайте эти операции самостоятельно. Если вы всё сделали правильно, то после сложения всех вы получите 90.

Продолжим расчёт дисперсии и математического ожидания, разделив 90 на N. Почему мы выбираем N, а не N-1? Правильно, потому что количество проведенных экспериментов превышает 30. Итак: 90/10 = 9. Дисперсию мы получили. Если у вас вышло другое число, не отчаивайтесь. Скорее всего, вы допустили банальную ошибку при расчётах. Перепроверьте написанное, и наверняка всё встанет на свои места.

Наконец, вспомним формулу математического ожидания. Не будем приводить всех расчётов, напишем лишь ответ, с которым вы сможете свериться, закончив все требуемые процедуры. Матожидание будет равно 5,48. Напомним лишь, как осуществлять операции, на примере первых элементов: 0*0,02 + 1*0,1… и так далее. Как видите, мы просто умножаем значение исхода на его вероятность.

Отклонение

Ещё одно понятие, тесно связанное с дисперсией и математическим ожиданием - среднее квадратичное отклонение. Обозначается оно либо латинскими буквами sd, либо греческой строчной «сигмой». Данное понятие показывает, насколько в среднем отклоняются значения от центрального признака. Чтобы найти её значение, требуется рассчитать квадратный корень из дисперсии.

Если вы построите график нормального распределения и захотите увидеть непосредственно на нём квадратичного отклонения, это можно сделать в несколько этапов. Возьмите половину изображения слева или справа от моды (центрального значения), проведите перпендикуляр к горизонтальной оси так, чтобы площади получившихся фигур были равны. Величина отрезка между серединой распределения и получившейся проекцией на горизонтальную ось и будет представлять собой среднее квадратичное отклонение.

Программное обеспечение

Как видно из описаний формул и представленных примеров, расчеты дисперсии и математического ожидания - не самая простая процедура с арифметической точки зрения. Чтобы не тратить время, имеет смысл воспользоваться программой, используемой в высших учебных заведениях - она называется «R». В ней есть функции, позволяющие рассчитывать значения для многих понятий из статистики и теории вероятности.

Например, вы задаете вектор значений. Делается это следующим образом: vector <-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

В заключение

Дисперсия и математическое ожидание - это без которых сложно в дальнейшем что-либо рассчитать. В основном курсе лекций в вузах они рассматриваются уже в первые месяцы изучения предмета. Именно из-за непонимания этих простейших понятий и неумения их рассчитать многие студенты сразу начинают отставать по программе и позже получают плохие отметки по результатам сессии, что лишает их стипендии.

Потренируйтесь хотя бы одну неделю по полчаса в день, решая задания, схожие с представленными в данной статье. Тогда на любой контрольной по теории вероятности вы справитесь с примерами без посторонних подсказок и шпаргалок.

Как уже известно, закон распределения полностью характеризует случайную величину. Однако часто закон распределения неизвестен и приходится ограничиваться меньшими сведениями. Иногда даже выгоднее пользоваться числами, которые описывают случайную величину суммарно; такие числа называют числовыми характеристиками случайной величины. К числу важных числовых характеристик относится математическое ожидание.

Математическое ожидание, как будет показано далее, приближенно равно среднему значению случайной величины. Для решения многих задач достаточно знать математическое ожидание. Например, если известно, что математическое ожидание числа выбиваемых очков у первого стрелка больше, чем у второго, то первый стрелок в среднем выбивает больше очков, чем второй, и, следовательно, стреляет лучше второго. Хотя математическое ожидание дает о случайной величине значительно меньше сведений, чем закон ее распределения, но для решения задач, подобных приведенной и многих других, знание математического ожидания оказывается достаточным.

§ 2. Математическое ожидание дискретной случайной величины

Математическим ожиданием дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности.

Пусть случайная величина X может принимать только значения х 1 , х 2 , ..., х п , вероятности которых соответственно равны р 1 , р 2 , . . ., р п . Тогда математическое ожидание М (X ) случайной величины X определяется равенством

М (X ) = х 1 р 1 + х 2 р 2 + … + x n p n .

Если дискретная случайная величина X принимает счетное множество возможных значений, то

М (Х )=

причем математическое ожидание существует, если ряд в правой части равенства сходится абсолютно.

Замечание. Из определения следует, что математическое ожидание дискретной случайной величины есть неслучайная (постоянная) величина. Рекомендуем запомнить это утверждение, так как далее оно используется многократно. В дальнейшем будет показано, что математическое ожидание непрерывной случайной величины также есть постоянная величина.

Пример 1. Найти математическое ожидание случайной величины X , зная закон ее распределения:

Решение. Искомое математическое ожидание равно сумме произведений всех возможных значений случайной величины на их вероятности:

M (X )= 3* 0, 1+ 5* 0, 6+ 2* 0, 3= 3, 9.

Пример 2. Найти математическое ожидание числа появлений события А в одном испытании, если вероятность события А равна р.

Решение. Случайная величина X - число появлений события А в одном испытании - может принимать только два значения: х 1 = 1 (событие А наступило) с вероятностью р и х 2 = 0 (событие А не наступило) с вероятностью q = 1 -р. Искомое математическое ожидание

M (X )= 1* p + 0* q = p

Итак, математическое ожидание числа появлений события в одном испытании равно вероятности этого события. Этот результат будет использован ниже.

§ 3. Вероятностный смысл математического ожидания

Пусть произведено п испытаний, в которых случайная величина X приняла т 1 раз значение х 1 , т 2 раз значение х 2 ,...,m k раз значение x k , причем т 1 + т 2 + …+т к = п. Тогда сумма всех значений, принятых X , равна

х 1 т 1 + х 2 т 2 + ... + х к т к .

Найдем среднее арифметическое всех значений, принятых, случайной величиной, для чего разделим найденную сумму на общее число испытаний:

= (х 1 т 1 + х 2 т 2 + ... + х к т к )/п,

= х 1 (m 1 / n ) + х 2 (m 2 / n ) + ... + х к (т к /п ). (*)

Заметив, что отношение m 1 / n - относительная частота W 1 значения х 1 , m 2 / n - относительная частота W 2 значения х 2 и т. д., запишем соотношение (*) так:

= х 1 W 1 + x 2 W 2 + .. . + х к W k . (**)

Допустим, что число испытаний достаточно велико. Тогда относительная частота приближенно равна вероятности появления события (это будет доказано в гл. IX, § 6):

W 1 p 1 , W 2 p 2 , …, W k p k .

Заменив в соотношении (**) относительные частоты соответствующими вероятностями, получим

x 1 p 1 + х 2 р 2 + … + х к р к .

Правая часть этого приближенного равенства есть М (X ). Итак,

М (X ).

Вероятностный смысл полученного результата таков: математическое ожидание приближенно равно (тем точнее, чем больше число испытаний) среднему арифметическому наблюдаемых значений случайной величины.

Замечание 1. Легко сообразить, что математическое ожидание больше наименьшего и меньше наибольшего возможных значений. Другими словами, на числовой оси возможные значения расположены слева и справа от математического ожидания. В этом смысле математическое ожидание характеризует расположение распределения и поэтому его часто называют центром распределения.

Этот термин заимствован из механики: если массы р 1 , р 2 , ..., р п расположены в точках с абсциссами x 1 , х 2 , ..., х n , причем
то абсцисса центра тяжести

x c =
.

Учитывая, что
= M (X ) и
получим М (Х ) = х с .

Итак, математическое ожидание есть абсцисса центра тяжести системы материальных точек, абсциссы которых равны возможным значениям случайной величины, а массы - их вероятностям.

Замечание 2. Происхождение термина «математическое ожидание» связано с начальным периодом возникновения теории вероятностей (XVI - XVII вв.), когда область ее применения ограничивалась азартными играми. Игрока интересовало среднее значение ожидаемого выигрыша, или, иными словами, математическое ожидание выигрыша.