Мода и медиана случайной величины. Числовые характеристики случайных величин

Кроме математического ожидания и дисперсии, в теории вероятностей применяется еще ряд числовых характеристик, отражающих те или иные черты распределения.

Определение. Модой Мо(Х) случайной величины X называется ее наиболее вероятное значение (для которого вероятность р г или плотность вероятности

Если вероятность или плотность вероятности достигает максимума не в одной, а в нескольких точках, распределение называется полимодальным (рис. 3.13).

Мода Мо(Х), при которой вероятность р { или плотность вероятности (р(х) достигает глобального максимума, называется наивероятнейшим значением случайной величины (на рис. 3.13 это Мо(Х) 2).

Определение. Медианой Ме(Х) непрерывной случайной величины X называется такое ее значение , для которого

т.е. вероятность того, что случайная величина X примет значение, меньшее медианы Ме(Х) или большее ее, одна и та же и равна 1/2. Геометрически вертикальная прямая х = Ме(Х ), проходящая через точку с абсциссой, равной Ме(Х ), делит площадь фигуры иод кривой распределения на две равные части (рис. 3.14). Очевидно, что в точке х = Ме(Х) функция распределения равна 1/2, т.е. Р(Ме(Х)) = 1/2 (рис. 3.15).

Отметим важное свойство медианы случайной величины: математическое ожидание абсолютной величины отклонения случайной величины X от постоянной величины С минимально тогда , когда эта постоянная С равна медиане Ме(Х) = т , т.е.

(свойство аналогично свойству (3.10") минимальности среднего квадрата отклонения случайной величины от ее математического ожидания).

О Пример 3.15. Найти моду, медиану и математическое ожидание случайной величины X с плотностью вероятности ф(х) = 3х 2 при хе.

Решение. Кривая распределения представлена на рис. 3.16. Очевидно, что плотность вероятности ф(х) максимальна при х = Мо(Х) = 1.

Медиану Ме(Х) = Ь найдем из условия (3.28):

откуда

Математическое ожидание вычислим по формуле (3.25):

Взаимное расположение точек М(Х)> Ме(Х) и Мо(Х) в порядке возрастания абсцисс показано на рис. 3.16. ?

Наряду с отмеченными выше числовыми характеристиками для описания случайной величины используется понятие квантилей и процентных точек.

Определение. Квантилем уровня у-квантилем)

называется такое значение х ц случайной величины , при котором функция ее распределения принимает значение, равное д, т.е.

Некоторые квантили получили особое название. Очевидно, что введенная выше медиана случайной величины есть квантиль уровня 0,5, т.е. Ме(Х) = х 05 . Квантили дг 0 2 5 и х 075 получили название соответственно нижнего и верхнего квартилейК

С понятием квантиля тесно связано понятие процентной точки. Под ЮОуХо-ной точкой подразумевается квантиль х х ({ , т.е. такое значение случайной величины X, при котором

0 Пример 3.16. По данным примера 3.15 найти квантиль х 03 и 30%-ную точку случайной величины X.

Решение. По формуле (3.23) функция распределения

Квантиль.г 0 з найдем из уравнения (3.29), т.е. х$ 3 =0,3, откуда Л"оз -0,67. Найдем 30%-ную точку случайной величины X, или квантиль х 0 7 , из уравнения х$ 7 = 0,7, откуда х 0 7 «0,89. ?

Среди числовых характеристик случайной величины особое значение имеют м о м е н т ы - начальные и центральные.

Определение. Начальным моментом к-го порядка случайной величины X называется математическое ожидание к-й степени этой величины :

Определение. Центральным моментом к-го порядка случайной величины X называется математическое ожидание к-й степени отклонения случайной величины X от ее математического ожидания :

Формулы для вычисления моментов для дискретных случайных величин (принимающих значения х 1 с вероятностями р,) и непрерывных (с плотностью вероятности ср(х)) приведены в табл. 3.1.

Таблица 3.1

Нетрудно заметить, что при к = 1 первый начальный момент случайной величины X есть ее математическое ожидание, т.е. ч х = М[Х) = а, при к = 2 второй центральный момент - дисперсия, т.е. р 2 = Т)(Х).

Центральные моменты р А могут быть выражены через начальные моменты но формулам:

и т.д.

Например, ц 3 = М(Х-а)* = М(Х*-ЗаХ 2 +За 2 Х-а->) = М(Х*)~ -ЗаМ{Х 2)+За 2 М(Х)~ а 3 = у 3 -Зу^ + Зу(у, -у^ = у 3 - Зу^ + 2у^ (при выводе учли, что а = М(Х) = V, - неслучайная величина). ?

Выше отмечено, что математическое ожидание М(Х), или первый начальный момент, характеризует среднее значение или положение, центр распределения случайной величины X на числовой оси; дисперсия О(Х), или второй центральный момент р 2 , - с т с - пень рассеяния распределения X относительно М(Х). Для более подробного описания распределения служат моменты высших порядков.

Третий центральный момент р 3 служит для характеристики а с и м - м е т р и и (скошенности) распределения. Он имеет размерность куба случайной величины. Чтобы получить безразмерную величину, ее делят на о 3 , где а - среднее квадратическое отклонение случайной величины X. Полученная величина А называется коэффициентом асимметрии случайной величины.

Если распределение симметрично относительно математического ожидания, то коэффициент асимметрии Л = 0.

На рис. 3.17 показаны две кривые распределения: I и II. Кривая I имеет положительную (правостороннюю) асимметрию (Л > 0), а кривая II - отрицательную (левостороннюю) (Л


Четвертый центральный момент р 4 служит для характеристики к р у - тост и (о с т р о в е р ш и н н о с т и или п л о с к о в е р ш и н - пости) распределения.

Среди числовых характеристик случайных величин нужно, прежде всего, отметить те, которые характеризуют положение случайной величины на числовой оси, т.е. указывают некоторое среднее, ориентировочное значение, около которого группируются все возможные значения случайной величины.

Среднее значение случайной величины есть некоторое число, являющееся как бы её «представителем» и заменяющее её при грубо ориентировочных расчетах. Когда мы говорим: «среднее время работы лампы равно 100 часам» или «средняя точка попадания смещена относительно цели на 2 м вправо», мы этим указываем определенную числовую характеристику случайной величины, описывающую её местоположение на числовой оси, т.е. «характеристику положения».

Из характеристик положения в теории вероятностей важнейшую роль играет математическое ожидание случайной величины, которое иногда называют просто средним значением случайной величины.

Рассмотрим дискретную случайную величину , имеющую возможные значения с вероятностями . Нам требуется охарактеризовать каким-то числом положение значений случайной величины на оси абсцисс с учетом того, что эти значения имеют различные вероятности. Для этой цели естественно воспользоваться так называемым «средним взвешенным» из значений , причем каждое значение при осреднении должно учитываться с «весом», пропорциональным вероятности этого значения. Таким образом, мы вычислим среднее случайной величины , которое мы обозначим :

или, учитывая, что ,

. (5.6.1)

Это среднее взвешенное значение и называется математическим ожиданием случайной величины. Таким образом, мы ввели в рассмотрении одно из важнейших понятий теории вероятностей – понятие математического ожидания.

Математическим ожиданием случайной величины называется сумма произведений всех возможных значений случайной величины на вероятности этих значений.

Заметим, что в вышеприведенной формулировке определение математического ожидания справедливо, строго говоря, только для дискретных случайных величин; ниже будет дано обобщение этого понятия на случай непрерывных величин.

Для того, чтобы сделать понятие математического ожидания более наглядным, обратимся к механической интерпретации распределения дискретной случайной величины. Пусть на оси абсцисс расположены точки с абсциссами , в которых сосредоточены соответственно массы , причем . Тогда, очевидно, математическое ожидание , определяемое формулой (5.6.1), есть не что иное, как абсцисса центра тяжести данной системы материальных точек.

Математическое ожидание случайной величины связано своеобразной зависимостью со средним арифметическим наблюденных значений случайной величины при большом числе опытов. Эта зависимость того же типа, как зависимость между частотой и вероятностью, а именно: при большом числе опытов среднее арифметическое наблюденных значений случайной величины приближается (сходится по вероятности) к ее математическому ожиданию. Из наличия связи между частотой и вероятностью можно вывести как следствие наличие подобной же связи между средним арифметическим и математическим ожидание.

Действительно, рассмотрим дискретную случайную величину , характеризуемую рядом распределения:

где .

Пусть производится независимых опытов, в каждом из которых величина принимает определенное значение. Предположим, что значение появилось раз, значение появилось раз, вообще значение появилось раз. Очевидно,

Вычислим среднее арифметическое наблюденных значений величины , которое, в отличие от математического ожидания мы обозначим :

Но есть не что иное, как частота (или статистическая вероятность) события ; эту частоту можно обозначить . Тогда

,

т.е. среднее арифметическое наблюденных значений случайной величины равно сумме произведений всех возможных значений случайной величины на частоты этих значений.

При увеличении числа опытов частоты будут приближаться (сходиться по вероятности) к соответствующим вероятностям . Следовательно, и среднее арифметическое наблюденных значений случайной величины при увеличении числа опытов будет приближаться (сходится по вероятности) к её математическому ожиданию .

Сформулированная выше связь между средним арифметическим и математическим ожиданием составляет содержание одной из форм закона больших чисел. Строгое доказательство этого закона будет дано нами в главе 13.

Мы уже знаем, что все формы закона больших чисел констатируют факт устойчивости некоторых средних при большом числе опытов. Здесь речь идет об устойчивости среднего арифметического из ряда наблюдений одной и той же величины. При небольшом числе опытов среднее арифметическое их результатов случайно; при достаточном увеличении числа опытов оно становится «почти не случайным» и, стабилизируясь, приближается к постоянной величине – математическому ожиданию.

Свойство устойчивости средних при большом числе опытов легко проверить экспериментально. Например, взвешивая какое-либо тело в лаборатории на точных весах, мы в результате взвешивания получаем каждый раз новое значение; чтобы уменьшить ошибку наблюдения, мы взвешиваем тело несколько раз и пользуемся средним арифметическим полученных значений. Легко убедиться, что при дальнейшем увеличении числа опытов (взвешиваний) среднее арифметическое реагирует на это увеличение все меньше и меньше и при достаточно большом числе опытов практически перестает меняться.

Формула (5.6.1) для математического ожидания соответствует случаю дискретной случайной величины. Для непрерывной величины математическое ожидание, естественно, выражается уже не суммой, а интегралом:

, (5.6.2)

где - плотность распределения величины .

Формула (5.6.2) получается из формулы (5.6.1), если в ней заменить отдельные значения непрерывно изменяющимся параметром х, соответствующие вероятности - элементом вероятности , конечную сумму – интегралом. В дальнейшем мы часто будем пользоваться таким способом распространения формул, выведенных для прерывных величин, на случай непрерывных величин.

В механической интерпретации математическое ожидание непрерывной случайной величины сохраняет тот же смысл – абсцисса центра тяжести в случае, когда масса распределена по оси абсцисс непрерывно, с плотностью . Эта интерпретация часто позволяет найти математическое ожидание без вычисления интеграла (5.6.2), из простых механических соображений.

Выше мы ввели обозначение для математического ожидания величины . В ряде случаев, когда величина входит в формулы как определенное число, её удобнее обозначать одной буквой. В этих случаях мы будем обозначать математическое ожидание величины через :

Обозначения и для математического ожидания будут в дальнейшем применяться параллельно в зависимости от удобства той или иной записи формул. Условимся также в случае надобности сокращать слова «математическое ожидание» буквами м.о.

Следует заметить, что важнейшая характеристика положения – математическое ожидание – существует не для всех случайных величин. Можно составить примеры таких случайных величин, для которых математического ожидания не существует, так как соответствующая сумма или интеграл расходятся.

Рассмотрим, например, прерывную случайную величину с рядом распределения:

Нетрудно убедится в том, что , т.е. ряд распределения имеет смысл; однако сумма в данном случае расходится и, следовательно, математического ожидания величины не существует. Однако для практики такие случаи существенного интереса не представляют. Обычно случайные величины, с которыми мы имеем дело, имеют ограниченную область возможных значений и, безусловно, обладают математическим ожиданием.

Выше мы дали формулы (5.6.1) и (5.6.2), выражающие математическое ожидание соответственно для прерывной и непрерывной случайной величины .

Если величина принадлежит к величинам смешанного типа, то её математическое ожидание выражается формулой вида:

, (5.6.3)

где сумма распространяется на все точки , в которых функция распределения терпит разрыв, а интеграл – на все участки, на которых функция распределения непрерывна.

Кроме важнейшей из характеристик положения – математического ожидания, - на практике иногда применяются и другие характеристики положения, в частности, мода и медиана случайной величины.

Модой случайной величины называется её наиболее вероятное значение. Термин «наиболее вероятное значение», строго говоря, применим только к прерывным величинам; для непрерывной величины модой является то значение, в котором плотность вероятности максимальна. Условимся обозначать моду буквой . На рис. 5.6.1 и 5.6.2 показана мода соответственно для прерывной и непрерывной случайных величин.

Если многоугольник распределения (кривая распределения) имеет более одного максимума, распределение называется «полимодальным» (рис. 5.6.3 и 5.6.4).

Иногда встречаются распределения, обладающие посередине не максимумом, а минимумом (рис. 5.6.5 и 5.6.6). Такие распределения называют «антимодальными». Примером антимодального распределения может служить распределение, полученное в примере 5, n° 5.1.

В общем случае мода и математическое ожидание случайной величины не совпадают. В частном случае, когда распределение является симметричным и модальным (т.е. имеет моду) и существует математическое ожидание, то оно совпадает с модой и центром симметрии распределения.

Часто применяется еще одна характеристика положения – так называемая медиана случайной величины. Этой характеристикой пользуются обычно только для непрерывных случайных величин, хотя формально можно её определить и для прерывной величины.

Медианой случайной величины называется такое её значение , для которого

т.е. одинаково вероятно, окажется ли случайная величина меньше или больше . Геометрически медиана – это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам (рис. 5.6.7).

Математическое ожидание. Математическим ожиданием дискретной случайной величины Х , принимающей конечное число значений х i с вероятностями р i , называется сумма:

Математическим ожиданием непрерывной случайной величины Х называется интеграл от произведения ее значений х на плотность распределения вероятностей f (x ):

(6б )

Несобственный интеграл (6б ) предполагается абсолютно сходящимся (в противном случае говорят, что математическое ожидание М (Х ) не существует). Математическое ожидание характеризует среднее значение случайной величины Х . Его размерность совпадает с размерностью случайной величины.

Свойства математического ожидания:

Дисперсия. Дисперсией случайной величины Х называется число:

Дисперсия является характеристикой рассеяния значений случайной величины Х относительно ее среднего значения М (Х ). Размерность дисперсии равна размерности случайной величины в квадрате. Исходя из определений дисперсии (8) и математического ожидания (5) для дискретной случайной величины и (6) для непрерывной случайной величины получим аналогичные выражения для дисперсии:

(9)

Здесь m = М (Х ).

Свойства дисперсии:

Среднее квадратичное отклонение:

(11)

Так как размерность среднего квадратичного отклонения та же, что и у случайной величины, оно чаще, чем дисперсия, используется как мера рассеяния.

Моменты распределения. Понятия математического ожидания и дисперсии являются частными случаями более общего понятия для числовых характеристик случайных величин – моментов распределения . Моменты распределения случайной величины вводятся как математические ожидания некоторых простейших функций от случайной величины. Так, моментом порядка k относительно точки х 0 называется математическое ожидание М (Х х 0 )k . Моменты относительно начала координат х = 0 называются начальными моментами и обозначаются:

(12)

Начальный момент первого порядка есть центр распределения рассматриваемой случайной величины:

(13)

Моменты относительно центра распределения х = m называются центральными моментами и обозначаются:

(14)

Из (7) следует, что центральный момент первого порядка всегда равен нулю:

Центральные моменты не зависят от начала отсчета значений случайной величины, так как при сдвиге на постоянное значение С ее центр распределения сдвигается на то же значение С , а отклонение от центра не меняется: Х m = (Х С ) – (m С ).
Теперь очевидно, что дисперсия – это центральный момент второго порядка :

Асимметрия. Центральный момент третьего порядка:

(17)

служит для оценки асимметрии распределения . Если распределение симметрично относительно точки х = m , то центральный момент третьего порядка будет равен нулю (как и все центральные моменты нечетных порядков). Поэтому, если центральный момент третьего порядка отличен от нуля, то распределение не может быть симметричным. Величину асимметрии оценивают с помощью безразмерного коэффициента асимметрии :

(18)

Знак коэффициента асимметрии (18) указывает на правостороннюю или левостороннюю асимметрию (рис. 2).


Рис. 2. Виды асимметрии распределений.

Эксцесс. Центральный момент четвертого порядка:

(19)

служит для оценки так называемого эксцесса , определяющего степень крутости (островершинности) кривой распределения вблизи центра распределения по отношению к кривой нормального распределения. Так как для нормального распределения, то в качестве эксцесса принимается величина:

(20)

На рис. 3 приведены примеры кривых распределения с различными значениями эксцесса. Для нормального распределения Е = 0. Кривые, более островершинные, чем нормальная, имеют положительный эксцесс, более плосковершинные – отрицательный.


Рис. 3. Кривые распределения с различной степенью крутости (эксцессом).

Моменты более высоких порядков в инженерных приложениях математической статистики обычно не применяются.

Мода дискретной случайной величины – это ее наиболее вероятное значение. Модой непрерывной случайной величиныназывается ее значение, при котором плотность вероятности максимальна (рис. 2). Если кривая распределения имеет один максимум, то распределение называется унимодальным . Если кривая распределения имеет более одного максимума, то распределение называется полимодальным . Иногда встречаются распределения, кривые которых имеют не максимум, а минимум. Такие распределения называются антимодальными . В общем случае мода и математическое ожидание случайной величины не совпадают. В частном случае, для модального , т.е. имеющего моду, симметричного распределения и при условии, что существует математическое ожидание, последнее совпадает с модой и центром симметрии распределения.

Медиана случайной величины Х – это ее значение Ме , для которого имеет место равенство: т.е. равновероятно, что случайная величина Х окажется меньше или больше Ме . Геометрически медиана – это абсцисса точки, в которой площадь под кривой распределения делится пополам (рис. 2). В случае симметричного модального распределения медиана, мода и математическое ожидание совпадают.