Распределение пуассона примеры. Распределение Пуассона

Где λ равна среднему числу появления событий в одинаковых независимых испытаниях, т.е. λ = n × p, где p – вероятность события при одном испытании, e = 2,71828 .

Ряд распределения закона Пуассона имеет вид:

Назначение сервиса . Онлайн-калькулятор используется для построения Пуассоновского распределения и вычисления всех характеристик ряда: математического ожидания, дисперсии и среднеквадратического отклонения. Отчет с решением оформляется в формате Word . В случае, когда n велико, а λ = p·n > 10 формула Пуассона дает очень грубое приближение и для расчета P n (m) используют локальную и интегральную теоремы Муавра-Лапласа .

Числовые характеристики случайной величины Х

Математическое ожидание распределения Пуассона
M[X] = λ

Дисперсия распределения Пуассона
D[X] = λ

Пример №1 . Семена содержат 0.1% сорняков. Какова вероятность при случайном отборе 2000 семян обнаружить 5 семян сорняков?
Решение.
Вероятность р мала, а число n велико. np = 2 P(5) = λ 5 e -5 /5! = 0.03609
Математическое ожидание : M[X] = λ = 2
Дисперсия : D[X] = λ = 2

Пример №2 . Среди семян ржи имеется 0.4% семян сорняков. Составить закон распределения числа сорняков при случайном отборе 5000 семян. Найти математическое ожидание и дисперсию этой случайной величины.
Решение. Математическое ожидание: M[X] = λ = 0.004*5000 = 20. Дисперсия: D[X] = λ = 20
Закон распределения:

X	0	1	2	…	m	…
P	e -20	20e -20	200e -20	…	20 m e -20 /m!	…

Пример №3 . На телефонной станции неправильное соединение происходит с вероятностью 1/200. Найдите вероятность того, что среди 200 соединений произойдет:
а) ровно одно неправильное соединение;
б) меньше чем три неправильных соединения;
в) больше чем два неправильных соединения.
Решение. По условию задачи вероятность события мала, поэтому используем формулу Пуассона (15).
а) Задано: n = 200, p = 1/200, k = 1. Найдем P 200 (1).
Получаем: . Тогда P 200 (1) ≈ e -1 ≈ 0,3679.
б) Задано: n = 200, p = 1/200, k < 3. Найдем P 200 (k < 3).
Имеем: a = 1.

в) Задано: n = 200, p = 1/200, k > 2. Найдем P 200 (k > 2).
Эту задачу можно решить проще: найти вероятность противоположного события, так как в этом случае нужно вычислить меньше слагаемых. Принимая во внимание предыдущий случай, имеем

Рассмотрим случай, когда n является достаточно большим, а p - достаточно малым; положим np = a, где a - некоторое число. В этом случае искомая вероятность определяется формулой Пуассона:

Вероятность появления k событий за время длительностью t можно также найти по формуле Пуассона:
где λ - интенсивность потока событий, то есть среднее число событий, которые появляются в единицу времени.

Пример №4 . Вероятность того, что деталь бракованная, равна 0.005. проверяется 400 деталей. Укажите формулу вычисления вероятности того, что больше 3 деталей оказались с браком.

Пример №5 . Вероятность появления бракованных деталей при их массовом производстве равна p. определить вероятность того, что в партии из N деталей содержится а) ровно три детали; б) не более трех бракованных деталей.
p=0,001; N = 4500
Решение.
Вероятность р мала, а число n велико. np = 4.5 < 10. Значит случайная величина Х – распределена по Пуассоновскому распределению. Составим закон.
Случайная величина X имеет область значений (0,1,2,...,m). Вероятности этих значений можно найти по формуле:

Найдем ряд распределения X.
Здесь λ = np = 4500*0.001 = 4.5
P(0) = e - λ = e -4.5 = 0.01111
P(1) = λe -λ = 4.5e -4.5 = 0.04999

Тогда вероятность того, что в партии из N деталей содержится ровно три детали, равна:

Тогда вероятность того, что в партии из N деталей содержится не более трех бракованных деталей:
P(x<3) = P(0) + P(1) + P(2) = 0,01111 + 0,04999 + 0,1125 = 0,1736

Пример №6 . Автоматическая телефонная станция получает в среднем за час N вызовов. Определить вероятность того, что за данную минуту она получит: а) ровно два вызова; б) более двух вызовов.
N = 18
Решение.
За одну минуту АТС в среднем получает λ = 18/60 мин. = 0,3
Считая, что случайное число X вызовов, поступивших на АТС за одну минуту,
подчиняется закону Пуассона, по формуле найдем искомую вероятность

Найдем ряд распределения X.
Здесь λ = 0.3
P(0) = e - λ = e -0.3 = 0.7408
P(1) = λe -λ = 0.3e -0.3 = 0.2222

Вероятность того, что за данную минуту она получит ровно два вызова:
P(2) = 0,03334
Вероятность того, что за данную минуту она получит более двух вызовов:
P(x>2) = 1 – 0,7408 – 0,2222 – 0,03334 = 0,00366

Пример №7 . Рассматриваются два элемента, работающих независимо друг от друга. Продолжительность времени безотказной работы имеет показательное распределение с параметром λ1 = 0,02 для первого элемента и λ2 = 0,05 для второго элемента. Найти вероятность того, что за 10 часов: а) оба элемента будут работать безотказно; б) только Вероятность того, что за 10 часов элемент №1 не выйдет из строя:
Рещение.
P 1 (0) = e -λ1*t = e -0.02*10 = 0,8187

Вероятность того, что за 10 часов элемент №2 не выйдет из строя:
P 2 (0) = e -λ2*t = e -0.05*10 = 0,6065

а) оба элемента будут работать безотказно;
P(2) = P 1 (0)*P 2 (0) = 0,8187*0,6065 = 0,4966
б) только один элемент выйдет из строя.
P(1) = P 1 (0)*(1-P 2 (0)) + (1-P 1 (0))*P 2 (0) = 0.8187*(1-0.6065) + (1-0.8187)*0.6065 = 0.4321

Пример №7 . Производство даёт 1% брака. Какова вероятность того, что из взятых на исследование 1100 изделий выбраковано будет не больше 17?
Примечание : поскольку здесь n*p =1100*0.01=11 > 10, то необходимо использовать

Во многих задачах практики приходится иметь дело со случайными величинами, распределенными по своеобразному закону, который называется законом Пуассона.

Рассмотрим прерывную случайную величину , которая может принимать только целые, неотрицательные значения:

причем последовательность этих значений теоретически не ограничена.

Говорят, что случайная величина распределена по закону Пуассона, если вероятность того, что она примет определенное значение , выражается формулой

где а – некоторая положительная величина, называемая параметром закона Пуассона.

Ряд распределения случайной величины , распределенной по закону Пуассона, имеет вид:

Убедимся, прежде всего, что последовательность вероятностей, задаваемая формулой (5.9.1), может представлять собой ряд распределения, т.е. что сумма всех вероятностей равна единице. Имеем:

На рис. 5.9.1 показаны многоугольники распределения случайной величины , распределенной по закону Пуассона, соответствующие различным значениям параметра . В таблице 8 приложения приведены значения для различных .

Определим основные характеристики – математическое ожидание и дисперсию – случайной величины , распределенной по закону Пуассона. По определению математического ожидания

Первый член суммы (соответствующий ) равен нулю, следовательно, суммирование можно начать с :

Обозначим ; тогда

. (5.9.2)

Таким образом, параметр представляет собой не что иное, как математическое ожидание случайной величины .

Для определения дисперсии найдем сначала второй начальный момент величины :

По ранее доказанному

кроме того,

Таким образом, дисперсия случайной величины, распределенной по закону Пуассона, равна её математическому ожиданию .

Это свойство распределения Пуассона часто применяется на практике для решения вопроса, правдоподобна ли гипотеза о том, что случайная величина распределена по закону Пуассона. Для этого определяют из опыта статистические характеристики – математическое ожидание и дисперсию – случайной величины. Если их значения близки, то это может служить доводом в пользу гипотезы о пуассоновском распределении; резкое различие этих характеристик, напротив, свидетельствует против гипотезы.

Определим для случайной величины , распределенной по закону Пуассона, вероятность того, что она примет значение не меньше заданного . Обозначим эту вероятность :

Очевидно, вероятность может быть вычислена как сумма

Однако значительно проще определить её из вероятности противоположного события:

(5.9.4)

В частности, вероятность того, что величина примет положительное значение, выражается формулой

(5.9.5)

Мы уже упоминали о том, что многие задачи практики приводят к распределению Пуассона. Рассмотрим одну из типичных задач такого рода.

Пусть на оси абсцисс Ох случайным образом распределяются точки (рис. 5.9.2). Допустим, что случайное распределение точек удовлетворяет следующим условиям:

1. Вероятность попадания того или иного числа точек на отрезок зависит только от длины этого отрезка, но не зависит от его положения на оси абсцисс. Иными словами, точки распределяются на оси абсцисс с одинаковой средней плотностью. Обозначим эту плотность (т.е. математическое ожидание числа точек, приходящихся на единицу длины) через .

2. Точки распределяются на оси абсцисс независимо друг от друга, т.е. вероятность попадания того или другого числа точек на заданный отрезок не зависит от того, сколько их попало на любой другой отрезок, не перекрывающийся с ним.

3. Вероятность попадания на малый участок двух или более точек пренебрежимо мала по сравнению с вероятностью попадания одной точки (это условие означает практическую невозможность совпадения двух или более точек).

Выделим на оси абсцисс определенный отрезок длины и рассмотрим дискретную случайную величину – число точек, попадающих на этот отрезок. Возможные значения величины будут

Так как точки попадают на отрезок независимо друг от друга, то теоретически не исключено, что их там окажется сколь угодно много, т.е. ряд (5.9.6) продолжается неограниченно.

Докажем, что случайная величина имеет закон распределения Пуассона. Для этого вычислим вероятность того, что на отрезок попадет ровно точек.

Сначала решим более простую задачу. Рассмотрим на оси Ох малый участок и вычислим вероятность того, что на этот участок попадет хотя бы одна точка. Будем рассуждать следующим образом. Математическое ожидание числа точек, попадающих на этот участок, очевидно, равно (т.к. на единицу длины попадает в среднем точек). Согласно условию 3 для малого отрезка можно пренебречь возможностью попадания на него двух или больше точек. Поэтому математическое ожидание числа точек, попадающих на участок , будет приближенно равно вероятности попадания на него одной точки (или, что в наших условиях равнозначно, хотя бы одной).

Таким образом, с точностью до бесконечно малых высшего порядка, при можно считать вероятность того, что на участок попадет одна (хотя бы одна) точка, равной , а вероятность того, что не попадет ни одной, равной .

Воспользуемся этим для вычисления вероятности попадания на отрезок ровно точек. Разделим отрезок на равных частей длиной . Условимся называть элементарный отрезок «пустым», если в него не попало ни одной точки, и «занятым», если в него попала хотя бы одна. Согласно вышедоказанному вероятность того, что отрезок окажется «занятым», приближенно равна ; вероятность того, что он окажется «пустым», равна . Так как, согласно условию 2, попадания точек в неперекрывающиеся отрезки независимы, то наши n отрезков можно рассмотреть как независимых «опытов», в каждом из которых отрезок может быть «занят» с вероятностью . Найдем вероятность того, что среди отрезков будет ровно «занятых». По теореме о повторении опытов эта вероятность равна

или, обозначая ,

(5.9.7)

При достаточно большом эта вероятность приближенно равна вероятности попадания на отрезок ровно точек, так как попадание двух или больше точек на отрезок имеет пренебрежимо малую вероятность. Для того чтобы найти точное значение , нужно в выражении (5.9.7) перейти к пределу при :

(5.9.8)

Преобразуем выражение, стоящее под знаком предела:

(5.9.9)

Первая дробь и знаменатель последней дроби в выражении (5.9.9) при , очевидно, стремятся к единице. Выражение от не зависит. Числитель последней дроби можно преобразовать так:

(5.9.10)

При и выражение (5.9.10) стремится к . Таким образом, доказано, что вероятность попадания ровно точек в отрезок выражается формулой

где , т.е. величина Х распределена по закону Пуассона с параметром .

Отметим, что величина по смыслу представляет собой среднее число точек, приходящееся на отрезок .

Величина (вероятность того, что величина Х примет положительное значение) в данном случае выражает вероятность того, что на отрезок попадет хотя бы одна точка:

Таким образом, мы убедились, что распределение Пуассона возникает там, где какие-то точки (или другие элементы) занимают случайное положение независимо друг от друга, и подсчитывается количество этих точек, попавших в какую-то область. В нашем случае такой «областью» был отрезок на оси абсцисс. Однако наш вывод легко распространить и на случай распределения точек на плоскости (случайное плоское поле точек) и в пространстве (случайное пространственное поле точек). Нетрудно доказать, что если соблюдены условия:

1) точки распределены в поле статистически равномерно со средней плотностью ;

2) точки попадают в неперекрывающиеся области независимым образом;

3) точки появляются поодиночке, а не парами, тройками и т.д., то число точек , попадающих в любую область (плоскую или пространственную), распределяются по закону Пуассона:

где – среднее число точек, попадающих в область .

Для плоского случая

где – площадь области ; для пространственного

где - объем области .

Заметим, что для пуассоновского распределения числа точек, попадающих в отрезок или область, условие постоянной плотности () несущественно. Если выполнены два других условия, то закон Пуассона все равно имеет место, только параметр а в нем приобретает другое выражение: он получается не простым умножение плотности на длину, площадь или объем области, а интегрированием переменной плотности по отрезку, площади или объему. (Подробнее об этом см. n° 19.4)

Наличие случайных точек, разбросанных на линии, на плоскости или объеме – неединственное условие, при котором возникает распределение Пуассона. Можно, например, доказать, что закон Пуассона является предельным для биномиального распределения:

, (5.9.12)

если одновременно устремлять число опытов к бесконечности, а вероятность – к нулю, причем их произведение сохраняет постоянное значение:

Действительно, это предельное свойство биномиального распределения можно записать в виде:

. (5.9.14)

Но из условия (5.9.13) следует, что

Подставляя (5.9.15) в (5.9.14), получим равенство

, (5.9.16)

которое только что было доказано нами по другому поводу.

Это предельное свойство биномиального закона часто находит применение на практике. Допустим, что производится большое количество независимых опытов , в каждом из которых событие имеет очень малую вероятность . Тогда для вычисления вероятности того, что событие появится ровно раз, можно воспользоваться приближенной формулой:

, (5.9.17)

где - параметр того закона Пуассона, которым приближенно заменяется биномиальное распределение.

От этого свойства закона Пуассона – выражать биномиальное распределение при большом числе опытов и малой вероятности события – происходит его название, часто применяемое в учебниках статистики: закон редких явлений.

Рассмотрим несколько примеров, связанных с пуассоновским распределением, из различных областей практики.

Пример 1. На автоматическую телефонную станцию поступают вызовы со средней плотностью вызовов в час. Считая, что число вызовов на любом участке времени распределено по закону Пуассона, найти вероятность того, что за две минуты на станцию поступит ровно три вызова.

Решение. Среднее число вызовов за две минуты равно:

Кв.м. Для поражения цели достаточно попадания в нее хотя бы одного осколка. Найти вероятность поражения цели при данном положении точки разрыва.

Решение. . По формуле (5.9.4) находим вероятность попадания хотя бы одного осколка:

(Для вычисления значения показательной функции пользуемся таблицей 2 приложения).

Пример 7. Средняя плотность болезнетворных микробов в одном кубическом метре воздуха равна 100. Берется на пробу 2 куб. дм воздуха. Найти вероятность того, что в нем будет обнаружен хотя бы один микроб.

Решение. Принимая гипотезу о пуассоновском распределении числа микробов в объеме, находим:

Пример 8. По некоторой цели производится 50 независимых выстрелов. Вероятность попадания в цель при одном выстреле равна 0,04. Пользуясь предельным свойством биномиального распределения (формула (5.9.17)), найти приближенно вероятность того, что в цель попадет: ни одного снаряда, один снаряд, два снаряда.

Решение. Имеем . По таблице 8 приложения находим вероятности.

Наиболее общим случаем различного рода вероятностных распределений является биномиальное распределение. Воспользуемся его универсальностью для определения наиболее часто встречающихся на практике частных видов распределений.

Биномиальное распределение

Пусть имеется некое событие A . Вероятность появления события A равна p , вероятность непоявления события A равна 1 p , иногда ее обозначают как q . Пусть n число испытаний, m частота появления события A в этих n испытаниях.

Известно, что суммарная вероятность всех возможных комбинаций исходов равна единице, то есть:

1 = p n + n · p n 1 · (1 p ) + C n n 2 · p n 2 · (1 p ) 2 + + C n m · p m · (1 p ) n m + + (1 p ) n .

p n вероятность того, что в n n раз;

n · p n 1 · (1 p ) вероятность того, что в n n 1) раз и не произойдет 1 раз;

C n n 2 · p n 2 · (1 p ) 2 вероятность того, что в n испытаниях событие A произойдет (n 2) раза и не произойдет 2 раза;

P m = C n m · p m · (1 p ) n m вероятность того, что в n испытаниях событие A произойдет m раз и не произойдет (n m ) раз;

(1 p ) n вероятность того, что в n испытаниях событие A не произойдет ни разу;

число сочетаний из n по m .

Математическое ожидание M биномиального распределения равно:

M = n · p ,

где n число испытаний, p вероятность появления события A .

Среднеквадратичное отклонение σ :

σ = sqrt(n · p · (1 p )) .

Пример 1 . Вычислить вероятность того, что событие, имеющее вероятность p = 0.5 , в n = 10 испытаниях произойдет m = 1 раз. Имеем: C 10 1 = 10 , и далее: P 1 = 10 · 0.5 1 · (1 0.5) 10 1 = 10 · 0.5 10 = 0.0098 . Как видим, вероятность наступления этого события достаточно мала. Объясняется это, во-первых, тем, что абсолютно не ясно, произойдет ли событие или нет, поскольку вероятность равна 0.5 и шансы здесь «50 на 50»; а во-вторых, требуется исчислить то, что событие произойдет именно один раз (не больше и не меньше) из десяти.

Пример 2 . Вычислить вероятность того, что событие, имеющее вероятность p = 0.5 , в n = 10 испытаниях произойдет m = 2 раза. Имеем: C 10 2 = 45 , и далее: P 2 = 45 · 0.5 2 · (1 0.5) 10 2 = 45 · 0.5 10 = 0.044 . Вероятность наступления этого события стала больше!

Пример 3 . Увеличим вероятность наступления самого события. Сделаем его более вероятным. Вычислить вероятность того, что событие, имеющее вероятность p = 0.8 , в n = 10 испытаниях произойдет m = 1 раз. Имеем: C 10 1 = 10 , и далее: P 1 = 10 · 0.8 1 · (1 0.8) 10 1 = 10 · 0.8 1 · 0.2 9 = 0.000004 . Вероятность стала меньше, чем в первом примере! Ответ, на первый взгляд, кажется странным, но поскольку событие имеет достаточно большую вероятность, вряд ли оно произойдет только один раз. Более вероятно, что оно произойдет большее, чем один, количество раз. Действительно, подсчитывая P 0 , P 1 , P 2 , P 3 , , P 10 (вероятность того, что событие в n = 10 испытаниях произойдет 0, 1, 2, 3, , 10 раз), мы увидим:

C 10 0 = 1 , C 10 1 = 10 , C 10 2 = 45 , C 10 3 = 120 , C 10 4 = 210 , C 10 5 = 252 ,
C 10 6 = 210 , C 10 7 = 120 , C 10 8 = 45 , C 10 9 = 10 , C 10 10 = 1 ;

P 0 = 1 · 0.8 0 · (1 0.8) 10 0 = 1 · 1 · 0.2 10 = 0.0000 ;
P 1 = 10 · 0.8 1 · (1 0.8) 10 1 = 10 · 0.8 1 · 0.2 9 = 0.0000 ;
P 2 = 45 · 0.8 2 · (1 0.8) 10 2 = 45 · 0.8 2 · 0.2 8 = 0.0000 ;
P 3 = 120 · 0.8 3 · (1 0.8) 10 3 = 120 · 0.8 3 · 0.2 7 = 0.0008 ;
P 4 = 210 · 0.8 4 · (1 0.8) 10 4 = 210 · 0.8 4 · 0.2 6 = 0.0055 ;
P 5 = 252 · 0.8 5 · (1 0.8) 10 5 = 252 · 0.8 5 · 0.2 5 = 0.0264 ;
P 6 = 210 · 0.8 6 · (1 0.8) 10 6 = 210 · 0.8 6 · 0.2 4 = 0.0881 ;
P 7 = 120 · 0.8 7 · (1 0.8) 10 7 = 120 · 0.8 7 · 0.2 3 = 0.2013 ;
P 8 = 45 · 0.8 8 · (1 0.8) 10 8 = 45 · 0.8 8 · 0.2 2 = 0.3020 (самая большая вероятность!);
P 9 = 10 · 0.8 9 · (1 0.8) 10 9 = 10 · 0.8 9 · 0.2 1 = 0.2684 ;
P 10 = 1 · 0.8 10 · (1 0.8) 10 10 = 1 · 0.8 10 · 0.2 0 = 0.1074

Разумеется, P 0 + P 1 + P 2 + P 3 + P 4 + P 5 + P 6 + P 7 + P 8 + P 9 + P 10 = 1 .

Нормальное распределение

Если изобразить величины P 0 , P 1 , P 2 , P 3 , , P 10 , которые мы подсчитали в примере 3, на графике, то окажется, что их распределение имеет вид, близкий к нормальному закону распределения (см. рис. 27.1 ) (см. лекцию 25. Моделирование нормально распределенных случайных величин).

Рис. 27.1. Вид биномиального распределения
вероятностей для различных m при p = 0.8, n = 10

Биномиальный закон переходит в нормальный, если вероятности появления и непоявления события A примерно одинаковы, то есть, условно можно записать: p ≈ (1 p ) . Для примера возьмем n = 10 и p = 0.5 (то есть p = 1 p = 0.5 ).

Содержательно к такой задаче мы придем, если, например, захотим теоретически посчитать, сколько будет мальчиков и сколько девочек из 10 родившихся в роддоме в один день детей. Точнее, считать будем не мальчиков и девочек, а вероятность, что родятся только мальчики, что родится 1 мальчик и 9 девочек, что родится 2 мальчика и 8 девочек и так далее. Примем для простоты, что вероятность рождения мальчика и девочки одинакова и равна 0.5 (но на самом деле, если честно, это не так, см. курс «Моделирование систем искусственного интеллекта»).

Ясно, что распределение будет симметричное, так как вероятность рождения 3 мальчиков и 7 девочек равна вероятности рождения 7 мальчиков и 3 девочек. Наибольшая вероятность рождения будет у 5 мальчиков и 5 девочек. Эта вероятность равна 0.25, кстати, не такая уж она и большая по абсолютной величине. Далее, вероятность того, что родится сразу 10 или 9 мальчиков намного меньше, чем вероятность того, что родится 5 ± 1 мальчик из 10 детей. Как раз биномиальное распределение нам поможет сделать этот расчет. Итак.

C 10 0 = 1 , C 10 1 = 10 , C 10 2 = 45 , C 10 3 = 120 , C 10 4 = 210 , C 10 5 = 252 ,
C 10 6 = 210 , C 10 7 = 120 , C 10 8 = 45 , C 10 9 = 10 , C 10 10 = 1 ;

P 0 = 1 · 0.5 0 · (1 0.5) 10 0 = 1 · 1 · 0.5 10 = 0.000977 ;
P 1 = 10 · 0.5 1 · (1 0.5) 10 1 = 10 · 0.5 10 = 0.009766 ;
P 2 = 45 · 0.5 2 · (1 0.5) 10 2 = 45 · 0.5 10 = 0.043945 ;
P 3 = 120 · 0.5 3 · (1 0.5) 10 3 = 120 · 0.5 10 = 0.117188 ;
P 4 = 210 · 0.5 4 · (1 0.5) 10 4 = 210 · 0.5 10 = 0.205078 ;
P 5 = 252 · 0.5 5 · (1 0.5) 10 5 = 252 · 0.5 10 = 0.246094 ;
P 6 = 210 · 0.5 6 · (1 0.5) 10 6 = 210 · 0.5 10 = 0.205078 ;
P 7 = 120 · 0.5 7 · (1 0.5) 10 7 = 120 · 0.5 10 = 0.117188 ;
P 8 = 45 · 0.5 8 · (1 0.5) 10 8 = 45 · 0.5 10 = 0.043945 ;
P 9 = 10 · 0.5 9 · (1 0.5) 10 9 = 10 · 0.5 10 = 0.009766 ;
P 10 = 1 · 0.5 10 · (1 0.5) 10 10 = 1 · 0.5 10 = 0.000977

Разумеется, P 0 + P 1 + P 2 + P 3 + P 4 + P 5 + P 6 + P 7 + P 8 + P 9 + P 10 = 1 .

Отразим на графике величины P 0 , P 1 , P 2 , P 3 , , P 10 (см. рис. 27.2 ).

Рис. 27.2. График биномиального распределения при параметрах
p = 0.5 и n = 10, приближающих его к нормальному закону

Итак, при условиях m ≈ n /2 и p ≈ 1 p или p ≈ 0.5 вместо биномиального распределения можно использовать нормальное. При больших значениях n график сдвигается вправо и становится все более пологим, так как математическое ожидание и дисперсия возрастают с увеличением n : M = n · p , D = n · p · (1 p ) .

Кстати, биномиальный закон стремится к нормальному и при увеличении n , что вполне естественно, согласно центральной предельной теореме (см. лекцию 34. Фиксация и обработка статистических результатов).

Теперь рассмотрим, как изменится биномиальный закон в случае, когда p ≠ q , то есть p > 0 . В этом случае применить гипотезу о нормальности распределения нельзя, и биномиальное распределение переходит в распределение Пуассона.

Распределение Пуассона

Распределение Пуассона это частный случай биномиального распределения (при n >> 0 и при p > 0 (редкие события)).

Из математики известна формула, позволяющая примерно подсчитать значение любого члена биномиального распределения:

где a = n · p параметр Пуассона (математическое ожидание), а дисперсия равна математическому ожиданию. Приведем математические выкладки, поясняющие этот переход. Биномиальный закон распределения

P m = C n m · p m · (1 p ) n m

может быть написан, если положить p = a /n , в виде

Так как p очень мало, то следует принимать во внимание только числа m , малые по сравнению с n . Произведение

весьма близко к единице. Это же относится к величине

Величина

очень близка к e a . Отсюда получаем формулу:

Пример . В ящике находится n = 100 деталей, как качественных, так и бракованных. Вероятность достать бракованное изделие составляет p = 0.01 . Допустим, что мы вынимаем изделие, определяем, бракованное оно или нет, и кладем его обратно. Поступая таким образом, получилось, что из 100 изделий, которые мы перебрали, два оказались бракованными. Какова вероятность этого?

По биномиальному распределению получаем:

По распределению Пуассона получаем:

Как видно, величины получились близкими, поэтому в случае редких событий вполне допустимо применять закон Пуассона, тем более что он требует меньших вычислительных затрат.

Покажем графически вид закона Пуассона. Возьмем для примера параметры p = 0.05 , n = 10 . Тогда:

C 10 0 = 1 , C 10 1 = 10 , C 10 2 = 45 , C 10 3 = 120 , C 10 4 = 210 , C 10 5 = 252 ,
C 10 6 = 210 , C 10 7 = 120 , C 10 8 = 45 , C 10 9 = 10 , C 10 10 = 1 ;

P 0 = 1 · 0.05 0 · (1 0.05) 10 0 = 1 · 1 · 0.95 10 = 0.5987 ;
P 1 = 10 · 0.05 1 · (1 0.05) 10 1 = 10 · 0.05 1 · 0.95 9 = 0.3151 ;
P 2 = 45 · 0.05 2 · (1 0.05) 10 2 = 45 · 0.05 2 · 0.95 8 = 0.0746 ;
P 3 = 120 · 0.05 3 · (1 0.05) 10 3 = 120 · 0.05 3 · 0.95 7 = 0.0105 ;
P 4 = 210 · 0.05 4 · (1 0.05) 10 4 = 210 · 0.05 4 · 0.95 6 = 0.00096 ;
P 5 = 252 · 0.05 5 · (1 0.05) 10 5 = 252 · 0.05 5 · 0.95 5 = 0.00006 ;
P 6 = 210 · 0.05 6 · (1 0.05) 10 6 = 210 · 0.05 6 · 0.95 4 = 0.0000 ;
P 7 = 120 · 0.05 7 · (1 0.05) 10 7 = 120 · 0.05 7 · 0.95 3 = 0.0000 ;
P 8 = 45 · 0.05 8 · (1 0.05) 10 8 = 45 · 0.05 8 · 0.95 2 = 0.0000 ;
P 9 = 10 · 0.05 9 · (1 0.05) 10 9 = 10 · 0.05 9 · 0.95 1 = 0.0000 ;
P 10 = 1 · 0.05 10 · (1 0.05) 10 10 = 1 · 0.05 10 · 0.95 0 = 0.0000

Разумеется, P 0 + P 1 + P 2 + P 3 + P 4 + P 5 + P 6 + P 7 + P 8 + P 9 + P 10 = 1 .

Рис. 27.3. График распределения Пуассона при p = 0.05 и n = 10

При n > ∞ распределение Пуассона переходит в нормальный закон, согласно центральной предельной теореме (см.

Как сразу стали поступать запросы: «Где Пуассон? Где задачи на формулу Пуассона?» и т.п . И поэтому я начну с частного применения распределения Пуассона – ввиду большой востребованности материала.

Задача до боли эйфории знакома:

И следующие две задачи принципиально отличаются от предыдущих:

Пример 4

Случайная величина подчинена закону Пуассона с математическим ожиданием . Найти вероятность того, что данная случайная величина примет значение, меньшее, чем ее математическое ожидание.

Отличие состоит в том, что здесь речь идёт ИМЕННО о распределении Пуассона.

Решение : случайная величина принимает значения с вероятностями:

По условию, , и тут всё просто: событие состоит в трёх несовместных исходах :

Вероятность того, что случайная величина примет значение, меньшее, чем ее математическое ожидание.

Ответ :

Аналогичная задача на понимание:

Пример 5

Случайная величина подчинена закону Пуассона с математическим ожиданием . Найти вероятность того, что данная случайная величина примет положительное значение.

Решение и ответ в конце урока.

Помимо приближения биномиального распределения (Примеры 1-3), распределение Пуассона нашло широкое применение в теории массового обслуживания для вероятностной характеристики простейшего потока событий. Постараюсь быть лаконичным:

Пусть в некоторую систему поступают заявки (телефонные звонки, приходящие клиенты и т.д.). Поток заявок называют простейшим , если он удовлетворяет условиям стационарности , отсутствия последствий и ординарности . Стационарность подразумевает то, что интенсивность заявок постоянна и не зависит от времени суток, дня недели или других временнЫх рамок. Иными словами, не бывает «часа пик» и не бывает «мёртвых часов». Отсутствие последствий означает, что вероятность появления новых заявок не зависит от «предыстории», т.е. нет такого, что «одна бабка рассказала» и другие «набежали» (или наоборот, разбежались). И, наконец, свойство ординарности характеризуется тем, что за достаточно малый промежуток времени практически невозможно появление двух или бОльшего количества заявок. «Две старушки в двери?» – нет уж, увольте.

Итак, пусть в некоторую систему поступает простейший поток заявок со средней интенсивностью заявок в минуту (в час, в день или в произвольный промежуток времени). Тогда вероятность того, что за данный промежуток времени , в систему поступит ровно заявок, равна:

Пример 6

Звонки в диспетчерскую такси представляет собой простейший пуассоновский поток со средней интенсивностью 30 вызовов в час. Найти вероятность того, что: а) за 1 мин. поступит 2-3 вызова, б) в течение пяти минут будет хотя бы один звонок.

Решение : используем формулу Пуассона:

а) Учитывая стационарность потока, вычислим среднее количество вызовов за 1 минуту:
вызова – в среднем за одну минуту.

По теореме сложения вероятностей несовместных событий:
– вероятность того, что за 1 минуту в диспетчерскую поступит 2-3 вызова.

б) Вычислим среднее количество вызов за пять минут:

Рассмотрим распределение Пуассона, вычислим его математическое ожидание, дисперсию, моду. С помощью функции MS EXCEL ПУАССОН.РАСП() построим графики функции распределения и плотности вероятности. Произведем оценку параметра распределения, его математического ожидания и стандартного отклонения.

Сначала дадим сухое формальное определение распределения, затем приведем примеры ситуаций, когда распределение Пуассона (англ. Poisson distribution ) является адекватной моделью для описания случайной величины.

Если случайные события происходят в заданный период времени (или в определенном объеме вещества) со средней частотой λ(лямбда ), то число событий x , произошедших за этот период времени, будет иметь распределение Пуассона .

Применение распределения Пуассона

Примеры, когда Распределение Пуассона является адекватной моделью:

число вызовов, поступивших на телефонную станцию за определенный период времени;
число частиц, подвергнувшихся радиоактивному распаду за определенный период времени;
число дефектов в куске ткани фиксированной длины.

Распределение Пуассона является адекватной моделью, если выполняются следующие условия:

события происходят независимо друг от друга, т.е. вероятность последующего события не зависит от предыдущего;
средняя частота событий постоянна. Как следствие, вероятность события пропорциональна длине интервала наблюдения;
два события не могут произойти одновременно;
число событий должно принимать значения 0; 1; 2…

Примечание : Хорошей подсказкой, что наблюдаемая случайная величина имеет распределение Пуассона, является тот факт, что приблизительно равно (см. ниже).

Ниже представлены примеры ситуаций, когда Распределение Пуассона не может быть применено:

число студентов, которые выходят из университета в течение часа (т.к. средний поток студентов не постоянен: во время занятий студентов мало, а в перерыве между занятиями число студентов резко возрастает);
число землетрясений амплитудой 5 баллов в год в Калифорнии (т.к. одно землетрясение может вызвать повторные толчки сходной амплитуды – события не независимы);
число дней, которые пациенты проводят в отделении интенсивной терапии (т.к. число дней, которое пациенты проводят в отделении интенсивной терапии всегда больше 0).

Примечание : Распределение Пуассона является приближением более точных дискретных распределений: и .

Примечание : О взаимосвязи распределения Пуассона и Биномиального распределения можно прочитать в статье . О взаимосвязи распределения Пуассона и Экспоненциального распределения можно прочитать в статье про .

Распределение Пуассона в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Распределения Пуассона имеется функция ПУАССОН.РАСП() , английское название - POISSON.DIST(), которая позволяет вычислить не только вероятность того, что за заданный период времени произойдет х событий (функцию плотности вероятности p(x), см. формулу выше), но и (вероятность того, что за заданный период времени произойдет не меньше x событий).

До MS EXCEL 2010 в EXCEL была функция ПУАССОН() , которая также позволяет вычислить функцию распределения и плотность вероятности p(x). ПУАССОН() оставлена в MS EXCEL 2010 для совместимости.

В файле примера приведены графики плотности распределения вероятности и интегральной функции распределения .

Распределение Пуассона имеет скошенную форму (длинный хвост справа у функции вероятности), но при увеличении параметра λ становится все более симметричным.

Примечание : Среднее и дисперсия (квадрат ) равны параметру распределения Пуассона – λ (см. файл примера лист Пример ).

Задача

Типичным применением Распределения Пуассона в контроле качества является модель количества дефектов, которые могут появиться в приборе или устройстве.

Например, при среднем количестве дефектов в микросхеме λ (лямбда) равном 4, вероятность, что случайно выбранная микросхема будет иметь 2 или меньше дефектов, равна: =ПУАССОН.РАСП(2;4;ИСТИНА)=0,2381

Третий параметр в функции установлен = ИСТИНА, поэтому функция вернет интегральную функцию распределения , то есть вероятность того, что число случайных событий окажется в диапазоне от 0 до 4 включительно.

Вычисления в этом случае производятся по формуле:

Вероятность того, что случайно выбранная микросхема будет иметь ровно 2 дефекта, равна: =ПУАССОН.РАСП(2;4;ЛОЖЬ)=0,1465

Третий параметр в функции установлен = ЛОЖЬ, поэтому функция вернет плотность вероятности.

Вероятность того, что случайно выбранная микросхема будет иметь больше 2-х дефектов, равна: =1-ПУАССОН.РАСП(2;4;ИСТИНА) =0,8535

Примечание : Если x не является целым числом, то при вычислении формулы . Формулы =ПУАССОН.РАСП(2 ; 4; ЛОЖЬ) и =ПУАССОН.РАСП(2,9 ; 4; ЛОЖЬ) вернут одинаковый результат.

Генерация случайных чисел и оценка λ

При значениях λ>15 , Распределение Пуассона хорошо аппроксимируется Нормальным распределением со следующими параметрами: μ=λ , σ 2 =λ .

Подробнее о связи этих распределений, можно прочитать в статье . Там же приведены примеры аппроксимации, и пояснены условия, когда она возможна и с какой точностью.

СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье .