Centralne twierdzenie graniczne statystyki. Centralne twierdzenie graniczne w programie MS EXCEL

Centralne twierdzenie graniczne (CLT) to druga grupa twierdzeń granicznych, które ustalają związek między prawem dystrybucji sumy zmiennych losowych i jego ostateczna forma - normalne prawo dystrybucji.

Do tej pory często mówiliśmy o stabilności średnich charakterystyk dużej liczby testów, a dokładniej o stabilności sum postaci

Należy jednak zauważyć, że wartość
losowy, co oznacza, że ​​ma pewne prawo dystrybucji. Okazuje się, że ten niezwykły fakt stanowi treść

inna grupa twierdzeń, zjednoczona pod ogólną nazwą granica centralnatwierdzenie, że na dość ogólnych warunkach obowiązuje prawo dystrybucyjne zbliżone do normalnego prawa.

Ponieważ wartość różni się od kwoty

tylko stały czynnik
wówczas, ogólnie rzecz biorąc, zawartość CLT można sformułować w następujący sposób.

Rozkład sumy dużej liczby niezależnych zmiennych losowych z bardzo

Ogólne warunki są zbliżone do normalnego prawa dystrybucji.

Wiadomo, że zmienne losowe o rozkładzie normalnym mają szerokie zastosowanie w praktyce (nie tylko w teorii prawdopodobieństwa, ale także w jej licznych zastosowaniach). Co wyjaśnia to zjawisko? Odpowiedzi na takie „zjawisko” jako pierwszy udzielił wybitny rosyjski matematyk A.M. Lapunowa w 1901 r.: „Centralne twierdzenie graniczne Lapunowa”. Odpowiedź Łapunowa leży w warunkach, w jakich utrzymuje się CLT (patrz poniżej).

Aby przygotować dokładne sformułowanie CLT, zadajmy sobie dwa pytania:

1. Jakie jest dokładne znaczenie stwierdzenia, że ​​„prawo podziału sumy „blisko” normalnego prawa?

2. Na jakich warunkach ta bliskość jest ważna?

Aby odpowiedzieć na te pytania, rozważ nieskończoną sekwencję zmiennych losowych:
Skomponujmy „sumy cząstkowe” naszego ciągu r.v.

(23)

Z każdej zmiennej losowej przejdźmy do „znormalizowanej” zmiennej losowej

(24)

Ustaliliśmy (patrz T.8., akapit 3, równości (19)), że
.

Odpowiedź na pytanie pierwsze można teraz sformułować w kategoriach równości granicznej

(25)
, (
,

co oznacza, że ​​prawo podziału r.v. ze wzrostem zbliża się do normalnego prawa z
. Oczywiście z faktu, że wartość ma w przybliżeniu rozkład normalny, wynika z tego, że wartość w przybliżeniu rozkład normalny,

(26)

Wzór na określenie prawdopodobieństwa, że ​​suma kilku r.v. będzie mieścić się w określonych granicach. Często używa się CPT

Jeśli chodzi o warunki, które należy nałożyć na ilości
Można poczynić następujące rozważania. Rozważmy różnicę
Otrzymujemy odchylenie r.v. od swoich matematycznych oczekiwań. Ogólne znaczenie nałożonych warunków na ilości
to indywidualne odchylenia
musi być jednakowo mała w porównaniu do całkowitego odchylenia
Dokładne sformułowanie tych warunków, w jakich obowiązuje relacja graniczna, podał M.A. Łapunow w 1901 r. Jest następująco.

Niech dla każdej z wielkości
liczby są skończone (zauważ, że istnieje dyspersja r.v.
- « centralny moment trzeciego rzędu”).

Jestem gruby

,

wtedy powiemy, że sekwencja
zadowala Stan Łapunowa.

W szczególności CLT dla przypadków, gdy w sumie zmiennych losowych każdy wyraz ma ten sam rozkład, tj. wszystko i
wówczas warunek Lapunowa jest spełniony

Mianowicie, w praktyce najczęściej stosowany jest ten przypadek CLT. Ponieważ w statystyce matematycznej każda losowa próbka r.v. mają identyczne rozkłady, ponieważ „próbki” pochodzą z tej samej populacji.

Sformułujmy tę sprawę jako odrębne oświadczenie CLT.

Twierdzenie 10.7 (CPT).Niech zmienne losowe
niezależny, jednakowy
rozproszone, mają skończone oczekiwania matematyczne
i wariancja

Następnie funkcja dystrybucji wyśrodkowanej i znormalizowanej sumy tych r.v. Na
dąży do rozkładu standardowej normalnej zmiennej losowej:

(27)

W tym konkretnym przypadku dobrze jest zrozumieć, w jaki sposób objawia się jednolita „małość” terminów,
gdzie jest wartość ma porządek i wartość
zamówienie
, tym samym stosunek pierwszej wielkości do drugiej dąży do 0.

Teraz jesteśmy w stanie sformułować centralne twierdzenie graniczne w postaci A.M. Lapunowa.

Twierdzenie 10.8. (Łapunow).Jeżeli sekwencja
niezależnych zmiennych losowych spełnia warunek Lapunowa, wówczas obowiązuje relacja graniczna

(28)
,

dla każdego
I , w której (
.

Innymi słowy, w tym przypadku prawo podziału znormalizowanej kwoty zbiega się do prawa normalnego z parametrami

Należy zauważyć, że w celu wykazania, że ​​CPT A.M. Lapunow opracował specjalną metodę opartą na teorii tzw. funkcji charakterystycznych. Metoda ta okazała się bardzo przydatna w innych gałęziach matematyki (patrz dowód CLT na przykład w książce Borodin […]). W tej książce podamy krótkie informacje na temat generowania funkcji i niektórych zastosowań do obliczania charakterystyk numerycznych zmiennych losowych.

Krótka informacja o błędzie pomiaru. Wiadomo, że powtarzając pomiary tego samego obiektu, wykonane tym samym przyrządem pomiarowym z taką samą starannością (w tych samych warunkach), nie zawsze uzyskuje się takie same wyniki. Rozrzut wyników pomiarów wynika z faktu, że na proces pomiarowy wpływa wiele czynników, których uwzględnienie nie jest ani możliwe, ani wskazane. W tej sytuacji błąd powstający przy mierzeniu interesującej nas wielkości często można uznać za sumę dużej liczby niezależnych składników, z których każdy ma jedynie niewielki udział w tworzeniu całej sumy. Ale takie przypadki prowadzą nas właśnie do warunków stosowalności twierdzenia Lapunowa i możemy się spodziewać, że rozkład błędu mierzonej wielkości niewiele różni się od rozkładu normalnego.

Mówiąc bardziej ogólnie, błąd jest funkcją dużej liczby losowych argumentów, z których każdy różni się tylko nieznacznie od wartości oczekiwanej. Linearyzując tę ​​funkcję, czyli zastępując ją liniową, ponownie dochodzimy do poprzedniego przypadku. Zgromadzone doświadczenie w statystycznym przetwarzaniu wyników pomiarów rzeczywiście potwierdza ten fakt w większości praktycznych przypadków.

Podobnym rozumowaniem tłumaczy się pojawienie się rozkładu normalnego w odchyleniach parametrów decydujących o uwolnieniu gotowego produktu (wyrobu) od wartości standardowych w produkcji masowej.

Rozważ następujący przykład.

Przykład 5. Niezależne zmienne losowe rozłożone równomiernie na segmencie. Znajdź prawo dystrybucji r.v.
, a także prawdopodobieństwo, że

Rozwiązanie. Warunki CPT są spełnione, dlatego r.v. ma w przybliżeniu gęstość dystrybucji

Według znanych wzorów na m.o. i wariancję w przypadku rozkładu jednostajnego znajdujemy: Wtedy

Na podstawie wzoru (26) znajdujemy (biorąc pod uwagę tabelaryczne wartości funkcji Laplace'a)

Wiele problemów telewizyjnych wiąże się z badaniem sumy niezależnych zmiennych losowych, która w pewnych warunkach ma rozkład zbliżony do normalnego. Warunki te są wyrażone przez centralne twierdzenie graniczne (CLT).

Niech ξ 1, ξ 2, …, ξ n, … będzie ciągiem niezależnych zmiennych losowych. Oznaczmy

n η = ξ 1 + ξ 2 +…+ ξ n. Mówią, że CTP ma zastosowanie do ciągu ξ 1, ξ 2, ..., ξ n, ...

jeśli jako n → ∞ prawo rozkładu η n dąży do normalnego:

Istota CLT: przy nieograniczonym wzroście liczby zmiennych losowych prawo rozkładu ich sumy dąży do normalnego.

Centralne twierdzenie graniczne Lapunowa

Prawo wielkich liczb nie bada postaci granicznego prawa rozkładu sumy zmiennych losowych. Kwestię tę rozważa się w grupie twierdzeń tzw centralne twierdzenie graniczne. Twierdzą, że prawo rozkładu sumy zmiennych losowych, z których każda może mieć inny rozkład, zbliża się do normalnego, gdy liczba wyrazów jest wystarczająco duża. To wyjaśnia znaczenie prawa normalnego w zastosowaniach praktycznych.

Funkcje charakterystyczne.

Aby udowodnić centralne twierdzenie graniczne, stosuje się metodę funkcji charakterystycznych.

Definicja 14.1.Funkcja charakterystyczna zmienna losowa X zwaną funkcją

G(T) = M (e itX) (14.1)

Zatem, G (T) reprezentuje matematyczne oczekiwanie pewnej złożonej zmiennej losowej U = e itX, powiązany z wartością X. W szczególności, jeśli X jest zatem dyskretną zmienną losową określoną przez szereg dystrybucyjny

. (14.2)

Dla ciągłej zmiennej losowej o gęstości rozkładu F(X)

(14.3)

Przykład 1. Niech X– liczba 6 punktów uzyskanych za jeden rzut kostką. Następnie zgodnie ze wzorem (14.2) G(T) =

Przykład 2. Znajdź funkcję charakterystyczną dla znormalizowanej ciągłej zmiennej losowej o rozkładzie normalnym . Zgodnie ze wzorem (14.3) (użyliśmy wzoru i co I² = -1).

Własności funkcji charakterystycznych.

1. Funkcja F(X) można znaleźć za pomocą znanej funkcji G(T) zgodnie ze wzorem

(14.4)

(transformacja (14.3) nazywa się Transformata Fouriera i transformacja (14.4) – odwrotna transformata Fouriera).

2. Jeśli zmienne losowe X I Y powiązane relacją Y = aX, to ich funkcje charakterystyczne powiązane są zależnością

g y (T) = g x (Na). (14.5)

3. Funkcja charakterystyczna sumy niezależnych zmiennych losowych jest równa iloczynowi funkcji charakterystycznych wyrazów: dla

Twierdzenie 14.1 (centralne twierdzenie graniczne dla wyrazów o jednakowym rozkładzie). Jeśli X 1 , X 2 ,…, X s,… - niezależne zmienne losowe o tym samym prawie rozkładu, oczekiwanie matematyczne T i wariancja σ 2, następnie z nieograniczonym wzrostem P prawo podziału kwoty w nieskończoność zbliża się do normalnego.


Dowód.

Udowodnimy twierdzenie o ciągłych zmiennych losowych X 1 , X 2 ,…, X s(dowód dla wielkości dyskretnych jest podobny). Zgodnie z warunkami twierdzenia charakterystyczne funkcje terminów są identyczne: Następnie, zgodnie z właściwością 3, funkcja charakterystyczna sumy Yn będzie Rozwiń funkcję g x(T) w szeregu Maclaurina:

, gdzie co .

Przy założeniu, że T= 0 (to znaczy przesuń początek do punktu T), To .

(ponieważ T= 0). Podstawiając otrzymane wyniki do wzoru Maclaurina, znajdujemy to

.

Rozważmy nową zmienną losową inną niż Yn w tym jego rozproszenie dla dowolnego P równa się 0. Ponieważ Yn I Zn są ze sobą powiązane zależnością liniową, wystarczy to udowodnić Zn rozłożony zgodnie z prawem normalnym, lub, co jest tym samym, że jego funkcja charakterystyczna zbliża się do funkcji charakterystycznej prawa normalnego (patrz przykład 2). Z własności funkcji charakterystycznych

Weźmy logarytm wynikowego wyrażenia:

Gdzie

Ułóżmy to w rzędzie o godz P→ ∞, ograniczając się do dwóch wyrazów rozwinięcia, wówczas ln(1 - k) ≈ - k.

Gdzie ostatnia granica wynosi 0, ponieważ w . Stąd, , to jest - charakterystyczna funkcja rozkładu normalnego. Zatem przy nieograniczonym wzroście liczby terminów charakterystyczna funkcja ilości Zn w sposób nieograniczony zbliża się do funkcji charakterystycznej prawa normalnego; zatem prawo dystrybucyjne Zn(I Yn) zbliża się do normy bez ograniczeń. Twierdzenie zostało udowodnione.

A.M. Lapunow udowodnił centralne twierdzenie graniczne dla warunków o bardziej ogólnej postaci:

Twierdzenie 14.2 (twierdzenie Lapunowa). Jeśli zmienna losowa X jest sumą bardzo dużej liczby wzajemnie niezależnych zmiennych losowych, dla których spełniony jest warunek:

Gdzie b k– trzeci absolutny centralny moment wielkości X k, A Dk jest zatem jego wariancją X ma rozkład zbliżony do normalnego (warunek Lapunowa oznacza, że ​​wpływ każdego składnika na sumę jest znikomy).

W praktyce możliwe jest zastosowanie centralnego twierdzenia granicznego przy dostatecznie małej liczbie wyrazów, gdyż obliczenia probabilistyczne wymagają stosunkowo małej dokładności. Doświadczenie pokazuje, że dla sumy nawet dziesięciu lub mniejszej liczby wyrazów prawo ich rozkładu można zastąpić normalnym.

Omówione powyżej prawo wielkich liczb stwierdza, że ​​średnia dużej liczby zmiennych losowych zbliża się do pewnych stałych, ale nie ogranicza to wzorców powstających w wyniku całkowitego działania zmiennych losowych. Okazuje się, że w pewnych bardzo ogólnych warunkach połączone działanie dużej liczby zmiennych losowych prowadzi do pewnego y, czyli prawa rozkładu normalnego y.

Centralne twierdzenie graniczne to grupa twierdzeń poświęconych ustaleniu warunków, w jakich powstaje prawo rozkładu normalnego. Wśród tych twierdzeń najważniejsze miejsce zajmuje twierdzenie Lapunowa.

Twierdzenie Lapunowa. Jeśli X ( , X ъ ..., , z których każdy ma matematyczne oczekiwanie M(X r) = A,

dyspersja 0(Хд=a 2, absolutny moment centralny trzeciego rzędu I

następnie prawo podziału kwoty kiedy n -> oo nie jest ograniczony

ale zbliża się do normy z matematycznymi oczekiwaniami i wariancją

Twierdzenie przyjmujemy bez dowodu.

Nieograniczone przybliżenie prawa podziału sumy

do prawa normalnego dla n -> oo zgodnie z właściwościami prawa normalnego oznacza, że

gdzie Ф(r) jest funkcją Laplace'a (2.11).

Znaczenie warunku (6.20) jest takie, że suma nie powinna istnieć

terminy, których wpływ na rozpraszanie W górę przeważająco duży w porównaniu z wpływem wszystkich pozostałych i nie powinno być dużej liczby przypadkowych terminów, których wpływ jest bardzo mały w porównaniu z całkowitym wpływem pozostałych. Zatem, waga właściwa każdego pojedynczego terminu powinna dążyć do zera w miarę wzrostu liczby terminów.

Na przykład miesięczne zużycie energii elektrycznej na potrzeby gospodarstwa domowego w każdym mieszkaniu w budynku mieszkalnym można przedstawić jako P różne zmienne losowe. Jeżeli zużycie energii elektrycznej w każdym mieszkaniu nie odbiega znacząco od pozostałych pod względem wartości, to na podstawie twierdzenia Lapunowa możemy założyć, że zużycie energii elektrycznej przez cały dom, tj. suma P niezależne zmienne losowe będą zmienną losową, która ma w przybliżeniu prawo rozkładu normalnego. Jeśli na przykład w jednym z pomieszczeń domu znajduje się centrum komputerowe, poziom zużycia energii elektrycznej jest nieporównywalnie wyższy niż w każdym mieszkaniu na potrzeby domowe, wówczas wniosek o w przybliżeniu normalnym rozkładzie zużycia energii elektrycznej w całym domu będzie nieprawidłowe, ponieważ naruszony zostanie warunek (6.20), ponieważ zużycie energii elektrycznej przez centrum komputerowe będzie odgrywać dominującą rolę w kształtowaniu się całkowitej wielkości zużycia.

Inny przykład. Przy stabilnej i sprawnej pracy maszyn, jednorodności obrabianego materiału itp. zmienność jakości produktu przyjmuje postać prawa dystrybucji normalnej, ponieważ błąd produkcyjny jest wynikiem sumarycznego działania dużej liczby zmiennych losowych: błędu maszyny, narzędzia, pracownika itp.

Konsekwencja. Jeśli X ( , X 2 , ..., X n – niezależne zmienne losowe, które mają równe oczekiwania matematyczne M(X () = A, dyspersja 0(X,) = a 2 i absolutne momenty środkowe trzeciego

porządku, a następnie prawo podziału kwoty

Na n -> z w nieskończoność zbliża się do normy

prawo.

Dowód sprowadza się do sprawdzenia warunku (6.20):

zatem zachodzi również równość (6.21). ?

W szczególności, jeśli wszystkie zmienne losowe X) są równomiernie rozłożone, wówczas prawo podziału ich sumy w nieskończoność zbliża się do prawa normalnego jako n -> oo.

Zilustrujmy to stwierdzenie przykładem sumowania niezależnych zmiennych losowych o równomiernym rozkładzie na przedziale (0, 1). Krzywą rozkładu jednej takiej zmiennej losowej pokazano na ryc. 6.2, A. Na ryc. 6.2, B pokazuje gęstość prawdopodobieństwa sumy dwóch takich zmiennych losowych (patrz przykład 5.9), a na ryc. 6.2, V - gęstość prawdopodobieństwa sumy trzech takich zmiennych losowych (jej wykres składa się z trzech odcinków paraboli na przedziałach (0; 1), (1; 2) i (2; 3) i przypomina już jednak krzywą normalną) .

Jeśli dodasz sześć takich zmiennych losowych, otrzymasz zmienną losową o gęstości prawdopodobieństwa praktycznie nie różniącej się od normalnej.

Teraz mamy okazję to udowodnić lokalne i całkowe twierdzenia Moivre’a - Laplace'a(patrz paragraf 2.3).

Rozważ zmienną losową - liczba wystąpień zdarzenia w P niezależnych prób, w każdej z nich może wystąpić z tym samym prawdopodobieństwem p, tj. X = T - zmienna losowa posiadająca prawo rozkładu dwumianowego, dla którego matematyczne oczekiwanie M(X) = pr i wariancja O(X) = pr.

Zmienna losowa 7, podobnie jak zmienna losowa X, jest, ogólnie rzecz biorąc, dyskretna, ale dla dużej liczby P testach jego wartości leżą na osi odciętych na tyle blisko, że można ją uznać za ciągłą z gęstością prawdopodobieństwa ср(х).

Znajdźmy charakterystykę liczbową zmiennej losowej 7, korzystając z właściwości matematycznego oczekiwania i rozproszenia:

Ze względu na zmienną losową X jest sumą niezależnych alternatywnych zmiennych losowych (patrz paragraf 4.1), zmienną losową 2 reprezentuje także sumę niezależnych, jednakowo rozłożonych zmiennych losowych i dlatego opiera się na centralnym twierdzeniu granicznym dla dużej liczby P ma rozkład zbliżony do prawa normalnego z parametrami a = 0, z 2 = 1. Korzystając z własności (4.32) prawa normalnego, biorąc pod uwagę równości (4.33), otrzymujemy

Wierzyć biorąc pod uwagę to, co otrzymujemy,

że podwójna nierówność w nawiasach jest równoważna nierówności aW rezultacie ze wzoru (6.22) otrzymujemy integralna formuła Moivre’a – Laplace’a (2.10):

Prawdopodobieństwo Rt strże wydarzenie A stanie się T za każdym razem P niezależnych testów, można w przybliżeniu zapisać w formie

Mniej Na, tym dokładniejsza jest przybliżona równość. Minimalna (liczba całkowita) Na - 1. Zatem biorąc pod uwagę wzory (6.23) i (6.22) możemy napisać:

Gdzie

Dla małego Dg mamy

gdzie f(g) jest gęstością standardowej zmiennej losowej o rozkładzie normalnym z parametrami a = 0 i 2 = 1, tj.

Zakładając ze wzoru

(6.25) po uwzględnieniu równości (6.24) otrzymujemy lokalna formuła Moivre’a – Laplace’a (2.7):

Komentarz. Należy zachować pewną ostrożność przy stosowaniu centralnego twierdzenia granicznego w badaniach statystycznych. Tak więc, jeśli kwota na P -> oo zawsze ma normalne prawo

rozkładu, wówczas stopień zbieżności do niego zależy w istotny sposób od rodzaju rozkładu jego wyrazów. I tak np. jak zauważono powyżej, sumując zmienne losowe o rozkładzie jednostajnym, już przy 6-10 wyrazach można osiągnąć wystarczającą bliskość prawa normalnego, natomiast aby osiągnąć tę samą bliskość przy sumowaniu wyrazów losowych o rozkładzie x 2, ponad 100 potrzebne będą warunki.

Opierając się na centralnym twierdzeniu granicznym, można argumentować, że elementy rozważane w rozdz. 4 zmienne losowe posiadające prawa rozkładu - dwumianowy, Poissona, hipergeometryczny, y)(„chi-kwadrat”), B(test studencki), o godz n -> oo mają rozkład asymptotyczny normalny.

Centralne twierdzenie graniczne (CLT) to druga grupa twierdzeń granicznych, które ustalają związek między prawem dystrybucji sumy zmiennych losowych i jego ostateczna forma - normalne prawo dystrybucji.

Do tej pory często mówiliśmy o stabilności średnich charakterystyk dużej liczby testów, a dokładniej o stabilności sum postaci

Należy jednak zauważyć, że wartość
losowy, co oznacza, że ​​ma pewne prawo dystrybucji. Okazuje się, że ten niezwykły fakt stanowi treść

inna grupa twierdzeń, zjednoczona pod ogólną nazwą granica centralnatwierdzenie, że na dość ogólnych warunkach obowiązuje prawo dystrybucyjne zbliżone do normalnego prawa.

Ponieważ wartość różni się od kwoty

tylko stały czynnik
wówczas, ogólnie rzecz biorąc, zawartość CLT można sformułować w następujący sposób.

Rozkład sumy dużej liczby niezależnych zmiennych losowych z bardzo

Ogólne warunki są zbliżone do normalnego prawa dystrybucji.

Wiadomo, że zmienne losowe o rozkładzie normalnym mają szerokie zastosowanie w praktyce (nie tylko w teorii prawdopodobieństwa, ale także w jej licznych zastosowaniach). Co wyjaśnia to zjawisko? Odpowiedzi na takie „zjawisko” jako pierwszy udzielił wybitny rosyjski matematyk A.M. Lapunowa w 1901 r.: „Centralne twierdzenie graniczne Lapunowa”. Odpowiedź Łapunowa leży w warunkach, w jakich utrzymuje się CLT (patrz poniżej).

Aby przygotować dokładne sformułowanie CLT, zadajmy sobie dwa pytania:

1. Jakie jest dokładne znaczenie stwierdzenia, że ​​„prawo podziału sumy „blisko” normalnego prawa?

2. Na jakich warunkach ta bliskość jest ważna?

Aby odpowiedzieć na te pytania, rozważ nieskończoną sekwencję zmiennych losowych:
Skomponujmy „sumy cząstkowe” naszego ciągu r.v.

(23)

Z każdej zmiennej losowej przejdźmy do „znormalizowanej” zmiennej losowej

(24)

Ustaliliśmy (patrz T.8., akapit 3, równości (19)), że
.

Odpowiedź na pytanie pierwsze można teraz sformułować w kategoriach równości granicznej

(25)
, (
,

co oznacza, że ​​prawo podziału r.v. ze wzrostem zbliża się do normalnego prawa z
. Oczywiście z faktu, że wartość ma w przybliżeniu rozkład normalny, wynika z tego, że wartość w przybliżeniu rozkład normalny,

(26)

Wzór na określenie prawdopodobieństwa, że ​​suma kilku r.v. będzie mieścić się w określonych granicach. Często używa się CPT

Jeśli chodzi o warunki, które należy nałożyć na ilości
Można poczynić następujące rozważania. Rozważmy różnicę
Otrzymujemy odchylenie r.v. od swoich matematycznych oczekiwań. Ogólne znaczenie nałożonych warunków na ilości
to indywidualne odchylenia
musi być jednakowo mała w porównaniu do całkowitego odchylenia
Dokładne sformułowanie tych warunków, w jakich obowiązuje relacja graniczna, podał M.A. Łapunow w 1901 r. Jest następująco.

Niech dla każdej z wielkości
liczby są skończone (zauważ, że istnieje dyspersja r.v.
- « centralny moment trzeciego rzędu”).

Jestem gruby

,

wtedy powiemy, że sekwencja
zadowala Stan Łapunowa.

W szczególności CLT dla przypadków, gdy w sumie zmiennych losowych każdy wyraz ma ten sam rozkład, tj. wszystko i
wówczas warunek Lapunowa jest spełniony

Mianowicie, w praktyce najczęściej stosowany jest ten przypadek CLT. Ponieważ w statystyce matematycznej każda losowa próbka r.v. mają identyczne rozkłady, ponieważ „próbki” pochodzą z tej samej populacji.

Sformułujmy tę sprawę jako odrębne oświadczenie CLT.

Twierdzenie 10.7 (CPT).Niech zmienne losowe
niezależny, jednakowy
rozproszone, mają skończone oczekiwania matematyczne
i wariancja

Następnie funkcja dystrybucji wyśrodkowanej i znormalizowanej sumy tych r.v. Na
dąży do rozkładu standardowej normalnej zmiennej losowej:

(27)

W tym konkretnym przypadku dobrze jest zrozumieć, w jaki sposób objawia się jednolita „małość” terminów,
gdzie jest wartość ma porządek i wartość
zamówienie
, tym samym stosunek pierwszej wielkości do drugiej dąży do 0.

Teraz jesteśmy w stanie sformułować centralne twierdzenie graniczne w postaci A.M. Lapunowa.

Twierdzenie 10.8. (Łapunow).Jeżeli sekwencja
niezależnych zmiennych losowych spełnia warunek Lapunowa, wówczas obowiązuje relacja graniczna

(28)
,

dla każdego
I , w której (
.

Innymi słowy, w tym przypadku prawo podziału znormalizowanej kwoty zbiega się do prawa normalnego z parametrami

Należy zauważyć, że w celu wykazania, że ​​CPT A.M. Lapunow opracował specjalną metodę opartą na teorii tzw. funkcji charakterystycznych. Metoda ta okazała się bardzo przydatna w innych gałęziach matematyki (patrz dowód CLT na przykład w książce Borodin […]). W tej książce podamy krótkie informacje na temat generowania funkcji i niektórych zastosowań do obliczania charakterystyk numerycznych zmiennych losowych.

Krótka informacja o błędzie pomiaru. Wiadomo, że powtarzając pomiary tego samego obiektu, wykonane tym samym przyrządem pomiarowym z taką samą starannością (w tych samych warunkach), nie zawsze uzyskuje się takie same wyniki. Rozrzut wyników pomiarów wynika z faktu, że na proces pomiarowy wpływa wiele czynników, których uwzględnienie nie jest ani możliwe, ani wskazane. W tej sytuacji błąd powstający przy mierzeniu interesującej nas wielkości często można uznać za sumę dużej liczby niezależnych składników, z których każdy ma jedynie niewielki udział w tworzeniu całej sumy. Ale takie przypadki prowadzą nas właśnie do warunków stosowalności twierdzenia Lapunowa i możemy się spodziewać, że rozkład błędu mierzonej wielkości niewiele różni się od rozkładu normalnego.

Mówiąc bardziej ogólnie, błąd jest funkcją dużej liczby losowych argumentów, z których każdy różni się tylko nieznacznie od wartości oczekiwanej. Linearyzując tę ​​funkcję, czyli zastępując ją liniową, ponownie dochodzimy do poprzedniego przypadku. Zgromadzone doświadczenie w statystycznym przetwarzaniu wyników pomiarów rzeczywiście potwierdza ten fakt w większości praktycznych przypadków.

Podobnym rozumowaniem tłumaczy się pojawienie się rozkładu normalnego w odchyleniach parametrów decydujących o uwolnieniu gotowego produktu (wyrobu) od wartości standardowych w produkcji masowej.

Rozważ następujący przykład.

Przykład 5. Niezależne zmienne losowe rozłożone równomiernie na segmencie. Znajdź prawo dystrybucji r.v.
, a także prawdopodobieństwo, że

Rozwiązanie. Warunki CPT są spełnione, dlatego r.v. ma w przybliżeniu gęstość dystrybucji

Według znanych wzorów na m.o. i wariancję w przypadku rozkładu jednostajnego znajdujemy: Wtedy

Na podstawie wzoru (26) znajdujemy (biorąc pod uwagę tabelaryczne wartości funkcji Laplace'a)

Ponieważ wiele zmiennych losowych w aplikacjach powstaje pod wpływem kilku słabo zależnych czynników losowych, ich rozkład uważa się za normalny. W takim przypadku musi być spełniony warunek, że żaden z czynników nie jest dominujący. Centralne twierdzenia graniczne w tych przypadkach uzasadniają zastosowanie rozkładu normalnego.

Encyklopedyczny YouTube

  • 1 / 5

    Niech istnieje nieskończony ciąg niezależnych zmiennych losowych o identycznym rozkładzie, mających skończoną wartość oczekiwaną i wariancję. Oznaczmy to drugie μ (\ displaystyle \ mu) I σ 2 (\ Displaystyle \ sigma ^ (2)) odpowiednio. Niech także

    . S n - μ n σ n → N (0, 1) (\ Displaystyle (\ Frac (S_ (n) - \ mu n) (\ sigma (\ sqrt (n)))) \ do N (0,1) ) poprzez dystrybucję w ,

    Gdzie N (0, 1) (\ displaystyle N (0,1))- rozkład normalny z zerowym oczekiwaniem matematycznym i odchyleniem standardowym równym jeden. Symbolizując średnią próbki pierwszego n (\ displaystyle n) ilości tj X ¯ n = 1 n ∑ ja = 1 n X ja (\ Displaystyle (\ bar (X)) _ (n) = (\ Frac (1) (n)) \ suma \ limity _ (i = 1) ^ ( n)X_(i)), możemy przepisać wynik centralnego twierdzenia granicznego w następujący sposób:

    n X ¯ n - μ σ → N (0 , 1) (\ Displaystyle (\ sqrt (n)) (\ Frac ({\ bar (X)) _ (n) - \ mu) (\ sigma)) \ do N(0,1)) poprzez dystrybucję w godz n → ∞ (\ Displaystyle n \ do \ infty).

    Szybkość zbieżności można oszacować za pomocą nierówności Berry'ego-Esseena.

    Notatki

    • Mówiąc nieformalnie, klasyczne centralne twierdzenie graniczne stwierdza, że ​​suma n (\ displaystyle n) niezależne zmienne losowe o identycznym rozkładzie mają rozkład bliski N (n μ, n σ 2) (\ Displaystyle N (n \ mu, n \ sigma ^ (2)}). Równoważnie, X ¯ n (\ Displaystyle (\ bar (X)) _ (n)) ma dystrybucję blisko N (μ, σ 2 / n) (\ Displaystyle N (\ mu, \ sigma ^ (2) / n)).
    • Ponieważ funkcja rozkładu standardowego rozkładu normalnego jest ciągła, zbieżność do tego rozkładu jest równoważna punktowej zbieżności funkcji rozkładu z dystrybuantą standardowego rozkładu normalnego. Układanie Z n = S n - μ n σ n (\ Displaystyle Z_ (n) = (\ Frac (S_ (n) - \ mu n) (\ sigma (\ sqrt (n)}}), otrzymujemy fa Z n (x) → Φ (x) , ∀ x ∈ R (\ Displaystyle F_ (Z_ (n)) (x) \ do \ Phi (x), \; \ forall x \ in \ mathbb (R) ), Gdzie Φ (x) (\ Displaystyle \ Phi (x))- funkcja rozkładu standardowego rozkładu normalnego.
    • Centralne twierdzenie graniczne w klasycznym ujęciu dowodzi się metodą funkcji charakterystycznych (twierdzenie Leviego o ciągłości).
    • Ogólnie rzecz biorąc, zbieżność funkcji rozkładu nie implikuje zbieżności gęstości. Niemniej jednak w tym klasycznym przypadku tak właśnie jest.

    Lokalny C.P.T.

    Przy założeniach klasycznego sformułowania załóżmy dodatkowo, że rozkład zmiennych losowych ( X ja ) ja = 1 ∞ (\ Displaystyle \ (X_ (i) \) _ (i = 1) ^ (\ infty)} absolutnie ciągły, to znaczy ma gęstość. Wtedy rozkład jest również absolutnie ciągły, a ponadto

    fa Z n (x) → 1 2 π mi - x 2 2 (\ Displaystyle f_ (Z_ (n)) (x) \ do (\ Frac (1) (\ sqrt (2 \ pi))) \, e ^ (-(\frac (x^(2))(2)))) Na n → ∞ (\ Displaystyle n \ do \ infty),

    Gdzie fa Z n (x) (\ Displaystyle f_ (Z_ (n)) (x))- gęstość zmiennej losowej Z n (\ displaystyle Z_ (n)), a po prawej stronie gęstość standardowego rozkładu normalnego.

    Uogólnienia

    Wynik klasycznego centralnego twierdzenia granicznego obowiązuje w sytuacjach znacznie bardziej ogólnych niż całkowita niezależność i równy rozkład.

    CPT Lindeberg

    Niech niezależne zmienne losowe X 1 , … , X n , … (\ Displaystyle X_ (1), \ ldots, X_ (n), \ ldots ) są zdefiniowane w tej samej przestrzeni prawdopodobieństwa i mają skończone oczekiwania i wariancje: mi [ X ja ] = μ ja , re [ X ja ] = σ ja 2 (\ Displaystyle \ mathbb (E) = \ mu _ (i), \; \ operatorname (D) = \ sigma _ (i) ^ ( 2)).

    Pozwalać S n = ∑ ja = 1 n X ja (\ Displaystyle S_ (n) = \ suma \ limity _ (i = 1) ^ (n) X_ (i)).

    Następnie mi [ S n ] = m n = ∑ ja = 1 n μ ja , re [ S n ] = s n 2 = ∑ ja = 1 n σ ja 2 (\ Displaystyle \ mathbb (E) = m_ (n) = \ suma \ limity _(i=1)^(n)\mu _(i),\;\mathrm (D) =s_(n)^(2)=\suma \limity _(i=1)^(n)\ sigma_(i)^(2)).

    I niech tak się stanie Warunek Lindeberga:

    ∀ ε > 0 , lim n → ∞ ∑ ja = 1 n mi [ (X ja - μ ja) 2 s n 2 1 ( | X ja - μ ja | > ε s n ) ] = 0 , (\ displaystyle \ forall \ varepsilon >0,\;\lim \limits _(n\to \infty )\sum \limits _(i=1)^(n)\mathbb (E) \left[(\frac ((X_(i)-\ mu _(i))^(2))(s_(n)^(2)))\,\mathbf (1) _(\(|X_(i)-\mu _(i)|>\varepsilon s_ (n)\))\prawo]=0,)

    Gdzie 1 ( | X ja - μ ja | > ε s n ) (\ Displaystyle \ mathbf (1) _ (\ (| X_ (i) - \ mu _ (i) |> \ varepsilon s_ (n) \)}) wskaźnik funkcji  - .

    poprzez dystrybucję w godz n → ∞ (\ Displaystyle n \ do \ infty).

    Ts. P. T. Lyapunova

    Niech zostaną spełnione podstawowe założenia C. P. T. Lindeberga. Niech zmienne losowe ( X ja ) (\ displaystyle \ (X_ (i) \)) mieć skończoną trzecią chwilę. Następnie ustalana jest kolejność

    r n 3 = ∑ ja = 1 n mi [ | X i - μ i | 3 ] (\ Displaystyle r_ (n) ^ (3) = \ suma _ (i = 1) ^ (n) \ mathbb (E) \ lewo [|X_ (i) - \ mu _ (i) | ^ (3 )\Prawidłowy]).

    Jeśli limit

    lim n → ∞ r n s n = 0 (\ Displaystyle \ lim \ limity _ (n \ do \ infty) (\ Frac (r_ (n)) (s_ (n))) = 0) (Stan Łapunowa), S n - m n s n → N (0, 1) (\ Displaystyle (\ Frac (S_ (n) -m_ (n)) (s_ (n))) \ do N (0,1)) poprzez dystrybucję w godz n → ∞ (\ Displaystyle n \ do \ infty).

    C.P.T. dla martyngałów

    Pozwól procesowi (X n) n ∈ N (\ Displaystyle (X_ (n)) _ (n \ in \ mathbb (N))} jest martyngałem z ograniczonymi przyrostami. W szczególności załóżmy, że

    mi [ X n + 1 - X n ∣ X 1 , … , X n ] = 0 , n ∈ N , X 0 ≡ 0 , (\ Displaystyle \ mathbb (E) \ lewo = 0, \; n \ in \ mathbb (N) ,\;X_(0)\równoważnik 0,)

    a przyrosty są równomiernie ograniczone, to znaczy

    ∃ do > 0 ∀ n ∈ N | X n + 1 - X n | ≤ do (\ Displaystyle \ istnieje C> 0 \, \ forall n \ in \ mathbb (N) \; | X_ (n + 1) -X_ (n) | \ równoważnik C) τ n = min ( k | ∑ ja = 1 k σ ja 2 ≥ n ) (\ Displaystyle \ tau _ (n) = \ min \ lewo \ (k \ lewo \ pion \; \ suma _ (i = 1) ^ (k)\sigma _(i)^(2)\geq n\prawo.\prawo\)). X τ n n → N (0, 1) (\ Displaystyle (\ Frac (X _ (\ tau _ (n))) (\ sqrt (n)}) \ do N (0,1)) poprzez dystrybucję w godz n → ∞ (\ Displaystyle n \ do \ infty).