Mediana zmiennej losowej. Charakterystyki numeryczne zmiennych losowych

Tryb jest najbardziej prawdopodobną wartością zmiennej losowej. Przy rozkładzie symetrycznym względem średniej tryb pokrywa się z oczekiwaniem matematycznym. Jeśli wartości zmiennej losowej nie powtarzają się, nie ma trybu.

Punkt na osi x odpowiadający maksimum krzywej gęstości rozkładu nazywany jest modą, czyli modą jest najbardziej prawdopodobna wartość zmiennej losowej. Jednak nie wszystkie dystrybucje mają tryb. Przykładem jest rozkład równomierny. W tym przypadku określenie środka rozkładu jako modu jest niemożliwe. Moda jest zwykle określana jako Mo.

Istnieją pojęcia trybu i mediany zmienna losowa.  

Oczywiście w przypadku mediany symetrycznej pokrywa się ona z modą i oczekiwaniem matematycznym.

Wychodząc z tego, że moda opiera się nie na pojedynczych pomiarach, ale na duża objętość obserwacji, nie można jej uznać za zmienną losową. Wielkość trybu nie ma wpływu różnego rodzaju opóźnienia w pracy i utrata jej normalnego tempa.

Czasami podczas analizy rozkłady empiryczne użyj pojęć trybu i mediany rozkładu, „...Moda jest najbardziej prawdopodobną wartością zmiennej losowej,

Szerszą prawdopodobną interpretacją zjawiska loterii jest koncepcja rozkładu prawdopodobieństwa zmiennej losowej. Za jego pomocą określa się prawdopodobieństwo, że zmienna losowa przyjmie jedną lub drugą z możliwych wartości. Oznaczmy przez y zmienną losową, a przez y jej możliwe wartości. Następnie dla dyskretnej zmiennej losowej, która może przyjmować możliwe wartości Y, y2, VZ. .., za dogodną postać rozkładu prawdopodobieństwa należy uznać zależność P(y = y), którą zwykle nazywa się szeregiem prawdopodobieństwa, szeregiem rozkładu. W praktyce do szybkiej uogólnionej oceny probabilistycznego rozkładu wartości ryzyka często wykorzystuje się tzw. numeryczne i inne charakterystyki rozkładu wyników losowych: oczekiwanie matematyczne, rozproszenie, odchylenie średniokwadratowe (standardowe), współczynnik zmienności, tryb, mediana itp. (patrz na przykład itp.). Innymi słowy, o szybkie i całościowe postrzeganie przedsiębiorca dąży (lub po prostu

Na podstawie danych Państwowego Komitetu Statystycznego ZSRR na temat rozkładu populacji według średniego całkowitego dochodu na mieszkańca spróbujemy porównać wskaźniki dochodu średniego, mediany i modalnego (tabela 1). Z tabeli wynika, że ​​dochód przeciętny w wartości bezwzględnej przewyższa dochód medianowy i modalny, a jego wzrost następuje głównie na skutek wzrostu odsetka osób o wysokich dochodach, czyli stosowanie wskaźnika przeciętnego dochodu prowadzi do znacznego przeszacowania poziomu dochodów większości społeczeństwa i w dużej mierze ukrywa proces ich różnicowania. Modalne wartości dochodu ciążą w stronę niższych grup rozkładu i odbiegają od mediany dochodu w dół. Jednak występowanie mody w tym czy innym przedziale często ma charakter dość losowy. mała zmiana w rozkładzie - a mod będzie już w sąsiednim przedziale. Na przykład w 1989 r. najczęstszy poziom dochodów wynosił od 100 do 125 rubli (takie dochody osiągało 16,1% ludności), jednak ze względu na niewielkie zmiany w dochodach, jakie miały miejsce w latach 1989-1990, najczęstszym przedziałem był następujący przedział (125-150 rubli) , a wartość samej mody wzrosła o 15,6 rubli. Ponadto udział ludności w przedziale dochodów modalnych może tylko nieznacznie przekraczać pozostałe udziały.

W celu scharakteryzowania środka rozkładu logarytmicznie normalnej zmiennej losowej a można zastosować, wraz z już obliczoną oczekiwaniem matematycznym Ma, modę (lokalna gęstość maksymalna /(a a)) toc1a = exp(t-st2) i

Tryb - moda. Najbardziej prawdopodobna wartość zmiennej losowej.

MODA - koncepcja

Wartość oczekiwana. Oczekiwanie matematyczne Dyskretna zmienna losowa X, gospodarz ostateczny numer wartości XI z prawdopodobieństwami RI, kwota ta nazywa się:

Oczekiwanie matematyczne ciągła zmienna losowa X nazywa się całką iloczynu jej wartości X na gęstość rozkładu prawdopodobieństwa F(X):

(6B)

Całka niewłaściwa (6 B) przyjmuje się, że jest absolutnie zbieżny (w W przeciwnym razie mówią, że oczekiwanie matematyczne M(X) nie istnieje). Charakteryzuje się oczekiwaniem matematycznym Średnia wartość zmienna losowa X. Jego wymiar pokrywa się z wymiarem zmiennej losowej.

Nieruchomości oczekiwanie matematyczne:

Dyspersja. Zmienność zmienna losowa X numer nazywa się:

Różnica jest charakterystyka rozpraszania losowe wartości zmiennych X w stosunku do jego średniej wartości M(X). Wymiar wariancji jest równy kwadratowi wymiaru zmiennej losowej. Bazując na definicjach wariancji (8) i oczekiwaniu matematycznym (5) dla dyskretnej zmiennej losowej i (6) dla ciągłej zmiennej losowej otrzymujemy podobne wyrażenia na wariancję:

(9)

Tutaj M = M(X).

Właściwości dyspersji:

Odchylenie standardowe:

(11)

Ponieważ wymiar średniej odchylenie kwadratowe podobnie jak zmienna losowa, częściej jest używana jako miara rozproszenia niż wariancji.

Momenty dystrybucji. Pojęcia matematycznego oczekiwania i rozproszenia są szczególnymi przypadkami więcej ogólna koncepcja dla numerycznych charakterystyk zmiennych losowych – momenty dystrybucji. Momenty rozkładu zmiennej losowej wprowadza się jako oczekiwania matematyczne prostych funkcji zmiennej losowej. A więc chwila porządku k względem punktu X Wartość 0 nazywa się oczekiwaniem matematycznym M(XX 0 )k. Chwile o pochodzeniu X= 0 są wywoływane początkowe chwile i są oznaczone:

(12)

Momentem początkowym pierwszego rzędu jest środek rozkładu rozpatrywanej zmiennej losowej:

(13)

Chwile o centrum dystrybucji X= M są nazywane punkty centralne i są oznaczone:

(14)

Z (7) wynika, że ​​momentem centralnym pierwszego rzędu jest zawsze równy zeru:

Momenty centralne nie zależą od pochodzenia wartości zmiennej losowej, ponieważ po przesunięciu stała wartość Z jego centrum dystrybucyjne przesuwa się o tę samą wartość Z, a odchylenie od środka nie zmienia się: XM = (XZ) – (MZ).
Teraz to oczywiste dyspersja- Ten moment centralny drugiego rzędu:

Asymetria. Moment centralny trzeciego rzędu:

(17)

służy ocenie asymetrie dystrybucji. Jeśli rozkład jest symetryczny względem punktu X= M, wówczas moment centralny trzeciego rzędu będzie równy zeru (jak wszystkie momenty centralne rzędów nieparzystych). Dlatego też, jeżeli moment centralny trzeciego rzędu jest różny od zera, to rozkład nie może być symetryczny. Wielkość asymetrii ocenia się za pomocą bezwymiarowości współczynnik asymetrii:

(18)

Znak współczynnika asymetrii (18) wskazuje na asymetrię prawostronną lub lewostronną (rys. 2).


Ryż. 2. Rodzaje asymetrii rozkładu.

Nadmiar. Moment centralny czwartego rzędu:

(19)

służy do oceny tzw nadmiar, który określa stopień stromości (punktowości) krzywej rozkładu w pobliżu środka rozkładu w stosunku do krzywej normalna dystrybucja. Ponieważ dla rozkładu normalnego wartość przyjęta jako kurtoza wynosi:

(20)

Na ryc. 3 pokazuje przykłady krzywych rozkładu z różne znaczenia nadmiar. Do rozkładu normalnego mi= 0. Krzywe, które są bardziej spiczaste niż normalnie, mają kurtozę dodatnią, a te, które są bardziej płaskie, mają kurtozę ujemną.


Ryż. 3. Krzywe rozkładu z różnym stopniu chłód (nadmiar).

Momenty wyższego rzędu w zastosowaniach inżynierskich statystyka matematyczna zwykle nie używany.

Moda oddzielny zmienna losowa to jej najbardziej prawdopodobna wartość. Moda ciągły zmienna losowa to jej wartość, przy której gęstość prawdopodobieństwa jest maksymalna (rys. 2). Jeżeli krzywa rozkładu ma jedno maksimum, wówczas nazywa się rozkład jednomodalny. Jeżeli krzywa rozkładu ma więcej niż jedno maksimum, wówczas nazywa się rozkład multimodalny. Czasami istnieją rozkłady, których krzywe mają raczej minimum niż maksimum. Takie rozkłady nazywane są antymodalne. W przypadek ogólny tryb i oczekiwanie matematyczne zmiennej losowej nie pokrywają się. W szczególnym przypadku, np modalny, tj. mający modę, rozkład symetryczny i pod warunkiem, że istnieje oczekiwanie matematyczne, to drugie pokrywa się z trybem i środkiem symetrii rozkładu.

Mediana zmienna losowa X– taki jest jego sens Meh, dla którego zachodzi równość: tj. jest równie prawdopodobne, że zmienna losowa X będzie mniej lub więcej Meh. Geometrycznie mediana jest odciętą punktu, w którym pole pod krzywą rozkładu jest podzielone na pół (ryc. 2). W przypadku symetrycznego rozkładu modalnego mediana, moda i oczekiwanie matematyczne są takie same.

Wśród liczbowych charakterystyk zmiennych losowych należy przede wszystkim zwrócić uwagę na te, które charakteryzują położenie zmiennej losowej na osi liczbowej, tj. wskazać jakąś średnią, przybliżoną wartość, wokół której zgrupowane są wszystkie możliwe wartości zmiennej losowej.

Wartość średnia zmiennej losowej to pewna liczba, która jest niejako jej „przedstawicielem” i zastępuje ją w mniej więcej przybliżonych obliczeniach. Kiedy mówimy: „średni czas pracy lampy wynosi 100 godzin” lub „średni punkt trafienia jest przesunięty względem celu o 2 m w prawo”, wskazujemy na pewną charakterystykę liczbową zmiennej losowej opisującej jej położenie na osi liczbowej, tj. „charakterystyka pozycji”.

Z charakterystyki pozycji w teorii prawdopodobieństwa Istotną rolę odgrywa matematyczne oczekiwanie zmiennej losowej, które czasami nazywane jest po prostu średnią wartością zmiennej losowej.

Rozważmy dyskretną zmienną losową mającą możliwe wartości z prawdopodobieństwem. Musimy scharakteryzować jakąś liczbą położenie wartości zmiennej losowej na osi x, biorąc pod uwagę fakt, że wartości te mają różne prawdopodobieństwa. Naturalnym jest w tym celu stosowanie tzw. „średniej ważonej” wartości, a każdą wartość podczas uśredniania należy uwzględniać z „wagą” proporcjonalną do prawdopodobieństwa tej wartości. W ten sposób obliczymy średnią zmiennej losowej, którą oznaczymy wzorem:

lub, biorąc pod uwagę, że

. (5.6.1)

Ta średnia ważona nazywana jest matematycznym oczekiwaniem zmiennej losowej. W związku z tym wprowadziliśmy pod uwagę jeden z najważniejsze pojęcia teoria prawdopodobieństwa – koncepcja oczekiwań matematycznych.

Matematyczne oczekiwanie zmiennej losowej jest sumą iloczynów wszystkich możliwych wartości zmiennej losowej i prawdopodobieństw tych wartości.

Należy zauważyć, że w powyższym sformułowaniu definicja oczekiwań matematycznych obowiązuje ściśle rzecz biorąc, tylko dla dyskretnych zmiennych losowych; Poniżej uogólnimy tę koncepcję na przypadek wielkości ciągłych.

Aby uczynić pojęcie oczekiwań matematycznych bardziej przejrzystym, przejdźmy do mechanicznej interpretacji rozkładu dyskretnej zmiennej losowej. Niech na osi odciętych będą punkty z odciętymi, w których skupione są odpowiednio masy, oraz . Wtedy oczywiście oczekiwanie matematyczne określone wzorem (5.6.1) jest niczym innym jak odciętą środka ciężkości danego układu punktów materialnych.

Matematyczne oczekiwanie zmiennej losowej wiąże się ze szczególną zależnością ze średnią arytmetyczną obserwowanych wartości zmiennej losowej w duża liczba eksperymenty. Zależność ta jest tego samego typu, co zależność między częstotliwością a prawdopodobieństwem, a mianowicie: przy dużej liczbie eksperymentów średnia arytmetyczna obserwowanych wartości zmiennej losowej zbliża się (zbiega się pod względem prawdopodobieństwa) do jej oczekiwań matematycznych. Z obecności związku pomiędzy częstotliwością i prawdopodobieństwem można w konsekwencji wywnioskować istnienie podobnego związku pomiędzy średnią arytmetyczną i oczekiwaniem matematycznym.

Rzeczywiście, rozważ dyskretną zmienną losową charakteryzującą się szeregiem rozkładów:

Gdzie .

Niech zostaną przeprowadzone niezależne eksperymenty, w każdym z których ilość przyjmuje określoną wartość. Załóżmy, że wartość pojawiła się raz, wartość pojawiła się raz i wartość pojawiła się raz. Oczywiście,

Obliczmy średnią arytmetyczną zaobserwowanych wartości wielkości, którą w przeciwieństwie do oczekiwań matematycznych oznaczamy:

Ale nie ma nic więcej niż częstotliwość (lub statystyczne prawdopodobieństwo) zdarzenia; częstotliwość ta może zostać wyznaczona. Następnie

,

te. średnia arytmetyczna zaobserwowanych wartości zmiennej losowej jest równa sumie iloczynów wszystkich możliwych wartości zmiennej losowej i częstotliwości tych wartości.

W miarę wzrostu liczby eksperymentów częstotliwości będą zbliżać się (zbiegać się pod względem prawdopodobieństwa) z odpowiednimi prawdopodobieństwami. W rezultacie średnia arytmetyczna obserwowanych wartości zmiennej losowej będzie zbliżać się (zbiegać się pod względem prawdopodobieństwa) z oczekiwaniami matematycznymi w miarę wzrostu liczby eksperymentów.

Sformułowany powyżej związek średniej arytmetycznej z oczekiwaniem matematycznym stanowi treść jednej z form prawa duże liczby. Dokładny dowód tego prawa przedstawimy w rozdziale 13.

Wiemy już, że wszystkie formy prawa wielkich liczb stwierdzają, że niektóre średnie są stabilne w dużej liczbie eksperymentów. Tutaj mówimy o na stabilność średniej arytmetycznej z serii obserwacji tej samej wielkości. Przy niewielkiej liczbie eksperymentów średnia arytmetyczna ich wyników jest losowa; przy wystarczającym wzroście liczby eksperymentów staje się „prawie nielosowy” i stabilizuje się stała wartość– oczekiwanie matematyczne.

Stabilność średnich w dużej liczbie eksperymentów można łatwo zweryfikować eksperymentalnie. Na przykład podczas ważenia ciała w laboratorium precyzyjne wagi w wyniku ważenia za każdym razem otrzymujemy nową wartość; Aby zmniejszyć błąd obserwacji, ważymy ciało kilka razy i wykorzystujemy średnią arytmetyczną uzyskanych wartości. Łatwo zauważyć, że wraz ze wzrostem liczby doświadczeń (ważeń) średnia arytmetyczna coraz mniej reaguje na ten wzrost i przy odpowiednio dużej liczbie doświadczeń praktycznie przestaje się zmieniać.

Wzór (5.6.1) na oczekiwanie matematyczne odpowiada przypadkowi dyskretnej zmiennej losowej. Dla wartość ciągła oczekiwanie matematyczne wyraża się oczywiście nie jako sumę, ale jako całkę:

, (5.6.2)

gdzie jest gęstością rozkładu ilości .

Wzór (5.6.2) otrzymujemy ze wzoru (5.6.1), jeśli go zastąpimy indywidualne wartości stale zmieniający się parametr x, odpowiednie prawdopodobieństwa są elementem prawdopodobieństwa, końcowa kwota– integralny. W przyszłości będziemy często korzystać z tej metody, rozszerzając wzory wyprowadzane na wielkości nieciągłe na przypadek wielkości ciągłych.

W interpretacji mechanicznej matematyczne oczekiwanie ciągłej zmiennej losowej zachowuje to samo znaczenie - odciętą środka ciężkości w przypadku, gdy masa jest rozłożona wzdłuż odciętej w sposób ciągły, z gęstością . Ta interpretacja często pozwala znaleźć oczekiwanie matematyczne bez obliczania całki (5.6.2) na podstawie prostych rozważań mechanicznych.

Powyżej wprowadziliśmy zapis matematycznego oczekiwania wielkości. W wielu przypadkach, gdy ilość jest zawarta we wzorach jako konkretna liczba, wygodniej jest oznaczyć ją jedną literą. W takich przypadkach będziemy oznaczać matematyczne oczekiwanie wartości poprzez:

Oznaczenia i oczekiwania matematyczne będą w przyszłości stosowane równolegle, w zależności od wygody konkretnego zapisu wzorów. Zgódźmy się także, jeśli to konieczne, na skróty słów „oczekiwanie matematyczne” literami m.o.

Należy zauważyć, że najważniejsza cecha pozycji – oczekiwanie matematyczne – nie istnieje dla wszystkich zmiennych losowych. Można ułożyć przykłady takich zmiennych losowych, dla których nie istnieje oczekiwanie matematyczne, ponieważ odpowiadająca im suma lub całka jest rozbieżna.

Rozważmy na przykład nieciągłą zmienną losową z szeregiem rozkładów:

Łatwo to sprawdzić, tzn. szereg dystrybucji ma sens; jednak kwota w w tym przypadku jest rozbieżna i dlatego nie ma matematycznego oczekiwania co do wartości. Przypadki takie nie mają jednak większego znaczenia dla praktyki. Zazwyczaj zmienne losowe, z którymi mamy do czynienia, mają ograniczony obszar możliwa wartość i oczywiście mają matematyczne oczekiwania.

Powyżej podaliśmy wzory (5.6.1) i (5.6.2), wyrażające odpowiednio oczekiwanie matematyczne dla nieciągłej i ciągłej zmiennej losowej.

Jeśli ilość należy do ilości typ mieszany, to jego matematyczne oczekiwanie wyraża się wzorem w postaci:

, (5.6.3)

gdzie suma rozciąga się na wszystkie punkty, w których funkcja dystrybucji jest nieciągła, a całka rozciąga się na wszystkie obszary, w których funkcja dystrybucji jest ciągła.

Oprócz najważniejszej charakterystyki pozycji – oczekiwania matematycznego – w praktyce czasami wykorzystuje się inne cechy pozycji, w szczególności modę i medianę zmiennej losowej.

Modą zmiennej losowej jest jej najbardziej prawdopodobna wartość. Termin „najbardziej prawdopodobna wartość” ściśle rzecz biorąc odnosi się tylko do wielkości nieciągłych; dla wielkości ciągłej modą jest wartość, przy której gęstość prawdopodobieństwa jest maksymalna. Zgódźmy się oznaczać tryb literą . Na ryc. Rysunki 5.6.1 i 5.6.2 pokazują odpowiednio tryb dla nieciągłych i ciągłych zmiennych losowych.

Jeżeli wielokąt rozkładu (krzywa rozkładu) ma więcej niż jedno maksimum, rozkład nazywa się „multimodalnym” (rys. 5.6.3 i 5.6.4).

Czasami istnieją rozkłady, które mają minimum pośrodku, a nie maksimum (ryc. 5.6.5 i 5.6.6). Takie rozkłady nazywane są „antymodalnymi”. Przykładem rozkładu antymodalnego jest rozkład uzyskany w Przykładzie 5, nr 5.1.

W ogólnym przypadku tryb i oczekiwanie matematyczne zmiennej losowej nie pokrywają się. W szczególnym przypadku, gdy rozkład jest symetryczny i modalny (tj. ma modę) i istnieje oczekiwanie matematyczne, to pokrywa się on z modą i środkiem symetrii rozkładu.

Często wykorzystuje się inną charakterystykę pozycji – tzw. medianę zmiennej losowej. Cecha ta jest zwykle stosowana tylko dla ciągłych zmiennych losowych, chociaż można ją formalnie zdefiniować dla zmiennej nieciągłej.

Mediana zmiennej losowej to jej wartość, dla której

te. jest równie prawdopodobne, że zmienna losowa będzie mniejsza lub większa niż . Geometrycznie mediana jest odciętą punktu, w którym obszar ograniczony krzywą rozkładu jest podzielony na pół (ryc. 5.6.7).

Moda- wartość w zbiorze obserwacji, która występuje najczęściej

Mo = X Mo + h Mo * (f Mo - f Mo-1): ((f Mo - f Mo-1) + (f Mo - f Mo+1)),

tutaj X Mo jest lewą granicą przedziału modalnego, h Mo jest długością przedziału modalnego, f Mo-1 jest częstotliwością przedziału przedmodalnego, f Mo jest częstotliwością przedziału modalnego, f Mo+1 jest częstotliwością częstotliwość interwału postmodalnego.

Postacią rozkładu absolutnie ciągłego jest dowolny punkt lokalnego maksimum gęstości rozkładu. Dla dystrybucje dyskretne za modę uważa się dowolną wartość a i, której prawdopodobieństwo pi jest większe od prawdopodobieństw sąsiednich wartości

Mediana ciągła zmienna losowa X wywoływana jest jego wartość Me, dla której jest równie prawdopodobne, że zmienna losowa będzie mniejsza lub większa Meh, tj.

M mi = (n+1)/2 P(X < Ja) = P(X > Meh)

Równomiernie rozłożone NSV

Równomierna dystrybucja. Ciągłą zmienną losową nazywa się równomiernie rozłożoną na segmencie (), jeśli jej funkcja gęstości rozkładu (ryc. 1.6, A) ma postać:

Oznaczenie: – SW jest równomiernie rozłożone na .

Odpowiednio funkcja rozkładu na segmencie (ryc. 1.6, B):

Ryż. 1.6. Funkcje zmiennej losowej o rozkładzie jednostajnym na [ A,B]: A– gęstości prawdopodobieństwa F(X); B– dystrybucje F(X)

Matematyczne oczekiwanie i rozproszenie danej wartości SV określają wyrażenia:

Ze względu na symetrię funkcji gęstości pokrywa się ona z medianą. Mody równomierny rozkład nie ma

Przykład 4. Czas oczekiwania na odpowiedź połączenie telefoniczne– zmienna losowa spełniająca prawo rozkładu równomiernego w przedziale od 0 do 2 minut. Znajdź całkę i funkcja różniczkowa rozkład tej zmiennej losowej.

27.Normalne prawo rozkładu prawdopodobieństwa

Ciągła zmienna losowa x ma rozkład normalny o parametrach: m,s > 0, jeżeli gęstość rozkładu prawdopodobieństwa ma postać:

gdzie: m – oczekiwanie matematyczne, s – odchylenie standardowe.



Rozkład normalny nazywany jest również gaussowskim Niemiecki matematyk Gaus. Fakt, że zmienna losowa ma rozkład normalny o parametrach: m, oznacza się następująco: N (m,s), gdzie: m=a=M[X];

Dość często we wzorach oczekiwanie matematyczne jest oznaczone przez A . Jeśli zmienna losowa jest rozłożona zgodnie z prawem N(0,1), wówczas nazywa się ją znormalizowaną lub standaryzowaną normalny rozmiar. Funkcja dystrybucji dla niego ma postać:

Wykres gęstości rozkładu normalnego, zwany krzywą normalną lub krzywą Gaussa, pokazano na ryc. 5.4.

Ryż. 5.4. Normalna gęstość dystrybucji

nieruchomości zmienna losowa posiadająca normalne prawo dystrybucje.

1. Jeżeli , to znaleźć prawdopodobieństwo, że ta wartość będzie mieściła się w danym przedziale ( x 1; x 2) stosuje się wzór:

2. Prawdopodobieństwo, że odchylenie zmiennej losowej od jej oczekiwań matematycznych nie przekroczy wartości (o całkowita wartość), jest równy.