Bestem estimater af matematisk forventning og varians. Punktestimat og dets egenskaber

Lad den tilfældige prøve genereres af den observerede tilfældige variabel ξ, den matematiske forventning og varians som er ukendte. Det blev foreslået at bruge stikprøvegennemsnittet som estimater for disse karakteristika

og prøvevarians

. (3.14)

Lad os overveje nogle egenskaber ved estimater af matematisk forventning og spredning.

1. Beregn den matematiske forventning af stikprøvegennemsnittet:

Derfor er stikprøvegennemsnittet en upartisk estimator for .

2. Husk at resultaterne observationer er uafhængige stokastiske variable, som hver især har samme fordelingslov som værdien, hvilket betyder , , . Vi vil antage, at variansen er endelig. Så, ifølge Chebyshevs sætning om loven om store tal, gælder ligheden for enhver ε > 0 ,

som kan skrives sådan her: . (3.16) Ved at sammenligne (3.16) med definitionen af ​​konsistensegenskaben (3.11) ser vi, at estimatet er et konsistent estimat af den matematiske forventning.

3. Find variansen af ​​prøvegennemsnittet:

. (3.17)

Således falder variansen af ​​det matematiske forventningsestimat i omvendt proportion til stikprøvestørrelsen.

Det kan bevises, at hvis den stokastiske variabel ξ er normalfordelt, så er stikprøvegennemsnittet et effektivt estimat af den matematiske forventning, det vil sige, at variansen tager den mindste værdi sammenlignet med ethvert andet estimat af den matematiske forventning. For andre distributionslove ξ er dette muligvis ikke tilfældet.

Prøvevariansen er et skævt estimat af variansen, fordi . (3.18)

Faktisk, ved at bruge egenskaberne for den matematiske forventning og formel (3.17), finder vi

.

For at opnå et upartisk estimat af variansen skal estimat (3.14) korrigeres, det vil sige ganget med . Så får vi den upartiske prøvevarians

. (3.19)

Bemærk, at formlerne (3.14) og (3.19) kun adskiller sig i nævneren, og for store værdier adskiller stikprøven og uvildige varianser sig lidt. Men med en lille stikprøvestørrelse bør relation (3.19) anvendes.

For at estimere standardafvigelsen af ​​en stokastisk variabel bruges den såkaldte "korrigerede" standardafvigelse, som er lig med kvadratroden af ​​den upartiske varians: .

Interval estimater

I statistik er der to tilgange til at estimere ukendte parametre for distributioner: punkt og interval. I overensstemmelse med punktestimering, som blev diskuteret i det foregående afsnit, er kun det punkt, som den estimerede parameter er placeret omkring, angivet. Det er dog ønskeligt at vide, hvor langt denne parameter faktisk kan være fra de mulige realiseringer af estimaterne i forskellige serier af observationer.

Svaret på dette spørgsmål - også omtrentligt - er givet ved en anden metode til at estimere parametre - interval. I overensstemmelse med denne estimeringsmetode findes et interval, der med en sandsynlighed tæt på én dækker den ukendte numeriske værdi af parameteren.

Begrebet interval estimering

Punktestimat er en tilfældig variabel og for mulige prøveimplementeringer tager kun værdier omtrent lig med den sande værdi af parameteren. Jo mindre forskellen er, desto mere nøjagtig er estimatet. Altså et positivt tal for hvilket , karakteriserer nøjagtigheden af ​​estimatet og kaldes estimeringsfejl (eller marginalfejl).

Tillidssandsynlighed(eller pålidelighed) kaldet sandsynlighed β , hvormed ulighed realiseres , dvs.

. (3.20)

Erstatter ulighed tilsvarende dobbelt ulighed , eller , vi får

Interval , der dækker med sandsynlighed β , , ukendt parameter, kaldes konfidensinterval (eller interval estimering), tilsvarende tillidssandsynlighed β .

En tilfældig variabel er ikke kun et skøn, men også en fejl: dens værdi afhænger af sandsynligheden β og som regel fra stikprøven. Derfor er konfidensintervallet tilfældigt, og udtryk (3.21) skal læses som følger: “Intervallet vil dække parameteren med sandsynlighed β ”, og ikke sådan her: “Parameteren vil med sandsynlighed falde ind i intervallet β ”.

Betydningen af ​​konfidensintervallet er, at når en prøvevolumen gentages mange gange i en relativ andel af tilfælde lig med β , konfidensinterval svarende til konfidenssandsynligheden β , dækker den sande værdi af den estimerede parameter. Således tillidssandsynligheden β karakteriserer pålidelighed tillidsvurdering: jo mere β , jo mere sandsynligt er det, at implementeringen af ​​konfidensintervallet indeholder en ukendt parameter.

Lad uafhængige eksperimenter udføres på en tilfældig variabel med ukendt matematisk forventning og varians, hvilket gav resultaterne - . Lad os beregne konsistente og upartiske estimater for parametrene og .

Som et estimat for den matematiske forventning tager vi det aritmetiske middelværdi af de eksperimentelle værdier

. (2.9.1)

Ifølge loven om store tal er dette skøn velhavende , med værdi efter sandsynlighed. Den samme vurdering er også upartisk , fordi

. (2.9.2)

Variansen af ​​dette skøn er

. (2.9.3)

Det kan påvises, at for normalfordelingsloven er dette skøn effektiv . For andre love er dette muligvis ikke tilfældet.

Lad os nu anslå variansen. Lad os først vælge formlen for estimering statistisk varians

. (2.9.4)

Lad os kontrollere konsistensen af ​​variansestimatet. Lad os åbne parenteserne i formel (2.9.4)

.

Når det første led konvergerer i sandsynlighed til værdien , i den anden - til. Vores estimat konvergerer således i sandsynlighed til variansen

,

derfor er hun velhavende .

Lad os tjekke uforskudt skøn for mængde. For at gøre dette erstatter vi udtryk (2.9.1) med formel (2.9.4) og tager højde for, at de stokastiske variabler uafhængig

,

. (2.9.5)

Lad os gå i formlen (2.9.5) til fluktuationer af stokastiske variable

Åbning af beslagene, får vi

,

. (2.9.6)

Lad os beregne den matematiske forventning om værdi (2.9.6) under hensyntagen til det

. (2.9.7)

Relation (2.9.7) viser, at værdien beregnet ved hjælp af formel (2.9.4) er ikke et uvildigt skøn til spredning. Dens matematiske forventning er ikke lige, men noget mindre. En sådan vurdering fører til en systematisk fejl nedad. For at eliminere en sådan skævhed skal du indføre en korrektion ved at gange værdien. Denne korrigerede statistiske varians kan derefter tjene som en upartisk estimator for variansen

. (2.9.8)

Dette estimat er lige så gyldigt som estimatet, siden da er værdien.

I praksis er det i stedet for estimat (2.9.8) nogle gange mere bekvemt at bruge et tilsvarende estimat forbundet med det andet indledende statistiske øjeblik

. (2.9.9)

Estimater (2.9.8), (2.9.9) er ikke effektive. Det kan påvises, at i tilfælde af en normalfordelingslov vil de være det asymptotisk effektiv (efter vilje til den mindst mulige værdi).

Således kan følgende regler for behandling af statistisk materiale begrænset i volumen formuleres. Hvis i uafhængige eksperimenter den stokastiske variabel tager værdierne med ukendt matematisk forventning og spredning, så for at bestemme disse parametre bør man bruge omtrentlige estimater

(2.9.10)

Slut på arbejde -

Dette emne hører til sektionen:

Forelæsningsnotater i matematik sandsynlighedsteori matematisk statistik

Institut for Højere Matematik og Datalogi.. Forelæsningsnotater.. i Matematik..

Hvis du har brug for yderligere materiale om dette emne, eller du ikke fandt det, du ledte efter, anbefaler vi at bruge søgningen i vores database over værker:

Hvad vil vi gøre med det modtagne materiale:

Hvis dette materiale var nyttigt for dig, kan du gemme det på din side på sociale netværk:

Alle emner i dette afsnit:

Sandsynlighedsteori
Sandsynlighedsteori er en gren af ​​matematikken, hvor mønstrene af tilfældige massefænomener studeres. Et tilfældigt fænomen kaldes

Statistisk definition af sandsynlighed
En hændelse er et tilfældigt fænomen, der kan eller måske ikke opstår som et resultat af erfaring (tvetydigt fænomen). Angiv begivenheder med store latinske bogstaver

Rum af elementære begivenheder
Lad der være mange begivenheder forbundet med en eller anden oplevelse, og: 1) som et resultat af oplevelsen dukker der kun én ting op

Handlinger på begivenheder
Summen af ​​to begivenheder og

Omarrangeringer
Antallet af forskellige permutationer af elementer er angivet med

Placeringer
Ved at placere elementerne iflg

Kombinationer
En kombination af elementer

Formel til tilføjelse af sandsynligheder for uforenelige hændelser
Sætning. Sandsynligheden for summen af ​​to uforenelige hændelser er lig med summen af ​​sandsynligheden for disse hændelser. (1

Formel til tilføjelse af sandsynligheder for vilkårlige hændelser
Sætning. Sandsynligheden for summen af ​​to begivenheder er lig med summen af ​​sandsynligheden for disse begivenheder uden sandsynligheden for deres produkt.

Formel for sandsynlighedsmultiplikation
Lad to begivenheder og blive givet. Overvej begivenheden

Formel for total sandsynlighed
Lad være en komplet gruppe af uforenelige begivenheder; de kaldes hypoteser. Overvej en begivenhed

Hypotese Sandsynlighedsformel (Bayes)
Lad os overveje igen - den komplette gruppe af uforenelige hypoteser og begivenheden

Asymptotisk Poisson-formel
I tilfælde, hvor antallet af tests er stort og sandsynligheden for, at en hændelse indtræffer

Tilfældige diskrete mængder
En tilfældig størrelse er en størrelse, der, når forsøget gentages, kan antage ulige numeriske værdier. Den tilfældige variabel kaldes diskret,

Tilfældige kontinuerte variable
Hvis en stokastisk variabel som et resultat af et eksperiment kan antage en hvilken som helst værdi fra et bestemt segment eller hele den reelle akse, så kaldes det kontinuert. Lov

Sandsynlighedstæthedsfunktion af en tilfældig kontinuerlig variabel
Lad ske. Lad os overveje et punkt og give det trin

Numeriske karakteristika for stokastiske variable
Tilfældige diskrete eller kontinuerte variable anses for at være fuldstændig specificerede, hvis deres distributionslove er kendte. Hvis du kender distributionslovene, kan du faktisk altid beregne sandsynligheden for at ramme

Kvantiler af stokastiske variable
Kvantil af størrelsesordenen af ​​en tilfældig kontinuerlig variabel

Matematisk forventning til stokastiske variable
Den matematiske forventning til en stokastisk variabel karakteriserer dens gennemsnitlige værdi. Alle værdier af den tilfældige variabel er grupperet omkring denne værdi. Lad os først overveje den tilfældige diskrete variabel

Standardafvigelse og spredning af stokastiske variable
Lad os først overveje en tilfældig diskret variabel. Numeriske karakteristika tilstand, median, kvantiler og matematisk forventning

Momenter af tilfældige variable
Ud over matematisk forventning og spredning bruger sandsynlighedsteorien numeriske karakteristika af højere orden, som kaldes momenter af tilfældige variable.

Sætning om stokastiske variables numeriske karakteristika
Sætning 1. Den matematiske forventning om en ikke-tilfældig værdi er lig med denne værdi selv. Bevis: Lad

Binomial distributionslov

Poisson distribution lov
Lad en tilfældig diskret variabel tage værdierne

Ensartet distributionslov
Den ensartede lov om fordelingen af ​​en tilfældig kontinuert variabel er loven for sandsynlighedstæthedsfunktionen, som

Normalfordelingsloven
Normalfordelingsloven for en tilfældig kontinuert variabel er tæthedsfunktionsloven

Eksponentiel distributionslov
Den eksponentielle eller eksponentielle fordeling af en stokastisk variabel bruges i sådanne anvendelser af sandsynlighedsteori som køteori, pålidelighedsteori

Systemer af tilfældige variable
I praksis støder man i anvendelser af sandsynlighedsteori ofte på problemer, hvor resultaterne af et eksperiment ikke beskrives af én stokastisk variabel, men af ​​flere tilfældige på én gang.

System af to tilfældige diskrete variable
Lad to tilfældige diskrete variable danne et system. Tilfældig værdi

System af to tilfældige kontinuerte variable
Lad nu systemet være dannet af to tilfældige kontinuerte variable. Distributionsloven for dette system kaldes sandsynligvis

Betingede distributionslove
Lad afhængige tilfældige kontinuerlige mængder

Numeriske karakteristika for et system af to stokastiske variable
Det første rækkefølgemoment for et system af stokastiske variable

System af flere tilfældige variable
De opnåede resultater for et system med to stokastiske variable kan generaliseres til tilfældet med systemer, der består af et vilkårligt antal stokastiske variable. Lad systemet dannes af et sæt

Normalfordelingsloven for et system af to stokastiske variable
Lad os betragte et system af to tilfældige kontinuerte variable. Fordelingsloven for dette system er normalfordelingsloven

Sandsynlighedsteoriens grænsesætninger
Hovedmålet med disciplinteorien om sandsynlighed er at studere mønstrene for tilfældige massefænomener. Praksis viser, at observation af en masse homogene tilfældige fænomener afslører

Chebyshevs ulighed
Overvej en tilfældig variabel med matematisk forventning

Chebyshevs teorem
Hvis de stokastiske variable er parvis uafhængige og har endelige, kollektivt afgrænsede varianser

Bernoullis sætning
Med en ubegrænset stigning i antallet af eksperimenter konvergerer hyppigheden af ​​forekomsten af ​​en begivenhed i sandsynlighed til sandsynligheden for begivenheden

Central grænsesætning
Ved tilføjelse af tilfældige variable med eventuelle fordelingslove, men med fælles begrænsede varianser, er fordelingsloven

Hovedproblemer i matematisk statistik
Lovene for sandsynlighedsteori diskuteret ovenfor repræsenterer et matematisk udtryk for virkelige mønstre, der faktisk eksisterer i forskellige tilfældige massefænomener. Studerer

En simpel statistisk population. Statistisk fordelingsfunktion
Lad os overveje en tilfældig variabel, hvis fordelingslov er ukendt. Påkrævet baseret på erfaring

Statistiske serier. søjlediagram
Med et stort antal observationer (i størrelsesordenen hundreder) bliver befolkningen ubelejlig og besværlig at registrere statistisk materiale. For klarhed og kompakthed, statistisk materiale

Numeriske karakteristika for statistisk fordeling
I sandsynlighedsteorien blev forskellige numeriske karakteristika for stokastiske variable overvejet: matematisk forventning, spredning, indledende og centrale momenter af forskellige ordener. Lignende tal

Udvælgelse af teoretisk fordeling ved hjælp af momentmetoden
Enhver statistisk fordeling indeholder uundgåeligt elementer af tilfældighed forbundet med det begrænsede antal observationer. Med et stort antal observationer udjævnes disse elementer af tilfældighed,

Kontrol af plausibiliteten af ​​hypotesen om fordelingslovens form
Lad en given statistisk fordeling tilnærmes med en eller anden teoretisk kurve eller

Samtykkekriterier
Lad os overveje et af de mest almindeligt anvendte godhedskriterier - det såkaldte Pearson-kriterium. Gætte

Punktestimater for ukendte fordelingsparametre
I pp. 2.1. – 2.7 undersøgte vi i detaljer, hvordan man løser det første og andet hovedproblem i matematisk statistik. Disse er problemerne med at bestemme lovene for fordeling af tilfældige variable baseret på eksperimentelle data

Konfidensinterval. Tillidssandsynlighed
I praksis, med et lille antal eksperimenter på en stokastisk variabel, en omtrentlig erstatning af den ukendte parameter

Lad der være en tilfældig variabel X, og dens parametre er den matematiske forventning EN og varians er ukendt. N uafhængige eksperimenter blev udført på værdien X, hvilket gav resultaterne x 1, x 2, x n.

Uden at reducere almenheden af ​​ræsonnementet, vil vi betragte disse værdier af den tilfældige variabel for at være forskellige. Vi vil betragte værdierne x 1, x 2, x n som uafhængige, identisk fordelte stokastiske variable X 1, X 2, X n.

Den enkleste metode til statistisk estimering - metoden til substitution og analogi - består i at tage den tilsvarende karakteristik af stikprøvefordelingen - stikprøvekarakteristikken - som et estimat af en eller anden numerisk karakteristik (middelværdi, varians osv.) for den generelle befolkning .

Brug af substitutionsmetoden som et skøn over den matematiske forventning EN vi skal tage den matematiske forventning til stikprøvefordelingen - stikprøvegennemsnittet. Således får vi

For at kontrollere stikprøvens objektivitet og konsistens som et skøn EN, betragte denne statistik som en funktion af den valgte vektor (X 1, X 2, X n). Under hensyntagen til, at hver af størrelserne X 1, X 2, X n har samme fordelingslov som værdien X, konkluderer vi, at de numeriske karakteristika for disse størrelser og værdien X er de samme: M(X) jeg) = M(X) = -en, D(X jeg) = D(X) = , jeg = 1, 2, n , hvor X i er kollektivt uafhængige stokastiske variable.

Derfor,

Herfra får vi per definition, at det er et upartisk skøn EN, og da D()®0 for n®¥, så ved sætningen i det foregående afsnit er et konsistent estimat af den matematiske forventning EN almindelig befolkning.

Estimatets effektivitet eller ineffektivitet afhænger af typen af ​​fordelingslov for den stokastiske variabel X. Det kan bevises, at hvis værdien X er fordelt efter en normallov, så er estimatet effektivt. For andre distributionslove er dette muligvis ikke tilfældet.

Et upartisk estimat af den generelle varians fungerer som den korrigerede prøvevarians

,

Fordi , hvor er den generelle varians. Virkelig,

Estimatet s -- 2 for den generelle varians er også gyldigt, men det er ikke effektivt. Men i tilfælde af en normalfordeling er den "asymptotisk effektiv", det vil sige, når n stiger, nærmer forholdet mellem dens varians til den mindst mulige en uendeligt enhed.

Så hvis der gives en prøve fra fordelingen F( x) stokastisk variabel X med ukendt matematisk forventning EN og spredning, så for at beregne værdierne af disse parametre har vi ret til at bruge følgende omtrentlige formler:

-en ,

.

Her x-i- - sampling mulighed, n-i - - frekvens muligheder x i, - - prøvestørrelse.
For at beregne den korrigerede prøvevarians er formlen mere praktisk


.

For at forenkle beregningen er det tilrådeligt at skifte til betingede muligheder (som med er det fordelagtigt at tage den originale version, placeret i midten af ​​intervalvariationsserien). Derefter

, .

Interval estimering

Ovenfor overvejede vi spørgsmålet om at estimere en ukendt parameter ENét nummer. Sådanne estimater kalder vi punktestimater. De har den ulempe, at de med en lille stikprøvestørrelse kan afvige væsentligt fra de estimerede parametre. For at få en idé om nærheden mellem en parameter og dens estimat introduceres såkaldte intervalestimater i matematisk statistik.

Lad et punktestimat q * findes i prøven for parameter q. Normalt får forskere på forhånd en tilstrækkelig stor sandsynlighed g (f.eks. 0,95, 0,99 eller 0,999), således at en hændelse med sandsynlighed g kan anses for praktisk pålidelig, og de rejser spørgsmålet om at finde en sådan værdi e > 0 for hvilken

.

Ved at ændre denne lighed får vi:

og i dette tilfælde vil vi sige, at intervallet ]q * - e; q * + e[ dækker den estimerede parameter q med sandsynlighed g.

Interval ]q * -e; q * +e [ kaldes konfidensinterval .

Sandsynligheden g kaldes pålidelighed (konfidenssandsynlighed) for intervalestimatet.

Enderne af konfidensintervallet, dvs. punkterne q * -e og q * +e kaldes tillidsgrænser .

Nummeret e kaldes vurderingsnøjagtighed .

Som et eksempel på problemet med at bestemme konfidensgrænser kan du overveje spørgsmålet om at estimere den matematiske forventning til en stokastisk variabel X, som har en normalfordelingslov med parametre EN og s, dvs. X = N( -en, s). Den matematiske forventning er i dette tilfælde lig med EN. Ud fra observationer X 1, X 2, X n beregner vi gennemsnittet og vurdering dispersion s 2.

Det viser sig, at det ud fra stikprøvedataene er muligt at konstruere en tilfældig variabel

som har en Student-fordeling (eller t-fordeling) med n = n -1 frihedsgrader.

Lad os bruge tabel A.1.3 og finde for en given sandsynlighed g og tal n tallet t g, således at sandsynligheden

P(|t(n)|< t g) = g,

.

Efter at have foretaget åbenlyse transformationer får vi,

Proceduren for at anvende F-testen er som følger:

1. Det antages, at fordelingen af ​​befolkningen er normal. På et givet signifikansniveau a formuleres nulhypotesen H 0: s x 2 = s y 2 om ligheden af ​​normalpopulationernes generelle varians under den konkurrerende hypotese H 1: s x 2 > s y 2.

2. To uafhængige prøver er opnået fra populationerne X og Y af henholdsvis volumen n x og n y.

3. Beregn værdierne af de korrigerede stikprøvevarianser s x 2 og s y 2 (beregningsmetoder er omtalt i §13.4). Jo større af varianserne (s x 2 eller s y 2) betegnes s 1 2, jo mindre - s 2 2.

4. Værdien af ​​F-kriteriet beregnes ved hjælp af formlen F obs = s 1 2 / s 2 2.

5. Ved hjælp af tabellen over kritiske punkter for Fisher-Snedecor-fordelingen, på et givet signifikansniveau a og antallet af frihedsgrader n 1 = n 1 - 1, n 2 = n 2 - 1 (n 1 er antallet af frihedsgrader frihedsgrader af den større korrigerede varians), findes det kritiske punkt F cr (a, n 1, n 2).

Bemærk, at tabel A.1.7 viser de kritiske værdier for den ensidede F-test. Derfor, hvis der anvendes et tosidet kriterium (H 1: s x 2 ¹ s y 2), så søges det højresidede kritiske punkt F cr (a/2, n 1, n 2) efter signifikansniveauet a/ 2 (halvdelen af ​​den angivne værdi) og antallet af magter frihed n 1 og n 2 (n 1 er antallet af frihedsgrader for større spredning). Det kritiske punkt til venstre kan muligvis ikke findes.

6. Konklusionen drages: hvis den beregnede værdi af F-kriteriet er større end eller lig med den kritiske værdi (F obs ³ F cr), så adskiller varianserne sig væsentligt på et givet signifikansniveau. Ellers (F obs.< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Opgave 15.1. Forbruget af råvarer pr. produktionsenhed ved brug af den gamle teknologi var:

Brug af ny teknologi:

Hvis vi antager, at de tilsvarende generelle populationer X og Y har normalfordelinger, skal du kontrollere, at forbruget af råmaterialer til de nye og gamle teknologier med hensyn til variabilitet ikke adskiller sig, hvis vi tager signifikansniveauet a = 0,1.

Løsning. Vi fortsætter i den rækkefølge, der er angivet ovenfor.

1. Vi vil bedømme variabiliteten af ​​råvareforbrug ved nye og gamle teknologier baseret på spredningsværdierne. Således har nulhypotesen formen H 0: s x 2 = s y 2. Som en konkurrerende hypotese accepterer vi hypotese H 1: s x 2 ¹ s y 2, da vi ikke på forhånd er sikre på, at nogen af ​​de generelle varianser er større end den anden.

2-3. Lad os finde prøvevarianserne. For at forenkle beregningerne, lad os gå videre til betingede muligheder:

ui = x i - 307, v i = y i - 304.

Vi arrangerer alle beregninger i form af følgende tabeller:

u i m i m i u i m i u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 ni (vi+1) 2
-3 -3 -1 -2
å -
å -

Kontrol: å m i u i 2 + 2å m i u i + m i = Kontrol: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Lad os finde de korrigerede prøvevarianser:

4. Lad os sammenligne varianserne. Lad os finde forholdet mellem den større korrigerede varians og den mindre:

.

5. Som betingelse har den konkurrerende hypotese formen s x 2 ¹ s y 2, derfor er det kritiske område tosidet, og når man finder det kritiske punkt, bør der tages signifikansniveauer, der er halvdelen af ​​den specificerede værdi.

Ifølge tabel A.1.7, ved at bruge signifikansniveauet a/2 = 0,1/2 = 0,05 og antallet af frihedsgrader n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, finder vi kritisk punkt Fcr (0,05; 12; 8) = 3,28.

6. Siden F obs.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Ovenfor antog vi, når vi testede hypoteser, normalfordelingen af ​​de tilfældige variabler under undersøgelse. Særlige undersøgelser har dog vist, at de foreslåede algoritmer er meget stabile (især med store stikprøvestørrelser) med hensyn til afvigelser fra normalfordelingen.

Fordelingsparametre og statistik

Alle parametre for fordelingen af ​​en tilfældig variabel, for eksempel, såsom den matematiske forventning eller varians, er teoretiske størrelser, der ikke kan måles direkte, selvom de kan estimeres. De repræsenterer en kvantitativ egenskab befolkning og kan i sig selv kun bestemmes under teoretisk modellering som hypotetiske værdier, da de beskriver træk ved fordelingen af ​​en tilfældig variabel i selve den generelle befolkning. For at bestemme dem i praksis, foretager forskeren, der udfører eksperimentet, en selektiv vurdering af dem. Denne vurdering involverer statistisk beregning.

Statistikker er en kvantitativ karakteristik af de undersøgte parametre, der karakteriserer fordelingen af ​​en stokastisk variabel opnået på grundlag af en undersøgelse af stikprøveværdier. Statistik bruges enten til at beskrive selve stikprøven, eller, hvilket er af afgørende betydning i fundamental eksperimentel forskning, til at estimere parametrene for fordelingen af ​​en tilfældig variabel i den undersøgte population.

Adskillelse af begreber "parameter" Og "Statistikker" er meget vigtigt, da det giver dig mulighed for at undgå en række fejl forbundet med forkert fortolkning af data opnået i eksperimentet. Faktum er, at når vi estimerer distributionsparametre ved hjælp af statistiske data, får vi værdier, der kun til en vis grad er tæt på de estimerede parametre. Der er næsten altid en vis forskel mellem parametre og statistik, og vi kan normalt ikke sige, hvor stor denne forskel er. Teoretisk set, jo større stikprøven er, jo tættere er de estimerede parametre på deres prøvekarakteristika. Dette betyder dog ikke, at vi ved at øge stikprøvestørrelsen uundgåeligt vil komme tættere på den estimerede parameter og reducere forskellen mellem den og den beregnede statistik. I praksis kan alt vise sig at være meget mere kompliceret.

Hvis den forventede værdi af statistikken i teorien falder sammen med den estimerede parameter, kaldes et sådant estimat uforskudt. Et estimat, hvor den forventede værdi af den estimerede parameter adskiller sig fra selve parameteren med en vis mængde kaldes fortrængt.

Det er også nødvendigt at skelne mellem punkt- og intervalestimater af fordelingsparametre. Få øje på kaldet en vurdering ved hjælp af et nummer. For eksempel, hvis vi siger, at værdien af ​​den rumlige tærskel for taktil følsomhed for et givet emne under givne forhold og på et givet hudområde er 21,8 mm, så vil et sådant estimat være punkt. På samme måde opstår et punktestimat, når vejrudsigten fortæller os, at det er 25°C uden for vinduet. Interval estimering involverer brugen af ​​et sæt eller række af tal i en vurdering. Ved at vurdere den rumlige tærskel for taktil følsomhed kan vi sige, at den var i området fra 20 til 25 mm. Tilsvarende kan vejrudsigtere rapportere, at lufttemperaturen i de næste 24 timer ifølge deres prognoser vil nå 22-24°C. Interval estimering af en tilfældig variabel giver os ikke kun mulighed for at bestemme den ønskede værdi af denne mængde, men også at indstille den mulige nøjagtighed for et sådant estimat.

Matematisk forventning og dens evaluering

Lad os vende tilbage til vores møntkast-eksperiment.

Lad os prøve at besvare spørgsmålet: hvor mange gange skal "hoveder" dukke op, hvis vi slår en mønt ti gange? Svaret virker indlysende. Hvis sandsynligheden for hvert af to udfald er lige store, så skal selve udfaldene være ligeligt fordelt. Med andre ord, når vi kaster en almindelig mønt ti gange, kan vi forvente, at en af ​​dens sider, for eksempel "hoveder", vil lande præcis fem gange. På samme måde, når man kaster en mønt 100 gange, skal "hoveder" vises nøjagtigt 50 gange, og hvis mønten kastes 4236 gange, så skal den side af interesse for os vises 2118 gange, hverken mere eller mindre.

Så den teoretiske betydning af en tilfældig begivenhed kaldes normalt matematisk forventning. Den forventede værdi kan findes ved at gange den tilfældige variabels teoretiske sandsynlighed med antallet af forsøg. Mere formelt defineres det dog som et førsteordens centralt øjeblik. Den matematiske forventning er således værdien af ​​en tilfældig variabel, som den teoretisk tenderer til under gentagne tests, omkring hvilke den varierer.

Det er klart, at den teoretiske værdi af den matematiske forventning som en fordelingsparameter ikke altid er lig med den empiriske værdi af den for os interessante stokastiske variabel, udtrykt i statistik. Hvis vi laver et eksperiment med at kaste en mønt, så er det ret sandsynligt, at ud af ti udfald vil "hoveder" kun komme op fire eller tre gange, eller måske tværtimod vil det komme op otte gange, eller måske det kommer overhovedet aldrig op. Det er klart, at nogle af disse udfald viser sig at være mere, nogle mindre sandsynlige. Hvis vi bruger normalfordelingsloven, kan vi komme til den konklusion, at jo mere resultatet afviger fra den teoretisk forventede værdi specificeret af den matematiske forventningsværdi, jo mindre sandsynligt er det i praksis.

Lad os yderligere antage, at vi har udført en lignende procedure flere gange og aldrig har observeret den teoretisk forventede værdi. Så kan vi komme i tvivl om møntens ægthed. Vi kan antage, at for vores mønt er sandsynligheden for at få hoveder faktisk ikke 50%. I dette tilfælde kan det være nødvendigt at estimere sandsynligheden for denne begivenhed og dermed værdien af ​​den matematiske forventning. Dette behov opstår, når vi i et eksperiment studerer fordelingen af ​​en kontinuert stokastisk variabel, såsom reaktionstid, uden at have nogen teoretisk model på forhånd. Som regel er dette det første obligatoriske trin i den kvantitative behandling af eksperimentelle resultater.

Den matematiske forventning kan estimeres på tre måder, som i praksis kan give lidt forskellige resultater, men i teorien burde de bestemt føre os til værdien af ​​den matematiske forventning.

Logikken i en sådan vurdering er illustreret i fig. 1.2. Den forventede værdi kan betragtes som den centrale tendens i fordelingen af ​​en stokastisk variabel X, som dens mest sandsynlige og derfor hyppigst forekommende værdi og som et punkt, der deler fordelingen i to lige store dele.

Ris. 1.2.

Lad os fortsætte vores imaginære eksperimenter med en mønt og udføre tre eksperimenter med at kaste den ti gange. Lad os antage, at i det første eksperiment kom "hoveder" op fire gange, det samme skete i det andet eksperiment, i det tredje eksperiment kom "hoveder" op mere end halvanden gange oftere - syv gange. Det er logisk at antage, at den matematiske forventning til den begivenhed, vi er interesseret i, faktisk ligger et sted mellem disse værdier.

Først, enkleste vurderingsmetode matematisk forventning vil være at finde aritmetisk middelværdi. Så vil estimatet af den forventede værdi baseret på ovenstående tre målinger være (4 + 4 + 7)/3 = 5. På samme måde kan den forventede værdi i reaktionstidseksperimenter estimeres ved at tage det aritmetiske middelværdi af alle de opnåede værdier X. Så hvis vi brugte P reaktionstidsmålinger X, så kan vi bruge følgende formel, som viser os det til at beregne det aritmetiske gennemsnit x det er nødvendigt at sammenlægge alle empirisk opnåede værdier og dividere dem med antallet af observationer:

I formel (1.2) er målet for matematisk forventning normalt betegnet som ̅ x (læses som "X med en streg"), selvom det nogle gange kan skrives som M (fra engelsk betyde - gennemsnit).

Det aritmetiske gennemsnit er det mest almindeligt anvendte estimat for matematisk forventning. I sådanne tilfælde antages det, at den stokastiske variabel måles i metrisk vægt. Det er klart, at det opnåede resultat måske eller måske ikke falder sammen med den sande værdi af den matematiske forventning, som vi aldrig ved. Det er dog vigtigt, at denne metode er upartisk estimering af matematisk forventning. Det betyder, at den forventede værdi af den estimerede værdi er lig med dens matematiske forventning:.

Anden vurderingsmetode matematisk forventning er at tage den hyppigst forekommende værdi af den variabel, der er af interesse for os, som værdi. Denne værdi kaldes distributionstilstand. For eksempel, i tilfælde af at kaste en mønt lige overvejet, kan "fire" tages som værdien af ​​den matematiske forventning, da denne værdi optrådte to gange i de tre udførte test; Det er grunden til, at distributionstilstanden i dette tilfælde viste sig at være lig med fire. Mode-estimering bruges hovedsageligt, når eksperimentatoren har at gøre med variabler, der tager diskrete værdier specificeret i ikke-metrisk vægt.

For eksempel kan man ved at beskrive fordelingen af ​​elevers karakterer på en eksamen konstruere en frekvensfordeling af karakterer modtaget af elever. Denne frekvensfordeling kaldes histogram. I dette tilfælde kan det mest almindelige estimat tages som værdien af ​​den centrale tendens (matematisk forventning). Når man studerer variable karakteriseret ved kontinuerte værdier, bruges dette mål praktisk talt ikke eller bruges sjældent. Hvis frekvensfordelingen af ​​de opnåede resultater ikke desto mindre er konstrueret, drejer det sig som regel ikke om de eksperimentelt opnåede værdier af den karakteristik, der undersøges, men nogle intervaller af dens manifestation. For eksempel kan du ved at studere højden på mennesker se, hvor mange mennesker der falder inden for området op til 150 cm i højden, hvor mange der falder inden for området fra 150 til 155 cm osv. I dette tilfælde vil tilstanden være relateret til intervalværdierne for den karakteristik, der undersøges, i dette tilfælde højden.

Det er klart, at tilstanden, ligesom det aritmetiske middelværdi, kan eller måske ikke falder sammen med den faktiske værdi af den matematiske forventning. Men ligesom det aritmetiske middelværdi er tilstanden et upartisk estimat af den matematiske forventning.

Lad os tilføje, at hvis to værdier i prøven forekommer lige ofte, kaldes en sådan fordeling bimodal. Hvis tre eller flere værdier i en prøve forekommer lige ofte, siges en sådan prøve ikke at have nogen tilstand. Sådanne tilfælde, med et tilstrækkeligt stort antal observationer, indikerer som regel, at dataene er udtrukket fra en generel befolkning, hvis fordeling er forskellig fra normalen.

Endelig, tredje vurderingsmetode matematisk forventning er at dele prøven af ​​emner i henhold til parameteren af ​​interesse for os nøjagtigt i halvdelen. Den mængde, der karakteriserer denne grænse, kaldes median distributioner.

Antag, at vi er til stede ved en skikonkurrence, og efter at den er afsluttet, vil vi vurdere, hvem af atleterne, der viste resultater over gennemsnittet, og hvilke under. Hvis sammensætningen af ​​deltagere er nogenlunde jævn, så er det logisk at beregne det aritmetiske gennemsnit ved vurdering af gennemsnitsresultatet. Lad os dog antage, at der blandt de professionelle deltagere er flere amatører. Der er få af dem, men de viser resultater, der er væsentligt ringere end andre. I dette tilfælde kan det vise sig, at ud af 100 deltagere i konkurrencen for eksempel 87 viste resultater over gennemsnittet.Det er klart, at en sådan vurdering af den gennemsnitlige tendens ikke altid kan tilfredsstille os. I dette tilfælde er det logisk at antage, at det gennemsnitlige resultat blev vist af de deltagere, der tog et sted på 50. eller 51. pladsen. Dette vil være medianen af ​​fordelingen. Før den 50. finalist sluttede 49 deltagere, efter den 51. – også 49. Det er dog ikke klart, hvis resultat blandt dem skal tages som gennemsnit. Det kan selvfølgelig vise sig, at de blev færdige på samme tid. Så er der ikke noget problem. Problemet opstår ikke, når antallet af observationer er ulige. I andre tilfælde kan du dog bruge gennemsnittet af resultaterne fra to deltagere.

Medianen er et specialtilfælde af kvantilen af ​​en fordeling. Kvantil er en del af distributionen. Formelt kan det defineres som integralværdien af ​​fordelingen mellem to værdier af en variabel X. Altså værdien x vil være medianen af ​​fordelingen, hvis integralværdien af ​​fordelingen (sandsynlighedstæthed) er fra -∞ til x lig med integralværdien af ​​fordelingen fra x til +∞. Tilsvarende kan fordelingen opdeles i fire, ti eller 100 dele. Sådanne kvantiler kaldes i overensstemmelse hermed kvartiler, deciler Og percentiler. Der er andre typer kvantiler.

Ligesom de to foregående metoder til at estimere matematisk forventning, er medianen et upartisk estimat af matematisk forventning.

Teoretisk antages det, at hvis vi virkelig har at gøre med en normalfordeling af en stokastisk variabel, så burde alle tre estimater af den matematiske forventning give det samme resultat, da de alle repræsenterer en variant upartisk estimater af den samme fordelingsparameter af den estimerede stokastiske variabel (se fig. 1.2). I praksis sker dette dog sjældent. Dette kan især skyldes, at den analyserede fordeling adskiller sig fra normalen. Men hovedårsagen til sådanne uoverensstemmelser er som regel, at man ved at estimere værdien af ​​den matematiske forventning kan opnå en værdi, der adskiller sig meget væsentligt fra dens sande værdi. Som nævnt ovenfor er det imidlertid blevet bevist i matematisk statistik, at jo mere uafhængige tests af den pågældende variabel udføres, jo tættere bør den estimerede værdi være på den sande.

I praksis er valget af metode til at estimere den matematiske forventning således ikke bestemt af ønsket om at opnå et mere nøjagtigt og pålideligt estimat af denne parameter, men kun af bekvemmelighedsovervejelser. Også en vis rolle i valget af metode til at estimere den matematiske forventning spilles af måleskalaen, som afspejler observationerne af den stokastiske variabel, der evalueres.

Forventning er sandsynlighedsfordelingen af ​​en stokastisk variabel

Matematisk forventning, definition, matematisk forventning af diskrete og kontinuerte stokastiske variable, stikprøve, betinget forventning, beregning, egenskaber, problemer, estimering af forventning, spredning, fordelingsfunktion, formler, regneeksempler

Udvid indholdet

Skjul indholdet

Matematisk forventning er definitionen

Et af de vigtigste begreber i matematisk statistik og sandsynlighedsteori, der karakteriserer fordelingen af ​​værdier eller sandsynligheder for en tilfældig variabel. Typisk udtrykt som et vægtet gennemsnit af alle mulige parametre for en stokastisk variabel. Udbredt i teknisk analyse, studiet af talserier og studiet af kontinuerlige og tidskrævende processer. Det er vigtigt ved vurdering af risici, forudsigelse af prisindikatorer ved handel på finansielle markeder og bruges til at udvikle strategier og metoder til spiltaktik i teorien om spil.

Matematisk forventning er gennemsnitsværdien af ​​en stokastisk variabel, er sandsynlighedsfordelingen af ​​en stokastisk variabel betragtet i sandsynlighedsteorien.

Matematisk forventning er et mål for gennemsnitsværdien af ​​en stokastisk variabel i sandsynlighedsteori. Forventning af en tilfældig variabel x betegnet med M(x).

Matematisk forventning er

Matematisk forventning er i sandsynlighedsteori, et vægtet gennemsnit af alle mulige værdier, som en stokastisk variabel kan tage.

Matematisk forventning er summen af ​​produkterne af alle mulige værdier af en stokastisk variabel og sandsynligheden for disse værdier.

Matematisk forventning er det gennemsnitlige udbytte af en bestemt beslutning, forudsat at en sådan beslutning kan betragtes inden for rammerne af teorien om store tal og langdistance.


Matematisk forventning er i gambling teori, mængden af ​​gevinster en spiller kan tjene eller tabe i gennemsnit for hvert væddemål. I gambling sprogbrug kaldes dette nogle gange "spillerens kant" (hvis den er positiv for spilleren) eller "huskanten" (hvis den er negativ for spilleren).

Matematisk forventning er procentdelen af ​​fortjeneste pr. gevinst ganget med den gennemsnitlige fortjeneste, minus sandsynligheden for tab ganget med det gennemsnitlige tab.


Matematisk forventning om en stokastisk variabel i matematisk teori

En af de vigtige numeriske egenskaber ved en tilfældig variabel er dens matematiske forventning. Lad os introducere begrebet et system af stokastiske variable. Lad os overveje et sæt af tilfældige variable, der er resultaterne af det samme tilfældige eksperiment. Hvis det er en af ​​systemets mulige værdier, svarer begivenheden til en vis sandsynlighed, der opfylder Kolmogorovs aksiomer. En funktion defineret for alle mulige værdier af stokastiske variable kaldes en fælles distributionslov. Denne funktion giver dig mulighed for at beregne sandsynligheden for enhver hændelse fra. Især den fælles distributionslov for stokastiske variable og, som tager værdier fra mængden og, er givet af sandsynligheder.


Udtrykket "matematisk forventning" blev introduceret af Pierre Simon Marquis de Laplace (1795) og kommer fra begrebet "forventet værdi af gevinster", som først dukkede op i det 17. århundrede i teorien om gambling i Blaise Pascal og Christiaans værker. Huygens. Imidlertid blev den første fuldstændige teoretiske forståelse og vurdering af dette koncept givet af Pafnuty Lvovich Chebyshev (midten af ​​det 19. århundrede).


Fordelingsloven for tilfældige numeriske variable (fordelingsfunktion og fordelingsrækker eller sandsynlighedstæthed) beskriver fuldstændig adfærden af ​​en stokastisk variabel. Men i en række problemer er det nok at kende nogle numeriske karakteristika for den mængde, der undersøges (for eksempel dens gennemsnitlige værdi og mulige afvigelse fra den) for at besvare det stillede spørgsmål. De vigtigste numeriske karakteristika ved tilfældige variable er den matematiske forventning, varians, tilstand og median.

Den matematiske forventning til en diskret tilfældig variabel er summen af ​​produkterne af dens mulige værdier og deres tilsvarende sandsynligheder. Nogle gange kaldes den matematiske forventning et vægtet gennemsnit, da det er omtrent lig med det aritmetiske gennemsnit af de observerede værdier af en tilfældig variabel over et stort antal eksperimenter. Af definitionen af ​​matematisk forventning følger det, at dens værdi ikke er mindre end den mindst mulige værdi af en tilfældig variabel og ikke mere end den største. Den matematiske forventning til en tilfældig variabel er en ikke-tilfældig (konstant) variabel.


Den matematiske forventning har en simpel fysisk betydning: hvis du placerer en enhedsmasse på en lige linje, placerer en bestemt masse på nogle punkter (for en diskret fordeling) eller "smører" den med en vis tæthed (for en absolut kontinuerlig fordeling) , så vil punktet svarende til den matematiske forventning være koordinaten "tyngdepunkt" er lige.


Gennemsnitsværdien af ​​en tilfældig variabel er et vist tal, der så at sige er dens "repræsentative" og erstatter det i nogenlunde tilnærmede beregninger. Når vi siger: "den gennemsnitlige lampedriftstid er 100 timer" eller "det gennemsnitlige anslagspunkt er forskudt i forhold til målet med 2 m til højre", angiver vi en vis numerisk karakteristik af en tilfældig variabel, der beskriver dens placering på den numeriske akse, dvs. "positionskarakteristika".

Af karakteristikaene ved en position i sandsynlighedsteorien spilles den vigtigste rolle af den matematiske forventning om en tilfældig variabel, som nogle gange blot kaldes gennemsnitsværdien af ​​en tilfældig variabel.


Overvej den tilfældige variabel x, der har mulige værdier x1, x2, …, xn med sandsynligheder p1, p2, …, pn. Vi skal karakterisere med et eller andet tal placeringen af ​​værdierne af en tilfældig variabel på x-aksen under hensyntagen til, at disse værdier har forskellige sandsynligheder. Til dette formål er det naturligt at bruge det såkaldte ”vægtede gennemsnit” af værdierne xi, og hver værdi xi under gennemsnitsberegning bør tages i betragtning med en "vægt" proportional med sandsynligheden for denne værdi. Således vil vi beregne gennemsnittet af den stokastiske variabel x, som vi betegner M |X|:


Dette vægtede gennemsnit kaldes den matematiske forventning til den stokastiske variabel. Således introducerede vi et af de vigtigste begreber inden for sandsynlighedsteori - begrebet matematisk forventning. Den matematiske forventning til en tilfældig variabel er summen af ​​produkterne af alle mulige værdier af en tilfældig variabel og sandsynligheden for disse værdier.

x er forbundet med en ejendommelig afhængighed med det aritmetiske middelværdi af de observerede værdier af den stokastiske variabel over et stort antal eksperimenter. Denne afhængighed er af samme type som afhængigheden mellem frekvens og sandsynlighed, nemlig: med et stort antal eksperimenter nærmer det aritmetiske middelværdi af de observerede værdier af en tilfældig variabel sig (konvergerer i sandsynlighed) til dens matematiske forventning. Ud fra tilstedeværelsen af ​​en sammenhæng mellem frekvens og sandsynlighed kan man som konsekvens udlede tilstedeværelsen af ​​en lignende sammenhæng mellem det aritmetiske middelværdi og den matematiske forventning. Overvej faktisk den tilfældige variabel x, kendetegnet ved en distributionsserie:


Lad det produceres N uafhængige forsøg, i hver af hvilke værdien x får en vis værdi. Lad os antage, at værdien x1 dukkede op m1 gange, værdi x2 dukkede op m2 gange, generel betydning xi dukket op mi gange. Lad os beregne det aritmetiske middelværdi af de observerede værdier af værdien X, som i modsætning til den matematiske forventning M|X| vi betegner M*|X|:

Med stigende antal eksperimenter N frekvenser pi vil nærme sig (konvergere i sandsynlighed) de tilsvarende sandsynligheder. Følgelig er det aritmetiske middelværdi af de observerede værdier af den stokastiske variabel M|X| med en stigning i antallet af eksperimenter vil den nærme sig (konvergere i sandsynlighed) til dens matematiske forventning. Sammenhængen mellem det aritmetiske middelværdi og den matematiske forventning formuleret ovenfor udgør indholdet af en af ​​formerne for loven om store tal.

Vi ved allerede, at alle former for loven om store tal angiver, at nogle gennemsnit er stabile over et stort antal eksperimenter. Her taler vi om stabiliteten af ​​det aritmetiske middelværdi fra en række observationer af samme størrelse. Med et lille antal eksperimenter er det aritmetiske gennemsnit af deres resultater tilfældigt; med en tilstrækkelig stigning i antallet af eksperimenter bliver det "næsten ikke-tilfældigt" og, stabiliserende, nærmer det sig en konstant værdi - den matematiske forventning.


Stabiliteten af ​​gennemsnit over et stort antal eksperimenter kan let verificeres eksperimentelt. For eksempel når vi vejer en krop i et laboratorium på præcise vægte, får vi som følge af vejningen en ny værdi hver gang; For at reducere observationsfejlen vejer vi kroppen flere gange og bruger det aritmetiske middelværdi af de opnåede værdier. Det er let at se, at med en yderligere stigning i antallet af forsøg (vejninger), reagerer det aritmetiske middelværdi mindre og mindre på denne stigning og ved et tilstrækkeligt stort antal forsøg praktisk talt ophører med at ændre sig.

Det skal bemærkes, at den vigtigste egenskab ved positionen af ​​en stokastisk variabel - den matematiske forventning - ikke eksisterer for alle stokastiske variable. Det er muligt at sammensætte eksempler på sådanne stokastiske variable, for hvilke den matematiske forventning ikke eksisterer, da den tilsvarende sum eller integral divergerer. Sådanne sager er dog ikke af væsentlig interesse for praksis. Typisk har de tilfældige variabler, vi beskæftiger os med, et begrænset udvalg af mulige værdier og har selvfølgelig en matematisk forventning.


Ud over de vigtigste egenskaber ved positionen af ​​en stokastisk variabel - den matematiske forventning - bruges i praksis andre karakteristika for positionen, især tilstanden og medianen for den stokastiske variabel.


En tilfældig variabels tilstand er dens mest sandsynlige værdi. Udtrykket "mest sandsynlige værdi" gælder strengt taget kun for diskontinuerlige mængder; for en kontinuerlig størrelse er tilstanden den værdi, hvor sandsynlighedstætheden er maksimal. Figurerne viser tilstanden for henholdsvis diskontinuerlige og kontinuerte stokastiske variable.


Hvis fordelingspolygonen (fordelingskurven) har mere end et maksimum, kaldes fordelingen "multimodal".



Nogle gange er der distributioner, der har et minimum i midten frem for et maksimum. Sådanne fordelinger kaldes "anti-modale".


I det generelle tilfælde er tilstanden og den matematiske forventning for en stokastisk variabel ikke sammenfaldende. I det særlige tilfælde, når fordelingen er symmetrisk og modal (dvs. har en tilstand), og der er en matematisk forventning, så falder den sammen med fordelingens tilstand og symmetricenter.

En anden positionskarakteristik bruges ofte - den såkaldte median af en stokastisk variabel. Denne karakteristik bruges normalt kun til kontinuerte tilfældige variable, selvom den formelt kan defineres for en diskontinuerlig variabel. Geometrisk er medianen abscissen af ​​det punkt, hvor arealet omgivet af fordelingskurven er delt i to.


I tilfælde af en symmetrisk modal fordeling falder medianen sammen med den matematiske forventning og mode.

Den matematiske forventning er gennemsnitsværdien af ​​en stokastisk variabel - en numerisk karakteristik af sandsynlighedsfordelingen af ​​en stokastisk variabel. På den mest generelle måde, den matematiske forventning til en stokastisk variabel X(w) er defineret som Lebesgue-integralet med hensyn til sandsynlighedsmålet R i det oprindelige sandsynlighedsrum:


Den matematiske forventning kan også beregnes som Lebesgue-integralet af x efter sandsynlighedsfordeling px mængder x:


Begrebet en stokastisk variabel med uendelig matematisk forventning kan defineres på en naturlig måde. Et typisk eksempel er returtider for nogle tilfældige gåture.

Ved hjælp af den matematiske forventning bestemmes mange numeriske og funktionelle karakteristika for en fordeling (som den matematiske forventning af de tilsvarende funktioner af en tilfældig variabel), for eksempel den genererende funktion, karakteristiske funktion, momenter af enhver rækkefølge, især spredning, kovarians .

Den matematiske forventning er en karakteristik af placeringen af ​​værdierne af en tilfældig variabel (gennemsnitsværdien af ​​dens fordeling). I denne egenskab tjener den matematiske forventning som en eller anden "typisk" fordelingsparameter, og dens rolle svarer til rollen for det statiske moment - koordinaten for massefordelingens tyngdepunkt - i mekanikken. Fra andre karakteristika ved lokaliteten, ved hjælp af hvilke fordelingen beskrives i generelle vendinger - adskiller medianer, tilstande, matematisk forventning sig i den større værdi, den og den tilsvarende spredningskarakteristik - spredning - har i sandsynlighedslærens grænsesætninger. Betydningen af ​​matematisk forventning afsløres bedst af loven om store tal (Chebyshevs ulighed) og den styrkede lov om store tal.

Forventning af en diskret stokastisk variabel

Lad der være en tilfældig variabel, der kan tage en af ​​flere numeriske værdier (for eksempel kan antallet af point, når du kaster en terning være 1, 2, 3, 4, 5 eller 6). Ofte i praksis, for en sådan værdi, opstår spørgsmålet: hvilken værdi tager det "i gennemsnit" med et stort antal test? Hvad bliver vores gennemsnitlige indkomst (eller tab) fra hver af de risikable transaktioner?


Lad os sige, at der er en form for lotteri. Vi ønsker at forstå, om det er rentabelt eller ej at deltage i det (eller endda deltage gentagne gange, regelmæssigt). Lad os sige, at hver fjerde billet er en vinder, præmien vil være 300 rubler, og prisen på enhver billet vil være 100 rubler. Med et uendeligt stort antal deltagelser er det, hvad der sker. I tre fjerdedele af tilfældene vil vi tabe, hvert tredje tab vil koste 300 rubler. I hvert fjerde tilfælde vinder vi 200 rubler. (præmie minus omkostninger), det vil sige, for fire deltagelser taber vi i gennemsnit 100 rubler, for en - i gennemsnit 25 rubler. I alt vil den gennemsnitlige sats for vores ruin være 25 rubler per billet.

Vi kaster terningerne. Hvis det ikke er snyd (uden at flytte tyngdepunktet osv.), hvor mange point har vi så i gennemsnit ad gangen? Da hver mulighed er lige sandsynlig, tager vi blot det aritmetiske gennemsnit og får 3,5. Da dette er AVERAGE, er der ingen grund til at være indigneret over, at intet specifikt kast vil give 3,5 point - ja, denne terning har ikke noget ansigt med sådan et tal!

Lad os nu opsummere vores eksempler:


Lad os se på billedet, der netop er givet. Til venstre er en tabel over fordelingen af ​​en stokastisk variabel. Værdien X kan have en af ​​n mulige værdier (vist i den øverste linje). Der kan ikke være andre betydninger. Under hver mulig værdi er dens sandsynlighed skrevet nedenfor. Til højre ses formlen, hvor M(X) kaldes den matematiske forventning. Betydningen af ​​denne værdi er, at med et stort antal tests (med en stor stikprøve), vil gennemsnitsværdien tendere til den samme matematiske forventning.

Lad os vende tilbage til den samme spilleterning. Den matematiske forventning til antallet af point ved kast er 3,5 (beregn det selv ved hjælp af formlen, hvis du ikke tror mig). Lad os sige, at du smed den et par gange. Resultaterne var 4 og 6. Gennemsnittet var 5, hvilket er langt fra 3,5. De smed den en gang mere, de fik 3, altså i gennemsnit (4 + 6 + 3)/3 = 4,3333... På en eller anden måde langt fra den matematiske forventning. Lav nu et vanvittigt eksperiment - rul terningen 1000 gange! Og selvom gennemsnittet ikke lige er 3,5, så vil det være tæt på det.

Lad os beregne den matematiske forventning til lotteriet beskrevet ovenfor. Pladen vil se sådan ud:


Så vil den matematiske forventning være, som vi har fastslået ovenfor:


En anden ting er, at det ville være svært at gøre det "på fingrene" uden en formel, hvis der var flere muligheder. Tja, lad os sige, at der ville være 75 % tabte billetter, 20 % vinderbilletter og 5 % især vindende.

Nu nogle egenskaber ved matematisk forventning.

Det er nemt at bevise:


Den konstante faktor kan tages ud som et tegn på den matematiske forventning, det vil sige:


Dette er et særligt tilfælde af linearitetsegenskaben for den matematiske forventning.

En anden konsekvens af lineariteten af ​​den matematiske forventning:

det vil sige, at den matematiske forventning til summen af ​​stokastiske variable er lig med summen af ​​de matematiske forventninger til stokastiske variable.

Lad X, Y være uafhængige stokastiske variable, Derefter:

Dette er også nemt at bevise) Arbejde XY i sig selv er en tilfældig variabel, og hvis startværdierne kunne tage n Og m værdier i overensstemmelse hermed XY kan tage nm-værdier. Sandsynligheden for hver værdi beregnes ud fra det faktum, at sandsynligheden for uafhængige hændelser ganges. Som et resultat får vi dette:


Forventning af en kontinuert stokastisk variabel

Kontinuerlige tilfældige variable har en sådan karakteristik som fordelingstæthed (sandsynlighedstæthed). Det karakteriserer i det væsentlige situationen, at en tilfældig variabel tager nogle værdier fra sættet af reelle tal oftere og nogle sjældnere. Overvej for eksempel denne graf:


Her x- faktisk tilfældig variabel, f(x)- fordelingstæthed. At dømme efter denne graf, under eksperimenter værdien x vil ofte være et tal tæt på nul. Chancerne er overskredet 3 eller være mindre -3 snarere rent teoretisk.


Lad for eksempel være en ensartet fordeling:



Dette er helt i overensstemmelse med intuitiv forståelse. Lad os sige, hvis vi modtager mange tilfældige reelle tal med en ensartet fordeling, hver af segmenterne |0; 1| , så skal det aritmetiske gennemsnit være omkring 0,5.

Egenskaberne for matematisk forventning - linearitet osv., der gælder for diskrete stokastiske variable, er også anvendelige her.

Sammenhæng mellem matematisk forventning og andre statistiske indikatorer

I statistisk analyse er der sammen med den matematiske forventning et system af indbyrdes afhængige indikatorer, der afspejler fænomenernes homogenitet og processernes stabilitet. Variationsindikatorer har ofte ingen selvstændig betydning og bruges til yderligere dataanalyse. Undtagelsen er variationskoefficienten, som karakteriserer homogeniteten af ​​dataene, som er en værdifuld statistisk egenskab.


Graden af ​​variabilitet eller stabilitet af processer i statistisk videnskab kan måles ved hjælp af flere indikatorer.

Den vigtigste indikator, der karakteriserer variabiliteten af ​​en tilfældig variabel er Spredning, som er tættest og direkte relateret til den matematiske forventning. Denne parameter bruges aktivt i andre typer statistiske analyser (hypotesetestning, analyse af årsag-virkningssammenhænge osv.). Ligesom den gennemsnitlige lineære afvigelse afspejler variansen også omfanget af spredningen af ​​data omkring middelværdien.


Det er nyttigt at oversætte tegnsproget til ordsproget. Det viser sig, at spredningen er den gennemsnitlige kvadrat af afvigelserne. Det vil sige, at gennemsnitsværdien først beregnes, derefter tages forskellen mellem hver original- og gennemsnitsværdi, kvadreres, tilføjes og derefter divideres med antallet af værdier i populationen. Forskellen mellem en individuel værdi og gennemsnittet afspejler målet for afvigelsen. Den er kvadreret, så alle afvigelser udelukkende bliver positive tal og for at undgå gensidig ødelæggelse af positive og negative afvigelser, når de summeres. Så, givet de kvadrerede afvigelser, beregner vi blot det aritmetiske middelværdi. Gennemsnit - kvadratisk - afvigelser. Afvigelserne kvadreres, og gennemsnittet beregnes. Svaret på det magiske ord "spredning" ligger i blot tre ord.

Men i sin rene form, såsom det aritmetiske middelværdi eller indeks, bruges spredning ikke. Det er snarere en hjælpe- og mellemindikator, der bruges til andre typer statistiske analyser. Den har ikke engang en normal måleenhed. At dømme efter formlen er dette kvadratet på måleenheden for de oprindelige data.

Lad os måle en tilfældig variabel N gange måler vi for eksempel vindhastigheden ti gange og ønsker at finde gennemsnitsværdien. Hvordan er gennemsnitsværdien relateret til fordelingsfunktionen?

Eller vi kaster terningerne et stort antal gange. Antallet af point, der vises på terningerne ved hvert kast, er en tilfældig variabel og kan tage en hvilken som helst naturlig værdi fra 1 til 6. Det aritmetiske gennemsnit af de tabte point beregnet for alle terningkast er også en tilfældig variabel, men for store N det har tendens til et meget specifikt tal - matematisk forventning Mx. I dette tilfælde Mx = 3,5.

Hvordan fik du denne værdi? Lukke ind N tests n1 når du får 1 point, n2 en gang - 2 point og så videre. Så antallet af udfald, hvor ét point faldt:


Tilsvarende for udfald, når der kastes 2, 3, 4, 5 og 6 point.


Lad os nu antage, at vi kender fordelingsloven for den stokastiske variabel x, det vil sige, at vi ved, at den stokastiske variabel x kan tage værdier x1, x2, ..., xk med sandsynligheder p1, p2, ..., pk.

Den matematiske forventning Mx for en stokastisk variabel x er lig med:


Den matematiske forventning er ikke altid et rimeligt estimat af en eller anden tilfældig variabel. For at estimere gennemsnitslønnen er det således mere rimeligt at bruge begrebet median, det vil sige en sådan værdi, at antallet af personer, der modtager en lavere løn end medianen og en større, er sammenfaldende.

Sandsynligheden p1 for, at den stokastiske variabel x vil være mindre end x1/2, og sandsynligheden p2 for, at den stokastiske variabel x vil være større end x1/2, er den samme og lig med 1/2. Medianen er ikke bestemt entydigt for alle distributioner.


Standard eller standardafvigelse i statistik kaldes graden af ​​afvigelse af observationsdata eller -sæt fra AVERAGE værdien. Betegnes med bogstaverne s eller s. En lille standardafvigelse indikerer, at dataene klynger sig omkring middelværdien, mens en stor standardafvigelse indikerer, at de oprindelige data er placeret langt fra det. Standardafvigelsen er lig med kvadratroden af ​​en størrelse kaldet varians. Det er gennemsnittet af summen af ​​de kvadrerede forskelle af de indledende data, der afviger fra gennemsnitsværdien. Standardafvigelsen for en tilfældig variabel er kvadratroden af ​​variansen:


Eksempel. Under testforhold, når du skyder mod et mål, beregnes spredningen og standardafvigelsen af ​​den tilfældige variabel:


Variation- fluktuation, foranderlighed af værdien af ​​en egenskab blandt enheder af befolkningen. Individuelle numeriske værdier af en egenskab, der findes i den undersøgte population, kaldes varianter af værdier. Utilstrækkeligheden af ​​gennemsnitsværdien til fuldt ud at karakterisere befolkningen tvinger os til at supplere gennemsnitsværdierne med indikatorer, der giver os mulighed for at vurdere typiskheden af ​​disse gennemsnit ved at måle variabiliteten (variationen) af den karakteristik, der undersøges. Variationskoefficienten beregnes ved hjælp af formlen:


Variationsområde(R) repræsenterer forskellen mellem maksimum- og minimumværdierne for attributten i den population, der undersøges. Denne indikator giver den mest generelle idé om variabiliteten af ​​den karakteristik, der undersøges, da den kun viser forskellen mellem de maksimale værdier af mulighederne. Afhængighed af de ekstreme værdier af en karakteristik giver variationsomfanget en ustabil, tilfældig karakter.


Gennemsnitlig lineær afvigelse repræsenterer det aritmetiske gennemsnit af de absolutte (modulo) afvigelser af alle værdier af den analyserede population fra deres gennemsnitsværdi:


Matematisk forventning i gambling teori

Matematisk forventning er Det gennemsnitlige beløb, en gambler kan vinde eller tabe på en given indsats. Dette er et meget vigtigt koncept for spilleren, fordi det er grundlæggende for vurderingen af ​​de fleste spilsituationer. Matematisk forventning er også det optimale værktøj til at analysere grundlæggende kortlayouts og spilsituationer.

Lad os sige, at du spiller et møntspil med en ven og satser lige meget $1 hver gang, uanset hvad der dukker op. Haler betyder, at du vinder, hoveder betyder, at du taber. Oddsene er 1 til 1 for, at det kommer op, så du satser $1 til $1. Din matematiske forventning er således nul, fordi Fra et matematisk synspunkt kan du ikke vide, om du fører eller taber efter to kast eller efter 200.


Din timegevinst er nul. Timegevinster er det beløb, du forventer at vinde på en time. Du kan kaste en mønt 500 gange på en time, men du vil ikke vinde eller tabe, fordi... dine chancer er hverken positive eller negative. Hvis du ser på det, fra en seriøs spillers synspunkt, er dette væddemålssystem ikke dårligt. Men dette er simpelthen spild af tid.

Men lad os sige, at nogen vil satse $2 mod dine $1 på det samme spil. Så har du med det samme en positiv forventning på 50 øre fra hver indsats. Hvorfor 50 cents? I gennemsnit vinder du et væddemål og taber det andet. Sats den første dollar, og du vil tabe $1, sats den anden, og du vil vinde $2. Du satser $1 to gange og er foran med $1. Så hver af dine væddemål på én dollar gav dig 50 cent.


Hvis en mønt dukker op 500 gange på en time, vil dine timegevinster allerede være $250, fordi... I gennemsnit tabte du en dollar 250 gange og vandt to dollars 250 gange. $500 minus $250 er lig med $250, som er den samlede gevinst. Bemærk venligst, at den forventede værdi, som er det gennemsnitlige beløb, du vinder pr. indsats, er 50 cent. Du vandt $250 ved at satse en dollar 500 gange, hvilket svarer til 50 cents pr. indsats.

Matematisk forventning har intet at gøre med kortsigtede resultater. Din modstander, som besluttede at satse $2 mod dig, kunne slå dig på de første ti kast i træk, men du, som har en fordel på 2 til 1, alt andet lige, vil tjene 50 cent på hver $1 indsats i enhver omstændigheder. Det gør ingen forskel, om du vinder eller taber et væddemål eller flere væddemål, så længe du har penge nok til komfortabelt at dække omkostningerne. Hvis du fortsætter med at satse på samme måde, så vil dine gevinster over en længere periode nærme sig summen af ​​forventningerne i individuelle kast.


Hver gang du laver et bedste væddemål (et væddemål, der kan vise sig at være rentabelt i det lange løb), når oddsene er til din fordel, er du forpligtet til at vinde noget på det, uanset om du taber det eller ej. givet hånd. Omvendt, hvis du laver et underdog bet (et væddemål, der er urentabelt i det lange løb), når oddsene er imod dig, taber du noget, uanset om du vinder eller taber hånden.

Du placerer et væddemål med det bedste resultat, hvis din forventning er positiv, og det er positivt, hvis oddsene er på din side. Når du placerer et væddemål med det værste resultat, har du en negativ forventning, som sker, når oddsene er imod dig. Seriøse spillere satser kun på det bedste resultat; hvis det værste sker, folder de. Hvad betyder oddsene til din fordel? Du kan ende med at vinde mere end de rigtige odds giver. De reelle odds for at lande hoveder er 1 til 1, men du får 2 til 1 på grund af odds-forholdet. I dette tilfælde er oddsene til din fordel. Du får helt sikkert det bedste resultat med en positiv forventning på 50 cents pr. indsats.


Her er et mere komplekst eksempel på matematisk forventning. En ven skriver tal fra et til fem ned og satser $5 mod din $1, at du ikke vil gætte tallet. Skal du gå med til sådan et væddemål? Hvad er forventningen her?

I gennemsnit tager du fejl fire gange. Baseret på dette er oddsene mod, at du gætter tallet, 4 til 1. Oddsene mod, at du taber en dollar på et forsøg. Du vinder dog 5 til 1, med mulighed for at tabe 4 til 1. Så oddsene er i din favør, du kan tage væddemålet og håbe på det bedste resultat. Hvis du laver denne indsats fem gange, vil du i gennemsnit tabe $1 fire gange og vinde $5 én gang. Baseret på dette vil du for alle fem forsøg tjene $1 med en positiv matematisk forventning på 20 cents pr. indsats.


En spiller, der vil vinde mere, end han satser, som i eksemplet ovenfor, tager chancer. Tværtimod ødelægger han sine chancer, når han forventer at vinde mindre, end han satser. En spiller kan have enten en positiv eller en negativ forventning, som afhænger af, om han vinder eller ødelægger oddsene.

Hvis du satser $50 for at vinde $10 med en 4 til 1 chance for at vinde, vil du få en negativ forventning på $2, fordi I gennemsnit vil du vinde $10 fire gange og tabe $50 én gang, hvilket viser, at tabet pr. indsats vil være $10. Men hvis du satser $30 for at vinde $10, med samme odds for at vinde 4 til 1, så har du i dette tilfælde en positiv forventning på $2, fordi du vinder igen $10 fire gange og taber $30 én gang, med en fortjeneste på $10. Disse eksempler viser, at den første indsats er dårlig, og den anden er god.


Matematisk forventning er centrum for enhver spilsituation. Når en bookmaker opfordrer fodboldfans til at satse $11 for at vinde $10, har han en positiv forventning på 50 cent for hver $10. Hvis casinoet betaler lige penge fra pass line i craps, så vil casinoets positive forventning være cirka $1,40 for hver $100, fordi Dette spil er opbygget således, at enhver, der satser på denne linje, taber 50,7 % i gennemsnit og vinder 49,3 % af den samlede tid. Det er utvivlsomt denne tilsyneladende minimale positive forventning, der bringer enorme overskud til casinoejere rundt om i verden. Som Vegas World kasinoejer Bob Stupak bemærkede, "en tusindedel af én procent negativ sandsynlighed over en lang nok afstand vil ødelægge den rigeste mand i verden."


Forventning, når du spiller poker

Pokerspillet er det mest illustrative og illustrative eksempel ud fra et synspunkt om at bruge teorien og egenskaberne for matematiske forventninger.


Forventet værdi i poker er den gennemsnitlige fordel ved en bestemt beslutning, forudsat at en sådan beslutning kan betragtes inden for rammerne af teorien om store tal og langdistance. Et succesfuldt pokerspil er altid at acceptere træk med positiv forventet værdi.

Den matematiske betydning af den matematiske forventning, når man spiller poker, er, at vi ofte støder på tilfældige variabler, når vi træffer beslutninger (vi ved ikke, hvilke kort modstanderen har på hænderne, hvilke kort der kommer i de efterfølgende indsatsrunder). Vi skal betragte hver af løsningerne ud fra et stort talteoris synspunkt, som siger, at med en tilstrækkelig stor stikprøve, vil gennemsnitsværdien af ​​en stokastisk variabel have en tendens til dens matematiske forventning.


Blandt de særlige formler til beregning af den matematiske forventning er følgende mest anvendelige i poker:

Når du spiller poker, kan den forventede værdi beregnes for både bets og calls. I det første tilfælde skal fold equity tages i betragtning, i det andet, bankens egne odds. Når du vurderer den matematiske forventning til et bestemt træk, skal du huske, at en fold altid har en nul forventning. At kassere kort vil således altid være en mere profitabel beslutning end ethvert negativt træk.

Forventning fortæller dig, hvad du kan forvente (fortjeneste eller tab) for hver dollar, du risikerer. Kasinoer tjener penge, fordi den matematiske forventning til alle spil, der spilles i dem, er til fordel for casinoet. Med en lang nok serie af spil kan du forvente, at klienten vil miste sine penge, da "oddsene" er til fordel for casinoet. Professionelle casinospillere begrænser dog deres spil til korte perioder og stabler derved oddsene til deres fordel. Det samme gælder for investering. Hvis din forventning er positiv, kan du tjene flere penge ved at lave mange handler på kort tid. Forventning er din procentdel af fortjeneste pr. gevinst ganget med din gennemsnitlige fortjeneste, minus din sandsynlighed for tab ganget med dit gennemsnitlige tab.


Poker kan også betragtes ud fra et synspunkt om matematisk forventning. Du kan antage, at et bestemt træk er rentabelt, men i nogle tilfælde er det måske ikke det bedste, fordi et andet træk er mere rentabelt. Lad os sige, at du rammer et fuldt hus i poker med fem kort. Din modstander laver et væddemål. Du ved, at hvis du hæver indsatsen, vil han svare. Derfor ser det ud til at hæve den bedste taktik. Men hvis du hæver indsatsen, vil de resterende to spillere helt sikkert folde. Men hvis du kalder, har du fuld tillid til, at de to andre spillere bag dig vil gøre det samme. Når du hæver dit bet, får du en enhed, og når du bare kalder, får du to. Således giver calling dig en højere positiv forventet værdi og vil være den bedste taktik.

Den matematiske forventning kan også give en idé om, hvilke pokertaktik der er mindre rentable, og hvilke der er mere profitable. For eksempel, hvis du spiller en bestemt hånd, og du tror, ​​at dit tab i gennemsnit vil være 75 cent inklusive ante, så bør du spille den hånd, fordi dette er bedre end at folde, når ante er $1.


En anden vigtig grund til at forstå begrebet forventet værdi er, at det giver dig en følelse af ro i sindet, uanset om du vinder væddemålet eller ej: hvis du lavede et godt væddemål eller foldede på det rigtige tidspunkt, vil du vide, at du har tjent eller sparet en vis sum penge, som den svage spiller ikke kunne spare. Det er meget sværere at folde, hvis du er ked af det, fordi din modstander tegnede en stærkere hånd. Med alt dette lægges de penge, du sparer ved ikke at spille i stedet for at satse, til dine gevinster for natten eller måneden.

Bare husk, at hvis du skiftede hænder, ville din modstander have kaldt dig, og som du vil se i artiklen om Fundamental Theorem of Poker, er dette blot en af ​​dine fordele. Du skal være glad, når dette sker. Du kan endda lære at nyde at miste en hånd, fordi du ved, at andre spillere i din position ville have tabt meget mere.


Som nævnt i eksemplet med møntspil i begyndelsen, er timelønnen for profit forbundet med den matematiske forventning, og dette koncept er især vigtigt for professionelle spillere. Når du går til poker, bør du mentalt vurdere, hvor meget du kan vinde på en times spil. I de fleste tilfælde bliver du nødt til at stole på din intuition og erfaring, men du kan også bruge noget matematik. For eksempel spiller du draw lowball, og du ser tre spillere satse $10 og derefter bytte to kort, hvilket er en meget dårlig taktik, du kan regne ud, at hver gang de satser $10, taber de omkring $2. Hver af dem gør dette otte gange i timen, hvilket betyder, at de alle tre taber cirka $48 i timen. Du er en af ​​de resterende fire spillere, der er nogenlunde lige store, så disse fire spillere (og du blandt dem) skal dele $48, hver med en fortjeneste på $12 i timen. Dine timeodds i dette tilfælde er simpelthen lig med din andel af pengebeløbet tabt af tre dårlige spillere på en time.

Over en lang periode er spillerens samlede gevinster summen af ​​hans matematiske forventninger i individuelle hænder. Jo flere hænder du spiller med positiv forventning, jo mere vinder du, og omvendt, jo flere hænder du spiller med negativ forventning, jo mere taber du. Som et resultat bør du vælge et spil, der kan maksimere din positive forventning eller ophæve din negative forventning, så du kan maksimere dine timegevinster.


Positive matematiske forventninger i spilstrategi

Hvis du ved, hvordan man tæller kort, kan du have en fordel i forhold til casinoet, så længe de ikke opdager det og smider dig ud. Kasinoer elsker fulde spillere og tolererer ikke spillere, der tæller kort. En fordel vil give dig mulighed for at vinde flere gange, end du taber over tid. God pengestyring ved hjælp af beregninger af forventet værdi kan hjælpe dig med at udvinde mere overskud fra din fordel og reducere dine tab. Uden en fordel er det bedre at give pengene til velgørenhed. I spillet på børsen er fordelen givet af spilsystemet, som skaber større overskud end tab, prisforskelle og kommissioner. Ingen pengestyring kan redde et dårligt spilsystem.

En positiv forventning defineres som en værdi større end nul. Jo større dette tal er, jo stærkere er den statistiske forventning. Hvis værdien er mindre end nul, så vil den matematiske forventning også være negativ. Jo større modulet af den negative værdi er, jo værre er situationen. Hvis resultatet er nul, er ventetiden break-even. Du kan kun vinde, når du har en positiv matematisk forventning og et fornuftigt spillesystem. At spille efter intuition fører til katastrofe.


Matematisk forventning og aktiehandel

Matematisk forventning er en ret udbredt og populær statistisk indikator, når man udfører børshandel på finansielle markeder. Først og fremmest bruges denne parameter til at analysere succesen med handel. Det er ikke svært at gætte, at jo højere denne værdi er, desto flere grunde til at betragte den handel, der studeres, for vellykket. Selvfølgelig kan analyse af en erhvervsdrivendes arbejde ikke udføres ved hjælp af denne parameter alene. Imidlertid kan den beregnede værdi i kombination med andre metoder til at vurdere kvaliteten af ​​arbejdet øge analysens nøjagtighed betydeligt.


Den matematiske forventning beregnes ofte i handelskontoovervågningstjenester, som giver dig mulighed for hurtigt at evaluere det udførte arbejde på indbetalingen. Undtagelserne omfatter strategier, der bruger "sidder ude" urentable handler. En erhvervsdrivende kan være heldig i nogen tid, og derfor kan der slet ikke være nogen tab i hans arbejde. I dette tilfælde vil det ikke være muligt kun at blive styret af den matematiske forventning, fordi de risici, der bruges i arbejdet, ikke vil blive taget i betragtning.

I markedshandel bruges den matematiske forventning oftest, når man forudsiger rentabiliteten af ​​enhver handelsstrategi, eller når man forudsiger en erhvervsdrivendes indkomst baseret på statistiske data fra hans tidligere handel.

Med hensyn til pengestyring er det meget vigtigt at forstå, at når man handler med negative forventninger, er der ingen pengestyringsordning, der helt sikkert kan give høj fortjeneste. Hvis du fortsætter med at spille på aktiemarkedet under disse forhold, så vil du, uanset hvordan du forvalter dine penge, miste hele din konto, uanset hvor stor den var til at begynde med.

Dette aksiom gælder ikke kun for spil eller handler med negative forventninger, det gælder også for spil med lige chancer. Derfor er den eneste gang, du har en chance for at profitere på lang sigt, hvis du tager handler med positiv forventet værdi.


Forskellen mellem negativ forventning og positiv forventning er forskellen mellem liv og død. Det er lige meget, hvor positiv eller negativ forventningen er; Det afgørende er, om det er positivt eller negativt. Derfor, før du overvejer pengestyring, bør du finde et spil med positive forventninger.

Hvis du ikke har det spil, vil al pengeforvaltningen i verden ikke redde dig. På den anden side, hvis du har en positiv forventning, kan du gennem ordentlig pengestyring gøre det til en eksponentiel vækstfunktion. Det er lige meget, hvor lille den positive forventning er! Med andre ord er det ligegyldigt, hvor rentabelt et handelssystem er baseret på en enkelt kontrakt. Hvis du har et system, der vinder $10 pr. kontrakt pr. handel (efter provision og slip), kan du bruge pengestyringsteknikker til at gøre det mere rentabelt end et system, der i gennemsnit har $1.000 pr. handel (efter fradrag af provisioner og slip).


Det afgørende er ikke, hvor rentabelt systemet var, men hvor sikkert systemet kan siges at vise i det mindste minimal profit i fremtiden. Derfor er den vigtigste forberedelse, en erhvervsdrivende kan gøre, at sikre, at systemet vil vise en positiv forventet værdi i fremtiden.

For at have en positiv forventet værdi i fremtiden er det meget vigtigt ikke at begrænse dit systems frihedsgrader. Dette opnås ikke kun ved at eliminere eller reducere antallet af parametre, der skal optimeres, men også ved at reducere så mange systemregler som muligt. Hver parameter du tilføjer, hver regel du laver, hver lille ændring du foretager i systemet reducerer antallet af frihedsgrader. Ideelt set skal du bygge et ret primitivt og enkelt system, der konsekvent vil generere små overskud på næsten ethvert marked. Igen er det vigtigt for dig at forstå, at det er lige meget, hvor rentabelt systemet er, så længe det er rentabelt. De penge, du tjener i handel, vil blive tjent gennem effektiv pengestyring.

Et handelssystem er simpelthen et værktøj, der giver dig en positiv forventet værdi, så du kan bruge pengestyring. Systemer, der fungerer (viser mindst minimal profit) på kun et eller få markeder, eller har forskellige regler eller parametre for forskellige markeder, vil højst sandsynligt ikke fungere i realtid i lang tid. Problemet med de fleste teknisk orienterede handlende er, at de bruger for meget tid og kræfter på at optimere handelssystemets forskellige regler og parameterværdier. Dette giver helt modsatte resultater. I stedet for at spilde energi og computertid på at øge handelssystemets overskud, skal du rette din energi mod at øge pålidelighedsniveauet for at opnå et minimumsoverskud.

Ved at vide, at pengestyring kun er et talspil, der kræver brug af positive forventninger, kan en erhvervsdrivende stoppe med at søge efter aktiehandelens "hellige gral". I stedet kan han begynde at teste sin handelsmetode, finde ud af hvor logisk denne metode er, og om den giver positive forventninger. Korrekte pengestyringsmetoder, anvendt på alle, selv meget middelmådige handelsmetoder, vil klare resten af ​​arbejdet selv.


For at enhver erhvervsdrivende skal få succes med sit arbejde, skal han løse tre vigtigste opgaver: . For at sikre, at antallet af vellykkede transaktioner overstiger de uundgåelige fejl og fejlberegninger; Indstil dit handelssystem, så du har mulighed for at tjene penge så ofte som muligt; Opnå stabile positive resultater fra dine operationer.

Og her, for os arbejdende handlende, kan matematisk forventning være til stor hjælp. Dette udtryk er et af de vigtigste inden for sandsynlighedsteori. Med dens hjælp kan du give et gennemsnitligt skøn over en eller anden tilfældig værdi. Den matematiske forventning til en stokastisk variabel svarer til tyngdepunktet, hvis man forestiller sig alle mulige sandsynligheder som punkter med forskellig masse.


I forhold til en handelsstrategi bruges den matematiske forventning om profit (eller tab) oftest til at evaluere dens effektivitet. Denne parameter er defineret som summen af ​​produkterne af givne niveauer af fortjeneste og tab og sandsynligheden for deres forekomst. For eksempel antager den udviklede handelsstrategi, at 37% af alle transaktioner vil give overskud, og den resterende del - 63% - vil være urentabel. Samtidig vil den gennemsnitlige indkomst fra en vellykket transaktion være $7, og det gennemsnitlige tab vil være $1,4. Lad os beregne den matematiske forventning til handel ved hjælp af dette system:

Hvad betyder dette tal? Den siger, at efter reglerne i dette system vil vi i gennemsnit modtage $1.708 fra hver afsluttet transaktion. Da den resulterende effektivitetsvurdering er større end nul, kan et sådant system bruges til rigtigt arbejde. Hvis den matematiske forventning som følge af beregningen viser sig at være negativ, indikerer dette allerede et gennemsnitligt tab, og en sådan handel vil føre til ruin.

Mængden af ​​fortjeneste pr. transaktion kan også udtrykkes som en relativ værdi i form af %. For eksempel:

– procentdel af indkomst pr. 1 transaktion - 5%;

– procentdel af vellykkede handelsoperationer - 62%;

– procentdel af tab pr. 1 transaktion - 3%;

– procentdel af mislykkede transaktioner - 38%;

Det vil sige, at den gennemsnitlige handel vil bringe 1,96%.

Det er muligt at udvikle et system, der på trods af overvægten af ​​urentable handler vil give et positivt resultat, da dets MO>0.

Det er dog ikke nok at vente alene. Det er svært at tjene penge, hvis systemet giver meget få handelssignaler. I dette tilfælde vil dens rentabilitet være sammenlignelig med bankrenter. Lad hver operation i gennemsnit kun producere 0,5 dollars, men hvad nu hvis systemet involverer 1000 operationer om året? Det vil være et meget betydeligt beløb på relativt kort tid. Det følger logisk heraf, at et andet karakteristisk træk ved et godt handelssystem kan betragtes som en kort periode med at holde positioner.


Kilder og links

dic.academic.ru – akademisk onlineordbog

mathematics.ru – undervisningswebsted i matematik

nsu.ru – uddannelsessted for Novosibirsk State University

webmath.ru er en uddannelsesportal for studerende, ansøgere og skolebørn.

exponenta.ru pædagogisk matematisk hjemmeside

ru.tradimo.com – gratis online handelsskole

crypto.hut2.ru – tværfaglig informationsressource

poker-wiki.ru – gratis encyklopædi af poker

sernam.ru – Videnskabeligt bibliotek med udvalgte naturvidenskabelige publikationer

reshim.su – hjemmeside VI LØSER testkursusproblemer

unfx.ru – Forex på UNFX: træning, handelssignaler, tillidsstyring

slovopedia.com – Big Encyclopedic Dictionary Slovopedia

pokermansion.3dn.ru – Din guide i pokerens verden

statanaliz.info – informationsblog "Statistisk dataanalyse"

forex-trader.rf – Forex-Trader-portal

megafx.ru – aktuelle Forex-analyser

fx-by.com – alt for en erhvervsdrivende