Betydningen af ​​ordet "sandsynlighed". Klassisk sandsynlighed

som en ontologisk kategori afspejler omfanget af muligheden for fremkomsten af ​​enhver enhed under alle forhold. I modsætning til den matematiske og logiske fortolkning af dette begreb, forbinder ontologisk matematik sig ikke med forpligtelsen til kvantitativt udtryk. Betydningen af ​​V. afsløres i sammenhæng med forståelsen af ​​determinisme og udviklingens natur generelt.

Fremragende definition

Ufuldstændig definition ↓

SANDSYNLIGHED

koncept, der karakteriserer mængder. målet for muligheden for, at en bestemt begivenhed indtræffer ved en bestemt betingelser. I videnskabeligt viden er der tre fortolkninger af V. Det klassiske begreb V., som opstod fra matematisk. analyse af gambling og mest fuldt udviklet af B. Pascal, J. Bernoulli og P. Laplace, betragter vinde som forholdet mellem antallet af gunstige sager og det samlede antal af alle lige mulige. For eksempel, når du kaster en terning, der har 6 sider, kan hver af dem forventes at lande med en værdi på 1/6, da ingen side har fordele frem for en anden. En sådan symmetri af eksperimentelle resultater tages særligt i betragtning, når man organiserer spil, men er relativt sjælden i studiet af objektive begivenheder i videnskab og praksis. Klassisk V.s fortolkning gav plads til statistik. V.s begreber, som bygger på det faktiske observere forekomsten af ​​en bestemt begivenhed over en længere periode. erfaring under præcist fastsatte forhold. Praksis bekræfter, at jo oftere en begivenhed indtræffer, jo større er graden af ​​objektiv mulighed for dens forekomst, eller B. Derfor statistisk. V.s fortolkning bygger på begrebet relaterer. frekvens, som kan bestemmes eksperimentelt. V. som en teoretisk begrebet falder aldrig sammen med den empirisk bestemte frekvens, dog i flertal. I tilfælde adskiller den sig praktisk talt lidt fra den relative. frekvens fundet som et resultat af varighed. observationer. Mange statistikere betragter V. som en "dobbelt" refererer. frekvenser, kanter bestemmes statistisk. undersøgelse af observationsresultater

eller eksperimenter. Mindre realistisk var definitionen af ​​V., som grænsen vedrører. frekvenser af massebegivenheder, eller grupper, foreslået af R. Mises. Som en videreudvikling af frekvenstilgangen til V. fremsættes en dispositionel, eller propensiv, fortolkning af V. (K. Popper, J. Hacking, M. Bunge, T. Settle). Ifølge denne fortolkning karakteriserer V. f.eks. egenskaben til at frembringe betingelser. eksperiment. installationer for at opnå en sekvens af massive tilfældige hændelser. Det er netop denne holdning, der giver anledning til fysisk dispositioner, eller dispositioner, V. som kan kontrolleres ved hjælp af pårørende. frekvens

Statistisk V.s fortolkning dominerer videnskabelig forskning. kognition, fordi den afspejler specifik. arten af ​​de mønstre, der er iboende i massefænomener af tilfældig karakter. I mange fysiske, biologiske, økonomiske, demografiske. og andre sociale processer, er det nødvendigt at tage højde for handlingen af ​​mange tilfældige faktorer, som er karakteriseret ved en stabil frekvens. Identifikation af disse stabile frekvenser og mængder. dens vurdering ved hjælp af V. gør det muligt at afsløre den nødvendighed, der gør sig vej gennem den kumulative handling af mange ulykker. Det er her, dialektikken om at transformere tilfældigheder til nødvendighed finder sin manifestation (se F. Engels, i bogen: K. Marx og F. Engels, Works, bind 20, s. 535-36).

Logisk eller induktiv ræsonnement karakteriserer forholdet mellem præmisserne og konklusionen af ​​ikke-demonstrative og især induktive ræsonnementer. I modsætning til deduktion garanterer induktionens præmisser ikke konklusionens sandhed, men gør den kun mere eller mindre plausibel. Denne plausibilitet, med præcist formulerede præmisser, kan nogle gange vurderes ved hjælp af V. Værdien af ​​denne V. bestemmes oftest ved sammenligning. begreber (mere end, mindre end eller lig med), og nogle gange på en numerisk måde. Logisk fortolkning bruges ofte til at analysere induktiv ræsonnement og konstruere forskellige systemer af probabilistisk logik (R. Carnap, R. Jeffrey). I semantik logiske begreber V. defineres ofte som den grad, i hvilken et udsagn bekræftes af andre (f.eks. en hypotese af dens empiriske data).

I forbindelse med udviklingen af ​​teorier om beslutningstagning og spil, den såkaldte personalistisk fortolkning af V. Selvom V. samtidig udtrykker graden af ​​tro hos subjektet og forekomsten af ​​en bestemt begivenhed, skal V. selv vælges på en sådan måde, at aksiomerne i V.s kalkulation er opfyldt. Derfor udtrykker V. med en sådan fortolkning ikke så meget graden af ​​subjektiv, men snarere rimelig tro. Følgelig vil beslutninger truffet på grundlag af sådan V. være rationelle, fordi de ikke tager hensyn til det psykologiske. emnets karakteristika og tilbøjeligheder.

Med epistemologisk t.zr. forskel mellem statistisk, logisk. og personalistiske fortolkninger af V. er, at hvis den første karakteriserer de objektive egenskaber og relationer af massefænomener af tilfældig karakter, så analyserer de to sidste træk ved det subjektive, erkendte. menneskelige aktiviteter under forhold med usikkerhed.

SANDSYNLIGHED

et af videnskabens vigtigste begreber, der karakteriserer en særlig systemisk vision af verden, dens struktur, evolution og viden. Specificiteten af ​​det probabilistiske syn på verden afsløres gennem inddragelsen af ​​begreberne tilfældighed, uafhængighed og hierarki (ideen om niveauer i strukturen og bestemmelsen af ​​systemer) blandt de grundlæggende eksistensbegreber.

Ideer om sandsynlighed opstod i oldtiden og relaterede til vores videns karakteristika, mens man anerkendte eksistensen af ​​sandsynlighedsviden, som adskilte sig fra pålidelig viden og fra falsk viden. Indvirkningen af ​​ideen om sandsynlighed på videnskabelig tænkning og på udviklingen af ​​viden er direkte relateret til udviklingen af ​​sandsynlighedsteori som en matematisk disciplin. Oprindelsen af ​​den matematiske sandsynlighedslære går tilbage til det 17. århundrede, hvor udviklingen af ​​en kerne af begreber tillader det. kvantitative (numeriske) karakteristika og udtrykker en sandsynlighedstanke.

Intensive anvendelser af sandsynlighed til udvikling af kognition forekommer i 2. halvdel. 19 - 1. halvleg. 20. århundrede Sandsynlighed er kommet ind i strukturerne af sådanne grundlæggende naturvidenskaber som klassisk statistisk fysik, genetik, kvanteteori og kybernetik (informationsteori). I overensstemmelse hermed personificerer sandsynlighed det stadie i videnskabens udvikling, som nu defineres som ikke-klassisk videnskab. For at afsløre nyheden og funktionerne i den sandsynlige måde at tænke på, er det nødvendigt at gå ud fra en analyse af emnet sandsynlighedsteori og grundlaget for dets talrige anvendelser. Sandsynlighedsteori er normalt defineret som en matematisk disciplin, der studerer mønstrene for massetilfældige fænomener under visse betingelser. Tilfældighed betyder, at inden for rammerne af massekarakteren er eksistensen af ​​hvert elementært fænomen ikke afhængig af og ikke bestemt af eksistensen af ​​andre fænomener. Samtidig har selve fænomenernes massenatur en stabil struktur og indeholder visse regelmæssigheder. Et massefænomen er ret strengt opdelt i delsystemer, og det relative antal elementære fænomener i hvert af delsystemerne (relativ frekvens) er meget stabilt. Denne stabilitet sammenlignes med sandsynlighed. Et massefænomen som helhed er karakteriseret ved en sandsynlighedsfordeling, det vil sige ved at specificere undersystemer og deres tilsvarende sandsynligheder. Sandsynlighedsteoriens sprog er sproget for sandsynlighedsfordelinger. Derfor er sandsynlighedsteori defineret som den abstrakte videnskab om at arbejde med fordelinger.

Sandsynlighed gav anledning i videnskaben til ideer om statistiske mønstre og statistiske systemer. Sidstnævnte er systemer dannet af uafhængige eller kvasi-uafhængige enheder, deres struktur er karakteriseret ved sandsynlighedsfordelinger. Men hvordan er det muligt at danne systemer fra uafhængige enheder? Det antages normalt, at for dannelsen af ​​systemer med integrerede karakteristika er det nødvendigt, at der eksisterer tilstrækkeligt stabile forbindelser mellem deres elementer, der cementerer systemerne. Stabilitet af statistiske systemer er givet af tilstedeværelsen af ​​ydre forhold, ydre miljø, eksterne snarere end interne kræfter. Selve definitionen af ​​sandsynlighed er altid baseret på at sætte betingelserne for dannelsen af ​​det initiale massefænomen. En anden vigtig idé, der karakteriserer det probabilistiske paradigme, er ideen om hierarki (underordning). Denne idé udtrykker forholdet mellem individuelle elementers karakteristika og systemernes integrerede karakteristika: sidstnævnte er så at sige bygget oven på førstnævnte.

Betydningen af ​​probabilistiske metoder i kognition ligger i, at de gør det muligt at studere og teoretisk udtrykke struktur- og adfærdsmønstrene for objekter og systemer, der har en hierarkisk "to-niveau" struktur.

Analyse af sandsynlighedens natur er baseret på dens hyppighed, statistisk fortolkning. Samtidig dominerede en sådan sandsynlighedsforståelse i meget lang tid i videnskaben, som blev kaldt logisk eller induktiv sandsynlighed. Logisk sandsynlighed er interesseret i spørgsmål om gyldigheden af ​​en separat, individuel dom under visse betingelser. Er det muligt at vurdere graden af ​​bekræftelse (reliabilitet, sandhed) af en induktiv konklusion (hypotetisk konklusion) i kvantitativ form? Under udviklingen af ​​sandsynlighedsteori blev sådanne spørgsmål gentagne gange diskuteret, og de begyndte at tale om graderne af bekræftelse af hypotetiske konklusioner. Dette mål for sandsynlighed bestemmes af den information, der er tilgængelig for en given person, dennes erfaring, syn på verden og psykologiske tankegang. I alle sådanne tilfælde er størrelsen af ​​sandsynlighed ikke modtagelig for strenge målinger og ligger praktisk talt uden for sandsynlighedsteoriens kompetence som en konsekvent matematisk disciplin.

Den objektive, hyppige fortolkning af sandsynlighed blev etableret i videnskaben med betydelige vanskeligheder. Til at begynde med var forståelsen af ​​sandsynlighedens natur stærkt påvirket af de filosofiske og metodiske synspunkter, der var karakteristiske for klassisk videnskab. Historisk set skete udviklingen af ​​probabilistiske metoder i fysik under den bestemmende indflydelse af mekanikkens ideer: statistiske systemer blev simpelthen fortolket som mekaniske. Da de tilsvarende problemer ikke blev løst ved hjælp af strenge mekaniske metoder, opstod der påstande om, at det at vende sig til probabilistiske metoder og statistiske love er resultatet af ufuldstændigheden af ​​vores viden. I historien om udviklingen af ​​klassisk statistisk fysik blev der gjort adskillige forsøg på at underbygge den på basis af klassisk mekanik, men de mislykkedes alle. Grundlaget for sandsynlighed er, at det udtrykker de strukturelle træk ved en bestemt klasse af systemer, bortset fra mekaniske systemer: tilstanden af ​​elementerne i disse systemer er karakteriseret ved ustabilitet og en speciel (ikke reducerbar til mekanik) karakter af interaktioner.

Sandsynlighedens indtræden i viden fører til benægtelse af begrebet hård determinisme, til benægtelse af den grundlæggende model af væren og viden udviklet i processen med dannelsen af ​​klassisk videnskab. De grundlæggende modeller repræsenteret af statistiske teorier er af en anden, mere generel karakter: de omfatter ideerne om tilfældighed og uafhængighed. Ideen om sandsynlighed er forbundet med afsløringen af ​​den indre dynamik af objekter og systemer, som ikke helt kan bestemmes af eksterne forhold og omstændigheder.

Konceptet med en sandsynlighedsvision af verden, baseret på absolutisering af ideer om uafhængighed (som før paradigmet med rigid beslutsomhed), har nu afsløret sine begrænsninger, hvilket er stærkest afspejlet i overgangen af ​​moderne videnskab til analytiske metoder til at studere komplekse systemer og det fysiske og matematiske grundlag for selvorganiseringsfænomener.

Fremragende definition

Ufuldstændig definition ↓

Det er klart, at hver begivenhed har en varierende grad af mulighed for sin forekomst (dens gennemførelse). For kvantitativt at sammenligne begivenheder med hinanden i overensstemmelse med graden af ​​deres mulighed, er det naturligvis nødvendigt at knytte et vist antal til hver begivenhed, som er større, jo mere mulig begivenheden er. Dette tal kaldes sandsynligheden for en hændelse.

Sandsynlighed for hændelse– er et numerisk mål for graden af ​​objektiv mulighed for forekomsten af ​​denne begivenhed.

Overvej et stokastisk eksperiment og en tilfældig begivenhed A observeret i dette eksperiment. Lad os gentage dette eksperiment n gange og lad m(A) være antallet af eksperimenter, hvor begivenhed A fandt sted.

Relation (1.1)

hedder relativ hyppighed hændelser A i rækken af ​​udførte eksperimenter.

Det er nemt at verificere gyldigheden af ​​egenskaberne:

hvis A og B er inkonsistente (AB= ), så er ν(A+B) = ν(A) + ν(B) (1.2)

Den relative frekvens bestemmes først efter en række eksperimenter og kan generelt variere fra serie til serie. Men erfaringen viser, at i mange tilfælde, når antallet af forsøg stiger, nærmer den relative frekvens sig et vist antal. Denne kendsgerning om stabiliteten af ​​den relative frekvens er gentagne gange blevet verificeret og kan betragtes som eksperimentelt etableret.

Eksempel 1.19.. Hvis du kaster en mønt, kan ingen forudsige, hvilken side den vil lande på toppen. Men hvis du kaster to tons mønter, så vil alle sige, at omkring et ton vil falde op med våbenskjoldet, det vil sige, at den relative hyppighed af, at våbenskjoldet falder ud, er cirka 0,5.

Hvis den relative frekvens af hændelsen ν(A) med en stigning i antallet af eksperimenter tenderer til et bestemt fast antal, så siges det, at hændelse A er statistisk stabil, og dette tal kaldes sandsynligheden for hændelse A.

Sandsynlighed for hændelsen EN kaldes et eller andet fast tal P(A), hvortil den relative frekvens ν(A) af denne hændelse tenderer, når antallet af eksperimenter stiger, dvs.

Denne definition kaldes statistisk bestemmelse af sandsynlighed .

Lad os betragte et bestemt stokastisk eksperiment og lade rummet af dets elementære begivenheder bestå af et endeligt eller uendeligt (men tælleligt) sæt af elementære begivenheder ω 1, ω 2, …, ω i, …. Lad os antage, at hver elementær begivenhed ω i er tildelt et vist tal - р i, der karakteriserer graden af ​​mulighed for forekomsten af ​​en given elementær begivenhed og opfylder følgende egenskaber:

Dette tal p i kaldes sandsynligheden for en elementær begivenhedωi.

Lad nu A være en tilfældig hændelse observeret i dette eksperiment, og lad den svare til et bestemt sæt

I denne indstilling sandsynligheden for en begivenhed EN kald summen af ​​sandsynligheden for elementære begivenheder, der favoriserer A(inkluderet i det tilsvarende sæt A):


(1.4)

Sandsynligheden introduceret på denne måde har de samme egenskaber som den relative frekvens, nemlig:

Og hvis AB = (A og B er uforenelige),

så P(A+B) = P(A) + P(B)

Faktisk ifølge (1.4)

I det sidste forhold udnyttede vi det faktum, at ikke en enkelt elementær begivenhed kan favorisere to uforenelige begivenheder på samme tid.

Vi bemærker især, at sandsynlighedsteori ikke angiver metoder til at bestemme p i, de skal søges af praktiske årsager eller opnås fra et tilsvarende statistisk eksperiment.

Som et eksempel kan du overveje det klassiske skema med sandsynlighedsteori. For at gøre dette skal du overveje et stokastisk eksperiment, hvis rum af elementære begivenheder består af et endeligt (n) antal elementer. Lad os desuden antage, at alle disse elementære hændelser er lige mulige, det vil sige, at sandsynligheden for elementære hændelser er lig med p(ω i)=pi =p. Den følger det

Eksempel 1.20. Når du kaster en symmetrisk mønt, er det lige muligt at få hoveder og haler, deres sandsynligheder er lig med 0,5.

Eksempel 1.21. Når du kaster en symmetrisk terning, er alle ansigter lige mulige, deres sandsynligheder er lig med 1/6.

Lad nu begivenhed A blive begunstiget af m elementære begivenheder, de kaldes normalt gunstige resultater for begivenhed A. Derefter

Fik klassisk definition af sandsynlighed: sandsynligheden P(A) for begivenhed A er lig med forholdet mellem antallet af gunstige udfald i forhold til begivenhed A og det samlede antal udfald

Eksempel 1.22. Urnen indeholder m hvide kugler og n sorte kugler. Hvad er sandsynligheden for at tegne en hvid kugle?

Løsning. Det samlede antal elementære begivenheder er m+n. De er alle lige sandsynlige. Gunstig begivenhed A, hvoraf m. Derfor, .

Følgende egenskaber følger af definitionen af ​​sandsynlighed:

Ejendom 1. Sandsynligheden for en pålidelig hændelse er lig med én.

Faktisk, hvis begivenheden er pålidelig, så favoriserer hvert elementært resultat af testen begivenheden. I dette tilfælde t=p, derfor,

P(A)=m/n=n/n=1.(1.6)

Ejendom 2. Sandsynligheden for en umulig begivenhed er nul.

Faktisk, hvis en begivenhed er umulig, så favoriserer ingen af ​​testens elementære resultater begivenheden. I dette tilfælde T= 0, derfor, P(A)=m/n=0/n=0. (1.7)

Ejendom 3.Sandsynligheden for en tilfældig hændelse er et positivt tal mellem nul og én.

Faktisk er kun en del af det samlede antal elementære udfald af testen begunstiget af en tilfældig begivenhed. Det vil sige 0≤m≤n, hvilket betyder 0≤m/n≤1, derfor opfylder sandsynligheden for enhver hændelse den dobbelte ulighed 0≤ P(A)1. (1.8)

Ved at sammenligne definitionerne af sandsynlighed (1,5) og relativ frekvens (1,1), konkluderer vi: definition af sandsynlighed kræver ikke testning faktisk; definitionen af ​​relativ frekvens forudsætter det test blev faktisk udført. Med andre ord, sandsynligheden beregnes før forsøget, og den relative frekvens - efter forsøget.

Men at beregne sandsynlighed kræver foreløbige oplysninger om antallet eller sandsynligheden for elementære udfald, der er gunstige for en given begivenhed. I mangel af sådanne foreløbige oplysninger bruges empiriske data til at bestemme sandsynligheden, det vil sige, at den relative hyppighed af begivenheden bestemmes baseret på resultaterne af et stokastisk eksperiment.

Eksempel 1.23. Teknisk kontrolafdeling opdaget 3 ikke-standarddele i et parti på 80 tilfældigt udvalgte dele. Relativ hyppighed af forekomst af ikke-standarddele r(A)= 3/80.

Eksempel 1.24. Ifølge formålet.fremstillet 24 skud, og der blev registreret 19 hits. Relativ målhitrate. r(A)=19/24.

Langtidsobservationer har vist, at hvis eksperimenter udføres under identiske forhold, hvor antallet af tests er tilstrækkeligt stort i hver af dem, så udviser den relative frekvens egenskaben stabilitet. Denne ejendom er at i forskellige eksperimenter ændres den relative frekvens lidt (jo mindre, jo flere tests udføres), svingende omkring et bestemt konstant tal. Det viste sig, at dette konstante tal kan tages som en omtrentlig værdi af sandsynligheden.

Forholdet mellem relativ hyppighed og sandsynlighed vil blive beskrevet mere detaljeret og mere præcist nedenfor. Lad os nu illustrere egenskaben ved stabilitet med eksempler.

Eksempel 1.25. Ifølge svensk statistik er den relative hyppighed af fødsler af piger for 1935 pr. måned karakteriseret ved følgende tal (tallene er arrangeret i rækkefølge efter måneder, startende med Januar): 0,486; 0,489; 0,490; 0.471; 0,478; 0,482; 0.462; 0,484; 0,485; 0,491; 0,482; 0,473

Den relative frekvens svinger omkring tallet 0,481, hvilket kan tages som en omtrentlig værdi for sandsynligheden for at få piger.

Bemærk, at statistiske data fra forskellige lande giver omtrent samme relative frekvensværdi.

Eksempel 1.26. Møntkastningseksperimenter blev udført mange gange, hvor antallet af forekomster af "våbenskjoldet" blev talt. Resultaterne af flere forsøg er vist i tabellen.

Så lad os tale om et emne, der interesserer mange mennesker. I denne artikel vil jeg besvare spørgsmålet om, hvordan man beregner sandsynligheden for en hændelse. Jeg vil give formler for sådan en beregning og flere eksempler for at gøre det mere tydeligt, hvordan dette gøres.

Hvad er sandsynlighed

Lad os starte med det faktum, at sandsynligheden for, at den eller den hændelse vil indtræffe, er en vis grad af tillid til, at et eller andet resultat i sidste ende opstår. Til denne udregning er der udviklet en total sandsynlighedsformel, der giver dig mulighed for at afgøre, om den begivenhed, du er interesseret i, vil indtræffe eller ej, gennem de såkaldte betingede sandsynligheder. Denne formel ser sådan ud: P = n/m, bogstaverne kan ændre sig, men det påvirker ikke selve essensen.

Eksempler på sandsynlighed

Lad os ved hjælp af et simpelt eksempel analysere denne formel og anvende den. Lad os sige, at du har en bestemt begivenhed (P), lad det være et terningkast, det vil sige en ligesidet terning. Og vi skal beregne, hvad der er sandsynligheden for at få 2 point på det. For at gøre dette har du brug for antallet af positive begivenheder (n), i vores tilfælde - tabet af 2 point, for det samlede antal begivenheder (m). Et kast med 2 point kan kun ske i ét tilfælde, hvis der er 2 point på terningerne, da summen ellers vil være større, følger det, at n = 1. Dernæst tæller vi antallet af kast med eventuelle andre tal på terninger, pr. 1 terninger - disse er 1, 2, 3, 4, 5 og 6, derfor er der 6 gunstige tilfælde, det vil sige m = 6. Nu laver vi ved hjælp af formlen en simpel beregning P = 1/ 6, og vi finder, at kast med 2 point på terningen er 1/6, det vil sige, at sandsynligheden for hændelsen er meget lav.

Lad os også se på et eksempel med farvede kugler, der er i en æske: 50 hvide, 40 sorte og 30 grønne. Du skal bestemme, hvad der er sandsynligheden for at tegne en grøn bold. Og så, da der er 30 kugler af denne farve, det vil sige, at der kun kan være 30 positive begivenheder (n = 30), er antallet af alle begivenheder 120, m = 120 (baseret på det samlede antal af alle kugler), ved hjælp af formlen beregner vi, at sandsynligheden for at trække en grøn kugle vil være lig med P = 30/120 = 0,25, det vil sige 25% af 100. På samme måde kan du beregne sandsynligheden for at tegne en kugle af en anden farve (sort vil være 33%, hvid 42%).

Faktisk er formlerne (1) og (2) en kort registrering af betinget sandsynlighed baseret på en eventuel tabel med karakteristika. Lad os vende tilbage til det omtalte eksempel (fig. 1). Antag, at vi lærer, at en familie planlægger at købe et bredskærms-tv. Hvad er sandsynligheden for, at denne familie rent faktisk vil købe sådan et tv?

Ris. 1. Bredskærms-tv-købsadfærd

I dette tilfælde skal vi beregne den betingede sandsynlighed P (køb gennemført | køb planlagt). Da vi ved, at familien planlægger at købe, består prøverummet ikke af alle 1000 familier, men kun dem, der planlægger at købe et widescreen-tv. Af de 250 sådanne familier købte 200 faktisk dette tv. Derfor kan sandsynligheden for, at en familie rent faktisk køber et widescreen-tv, hvis de har planlagt at gøre det, beregnes ved hjælp af følgende formel:

P (køb gennemført | køb planlagt) = antal familier, der planlagde og købte et widescreen-tv / antal familier, der planlægger at købe et widescreen-tv = 200 / 250 = 0,8

Formel (2) giver samme resultat:

hvor er arrangementet EN er, at familien planlægger at købe et widescreen-tv, og arrangementet I- at hun faktisk vil købe det. Ved at erstatte reelle data i formlen får vi:

Beslutningstræ

I fig. 1 familier er opdelt i fire kategorier: dem, der planlagde at købe et bredskærms-tv, og dem, der ikke gjorde det, samt dem, der købte et sådant tv, og dem, der ikke gjorde. En lignende klassificering kan udføres ved hjælp af et beslutningstræ (fig. 2). Træet vist i fig. 2 har to filialer svarende til familier, der planlagde at købe et widescreen-tv, og familier, der ikke gjorde det. Hver af disse filialer opdeles i to yderligere filialer svarende til husstande, der købte og ikke købte et widescreen-tv. Sandsynligheder skrevet i enderne af de to hovedgrene er de ubetingede sandsynligheder for begivenheder EN Og EN'. Sandsynligheder skrevet i enderne af de fire yderligere grene er de betingede sandsynligheder for hver kombination af hændelser EN Og I. Betingede sandsynligheder beregnes ved at dividere den fælles sandsynlighed for begivenheder med den tilsvarende ubetingede sandsynlighed for hver af dem.

Ris. 2. Beslutningstræ

For at beregne sandsynligheden for, at en familie vil købe et widescreen-fjernsyn, hvis den har planlagt at gøre det, skal man for eksempel bestemme sandsynligheden for begivenheden køb planlagt og gennemført, og divider det derefter med sandsynligheden for hændelsen køb planlagt. Bevægelse langs beslutningstræet vist i fig. 2, får vi følgende (svarende til det foregående) svar:

Statistisk uafhængighed

I eksemplet med at købe et bredskærms-tv er sandsynligheden for, at en tilfældigt udvalgt familie købte et bredskærms-tv, da de planlagde at gøre det, 200/250 = 0,8. Husk, at den ubetingede sandsynlighed for, at en tilfældigt udvalgt familie har købt et widescreen-tv, er 300/1000 = 0,3. Dette fører til en meget vigtig konklusion. Forudgående information om, at familien planlagde et køb, påvirker sandsynligheden for selve købet. Disse to begivenheder afhænger med andre ord af hinanden. I modsætning til dette eksempel er der statistisk uafhængige hændelser, hvis sandsynligheder ikke afhænger af hinanden. Statistisk uafhængighed udtrykkes ved identiteten: P(A|B) = P(A), Hvor P(A|B)- sandsynlighed for hændelse EN forudsat at hændelsen fandt sted I, P(A)- ubetinget sandsynlighed for begivenhed A.

Bemærk venligst at arrangementer EN Og I P(A|B) = P(A). Hvis i en beredskabstabel med karakteristika med en størrelse på 2×2, er denne betingelse opfyldt for mindst én kombination af hændelser EN Og I, vil den være gyldig for enhver anden kombination. I vores eksempel begivenheder køb planlagt Og køb gennemført er ikke statistisk uafhængige, fordi information om én begivenhed påvirker sandsynligheden for en anden.

Lad os se på et eksempel, der viser, hvordan man tester den statistiske uafhængighed af to begivenheder. Lad os spørge 300 familier, der har købt et widescreen-tv, om de var tilfredse med deres køb (fig. 3). Afgør, om graden af ​​tilfredshed med købet og typen af ​​tv hænger sammen.

Ris. 3. Data, der karakteriserer graden af ​​tilfredshed hos købere af widescreen-tv

At dømme efter disse data,

På samme tid,

P (kundetilfreds) = 240 / 300 = 0,80

Derfor er sandsynligheden for, at kunden er tilfreds med købet, og at familien har købt et HDTV, lige stor, og disse hændelser er statistisk uafhængige, fordi de ikke er relaterede på nogen måde.

Sandsynlighedsmultiplikationsregel

Formlen til beregning af betinget sandsynlighed giver dig mulighed for at bestemme sandsynligheden for en fælles begivenhed A og B. Har løst formel (1)

i forhold til fælles sandsynlighed P(A og B), får vi en generel regel for multiplikation af sandsynligheder. Sandsynlighed for hændelse A og B lig med sandsynligheden for hændelsen EN forudsat at hændelsen indtræffer I I:

(3) P(A og B) = P(A|B) * P(B)

Lad os som eksempel tage 80 familier, der købte et widescreen HDTV-fjernsyn (fig. 3). Tabellen viser, at 64 familier er tilfredse med købet og 16 ikke er. Lad os antage, at to familier er tilfældigt udvalgt blandt dem. Bestem sandsynligheden for, at begge kunder bliver tilfredse. Ved hjælp af formel (3) får vi:

P(A og B) = P(A|B) * P(B)

hvor er arrangementet EN er, at den anden familie er tilfreds med deres køb og arrangementet I- at den første familie er tilfreds med deres køb. Sandsynligheden for, at den første familie er tilfreds med deres køb, er 64/80. Men sandsynligheden for, at den anden familie også er tilfreds med deres køb, afhænger af den første families svar. Hvis den første familie ikke vender tilbage til stikprøven efter undersøgelsen (udvalg uden returnering), reduceres antallet af respondenter til 79. Hvis den første familie er tilfreds med deres køb, er sandsynligheden for, at den anden familie også bliver tilfreds, 63 /79, da der kun er 63 tilbage i stikprøven familier, der er tilfredse med deres køb. Ved at erstatte specifikke data i formel (3) får vi således følgende svar:

P(A og B) = (63/79)(64/80) = 0,638.

Derfor er sandsynligheden for, at begge familier er tilfredse med deres indkøb, 63,8 %.

Antag, at efter undersøgelsen vender den første familie tilbage til stikprøven. Bestem sandsynligheden for, at begge familier vil være tilfredse med deres køb. I dette tilfælde er sandsynligheden for, at begge familier er tilfredse med deres køb, den samme, svarende til 64/80. Derfor er P(A og B) = (64/80)(64/80) = 0,64. Sandsynligheden for, at begge familier er tilfredse med deres indkøb er således 64,0 %. Dette eksempel viser, at valget af den anden familie ikke afhænger af valget af den første. Således erstatter den betingede sandsynlighed i formel (3) P(A|B) sandsynlighed P(A), får vi en formel til at gange sandsynligheden for uafhængige hændelser.

Reglen for multiplikation af sandsynligheden for uafhængige hændelser. Hvis begivenheder EN Og I er statistisk uafhængige, sandsynligheden for en begivenhed A og B lig med sandsynligheden for hændelsen EN, ganget med sandsynligheden for hændelsen I.

(4) P(A og B) = P(A)P(B)

Hvis denne regel gælder for begivenheder EN Og I, hvilket betyder, at de er statistisk uafhængige. Der er således to måder at bestemme den statistiske uafhængighed af to begivenheder:

  1. Begivenheder EN Og I er statistisk uafhængige af hinanden, hvis og kun hvis P(A|B) = P(A).
  2. Begivenheder EN Og B er statistisk uafhængige af hinanden, hvis og kun hvis P(A og B) = P(A)P(B).

Hvis i en 2x2 beredskabstabel, er en af ​​disse betingelser opfyldt for mindst én kombination af hændelser EN Og B, vil den være gyldig for enhver anden kombination.

Ubetinget sandsynlighed for en elementær begivenhed

(5) P(A) = P(A|B 1)P(B 1) + P(A|B 2)P(B 2) + … + P(A|B k)P(B k)

hvor begivenheder B 1, B 2, ... B k er gensidigt udelukkende og udtømmende.

Lad os illustrere anvendelsen af ​​denne formel ved at bruge eksemplet i fig. 1. Ved hjælp af formel (5) får vi:

P(A) = P(A|B 1)P(B 1) + P(A|B 2)P(B 2)

Hvor P(A)- sandsynligheden for, at købet var planlagt, P(B 1)- sandsynligheden for, at købet er foretaget, P(B 2)- sandsynligheden for, at købet ikke gennemføres.

BAYES' TEOREM

Den betingede sandsynlighed for en hændelse tager højde for information om, at en anden hændelse har fundet sted. Denne tilgang kan både bruges til at finpudse sandsynligheden under hensyntagen til nymodtaget information, og til at beregne sandsynligheden for, at den observerede effekt er en konsekvens af en specifik årsag. Fremgangsmåden til at forfine disse sandsynligheder kaldes Bayes' sætning. Det blev først udviklet af Thomas Bayes i det 18. århundrede.

Lad os antage, at ovennævnte virksomhed undersøger markedet for en ny tv-model. Tidligere var 40% af de tv'er, som virksomheden havde skabt, succesfulde, mens 60% af modellerne ikke blev anerkendt. Før de annoncerer udgivelsen af ​​en ny model, undersøger marketingspecialister omhyggeligt markedet og registrerer efterspørgsel. Tidligere blev 80 % af succesrige modeller forudsagt at være succesfulde, mens 30 % af succesfulde forudsigelser viste sig at være forkerte. Marketingafdelingen gav en positiv prognose for den nye model. Hvad er sandsynligheden for, at en ny tv-model bliver efterspurgt?

Bayes' sætning kan udledes af definitionerne af betinget sandsynlighed (1) og (2). For at beregne sandsynligheden P(B|A), tag formlen (2):

og erstatte i stedet for P(A og B) værdien fra formel (3):

P(A og B) = P(A|B) * P(B)

Ved at erstatte formel (5) i stedet for P(A), får vi Bayes' sætning:

hvor begivenheder B 1, B 2, ... B k er gensidigt udelukkende og udtømmende.

Lad os introducere følgende notation: begivenhed S - TV er efterspurgt, begivenheder' - TV er ikke efterspurgt, begivenhed F - gunstig prognose, begivenhed F' - dårlig prognose. Lad os antage, at P(S) = 0,4, P(S’) = 0,6, P(F|S) = 0,8, P(F|S’) = 0,3. Ved at anvende Bayes' sætning får vi:

Sandsynligheden for efterspørgsel efter en ny tv-model, givet en gunstig prognose, er 0,64. Således er sandsynligheden for manglende efterspørgsel givet en gunstig prognose 1–0,64=0,36. Beregningsprocessen er vist i fig. 4.

Ris. 4. (a) Beregninger ved hjælp af Bayes-formlen til at estimere sandsynligheden for efterspørgsel efter fjernsyn; (b) Beslutningstræ ved undersøgelse af efterspørgslen efter en ny tv-model

Lad os se på et eksempel på brug af Bayes' teorem til medicinsk diagnostik. Sandsynligheden for, at en person lider af en bestemt sygdom er 0,03. En medicinsk test kan kontrollere, om dette er sandt. Hvis en person virkelig er syg, er sandsynligheden for en nøjagtig diagnose (som siger, at personen er syg, når han virkelig er syg) 0,9. Hvis en person er rask, er sandsynligheden for en falsk positiv diagnose (som siger, at en person er syg, når han er rask) 0,02. Lad os sige, at den medicinske test giver et positivt resultat. Hvad er sandsynligheden for, at en person rent faktisk er syg? Hvad er sandsynligheden for en præcis diagnose?

Lad os introducere følgende notation: begivenhed D - personen er syg, begivenhed D’ - personen er rask, begivenhed T - diagnosen er positiv, begivenhed T' - diagnose negativ. Af betingelserne for opgaven følger det, at P(D) = 0,03, P(D’) = 0,97, P(T|D) = 0,90, P(T|D’) = 0,02. Ved at anvende formel (6) får vi:

Sandsynligheden for, at en person ved en positiv diagnose er virkelig syg er 0,582 (se også fig. 5). Bemærk venligst, at nævneren i Bayes-formlen er lig med sandsynligheden for en positiv diagnose, dvs. 0,0464.

Hvis hændelserne H 1, H 2, ..., H n danner en komplet gruppe, så kan du bruge den samlede sandsynlighedsformel for at beregne sandsynligheden for en vilkårlig hændelse:

P(A) = P(A/H 1) P(H 1)+P(A/H 2) P(H 2)

Ifølge hvilken sandsynligheden for forekomsten af ​​begivenhed A kan repræsenteres som summen af ​​produkterne af de betingede sandsynligheder for begivenhed A, med forbehold for forekomsten af ​​begivenheder H i, ved de ubetingede sandsynligheder for disse begivenheder H i. Disse hændelser H i kaldes hypoteser.

Fra den samlede sandsynlighedsformel følger Bayes' formel:

Sandsynligheden P(H i) for hypoteserne H i kaldes a priori sandsynligheder - sandsynligheder før udførelse af eksperimenter.
Sandsynligheder P(A/H i) kaldes posteriore sandsynligheder - sandsynligheden for hypoteser H i, forfinet som et resultat af erfaring.

Formålet med tjenesten. Onlineberegneren er designet til at beregne den samlede sandsynlighed med hele løsningsprocessen skrevet i Word-format (se eksempler på problemløsning).

Antal objekter 2 3 4 5
Antal specificerede produkter Sandsynligheden for defekte produkter er specificeret
Anlæg nr. 1: P(H1) = . Sandsynlighed for standardprodukter: P(A|H1) =
Anlæg nr. 2: P(H2) = . Sandsynlighed for standardprodukter: P(A|H2) =
Anlæg nr. 3: P(H3) = . Sandsynlighed for standardprodukter: P(A|H3) =
Anlæg nr. 4: P(H4) = . Sandsynlighed for standardprodukter: P(A|H4) =
Anlæg nr. 5: P(H5) = . Sandsynlighed for standardprodukter: P(A|H5) =

Hvis kildedataene præsenteres som en procentdel (%), så skal de præsenteres som en andel. For eksempel 60 %: 0,6.

Eksempel nr. 1. Butikken modtager pærer fra to fabrikker, hvor den første fabriks andel er 25%. Det er kendt, at procentdelen af ​​fejl på disse fabrikker er lig med henholdsvis 5% og 10% af alle fremstillede produkter. Sælgeren tager en pære tilfældigt. Hvad er sandsynligheden for, at den er defekt?
Løsning: Lad os med A betegne begivenheden - "pæren viser sig at være defekt." Følgende hypoteser om oprindelsen af ​​denne pære er mulige: H 1- "pæren kom fra den første fabrik." H 2- "pæren kom fra den anden plante." Da andelen af ​​det første anlæg er 25 %, er sandsynligheden for disse hypoteser ens hhv. ; .
Den betingede sandsynlighed for, at en defekt pære blev produceret af den første plante er , den anden plante - p(A/H 2)=finder vi den krævede sandsynlighed for, at sælgeren tog en defekt pære ved hjælp af den samlede sandsynlighedsformel
0,25·0,05+0,75·0,10=0,0125+0,075=0,0875
Svar: p(A)= 0,0875.

Eksempel nr. 2. Butikken modtog to lige store mængder af produktet af samme navn. Det er kendt, at 25% af det første parti og 40% af det andet parti er førsteklasses varer. Hvad er sandsynligheden for, at en tilfældigt udvalgt vareenhed ikke er af første klasse?
Løsning:
Lad os med A betegne begivenheden - "produktet vil være førsteklasses." Følgende hypoteser om oprindelsen af ​​dette produkt er mulige: H 1- "produkt fra første batch." H 2- "produkt fra anden batch." Da andelen af ​​den første batch er 25%, er sandsynligheden for disse hypoteser ens hhv. ; .
Den betingede sandsynlighed for, at produktet fra den første batch er , fra den anden batch - den ønskede sandsynlighed for, at en tilfældigt udvalgt enhed af varer vil være førsteklasses
p(A) = P(H 1) p(A/H 1)+P(H 2) (A/H 2)= 0,25·0,5+0,4·0,5=0,125+0,2=0,325
Derefter vil sandsynligheden for, at en tilfældigt udvalgt vareenhed ikke er af den første kvalitet, være lig med: 1- 0,325 = 0,675
Svar: .

Eksempel nr. 3. Det er kendt, at 5 % af mændene og 1 % af kvinderne er farveblinde. Den tilfældigt udvalgte person viste sig ikke at være farveblind. Hvad er sandsynligheden for, at der er tale om en mand (antag, at der er lige mange mænd og kvinder).
Løsning.
Hændelse A - den tilfældige valgte person viser sig ikke at være farveblind.
Lad os finde sandsynligheden for, at denne begivenhed indtræffer.
P(A) = P(A|H=han) + P(A|H=hun) = 0,95*0,5 + 0,99*0,5 = 0,475 + 0,495 = 0,97
Så er sandsynligheden for, at dette er en mand: p = P(A|H=mand) / P(A) = 0,475/0,97 = 0,4897

Eksempel nr. 4. 4 førsteårsstuderende, 6 andetårsstuderende og 5 tredjeårsstuderende deltager i idrætsolympiaden. Sandsynligheden for, at en første-, anden-, tredjeårselev vinder Olympiaden er henholdsvis 0,9. 0,7 og 0,8.
a) Find sandsynligheden for at vinde af en tilfældigt udvalgt deltager.
b) Under betingelserne for dette problem vandt en elev olympiaden. Hvilken gruppe tilhører han højst sandsynligt?
Løsning.
Begivenhed A - sejr for en tilfældigt udvalgt deltager.
Her er P(H1) = 4/(4+6+5) = 0,267, P(H2) = 6/(4+6+5) = 0,4, P(H3) = 5/(4+6+5) = 0,333,
P(A|H1) = 0,9, P(A|H2) = 0,7, P(A|H3) = 0,8
a) P(A) = P(H1)*P(A|H1) + P(H2)*P(A|H2) + P(H3)*P(A|H3) = 0,267*0,9 + 0,4*0,7 + 0,333*0,8 = 0,787
b) Løsningen kan fås ved hjælp af denne lommeregner.
p1 = P(H1)*P(A|H1)/P(A)
p2 = P(H2)*P(A|H2)/P(A)
p3 = P(H3)*P(A|H3)/P(A)
Fra p1, p2, p3, vælg den maksimale.

Eksempel nr. 5. Virksomheden råder over tre maskiner af samme type. En af dem giver 20% af den samlede produktion, den anden - 30%, den tredje - 50%. I dette tilfælde producerer den første maskine 5% af fejlene, den anden 4%, den tredje - 2%. Find sandsynligheden for, at et tilfældigt udvalgt defekt produkt produceres af den første maskine.