Момент на корелација на случајни променливи. Нумерички карактеристики на систем од две случајни променливи

Во поглавје 5, ги воведовме во предвид нумеричките карактеристики на една случајна променлива - почетните и централните моменти од различни редови. Од овие карактеристики, две се најважни: математичко очекување и дисперзија.

Слични нумерички карактеристики - почетни и централни моменти од различни редови - може да се воведат за систем од две случајни променливи.

Почетниот момент на редослед на системот е математичкото очекување на производот со:

. (8.6.1)

Централниот момент на редот на системот е математичкото очекување на производот од та и та моќ на соодветните центрирани величини:

, (8.6.2)

Дозволете ни да ги запишеме формулите што се користат за директно пресметување на моментите. За дисконтинуирани случајни променливи

, (8.6.3)

, (8.6.4)

Каде - веројатноста дека системот ќе ги земе вредностите, а сумирањето се протега на сите можни вредности на случајните променливи.

За континуирани случајни променливи:

, (8.6.5)

, (8.6.6)

каде е густината на дистрибуцијата на системот.

Покрај и , кои го карактеризираат редот на моментот во однос на поединечни величини, се зема и вкупниот ред на моментот, еднаков на збирот на експонентите на и . Според вкупниот редослед, моментите се класифицираат на прв, втор итн. Во практиката обично се користат само првиот и вториот момент.

Првите почетни моменти ги претставуваат веќе познатите за нас математички очекувања за количините и вклучени во системот:

Множеството математички очекувања е карактеристика на положбата на системот. Геометриски, ова се координатите на средната точка на рамнината околу која точката е расфрлана.

Покрај првите почетни моменти, во пракса широко се користат и вторите централни моменти на системот. Два од нив ја претставуваат дисперзијата на количествата и веќе ни се познати:

карактеризирање на расејување на случајна точка во насока на и оските.

Вториот мешан централен момент игра посебна улога како карактеристика на системот:

,

тие. математичко очекување на производот од центрирани големини.

Поради фактот што овој момент игра важна улога во теоријата, воведуваме посебна нотација за него:

. (8.6.7)

Карактеристиката се нарекува момент на корелација (инаку „момент на поврзување“) на случајни променливи, .

За дисконтинуирани случајни променливи, моментот на корелација се изразува со формулата

, (8.6.8)

а за континуираните - по формулата

. (8.6.9)

Дозволете ни да го дознаеме значењето и целта на оваа карактеристика.

Моментот на корелација е карактеристика на систем од случајни променливи што ја опишува, покрај дисперзијата на променливите, а исто така и поврзаноста меѓу нив. За да го потврдиме ова, да докажеме дека за независни случајни променливи моментот на корелација е еднаков на нула.

Ќе го спроведеме доказот за континуирани случајни променливи. Нека се независни континуирани величини со густина на дистрибуција. Во 8.5 го докажавме тоа за независните количини

. (8.6.10)

каде што се густините на распределбата на вредностите и соодветно.

Заменувајќи го изразот (8.6.10) во формулата (8.6.9), гледаме дека интегралот (8.6.9) се претвора во производ на два интеграли:

.

Интегрален

не претставува ништо повеќе од првиот централен момент на количината и затоа е еднаква на нула; од истата причина, вториот фактор е исто така нула; затоа, за независни случајни променливи .

Така, ако моментот на корелација на две случајни променливи е различен од нула, ова е знак за присуство на зависност меѓу нив.

Од формулата (8.6.7) е јасно дека моментот на корелација ја карактеризира не само зависноста на количините, туку и нивната дисперзија. Навистина, ако, на пример, една од величините многу малку отстапува од математичкото очекување (речиси не случајно), тогаш моментот на корелација ќе биде мал, без разлика колку тесно се поврзани количините. Затоа, за да го карактеризираме односот помеѓу количините во неговата чиста форма, преминуваме од моментот кон бездимензионалната карактеристика

каде што се стандардните отстапувања на вредностите,. Оваа карактеристика се нарекува коефициент на корелација на величините и. Очигледно, коефициентот на корелација оди на нула истовремено со моментот на корелација; затоа, за независни случајни променливи коефициентот на корелација е нула.

Случајните променливи за кои моментот на корелација (а со тоа и коефициентот на корелација) е еднаков на нула се нарекуваат неповрзани (понекогаш „неповрзани“).

Дозволете ни да дознаеме дали концептот на неповрзани случајни променливи е еквивалентен на концептот на независност. Погоре докажавме дека две независни случајни променливи се секогаш неповрзани. Останува да се види: дали е точно обратното, дали нивната независност произлегува од неповрзаноста на количините? Излегува - не. Можно е да се конструираат примери на такви случајни променливи кои се неповрзани, но зависни. Еднаквоста на коефициентот на корелација на нула е неопходен, но не доволен услов за независноста на случајните променливи. Независноста на случајните променливи имплицира дека тие се неповрзани; напротив, фактот што количините се неповрзани не мора да значи дека се независни. Условот за независност на случајните променливи е построг од условот за неповрзаност.

Ајде да го видиме ова со пример. Да разгледаме систем од случајни променливи распределени со еднаква густина во круг со радиус со центар на почетокот (сл. 8.6.1).

Густината на распределбата на вредностите се изразува со формулата

Од состојбата ние најдовме .

Лесно е да се види дека во овој пример количините се зависни. Навистина, веднаш е јасно дека ако количината ја земе, на пример, вредноста 0, тогаш количината со еднаква веројатност може да ги земе сите вредности од до; ако количината ја примила вредноста , тогаш количината може да земе само една единствена вредност, точно еднаква на нула; генерално, опсегот на можни вредности зависи од тоа која вредност.

Ајде да видиме дали овие количини се во корелација. Да го пресметаме моментот на корелација. Имајќи предвид дека поради причини за симетрија, добиваме:

. (8.6.12)

За да го пресметаме интегралот, ја делиме областа на интеграција (круг) на четири сектори што одговараат на четири координатни агли. Во секторите и интеграндот е позитивен, во секторите е негативен; во апсолутна вредност интегралите над овие сектори се еднакви; затоа, интегралот (8.6.12) е еднаков на нула, а количините не се во корелација.

Така, гледаме дека неповрзаната природа на случајните променливи не секогаш имплицира нивна независност.

Коефициентот на корелација не карактеризира никаква зависност, туку само таканаречена линеарна зависност. Линеарната веројатносна зависност на случајните променливи е дека кога една случајна променлива се зголемува, другата има тенденција да се зголемува (или намалува) според линеарен закон. Оваа тенденција кон линеарна зависност може да биде повеќе или помалку изразена, повеќе или помалку да се приближува до функционална, т.е. до најблиската линеарна зависност. Коефициентот на корелација го карактеризира степенот на блискост на линеарната врска помеѓу случајните променливи. Ако случајните променливи се поврзани со точна линеарна функционална врска:

тогаш , и се зема знакот „плус“ или „минус“ во зависност од тоа дали коефициентот е позитивен или негативен. Во општиот случај, кога количините и се поврзани со произволна веројатност за зависност, коефициентот на корелација може да има вредност во следните граници: се менува само опсегот на промена, а неговата просечна вредност не се менува; Секако, количините се покажаа како неповрзани.

Ориз. 8.6.2 Сл.8.6.3

Да дадеме неколку примери на случајни променливи со позитивна и негативна корелација.

1. Тежината и висината на една личност се во позитивна корелација.

2. Времето поминато за прилагодување на уредот во подготовка за работа и времето на неговото функционирање без проблеми се поврзани со позитивна корелација (ако, се разбира, времето се троши паметно). Напротив, времето поминато на подготовка и бројот на откриени дефекти за време на работата на уредот се негативно корелирани.

3. При пукање во салво, координатите на точките на удар на поединечни проектили се поврзани со позитивна корелација (бидејќи има грешки во насочувањето заеднички за сите истрели, кои подеднакво го оттргнуваат секој од нив од целта).

4. Во целта се испукани два истрели; се снима точката на удар од првиот истрел и се воведува корекција во видот, пропорционална на грешката на првиот истрел со спротивен знак. Координатите на ударните точки на првиот и вториот истрел ќе бидат негативно корелирани.

Ако ги имаме на располагање резултатите од голем број експерименти на систем на случајни променливи, тогаш присуството или отсуството на значајна корелација меѓу нив лесно може да се процени до првото приближување со графикон на кој сите парови вредности на случајни променливи добиените од експериментот се прикажани како точки. На пример, ако набљудуваните парови на вредности се наоѓаат како што е прикажано на сл. 8.6.2, тогаш тоа укажува на присуство на јасно изразена позитивна корелација помеѓу количините. Уште поизразена позитивна корелација, блиска до линеарна функционална зависност, е забележана на сл. 8.6.3. На сл. Слика 8.6.4 го прикажува случајот на релативно слаба негативна корелација. Конечно, на Сл. 8.6.5 го илустрира случајот на практично неповрзани случајни променливи. Во пракса, пред да се испита корелацијата на случајните променливи, секогаш е корисно прво да се исцртаат набљудуваните парови на вредности на графикон за да се донесе првиот квалитативен суд за типот на корелација.

ДРЖАВЕН КОМИТЕТ ЗА НАУКА И ТЕХНОЛОГИЈА НА РЕПУБЛИКА АЗЕРБАЈАН

ЦЕНТАР ЗА ИСТРАЖУВАЊЕ И ОБУКА БАКУ

ДИПЛОМЕНСКИ СТУДЕНТ НА ​​КАТЕДРА ЗА ДЕТСКА ХИРУРГИЈА

АМУ на име Н.НАРИМАНОВ

МУХТАРОВА ЕМИЛ ГАСАН ogly

КОРЕЛАЦИОНИ МОМЕНТИ. КОЕФИЦИЕНТ НА ​​КОРЕЛАЦИЈА

ВОВЕД

Теорија на веројатност е математичка наука која ги проучува обрасците во случајни појави.

Што се подразбира под случајни појави?

Во научното проучување на физичките и техничките проблеми, често се среќаваат појави од посебен тип, кои обично се нарекуваат случајни. Случаен феномен- ова е феномен кој, кога истото искуство постојано се повторува, се одвива малку поинаку.

Да дадеме пример за случаен феномен.

Истото тело се мери неколку пати на аналитичка вага: резултатите од повторените мерење се малку различни едни од други. Овие разлики се должат на влијанието на различни помали фактори кои ја придружуваат работата на мерењето, како што се случајни вибрации на опремата, грешки во читањето на инструментот итн.

Очигледно е дека не постои ниту еден физички феномен во природата во кој елементите на случајност не би биле присутни до еден или друг степен. Без разлика колку точно и детално се фиксирани експерименталните услови, невозможно е да се осигура дека кога експериментот се повторува, резултатите целосно и точно се совпаѓаат.

Несреќите неизбежно го придружуваат секој природен феномен. Меѓутоа, во голем број практични проблеми овие случајни елементи може да се занемарат, земајќи го предвид неговиот поедноставен дијаграм наместо реален феномен, т.е. модел, и под претпоставка дека во дадените експериментални услови феноменот се одвива на многу дефинитивен начин. Воедно, од безбројот број на фактори кои влијаат на оваа појава, се издвојуваат најважните, фундаменталните и одлучувачките. Едноставно се занемарува влијанието на други, помали фактори. При проучувањето на обрасците во рамките на одредена теорија, главните фактори кои влијаат на одредена појава се вклучени во концептите или дефинициите со кои работи предметната теорија.

Како и секоја наука која развива општа теорија за кој било опсег на феномени, теоријата на веројатност исто така содржи голем број основни концепти на кои се заснова. Секако, не можат строго да се дефинираат сите основни концепти, бидејќи да се дефинира концепт значи да се сведе на други, попознати. Овој процес мора да биде конечен и да заврши со примарни концепти кои се само објаснети.

Еден од првите концепти во теоријата на веројатност е концептот на настан.

Под настансе разбира секој факт што може или не може да се појави како резултат на искуство.

Да дадеме примери на настани.

А - раѓање на момче или девојче;

Б - избор на едно или друго отворање во шаховска игра;

В - припаѓаат на еден или друг хороскопски знак.

Имајќи ги предвид горенаведените настани, гледаме дека секој од нив има одреден степен на можност: некои поголема, други помала. За квантитативно да се споредат настаните едни со други според степенот на нивната можност, очигледно, потребно е да се поврзе одреден број со секој настан, што е поголем, толку е можно настанот. Овој број се нарекува веројатност за настан. Така, веројатноста за настан е нумеричка карактеристика на степенот на објективна можност на настанот.

Единицата на веројатност се зема како веројатност за сигурен настан еднаков на 1, а опсегот на промени во веројатностите на кој било настан е број од 0 до 1.

Веројатноста обично се означува со буквата П.

Да го погледнеме примерот на вечниот проблем на Шекспировиот Хамлет „да се биде или не?“ Како можете да ја одредите веројатноста за настан?

Сосема е очигледно дека личноста, предметот и која било друга појава може да биде во една од двете и нема повеќе состојби: присуство („да се биде“) и отсуство („да не биде“). Односно, има два можни настани, но може да се случи само еден. Ова значи дека веројатноста за, на пример, постоење е 1/2.

Покрај концептот на настан и веројатност, еден од главните концепти на теоријата на веројатност е концептот на случајна променлива.

Случајна променлива е количина која како резултат на експеримент може да добие една или друга вредност, а однапред не се знае која.

Случајните променливи кои земаат само вредности кои се одвоени една од друга и кои можат однапред да се наведат се нарекуваат континуирани или дискретни случајни променливи.

На пример:

1. Број на преживеани и починати пациенти.

2. Вкупниот број на деца од пациентите примени во болница во текот на ноќта.

Случајните променливи чии можни вредности континуирано пополнуваат одреден интервал се нарекуваат континуирани случајни променливи.

На пример, грешка при мерење на аналитичка вага.

Забележете дека модерната теорија на веројатност првенствено работи со случајни променливи, наместо со настани, на кои главно се засновала „класичната“ теорија на веројатност.

КОРЕЛАЦИОНИ МОМЕНТИ. КОЕФИЦИЕНТ НА ​​КОРЕЛАЦИЈА.

Моменти на корелација, коефициент на корелација - тоа се нумерички карактеристики кои се тесно поврзани со концептот на случајна променлива воведен погоре, или поточно со систем на случајни променливи. Затоа, за да се воведе и дефинира нивното значење и улога, неопходно е да се објасни концептот на систем на случајни променливи и некои својства својствени за нив.

Се нарекуваат две или повеќе случајни променливи кои опишуваат некоја појава систем или комплекс од случајни променливи.

Систем од неколку случајни променливи X, Y, Z, …, W обично се означува со (X, Y, Z, …, W).

На пример, точка на рамнина е опишана не со една координата, туку со две, а во просторот - дури и со три.

Својствата на системот од неколку случајни променливи не се ограничени на својствата на поединечни случајни променливи вклучени во системот, туку вклучуваат и меѓусебни врски (зависности) помеѓу случајни променливи. Затоа, кога се проучува систем на случајни променливи, треба да се обрне внимание на природата и степенот на зависност. Оваа зависност може да биде повеќе или помалку изразена, повеќе или помалку блиска. И во други случаи, случајните променливи излегуваат практично независни.

Се повикува случајната променлива Y независнаод случајна променлива X, ако законот за распределба на случајната променлива Y не зависи од вредноста што ја земал X.

Треба да се забележи дека зависноста и независноста на случајните променливи е секогаш взаемна појава: ако Y не зависи од X, тогаш вредноста X не зависи од Y. Земајќи го предвид ова, можеме да ја дадеме следната дефиниција за независноста на случајни променливи.

Случајните променливи X и Y се нарекуваат независни ако законот за распределба на секоја од нив не зависи од тоа каква вредност зема другата. Во спротивно, се нарекуваат вредностите на X и Y зависни.

Закон за дистрибуција Случајна променлива е секоја врска што воспоставува врска помеѓу можните вредности на случајна променлива и нивните соодветни веројатности.

Концептот на „зависност“ на случајни променливи, кој се користи во теоријата на веројатност, е малку различен од вообичаениот концепт на „зависност“ на променливите што се користи во математиката. Така, математичарот под „зависност“ значи само еден вид зависност - целосна, цврста, таканаречена функционална зависност. Две величини X и Y се нарекуваат функционално зависни ако, знаејќи ја вредноста на едната од нив, можете точно да ја одредите вредноста на другата.

Во теоријата на веројатност, постои малку поинаков тип на зависност - веројатноста зависност. Ако вредноста Y е поврзана со вредноста X со веројатна зависност, тогаш, знаејќи ја вредноста на X, невозможно е точно да се означи вредноста на Y, но можете да го наведете неговиот закон за распределба, во зависност од тоа која вредност ја има вредноста X земени.

Веројатната врска може да биде повеќе или помалку блиска; Како што се зголемува затегнатоста на веројатноста за зависност, таа станува сè поблиска до функционалната. Така, функционалната зависност може да се смета како екстремен, ограничувачки случај на најблиската веројатна зависност. Друг екстремен случај е целосната независност на случајните променливи. Помеѓу овие два екстремни случаи лежат сите градации на веројатноста за зависност - од најсилната до најслабата.

Веројатната зависност помеѓу случајните променливи често се среќава во пракса. Ако случајните променливи X и Y се во веројатна врска, тоа не значи дека со промена на вредноста на X, вредноста на Y се менува на сосема дефинитивен начин; тоа само значи дека со промена на вредноста на X, вредноста на Y

има тенденција да се менува (се зголемува или намалува како што X се зголемува). Овој тренд е забележан само во општи рамки, а во секој поединечен случај можни се отстапувања од него.

Примери на веројатност за зависност.

Ајде да избереме еден пациент со перитонитис по случаен избор. случајна променлива Т е времето од почетокот на болеста, случајната променлива О е нивото на хомеостатските нарушувања. Постои јасна врска помеѓу овие вредности, бидејќи вредноста Т е една од најважните причини за одредување на вредноста на O.

Во исто време, постои послаба веројатна врска помеѓу случајната променлива Т и случајната променлива М, која ја одразува смртноста во дадена патологија, бидејќи случајната променлива, иако влијае на случајната променлива О, не е главната детерминанта.

Покрај тоа, ако ги земеме предвид вредноста на Т и вредноста Б (возраста на хирургот), тогаш овие вредности се практично независни.

Досега разговаравме за својствата на системите на случајни променливи, давајќи само вербално објаснување. Меѓутоа, постојат нумерички карактеристики преку кои се проучуваат својствата и на поединечните случајни променливи и на системот на случајни променливи.

За да се опише систем од две случајни променливи, покрај математичките очекувања и варијансите на компонентите, се користат и други карактеристики, кои вклучуваат момент на корелацијаИ коефициент на корелација(накратко спомнато на крајот од Т.8.стр.8.6) .

Момент на корелација(или коваријанса,или моментот на поврзување) две случајни променливи X И Y наречен м.о. производ на отстапувањата на овие количини (види еднаквост (5) клаузула 8.6):

Заклучок 1.За моментот на корелација р.в. X И Yважат и следните еднаквости:

,

каде што соодветните централизирани р.в. X И Y (види клаузула 8.6.).

Во овој случај: ако
е дводимензионален d.s.v., тогаш коваријансата се пресметува со формулата

(8)
;

Ако
е дводимензионален n.s.v., тогаш коваријансата се пресметува со формулата

(9)

Формулите (8) и (9) се добиени врз основа на формулите (6) во клаузула 12.1. Постои пресметковна формула

(10)

што е изведено од дефиницијата (9) и врз основа на својствата на МО, навистина,

Следствено, формулите (36) и (37) може да се препишат во форма

(11)
;

Моментот на корелација служи за карактеризирање на односот помеѓу количините X И Y.

Како што ќе биде прикажано подолу, моментот на корелација е еднаков на нула ако XИ Y се независен;

Затоа, ако моментот на корелација не е еднаков на нула, тогашXИYсе зависни случајни променливи.

Теорема 12.1.Момент на корелација на две независни случајни променливиXИYе еднакво на нула, т.е. за независна р.в.XИY,

Доказ.Бидејќи X И Yнезависни случајни променливи, потоа нивните отстапувања

И

Тисто така независни. Користење на својствата на математичкото очекување (математичкото очекување на производот на независни r.v.s е еднакво на производот од математичките очекувања на факторите
,
, Затоа

Коментар.Од оваа теорема произлегува дека ако
потоа с.в. X И Y зависна и во такви случаи р.в. X И Yповикани во корелација. Меѓутоа, од фактот дека
не ја следи независноста р.в. X И Y.

Во овој случај (
с.в. X И Yповикани неповрзани,Така, од независноста следи неповрзани; обратната изјава е, општо земено, лажна (види подолу пример 2.)

Да ги разгледаме главните својства на моментот на корелација.

Вковаријантни својства:

1. Коваријансата е симетрична, т.е.
.

Ова директно произлегува од формулата (38).

2. Постојат еднаквости: т.е. дисперзија р.в. е нејзината коваријанса со себе.

Овие еднаквости директно произлегуваат од дефиницијата за дисперзија и еднаквост (38), соодветно, за

3. Следниве еднаквости се валидни:

Овие еднаквости се изведени од дефиницијата за варијанса и коваријанса на р.в.
И , својства 2.

По дефиниција за дисперзија (земајќи ја предвид централноста на р.в.
) ние имаме

Сега, врз основа на (33) и својствата 2 и 3, го добиваме првото (со знак плус) својство 3.

Слично на тоа, вториот дел од својството 3 е изведен од еднаквоста

4. Нека
постојани броеви,
тогаш еднаквостите се валидни:

Обично овие својства се нарекуваат својства на хомогеност и периодичност од прв ред во аргументите.

Да ја докажеме првата еднаквост, а ќе ги искористиме својствата на m.o.
.

Теорема 12.2.Абсолутна вредностмомент на корелација на две произволни случајни променливиXИYне ја надминува геометриската средина на нивните варијанси: т.е.

Доказ.Забележете дека за независна р.в. неравенството важи (види теорема 12.1.). Значи, нека р.в. X И Y зависни. Да го разгледаме стандардниот р.в.
И
и пресметај ја дисперзијата на р.в.
земајќи го предвид имотот 3 имаме: од една страна
На другата страна

Затоа, земајќи го предвид фактот дека
И - нормализиран (стандардизиран) р.в., потоа за нив м.о. е еднаква на нула, а варијансата е еднаква на 1, затоа, користејќи го својството m.o.
добиваме

и затоа врз основа на фактот дека
добиваме

Следи дека т.е.

=

Изјавата е докажана.

Од дефиницијата и својствата на коваријансата произлегува дека таа го карактеризира и степенот на зависност на r.v и нивното расејување околу точка
Димензијата на коваријансата е еднаква на производот од димензиите на случајните променливи XИ Y. Со други зборови, големината на моментот на корелација зависи од мерните единици на случајните променливи. Поради оваа причина, за истите две количини XИ Y, големината на моментот на корелација ќе има различни вредности во зависност од единиците во кои се измерени вредностите.

Нека, на пример, XИ Y беа измерени во сантиметри и
; ако се мери XИ Y во милиметри, тогаш
Оваа карактеристика на моментот на корелација е недостаток на оваа нумеричка карактеристика, бидејќи споредбата на моментите на корелација на различни системи на случајни променливи станува тешка.

Со цел да се отстрани овој недостаток, се воведува нова нумеричка карактеристика - “ коефициент на корелација».

Коефициент на корелација
случајни променливи
И се нарекува сооднос на моментот на корелација до производот на стандардните отстапувања на овие големини:

(13)
.

Од димензијата
еднаков на производот од димензиите на количините
И ,
има димензија на големина
σ yима димензија на големина , Тоа
е само бројка (т.е.“ бездимензионална количина"). Така, вредноста на коефициентот на корелација не зависи од изборот на мерни единици на r.v., ова е предносткоефициент на корелација пред моментот на корелација.

Во Т.8. клаузула 8.3 го воведовме концептот нормализиранс.в.
, формула (18), а теоремата е докажана дека
И
(Видете исто така теорема 8.2.). Овде ја докажуваме следната изјава.

Теорема 12.3.За кои било две случајни променливи
И еднаквоста е вистина
.Со други зборови, коефициентот на корелација
кои било две со
.В.XИYеднаков на моментот на корелација на нивните соодветни нормализиранис.в.
И .

Доказ.По дефиниција на нормализирани случајни променливи
И

И
.

Земајќи го предвид својството на математичкото очекување: и еднаквост (40) добиваме

Изјавата е докажана.

Ајде да погледнеме некои најчесто сретнувани својства на коефициентот на корелација.

Својства на коефициентот на корелација:

1. Коефициентот на корелација во апсолутна вредност не надминува 1, т.е.

Ова својство следи директно од формулата (41) - дефиниција на коефициентот на корелација и теорема 13.5. (види еднаквост (40)).

2. Ако случајни променливи
И се независни, коефициентот на тековната корелација е нула, т.е.
.

Ова својство е директна последица на еднаквоста (40) и теорема 13.4.

Дозволете ни да го формулираме следново својство како посебна теорема.

Теорема 12.4.

Доколку р.в.
И меѓусебно се поврзани со линеарна функционална зависност, т.е.
Тоа

при што

И напротив, ако
,
Тоа с.в.
И меѓусебно се поврзани со линеарна функционална зависност, т.е. постојат константи
И
таква што важи еднаквоста

Доказ.Нека
Потоа Врз основа на својството 4 на коваријанса, имаме

и бидејќи, , затоа

Оттука,
. Се добива еднаквост во една насока. Нека понатаму
, Потоа

треба да се разгледаат два случаи: 1)
и 2)
Значи, да го разгледаме првиот случај. Потоа по дефиниција
па затоа и од еднаквоста
, Каде
. Во нашиот случај
, затоа од еднаквоста (види доказ на теорема 13.5.)

=
,

го добиваме тоа
, Средства
е константна. Бидејќи
и од тогаш
навистина,

.

Оттука,


.

Слично, се покажува дека за
се одвива (проверете сами!)

,
.

Некои заклучоци:

1. Ако
И независни.в., тогаш

2. Доколку р.в.
И се линеарно поврзани едни со други, тогаш
.

3. Во други случаи
:

Во овој случај велат дека р.в.
И меѓусебно поврзани позитивна корелација,Ако
во случаите
негативна корелација. Поблиските
на еден, толку повеќе причина да се верува дека р.в.
И се поврзани со линеарна врска.

Забележете дека корелационите моменти и дисперзии на системот на р.в. обично се дава матрица на корелација:

.

Очигледно, детерминантата на матрицата на корелација задоволува:

Како што веќе беше забележано, ако две случајни променливи се зависни, тогаш тие можат да бидат слични во корелација, така неповрзани.Со други зборови, моментот на корелација на две зависни величини може да биде не е еднаква на нула, но можеби еднакво на нула.

Пример 1.Законот за распределба на дискретна r.v е даден со табелата


Најдете го коефициентот на корелација

Решение.Наоѓање на законите за распределба на компонентите
И :


Сега да ја пресметаме м.о. компоненти:

Овие вредности може да се најдат врз основа на табелата за дистрибуција на r.v.

Исто така,
најдете сами.

Да ги пресметаме варијансите на компонентите и да ја користиме пресметковната формула:

Ајде да создадеме закон за распределба
, а потоа наоѓаме
:

Кога составувате табела за законот за распределба, треба да ги извршите следните чекори:

1) остави само различни значења на сите можни производи
.

2) да се определи веројатноста за дадена вредност
, мора да

соберете ги сите соодветни веројатности лоцирани на пресекот на главната табела кои го фаворизираат појавувањето на дадена вредност.

Во нашиот пример, р.в. зема само три различни вредности
. Еве ја првата вредност (
) одговара на производот
од вториот ред и
од првата колона, па на нивното вкрстување има број на веројатност
слично

што се добива од збирот на веројатностите лоцирани на пресеците на првиот ред и првата колона, соодветно (0,15; 0,40; 0,05) и една вредност
, кој е на пресекот на вториот ред и втората колона, и на крајот,
, кој е на пресекот на вториот ред и третата колона.

Од нашата табела наоѓаме:

Го наоѓаме моментот на корелација користејќи ја формулата (38):

Најдете го коефициентот на корелација користејќи ја формулата (41)

Така, негативна корелација.

Вежбајте.Закон за распределба на дискретни р.в. дадени по табела


Најдете го коефициентот на корелација

Ајде да погледнеме на пример каде што има два зависни случајни променливиможе да биде неповрзани.

Пример 2.Дводимензионална случајна променлива
)
дадена со функцијата за густина

Да го докажеме тоа
И зависни , Но неповрзани случајни променливи.

Решение.Да ги искористиме претходно пресметаните густини на дистрибуција на компонентите
И :

Од тогаш
И зависни количини. Да докаже неповрзани
И , доволно е да се уверите во тоа

Ајде да го најдеме моментот на корелација користејќи ја формулата:

Бидејќи диференцијалната функција
симетрични во однос на оската OY, Тоа
слично
, поради симетрија
во однос на оската Вол. Затоа, вадејќи постојан фактор

Внатрешниот интеграл е еднаков на нула (интеграндот е непарен, границите на интеграцијата се симетрични во однос на потеклото), затоа,
, т.е. зависни случајни променливи
И не се меѓусебно поврзани.

Значи, од корелацијата на две случајни променливи, следи нивната зависност, но од неповрзаноста сè уште е невозможно да се заклучи дека овие променливи се независни.

Меѓутоа, за нормално распределени р.в. таков заклучок е освентие. од неповрзани нормално дистрибуиранис.в. ги истекува независност.

Следниот пасус е посветен на ова прашање.

Коваријанса и коефициент на корелација.

Може да има функционална или стохастичка (веројатна) врска помеѓу случајните променливи. Стохастичката зависност се манифестира во фактот дека условниот закон за распределба на една случајна променлива се менува во зависност од вредностите прифатени од друга случајна променлива. Една од карактеристиките на стохастичката зависност на две случајни променливи е коваријансаслучајни променливи.

Коваријансаслучајни променливи ( X,Y) е број еднаков на математичкото очекување на производот од отстапувањата на случајните променливи XИ Yод вашите математички очекувања:

Понекогаш се нарекува коваријанса момент на корелацијаили втор мешан централен моментслучајни променливи ( X,Y).

Користејќи ја дефиницијата за математичко очекување, добиваме:

за дискретна дистрибуција

за континуирана дистрибуција

На Y= Xковаријансата е иста како и варијансата X.

Големината на корелациониот момент зависи од мерните единици на случајните променливи. Ова го отежнува споредувањето на моментите на корелација на различни системи на случајни променливи. За да се отстрани овој недостаток, воведена е нова нумеричка карактеристика - коефициент на корелација, што е

бездимензионална количина.

За да го пресметаме, ги заменуваме отстапувањата на случајните променливи од математичките очекувања со нивните нормализирани отстапувања, т.е.

Својства на коефициентот на корелација:

Нека т -променлива во смисла на математичка анализа. Размислете за варијансата на случајната променлива Д(Y – tX) како функција на променлива т.

Според својството на дисперзија. Дискриминаторот во овој случај мора да биде помал или еднаков на нула, т.е.

Од каде го добиваме?

2. Модулот на коефициентот на корелација не се менува при линеарни трансформации на случајни променливи: , каде што , , се произволни броеви.

3. , ако и само ако случајните променливи XИ Yсе поврзани линеарно, т.е. има такви бројки а, б,Што .

Ако , тогаш дискриминантот разгледан во став 1 е еднаков на нула, па затоа и за некоја вредност . Затоа, вредноста а за некои СОеднаквоста што требаше да се докаже е вистина.

4. Ако XИ Yсе статистички независни, тогаш .

Својствата 2.4 се проверуваат директно.

4.5.2. Корелација и зависност на систем од случајни променливи.

Неопходен услов за независност на случајните променливи XИ Yе еднаквост на нула на нивниот момент на корелација (или коефициент на корелација). Меѓутоа, еднаквоста (или ) е само неопходен, но не и доволен услов за независност.

Пример 1.

Сликата покажува точки што лежат на парабола , А.

Во овој поглед, воведен е потесен концепт на неповрзани (ако ) или корелирани (ако ) случајни променливи. Затоа независноста на случајните променливи значи и не-корелација() и обратно, корелација () – зависност.

Во општиот случај, кога , точките (X,Y) ќе бидат расфрлани околу линијата, колку поблиску, толку е поголема вредноста. Така, коефициентот на корелација карактеризира не било којоднос помеѓу XИ Y, А степен на затегнатост на линеарна врскапомеѓу нив.

Значи, особено, дури и со , т.е. во целосно отсуство на линеарна врска помеѓу XИ YМоже да постои произволно силна статистичка, па дури и нелинеарна функционална зависност (види пример 1).

Кога вредностите укажуваат на позитивна корелација помеѓу XИ Y, што значи дека и двете променливи имаат иста тенденција на зголемување или намалување. Кога зборуваат за негативна корелација, што значи спротивен тренд во промените во случајните променливи XИ Y, т.е. едниот се зголемува, а другиот се намалува, или обратно.

Ако случајни променливи XИ Yсе вообичаено распределени, тогаш нивната неповрзаност подразбира нивна независност, бидејќи

Ако тогаш.

За да го пресметаме коефициентот на корелација, продолжуваме со Пример 2 од §4.1. Ајде да ја користиме формулата

.

М(X× Y)=(-200)×(-100)×0,2 + (-200)×0×0,1 + (-200)×(100)×0,05 + 0×(-100)×0,05 + 0×0×0,25 + 0 ×100×0,02 + 200×(-100)×0,01 + 200×0×0,02 + 200×100×0,3 = 8800 долари;

; ;

.

Пример 2. Законот за распределба на систем од две случајни променливи е даден со табелата за распределба

X Y
-1 0,01 0,06 0,05 0,04
0,04 0,24 0,15 0,07
0,05 0,01 0,01 0,09

Најдете закони за еднодимензионална (маргинална) дистрибуција XИ Y, нивните математички очекувања, варијанси и коефициент на корелација помеѓу XИ Y.

Решение. Веројатности за можни вредности на дискретна случајна променлива X, вклучени во системот, се одредуваат со формулата

, До=1, 2, 3, 4.

Според тоа, еднодимензионалната распределба на количеството Xја има следната форма

Математички очекувања на случајни променливи XИ Y:

М(X)=1,6; М(Y)=0,18.

Варијанси на случајни променливи XИ Y:

Д(X)=0,84; Д(Y)=0,47.

Коефициент на корелација помеѓу XИ Yпресметано со формулата

; ;

; ;

Прашања за самотестирање.

1. Дефинирајте повеќеваријатна случајна променлива и функција за дистрибуција на веројатност.

2. Што се нарекува заедничка распределба на дводимензионална дискретна случајна променлива ( X,Y)? Како е напишано?

3. Што се однесува до познатата заедничка дистрибуција на дводимензионална случајна променлива ( X,Y) најдете ги маргиналните распределби на компонентите XИ Y?

4. Што се нарекува условна распределба на компонентата Xдводимензионална дискретна количина ( X,Y)?

5. Што се нарекува коваријанса?

6. Колку изнесува коефициентот на корелација?

7. Наведете ги својствата на коефициентот на корелација.

8. Колку изнесува коефициентот на корелација на случајните променливи? XИ Y = 1 – 2X?

9. Во која вредност се претвора коваријансата на две случајни променливи? XИ Y, Ако X = Y?

10. Дали концептите на независност и неповрзани се еквивалентни?

Задачи

4.1. На два различни пазари во градот се продаваат три типа автомобили ( А, Б, Ц).Подолу се дадени податоци за бројот на продадени автомобили за годината:



Најдете ги следните веројатности: Р(а, а), П(а, Б), П(а, Ц), П(б, А), П(б, Б), П(б, В), П(А), П(a/A), П(A/a). Направете табела со заеднички веројатности.

4.2. Патувачите во одредено одморалиште обично се бизнисмени ( Б)или луѓе од либерални професии ( П) (адвокати, уметници, лекари, итн.). Сопственикот на одморалиште сака да утврди дали би било попрофитабилно за него да произведува два вида реклами наместо еден. За да го направите ова, тој му наложи на својот оддел за рекламирање да подготви два вида реклами - еден за бизнисмени (тип I), другиот за луѓе од либерални професии (тип II). Подготвени се огласи, испратени се материјали до можни клиенти, а пристигнати се 800 апликации. Тие беа дистрибуирани на следниов начин.

А). Најдете ги веројатностите П(Б, И); П(Б, II); П(I/B).

Колку често сте слушнале изјави кои велат дека една појава е во корелација со друга?

„Високиот раст е во корелација со доброто образование и среќата, според експертите од службата за анкетирање на Галуп“.

„Цената на нафтата е во корелација со девизниот курс“.

„Мускулната болка после вежбање не е во корелација со хипертрофија на мускулните влакна“.

Се чини дека концептот на „корелација“ стана широко користен не само во науката, туку и во секојдневниот живот. Корелацијата го одразува степенот на линеарна врска помеѓу два случајни појави. Така, кога цените на нафтата почнуваат да паѓаат, курсот на доларот во однос на рубљата почнува да расте.

Од сето горенаведено, можеме да заклучиме дека кога се опишуваат дводимензионални случајни променливи, таквите добро познати карактеристики како математичко очекување, дисперзија и стандардно отстапување понекогаш се недоволни. Затоа, за нивно опишување често се користат уште две многу важни карактеристики: коваријансаИ корелација.

Коваријанса

Коваријанса$cov\left(X,\ Y\right)$ од случајните променливи $X$ и $Y$ е математичкото очекување на производот од случајните променливи $X-M\left(X\десно)$ и $Y-M\left(Y \десно)$, тоа е:

$$cov\лево(X,\ Y\десно)=M\лево(\лево(X-M\лево(X\десно)\десно)\лево(Y-M\лево(Y\десно)\десно)\десно). $$

Може да биде погодно да се пресмета коваријансата на случајните променливи $X$ и $Y$ користејќи ја следната формула:

$$cov\лево(X,\ Y\десно)=M\лево(XY\десно)-M\лево(X\десно)M\лево(Y\десно),$$

што може да се добие од првата формула користејќи ги својствата на математичкото очекување. Да ги наведеме главните коваријантни својства.

1 . Коваријансата на случајна променлива со самата себе е нејзината варијанса.

$$cov\left(X,\ X\десно)=D\лево(X\десно).$$

2 . Коваријансата е симетрична.

$$cov\left(X,\ Y\десно)=cov\left(Y,\ X\десно).$$

3 . Ако случајните променливи $X$ и $Y$ се независни, тогаш:

$$cov\left(X,\ Y\десно)=0.$$

4 . Константниот фактор може да се извади од знакот на коваријанса.

$$cov\left(cX,\ Y\десно)=cov\left(X,\ cY\десно)=c\cdot cov\лево(X,\ Y\десно).$$

5 . Коваријансата нема да се промени ако се додаде константна вредност на една од случајните променливи (или две одеднаш):

$$cov\left(X+c,\ Y\right)=cov\left(X,\ Y+c\right)=cov\left(X+x,\ Y+c\десно)=cov\лево( X,\Y\десно).$$

6 . $cov\left(aX+b,\ cY+d\right)=ac\cdot cov\left(X,\ Y\десно)$.

7 . $\left|cov\left(X,\ Y\десно)\десно|\le \sqrt(D\лево(X\десно)D\лево(Y\десно))$.

8 . $\left|cov\left(X,\ Y\десно)\десно|=\sqrt(D\лево(X\десно)D\лево(Y\десно))\Леводесна стрелка Y=aX+b$.

9 . Варијансата на збирот (разликата) на случајните променливи е еднаква на збирот на нивните варијанси плус (минус) двапати од коваријансата на овие случајни променливи:

$$D\лево(X\pm Y\десно)=D\лево(X\десно)+D\лево(Y\десно)\pm 2cov\лево(X,\ Y\десно).$$

Пример 1 . Дадена е корелација табела на случаен вектор $\left(X,\ Y\right)$. Пресметајте ја коваријансата $cov\left(X,\ Y\десно)$.

$\begin(низа)(|c|c|)
\hline

\hline
-2 & 0,1 & 0 & 0,2 \\
\hline
0 и 0,05 и p_(22) и 0 \\
\hline
1 & 0 & 0,2 & 0,05 \\
\hline
7 & 0,1 & 0 & 0,1 \\
\hline
\крај (низа)$

Настаните $\left(X=x_i,\ Y=y_j\right)$ формираат целосна група настани, затоа збирот на сите веројатности $p_(ij)$ наведен во табелата мора да биде еднаков на 1. Тогаш $0,1 +0+0 ,2+0.05+p_(22)+0+0+0.2+0.05+0.1+0+0.1=1$, па оттука и $p_(22)=0.2$.

$\begin(низа)(|c|c|)
\hline
X\задна коса црта Y & -6 и 0 и 3 \\
\hline
-2 & 0,1 & 0 & 0,2 \\
\hline
0 & 0,05 & 0,2 & 0 \\
\hline
1 & 0 & 0,2 & 0,05 \\
\hline
7 & 0,1 & 0 & 0,1 \\
\hline
\крај (низа)$

Користејќи ја формулата $p_(i) =\sum _(j)p_(ij) $, ја наоѓаме дистрибутивната серија на случајната променлива $X$.

$\begin(низа)(|c|c|)
\hline
X и -2 и 0 и 1 и 7 \\
\hline
p_i и 0,3 и 0,25 и 0,25 и 0,2 \\
\hline
\крај (низа)$

$$M\лево(X\десно)=\sum^n_(i=1)(x_ip_i)=-2\cdot 0,3+0\cdot 0,25+1\cdot 0,25+7\cdot 0 ,2=1,05.$ $

$$D\лево(X\десно)=\sum^n_(i=1)(p_i(\лево(x_i-M\лево(X\десно)\десно))^2)=0,3\cdot ( \лево (-2-1,05\десно))^2+0,25\cdot (\лево(0-1,05\десно))^2+0,25\cdot (\лево(1-1, 05\десно))^2+$$

$$+\ 0,2\cdot (\лево(7-1,05\десно))^2=10,1475.$$

$$\sigma \лево(X\десно)=\sqrt(D\лево(X\десно))=\sqrt(10.1475)\приближно 3.186.$$

Користејќи ја формулата $q_(j) =\sum _(i)p_(ij) $, ја наоѓаме дистрибутивната серија на случајната променлива $Y$.

$\begin(низа)(|c|c|)
\hline
Д и -6 и 0 и 3 \\
\hline
p_i и 0,25 и 0,4 и 0,35 \\
\hline
\крај (низа)$

$$M\лево(Y\десно)=\sum^n_(i=1)(y_ip_i)=-6\cdot 0,25+0\cdot 0,4+3\cdot 0,35=-0,45 .$$

$$D\лево(Y\десно)=\sum^n_(i=1)(p_i(\left(y_i-M\left(Y\десно)\десно))^2)=0,25\cdot ( \лево (-6+0,45\десно))^2+0,4\cdot (\лево(0+0,45\десно))^2+0,35\cdot (\лево(3+0, 45\десно))^2=11,9475. $$

$$\sigma \left(Y\десно)=\sqrt(D\left(Y\десно))=\sqrt(11,9475)\приближно 3,457.$$

Бидејќи $P\left(X=-2,\ Y=-6\right)=0.1\ne 0.3\cdot 0.25$, тогаш случајните променливи $X,\ Y$ се зависни.

Дозволете ни да ја дефинираме коваријансата $cov\ \left(X,\ Y\right)$ на случајните променливи $X,\ Y$ со формулата $cov\left(X,\ Y\right)=M\left(XY\ десно)-M\лево(X\десно)М\лево(Y\десно)$. Математичкото очекување на производот од случајните променливи $X,\Y$ е еднакво на:

$$M\left(XY\десно)=\sum_(i,\ j)(p_(ij)x_iy_j)=0,1\cdot \left(-2\десно)\cdot \left(-6\десно) +0,2 \cdot \left(-2\десно)\cdot 3+0.05\cdot 1\cdot 3+0.1\cdot 7\cdot \left(-6\десно)+0.1\cdot 7\cdot 3=-1.95.$$

Потоа $cov\left(X,\ Y\десно)=M\лево(XY\десно)-M\лево(X\десно)M\лево(Y\десно)=-1,95-1,05\cdot \лево(- 0.45\right)=-1.4775.$ Ако случајните променливи се независни, тогаш нивната коваријанса е нула. Во нашиот случај, $cov(X,Y)\ne 0$.

Корелација

Коефициент на корелацијаслучајните променливи $X$ и $Y$ се нарекуваат број:

$$\rho \лево(X,\ Y\десно)=((cov\left(X,\ Y\десно))\over (\sqrt(D\лево(X\десно)D\лево(Y\десно) )))).$$

Да ги наведеме главните својства на коефициентот на корелација.

1 . $\rho \лево(X,\ X\десно)=1$.

2 . $\rho \лево(X,\ Y\десно)=\rho \лево(Y,\ X\десно)$.

3 . $\rho \left(X,\ Y\right)=0$ за независни случајни променливи $X$ и $Y$.

4 . $\rho \лево(aX+b,\ cY+d\десно)=(sgn \лево(ac\десно)\rho \лево(X,\ Y\десно)\ )$, каде што $(sgn \лево( ac\right)\ )$ е знакот на производот $ac$.

5 . $\лево|\rho \лево(X,\ Y\десно)\десно|\le 1$.

6 . $\лево|\rho \лево(X,\ Y\десно)\десно|=1\Леводесна стрелка Y=aX+b$.

Претходно беше кажано дека коефициентот на корелација $\rho \left(X,\ Y\десно)$ го одразува степенот на линеарна зависност помеѓу две случајни променливи $X$ и $Y$.

Кога $\rho \left(X,\ Y\right)>0$ можеме да заклучиме дека како што се зголемува случајната променлива $X$, случајната променлива $Y$ има тенденција да се зголемува. Ова се нарекува позитивна корелација. На пример, висината и тежината на една личност се во позитивна корелација.

Кога $\rho \лево(X,\ Y\десно)<0$ можно сделать вывод о том, что с ростом случайной величины $X$ случайная величина $Y$ имеет тенденцию к уменьшению. Это называется отрицательной корреляционной зависимостью. Например, температура и время сохранности продуктов питания связаны между собой отрицательной корреляционной зависимостью.

Кога $\rho \left(X,\ Y\right)=0$, случајните променливи $X$ и $Y$ се нарекуваат неповрзани. Вреди да се напомене дека неповрзаноста на случајните променливи $X$ и $Y$ не значи нивна статистичка независност, тоа само значи дека не постои линеарна врска меѓу нив.

Пример 2 . Дозволете ни да го одредиме коефициентот на корелација $\rho \left(X,\ Y\right)$ за дводимензионалната случајна променлива $\left(X,\ Y\right)$ од Пример 1.

Коефициентот на корелација на случајните променливи $X,\Y$ е еднаков на $r_(XY) =(cov(X,Y)\over \sigma (X)\sigma (Y)) =(-1.4775\over 3.186\cdot 3.457) =-0.134.$ Бидејќи $r_(XY)<0$, то с ростом $X$ случайная величина $Y$ имеет тенденцию к уменьшению (отрицательная корреляционная зависимость).