Како да се направи корелација анализа во статистиката. Силни и слаби

Математички методи на анализа и предвидување

Анализа на корелација

Вовед

2. Анализа на регресија

3. Факторска анализа

4. Анализа на кластери

5. Анализа на динамиката и предвидување на општествените и правните процеси

Заклучок

Два типа на зависност се можни помеѓу социо-економските појави и процеси: функционална и стохастичка. На или други параметри кои карактеризираат различни појави. Примери за ваков вид зависност практично никогаш не се среќаваат во социјалната средина.

Со стохастичка (веројатна) зависност, одредена вредност на зависната променлива одговара на збир на вредности на објаснувачката променлива. Ова се должи, пред сè, на фактот дека зависната променлива е под влијание на голем број фактори кои не се пресметани. Покрај тоа, грешките во мерењето на променливите имаат влијание: поради случајното расејување на вредностите, нивните вредности може да се наведат само со одредена веројатност.

Во социо-економската сфера треба да се справиме со многу појави кои имаат веројатност. Така, бројот на кривични дела извршени и решени во одреден временски период, бројот на сообраќајни несреќи во кој било регион во одредено време се случајни променливи.

За проучување на стохастичките односи, постојат посебни методи, особено анализа на корелација („корелација“ е врска, врска помеѓу постоечките појави и процеси).

Анализа на корелација- ова е употреба во одредена низа на збир на статистички методи за обработка на информации, што овозможува да се проучат односите помеѓу различни карактеристики.

Задача на корелација анализакако метод на математичка статистика е да се воспостави формата и насоката на врската, како и да се измери блискоста на оваа врска помеѓу случајните карактеристики што се проучуваат.

Во статистиката, големината на линеарната врска помеѓу две карактеристики се мери со користење на едноставен (примерок) коефициент на корелација. Големината на линеарната зависност на една променлива од неколку други се мери со повеќекратниот коефициент откако ќе се елиминира делот од линеарната зависност поради поврзаноста на овие променливи со други променливи.

Во форма, корелационите врски можат да бидат линеарни (праволиниски) и нелинеарни (кривилинеарни), а во насока

Директно поврзувањепокажува дека со зголемување (намалување) на вредностите на една карактеристика, вредностите на друга карактеристика се зголемуваат (намалуваат). На повратни информацииЗголемувањето (намалувањето) на вредностите на една карактеристика доведува до намалување (зголемување) на вредностите на друга карактеристика.



Главната задача на корелација анализа- мерење на затегнатоста на врската - се решава со пресметување на различни коефициенти на корелација и проверка на нивното значење.

Коефициентот на корелација може да земе вредности од 0 до +1 за директна врска, а од -1 до 0 за инверзна врска. Со коефициенти блиску до 0, се смета дека нема статистичка линеарна врска помеѓу карактеристиките; со апсолутни вредности на коефициенти помали од 0,3, врската е слаба; при вредности од 0,3...0,5 врската е умерена; на 0,5...0,7 - односот е значаен; на 0,7...0,9 - врската е силна; ако вредностите на коефициентот се поголеми од 0,9, тогаш врската се смета за многу силна; ако коефициентите се еднакви на +1 или -1, тогаш зборуваме за функционална врска (што практично не се јавува во статистичките студии).

Сепак, таквата поедноставена проценка на силата на врската не е секогаш точна, бидејќи степенот на доверба во присуството на статистичка врска зависи од големината на популацијата што се проучува. Колку е помал обемот на популацијата, толку е поголема вредноста на коефициентот на корелација за да се прифати хипотезата за постоење на врска помеѓу карактеристиките. Со цел квантитативно да се измери степенот на доверба во постоењето на линеарна статистичка врска помеѓу карактеристиките, концептите ниво на значајностИ праг (критични) вредностикоефициент на корелација.

Проверка на значењеДобиениот коефициент на корелација се состои од споредување на пресметаната вредност со критичната вредност. За даден број мерења и одредено ниво на значајност, се наоѓа критична вредност и се споредува со пресметаната вредност. Ако пресметаната вредност е поголема од критичната, тогаш врската е значајна; ако е помала, тогаш врската или отсуствува (и оваа вредност на коефициентот на корелација се објаснува со случајни отстапувања), или примерокот е мал за да се идентификува тоа.

За утврдување на постоењето и големината на линеарна врскапомеѓу две променливи X и Y потребно е да се спроведат две постапки. Првиот е графички да се прикажат точките [(Xi,Yi),i=1,n] на рамнината. Добиениот график се нарекува валидност на претпоставката за линеарна врска помеѓу променливите. Ако таквата претпоставка е прифатлива, тогаш потребно е да се изрази во квантитативна форма големината на линеарната врска. За да го направите ова, се користи коефициентот на корелација на примерокот:

каде што n е бројот на мерења, Xi, Yi се i-тите вредности, X, Y се просечните вредности, sx, sy се стандардните отстапувања на променливите X и Y, соодветно.

Во теоријата на статистичка анализа корелација се дефинира како линеарна зависност во услови на нормална дистрибуција на анализираните променливи. Затоа, за правилна примена на методите на корелација, потребно е да се оправда блискоста на распределбата на променливите со нормалата и формата на врската со линеарната. Во спротивно, неопходно е да се користат посложени техники за анализа или други коефициенти на спојување.

Прилично едноставен пресметковно едноставен начин за проверка на нормалноста на емпириската дистрибуција е да се процени следниов сооднос:

,

каде што C е средна апсолутна девијација, s е стандардна девијација.

Ако оваа нееднаквост е исполнета, тогаш можеме да зборуваме за нормалноста на емпириските распределби и исправноста на користењето на коефициентот на корелација како мерка за линеарна статистичка врска помеѓу променливите.

Генерално, стапката на криминал е под влијание на многу фактори. Тие вклучуваат социо-економски, географски и климатски, демографски итн., Како и знаци кои ги карактеризираат силите и средствата, степенот на организација на телото за внатрешни работи.

Сепак, дури и ако постои силна статистички значајна врска помеѓу две променливи, не може да се биде целосно сигурен во нивната каузалност, бидејќи може да има други причини (фактори) кои ја одредуваат нивната заедничка статистичка врска. Статистичките заклучоци мора секогаш да бидат поткрепени со здрава теоретска рамка.

Во исто време, отсуството на статистички значајна врска не укажува на отсуство на причинско-последична врска, туку го принудува да се бараат други начини и средства за нејзино идентификување, доколку суштинскиот концепт и практичното искуство укажуваат на неговата можна постоење.

Концептот на меѓусебна поврзаност е доста чест во психолошките истражувања. Психологот мора да работи со него кога ќе стане неопходно да се споредат мерењата на два или повеќе индикатори на знаци или појави за да се извлечат какви било заклучоци.

Природата на односот помеѓу појавите што се проучуваат може да биде недвосмислена, т.е. такви кога одредена вредност на една карактеристика одговара на јасна и дефинитивна вредност на друга. Така, на пример, во поттестот за пребарување на обрасци во тестовите за ментални функции, бројот на освоени „суровини“ поени се одредува со формулата:
Xi = Stz - Soz / Stz + Spz * Sbc,
каде што Xi е вредноста на опцијата, Stz е бројот на априори одредени обрасци (соодветности) во поттестот, Soz е бројот на погрешно назначени кореспонденции до учесниците на тестот, Sz е бројот на неодредени (пропуштени) совпаѓања со полагачи на тестот, Sbс е бројот на сите зборови што ги гледаат полагачите во тестот.

Овој однос се нарекува функционален: овде еден индикатор е функција на друг, што е аргумент во однос на првиот.

Сепак, не секогаш се наоѓа недвосмислен, јасен однос. Почесто се среќаваме со ситуација во која една вредност на карактеристика може да одговара на неколку вредности на друга. Овие вредности варираат во повеќе или помалку дефинирани граници. Овој тип на врска се нарекува корелативен или корелативен.

Се користат неколку видови на изразување на корелациски односи. Така, за изразување на односот помеѓу карактеристиките кои имаат квантитативна природа на менување на нивните вредности, се користат мерки на централна тенденција: табелирање со последователно пресметување на коефициентот на корелација на парот, коефициент на повеќекратна и делумна корелација, коефициент на повеќекратна определба, однос на корелација.

Доколку е потребно да се проучи односот помеѓу карактеристиките, чија варијација е од квалитативна природа (резултатите од проективни методи на истражување на личноста, студии со семантички диференцијален метод, студии со употреба на отворени скали итн.), тогаш користете го квалитативниот алтернативен коефициент на корелација (тетрахоричен индикатор), Пирсоновиот критериум x2, Пирсон и Чупров показатели за вонредна состојба.

Да се ​​одреди квалитативно-квантитативна корелација, т.е. таква корелација, кога една карактеристика има квалитативна варијација, а другата – квантитативна.Се користат посебни методи.

Коефициентот на корелација (терминот првпат беше воведен од Ф. Галтон во 1888 година) е показател за јачината на врската помеѓу две споредени опции за примероци (примероци). Без оглед на формулата што се користи за пресметување на коефициентот на корелација, неговата вредност се движи од -1 до +1. Во случај на целосно позитивна корелација, овој коефициент е плус 1, а во случај на целосно негативна корелација, тоа е минус 1. Вообичаено, ова е права линија што минува низ точките на пресек на вредностите на секоја пар на податоци.

Ако вредностите на варијантите не се редат на права линија, туку формираат „облак“, тогаш коефициентот на корелација во апсолутна вредност станува помал од еден и, како што „облакот“ се заокружува, се приближува до нула. Ако коефициентот на корелација е 0, двете опции се целосно независни една од друга.

Секоја пресметана (емпириска) вредност на коефициентот на корелација мора да се провери за веродостојност (статистичка значајност) користејќи ги соодветните табели на критичните вредности на коефициентот на корелација. Ако емпириската вредност е помала или еднаква на вредноста на табелата на ниво од 5 проценти (P = 0,05), корелацијата не е значајна. Ако пресметаната вредност на коефициентот на корелација е поголема од вредноста на табелата за P = 0,01, корелацијата е статистички значајна (сигурна).

Во случај кога вредноста на коефициентот е помеѓу 0,05 > P > 0,01, во пракса тие зборуваат за значајноста на корелацијата за P = 0,05.

Коефициентот на корелација Браве-Пирсон (r) е параметарски индикатор предложен во 1896 година, за чие пресметување се споредуваат аритметичките средини и коренските средни квадратни вредности. За да го пресметате овој коефициент, користете ја следнава формула (може да изгледа различно за различни автори):
r= (E Xi Xi1) - NXap X1ap / N-1 Qx Qx1,

каде што E Xi Xi1 е збир на производите на вредностите на пар споредливи опции, n е бројот на споредени парови, NXap, X1ap се аритметичките просеци на опцијата Xi, Xi; соодветно, Qx, Qx, се стандардните отстапувања на распределбите x и x.

Спирмановиот коефициент на корелација Rs (коефициент на корелација на ранг, Спирмановиот коефициент) е наједноставниот облик на коефициентот на корелација и ја мери врската помеѓу ранговите (места) на дадена опција според различни карактеристики, без да ја земе предвид нејзината сопствена вредност. Она што овде се истражува е квалитативен однос наместо квантитативен.

Вообичаено, овој непараметриски критериум се користи во случаи кога е неопходно да се извлечат заклучоци не толку за интервалите помеѓу податоците, туку за нивните рангови, а исто така и кога кривите на дистрибуција се крајно асиметрични и не дозволуваат употреба на такви параметарски критериуми како што се коефициентот на корелација Bravais-Pearson (во овие Во некои случаи, може да биде неопходно да се претворат квантитативните податоци во редни податоци). Ако коефициентот Rs е блиску до +1, тогаш тоа значи дека двата реда од примерокот рангирани според одредени карактеристики практично се совпаѓаат, а ако овој коефициент е блиску до - 1, можеме да зборуваме за целосна инверзна врска.

Како и пресметката на коефициентот на корелација Bravais-Pearson, пресметките на коефициентот Rs се попогодно претставени во табеларна форма.

Регресијата го генерализира концептот на функционална врска со случајот на стохастичка (веројатна) природа на зависноста помеѓу вредностите на варијантата. Целта на решавањето на категоријата проблеми со регресија е да се процени вредноста на континуираната променливост на излезот врз основа на вредностите на влезните опции.

Анализа на корелација

Корелација- статистичка врска помеѓу две или повеќе случајни променливи (или променливи кои може да се сметаат како такви со одреден прифатлив степен на точност). Покрај тоа, промените во една или повеќе од овие количини доведуваат до систематска промена во друга или друга количина. Математичка мерка за корелација помеѓу две случајни променливи е коефициентот на корелација.

Корелацијата може да биде позитивна и негативна (исто така е можно да нема статистичка врска - на пример, за независни случајни променливи). Негативна корелација - корелација, во која зголемувањето на една променлива е поврзано со намалување на друга променлива, а коефициентот на корелација е негативен. Позитивна корелација - корелација, во која зголемувањето на една променлива е поврзано со зголемување на друга променлива, а коефициентот на корелација е позитивен.

Автокорелација - статистичка врска помеѓу случајни променливи од истата серија, но земени со поместување, на пример, за случаен процес - со временско поместување.

Нека X,Y- две случајни променливи дефинирани на еден простор на веројатност. Тогаш нивниот коефициент на корелација е даден со формулата:

,

каде што cov означува коваријанса, а D е варијанса, или еквивалентно,

,

каде што симболот го означува математичкото очекување.

За графички приказ на таква врска, можете да користите правоаголен координатен систем со оски што одговараат на двете променливи. Секој пар на вредности е означен со специфичен симбол. Овој график се нарекува „растерачка парцела“.

Методот за пресметување на коефициентот на корелација зависи од видот на скалата на која припаѓаат променливите. Така, за мерење на променливите со интервални и квантитативни скали, неопходно е да се користи коефициентот на корелација на Пирсон (корелација на производ момент). Ако барем една од двете променливи е на редна скала или не е нормално распределена, мора да се користи корелација на рангот на Спирман или τ (tau) на Кендал. Во случај кога една од двете променливи е дихотомна, се користи точка-бисериска корелација, а ако и двете променливи се дихотомни: корелација со четири полиња. Пресметувањето на коефициентот на корелација помеѓу две недихотомни променливи има смисла само кога врската меѓу нив е линеарна (еднонасочна).

Кенделовиот коефициент на корелација

Се користи за мерење на меѓусебното нарушување.

Спирман коефициент на корелација

Својства на коефициентот на корелација

ако ја земеме коваријансата како скаларен производ на две случајни променливи, тогаш нормата на случајната променлива ќе биде еднаква на , а последицата од нееднаквоста Коши-Бунјаковски ќе биде: . , Каде. Згора на тоа, во овој случај знаците и кпоклопуваат: .

Анализа на корелација

Анализа на корелација- метод на обработка на статистички податоци, кој се состои во проучување коефициенти ( корелации) помеѓу променливите. Во овој случај, коефициентите на корелација помеѓу еден пар или многу пара карактеристики се споредуваат за да се воспостават статистички односи меѓу нив.

Цел анализа на корелација- дајте некои информации за една променлива користејќи друга променлива. Во случаите кога е можно да се постигне цел, се вели дека се променливите корелираат. Во својата најопшта форма, прифаќањето на хипотезата за корелација значи дека промената на вредноста на променливата А ќе се случи истовремено со пропорционална промена на вредноста на B: ако двете променливи се зголемат, тогаш корелацијата е позитивна, ако едната променлива се зголемува, а другата се намалува, корелацијата е негативна.

Корелацијата ја одразува само линеарната зависност на вредностите, но не ја одразува нивната функционална поврзаност. На пример, ако го пресметате коефициентот на корелација помеѓу количините А = сјасn(x) И Б = вос(x) , тогаш ќе биде блиску до нула, односно нема зависност помеѓу количините. Во меѓувреме, количините А и Б се очигледно функционално поврзани според законот сјасn 2 (x) + вос 2 (x) = 1 .

Ограничувања на корелационата анализа

Графикони на распределби на парови (x,y) со соодветните коефициенти на корелација x и y за секој од нив. Забележете дека коефициентот на корелација рефлектира линеарна врска (горна линија), но не опишува крива на врска (средна линија) и воопшто не е соодветен за опишување сложени, нелинеарни односи (долна линија).

  1. Примената е можна доколку има доволен број случаи за проучување: за одреден тип, коефициентот на корелација се движи од 25 до 100 пара набљудувања.
  2. Второто ограничување следи од хипотезата за корелација анализа, која вклучува линеарна зависност на променливите. Во многу случаи, кога е веродостојно познато дека постои врска, анализата на корелација може да не даде резултати едноставно затоа што врската е нелинеарна (изразена, на пример, како парабола).
  3. Самиот факт на корелација не дава основа да се тврди која од променливите претходи или предизвикува промени, или дека променливите генерално се причински поврзани една со друга, на пример, поради дејството на трет фактор.

Областа на апликација

Овој метод на обработка на статистичките податоци е многу популарен во економијата и општествените науки (особено во психологијата и социологијата), иако опсегот на примена на коефициентите на корелација е обемен: контрола на квалитетот на индустриските производи, металургијата, агрохемијата, хидробиологијата, биометриката и други.

Популарноста на методот се должи на два фактори: коефициентите на корелација се релативно лесни за пресметување, а нивната употреба не бара посебна математичка обука. Во комбинација со неговата леснотија на толкување, леснотијата на примена на коефициентот доведе до негова широка употреба во областа на анализа на статистичките податоци.

Лажна корелација

Честопати, примамливата едноставност на корелациското истражување го поттикнува истражувачот да прави лажни интуитивни заклучоци за присуството на причинско-последична врска помеѓу паровите карактеристики, додека коефициентите на корелација воспоставуваат само статистички врски.

Во современата квантитативна методологија на општествените науки, всушност, имаше напуштање на обидите да се воспостават причинско-последични односи помеѓу набљудуваните променливи со помош на емпириски методи. Затоа, кога истражувачите од општествените науки зборуваат за воспоставување односи помеѓу променливите што се проучуваат, се подразбира или општа теоретска претпоставка или статистичка зависност.

исто така види

Фондацијата Викимедија. 2010 година.

Погледнете што е „Корелациска анализа“ во другите речници:

    Видете АНАЛИЗА НА КОРЕЛАЦИЈА. Антинаци. Енциклопедија за социологија, 2009 ... Енциклопедија на социологија

    Гранка на математичка статистика која комбинира практични методи за проучување на корелацијата помеѓу две (или повеќе) случајни карактеристики или фактори. Види Корелација (во математичката статистика)... Голем енциклопедиски речник

    КОРЕЛАЦИОНА АНАЛИЗА, дел од математичката статистика што комбинира практични методи за проучување на корелацијата помеѓу две (или повеќе) случајни карактеристики или фактори. Видете Корелација (види КОРЕЛАЦИЈА (меѓусебна врска ... енциклопедиски речник

    Анализа на корелација- (во економијата) гранка на математичката статистика која ги проучува односите помеѓу променливите величини (корелацијата е сооднос, од латинскиот збор correlatio). Врската може да биде целосна (т.е. функционална) и нецелосна,... ... Економско-математички речник

    анализа на корелација- (во психологијата) (од латинскиот correlatio ratio) статистичка метода за проценка на формата, знакот и блискоста на врската помеѓу карактеристиките или факторите што се проучуваат. При одредување на формата на врската, се зема предвид нејзината линеарност или нелинеарност (т.е. како во просек... ... Голема психолошка енциклопедија

    анализа на корелација- - [Л.Г. Суменко. Англиско-руски речник за информатичка технологија. M.: State Enterprise TsNIIS, 2003.] Теми информатичката технологија општо EN корелација анализа ... Водич за технички преведувач

    анализа на корелација- koreliacinė analizė statusas T sritis Kūno kultūra ir sportas apibrėžtis Statistikos metodas, kuriuo įvertinami tiriamųjų asmenų, reiškinių požymiai arba veiksnių santykiai. atitikmenys: ингли. корелација студии vok. Анализирај ја корелацијата, f;… … Спортски термини

    Збир на методи базирани на математичката теорија на корелација (Види Корелација) за откривање на корелација помеѓу две случајни карактеристики или фактори. К.а. експерименталните податоци го вклучуваат следново... ... Голема советска енциклопедија

    Математички дел статистика, комбинирајќи практични Корелативни методи на истражување. зависности помеѓу две (или повеќе) случајни карактеристики или фактори. Видете корелација... Голем енциклопедиски политехнички речник

Статијата ги разгледува дефинициите за корелација, анализа на корелација и коефициент на корелација. Дадена е дефиниција за корелација и нејзините главни карактеристики.

  • Корелација и регресивна анализа во проучувањето на факторите на плодност
  • Проценка на факторите на плодност во Република Башкортостан

Истражувачите често се заинтересирани за тоа како две или повеќе променливи се поврзани една со друга во еден или повеќе примероци што се проучуваат. На пример, таквата врска може да се забележи помеѓу грешката во хардверската обработка на експерименталните податоци и големината на напоните на мрежата. Друг пример е врската помеѓу капацитетот на податочната врска и односот сигнал-шум.

Во 1886 година, англискиот натуралист Френсис Галтон го измислил терминот „корелација“ за да ја опише природата на овој вид на интеракција. Подоцна, неговиот ученик Карл Пирсон развил математичка формула која овозможува да се измери корелацијата на особините.

Зависностите помеѓу количините (фактори, карактеристики) се поделени на два вида: функционални и статистички.

Кај функционалните зависности, секоја вредност на една променлива одговара на одредена вредност на друга променлива. Дополнително, функционалното поврзување на два фактора е можно само под услов второто количество да зависи само од првиот и да не зависи од други големини. Ако количината зависи од многу фактори, можно е функционално поврзување ако првата количина не зависи од други фактори освен оние вклучени во наведеното множество.

Со статистичка зависност, промената на една од количините повлекува промена во распределбата на други количини, кои со одредени веројатности добиваат одредени вредности.

Од многу поголем интерес е уште еден посебен случај на статистичка зависност, кога постои врска помеѓу вредностите на некои случајни променливи и просечната вредност на другите, со особеност што во секој поединечен случај може да земе некоја од меѓусебно поврзаните вредности. на различни вредности.

Овој вид на зависност помеѓу променливите се нарекува корелација или корелација.

Анализата на корелација е метод кој овозможува да се открие врска помеѓу неколку случајни променливи.

Анализата на корелација решава два главни проблеми:

  • Првата задача е да се одреди формата на комуникација, т.е. во утврдувањето на математичката форма во која се изразува овој однос. Ова е многу важно, бидејќи конечниот резултат од проучувањето на односот помеѓу карактеристиките зависи од правилниот избор на формата на комуникација.
  • Втората задача е да се измери гужвата, т.е. мерки на поврзаност помеѓу карактеристиките со цел да се утврди степенот на влијание на даден фактор врз резултатот. Се решава математички со одредување на параметрите на равенката за корелација.

Потоа добиените резултати се оценуваат и анализираат со помош на посебни показатели на методот на корелација (коефициенти на определување, линеарна и повеќекратна корелација и сл.), како и проверка на значајноста на односот помеѓу карактеристиките што се проучуваат.

Следниве задачи се решаваат со помош на методи за анализа на корелација:

  1. Врска. Дали има врска помеѓу параметрите?
  2. Прогнозирање. Ако е познато однесувањето на еден параметар, тогаш може да се предвиди однесувањето на друг параметар што е во корелација со првиот.
  3. Класификација и идентификација на објекти. Анализата на корелација помага да се избере збир на независни карактеристики за класификација.

Корелацијата е статистичка врска помеѓу две или повеќе случајни променливи (или вредности што може да се сметаат како такви со одреден прифатлив степен на точност). Нејзината суштина лежи во фактот дека кога вредноста на една променлива се менува, настанува природна промена (намалување или зголемување) на друга променлива.

Коефициентот на корелација се користи за да се утврди дали постои врска помеѓу две својства.

Коефициентот на корелација p за општата популација е, по правило, непознат, па затоа се проценува од експериментални податоци, што е примерок од n пара вредности (x i, y i), добиени со заедничко мерење на две карактеристики X и Y Коефициентот на корелација утврден од податоците од примерокот се нарекува коефициент на корелација на примерокот (или едноставно коефициент на корелација). Обично се означува со симболот r.

Главните својства на коефициентот на корелација вклучуваат:

  1. Коефициентите на корелација можат само да карактеризираат линеарни односи, т.е. оние кои се изразуваат со равенка на линеарна функција. Ако постои нелинеарна врска помеѓу различни карактеристики, треба да се користат други индикатори за поврзување.
  2. Вредностите на коефициентите на корелација се апстрактни броеви кои се движат од -1 до +1, т.е. -1< r < 1.
  3. Со независна варијација на карактеристиките, кога нема врска меѓу нив, r = 0.
  4. Со позитивна или директна врска, кога со зголемување на вредностите на една карактеристика се зголемуваат вредностите на друга, коефициентот на корелација добива позитивен (+) знак и се движи од 0 до +1, т.е. 0< r < 1.
  5. Со негативна или инверзна врска, кога со зголемување на вредностите на една карактеристика, вредностите на друга соодветно се намалуваат, коефициентот на корелација е придружен со негативен (–) знак и се движи од 0 до –1, т.е. -1< r <0.
  6. Колку е посилна врската помеѓу карактеристиките, толку е поблизок коефициентот на корелација до ô1ô. Ако r = ± 1, тогаш односот на корелација станува функционален, т.е. Секоја вредност на атрибутот X ќе одговара на една или повеќе строго дефинирани вредности на атрибутот Y.
  7. Веродостојноста на корелацијата помеѓу карактеристиките не може да се процени само според големината на коефициентите на корелација. Овој параметар зависи од бројот на степени на слобода k = n –2, каде што: n е бројот на корелирани парови на индикатори X и Y. Колку е поголемо n, толку е поголема веродостојноста на врската при иста вредност на коефициентот на корелација .

Коефициентот на корелација се пресметува со следнава формула:

каде што x е вредноста на факторската карактеристика; y - вредноста на добиениот атрибут; n - број на парови на податоци.

Корелацијата се проучува врз основа на експериментални податоци, кои се измерените вредности x i, y i на две карактеристики x, y. Ако има релативно малку експериментални податоци, тогаш дводимензионалната емпириска дистрибуција е претставена како двојна серија на вредности x i, y i. Во исто време, корелацијата зависност помеѓу карактеристиките може да се опише на различни начини. Кореспонденцијата помеѓу аргументот и функцијата може да се даде со табела, формула, график итн.

Кога се проучува корелацијата помеѓу квантитативните особини чии вредности може точно да се измерат во единици на метрички скали, многу често се усвојува биваријатен нормално распределен модел на популација. Ваквиот модел графички ја прикажува врската помеѓу променливите x и y во форма на геометриска локација на точките во правоаголен координатен систем. Оваа графичка врска се нарекува расфрлање или корелација.

Овој модел на дводимензионална нормална дистрибуција (поле за корелација) ни овозможува да дадеме јасна графичка интерпретација на коефициентот на корелација, бидејќи Дистрибуцијата колективно зависи од пет параметри:

  • математички очекувања E[x], E[y] на вредности x,y;
  • стандардни отстапувања px, py на случајни променливи x,y ;
  • коефициент на корелација p, кој е мерка за односот помеѓу случајните променливи, x и y. Да дадеме примери на корелациони полиња.

Ако p = 0, тогаш вредностите x i, y i добиени од дводимензионалната нормална популација се наоѓаат на графикот во областа ограничена со кругот. Во овој случај, не постои корелација помеѓу случајните променливи x и y, и тие се нарекуваат неповрзани. За биваријантна нормална дистрибуција, неповрзаноста истовремено значи независност на случајните променливи x и y.

Ако p = 1 или p = -1, тогаш зборуваме за целосна корелација, односно постои линеарна функционална зависност помеѓу случајните променливи x и y.

Кога p = 1, вредностите на x i, y i ги одредуваат точките што лежат на права линија со позитивен наклон (со зголемување на x i, вредностите на y i исто така се зголемуваат).

Во средни случаи, кога -1< p <1, определяемые значениями x i ,y i точки попадают в область, ограниченную некоторым эллипсом, причём при p>0 постои позитивна корелација (со зголемување на x, вредностите на y генерално имаат тенденција да се зголемуваат), со p<0 корреляция отрицательная. Чем ближе p к ±1, тем уже эллипс и тем теснее точки, определяемые экспериментальными значениями, группируются около прямой линии.

Овде треба да се обрне внимание на фактот дека линијата по која се групирани точките може да биде не само права линија, туку да има и друга форма: парабола, хипербола итн. Во овие случаи се разгледува нелинеарна корелација.

Корелациската зависност помеѓу карактеристиките може да се опише на различни начини, особено, секоја форма на поврзување може да се изрази со општа равенка y=f(x), каде што карактеристиката y е зависна променлива или функција на независна променлива x, повика на аргумент.

Така, визуелната анализа на полето на корелација помага да се утврди не само присуството на статистичка врска (линеарна или нелинеарна) помеѓу карактеристиките што се испитуваат, туку и нејзината близина и форма.

При проучување на корелациска врска, важна област на анализа е да се процени степенот на блискост на врската. Концептот за степенот на блискост на врската помеѓу две карактеристики се јавува поради фактот што во реалноста многу фактори влијаат на промената на добиената карактеристика. Во овој случај, влијанието на еден од факторите може да се изрази позабележително и појасно од влијанието на другите фактори. Како што се менуваат условите, улогата на одлучувачкиот фактор може да се префрли на друга карактеристика.

При статистички проучување на односите, по правило, се земаат предвид само главните фактори. Исто така, земајќи го предвид степенот на блискост на врската, се оценува потребата од подетално проучување на оваа конкретна врска и значењето на неговата практична употреба.

Генерално, познавањето на квантитативната проценка на блискоста на корелацијата ни овозможува да ја решиме следната група прашања:

  • потребата од длабинско проучување на овој однос помеѓу знаците и изводливоста на неговата практична примена;
  • степенот на разлики во манифестирањето на врската во специфични услови (споредување на проценката на блискоста на врската за различни услови);
  • идентификација на главни и помали фактори во дадени специфични услови со секвенцијално разгледување и споредување на особина со различни фактори.

Индикаторите за близина на врската мора да задоволат голем број основни барања:

  • вредноста на индикаторот за блискост на врската треба да биде еднаква или блиску до нула ако не постои врска помеѓу карактеристиките (процесите, појавите) што се проучуваат;
  • ако постои функционална врска помеѓу проучуваните карактеристики, вредноста на индикаторот за близината на врската треба да биде еднаква на еден;
  • ако постои корелација помеѓу карактеристиките, апсолутната вредност на показателот за близината на врската треба да се изрази како соодветна дропка, колку е поголема вредноста, толку е поблиска врската помеѓу проучуваните карактеристики (се стреми кон единство).

Зависноста на корелација се определува со различни параметри, меѓу кои најшироко користени се спарените индикатори кои ја карактеризираат врската помеѓу две случајни променливи: коефициентот на коваријанса (момент на корелација) и коефициентот на линеарна корелација (Пирсоновиот коефициент на корелација).

Јачината на врската се одредува со апсолутната вредност на индикаторот за затегнатост на врската и не зависи од насоката на поврзувањето.

Во зависност од апсолутната вредност на коефициентот на корелација p, корелациите помеѓу карактеристиките се поделени по јачина на следниов начин:

  • силна или тесна (на p>0,70);
  • просек (на 0,50< p <0,69);
  • умерена (во 0.30< p <0,49);
  • слаб (на 0,20< p <0,29);
  • многу слаб (на стр<0,19).

Формата на односот на корелација може да биде линеарна или нелинеарна.

На пример, врската помеѓу нивото на обука на студентот и конечните оценки за сертификација може да биде линеарна. Пример за нелинеарна врска е нивото на мотивација и ефективноста на завршувањето на дадената задача. (Како што се зголемува мотивацијата, прво се зголемува ефикасноста на завршување на задачата, а потоа, на одредено ниво на мотивација, се постигнува максимална ефикасност; но дополнителното зголемување на мотивацијата е придружено со намалување на ефикасноста.)

Во насока, врската на корелација може да биде позитивна (директна) и негативна (инверзна).

Со позитивна линеарна корелација, повисоките вредности на една карактеристика одговараат на повисоките вредности на друга, а пониските вредности на една карактеристика одговараат на пониските вредности на друга. Со негативна корелација, односите се обратни.

Знакот на коефициентот на корелација зависи од насоката на корелацијата: со позитивна корелација, коефициентот на корелација има позитивен знак, со негативна корелација има негативен знак.

Библиографија

  1. Аблеева, А. образование: материјали меѓународна научна и методолошка конференција, 4-5 април 2014 година / Државен аграрен универзитет Башкир, Факултет за информатички технологии и менаџмент. - Уфа, 2014. - стр. 11-14.
  2. Ганиева, А.М. Статистичка анализа на вработеноста и невработеноста [Текст] / А.М. Ганиева, Т.Н. Лубова // Актуелни прашања на економско-статистички истражувања и информатички технологии: збирка на статии. научни Уметност: посветена на 40-годишнината од создавањето на одделот за „Статистика и информациски системи во економијата“ / Државниот аграрен универзитет на Башкир. - Уфа, 2011. - стр. 315-316.
  3. Исмагилов, Р.Р. Креативна група - ефективна форма на организирање научно истражување во високото образование [Текст] / R. R. Ismagilov, M. Kh. Urazlin, D. R. Islamgulov // Научни, технички и научно-образовни комплекси на регионот: проблеми и развојни перспективи: материјали на научно-практична конференција / Академија на науките на Република Белорусија, УГАТУ. - Уфа, 1999. - стр. 105-106.
  4. Исламгулов, Д.Р. Пристап заснован на компетенции во наставата: оценување на квалитетот на образованието [Текст] / Д.Р. Исламгулов, Т.Н. Љубова, И.Р. Исламгулова // Современ научен билтен. – 2015. – T. 7. – No 1. – P. 62-69.
  5. Исламгулов, Д.Р. Истражувачката работа на студентите е најважниот елемент за обука на специјалисти на земјоделски универзитет [Текст] / Д.Р. Исламгулов // Проблеми со практична обука на студенти на универзитет во сегашната фаза и начини за нивно решавање: колекција. материјали научно-метод. Конф., 24 април 2007 година / Башкирски државен аграрен универзитет. - Уфа, 2007. - стр. 20-22.
  6. Љубова, Т.Н. Основата за имплементација на сојузниот државен образовен стандард е пристапот заснован на компетентност [Текст] / Т.Н. Лубова, Д.Р. Исламгулов, И.Р. Исламгулова // BODEST RESEARCH - 2016: Материјали за XII меѓународна научна и практична конференција, 15-22 февруари 2016 година. - Софија: Byal GRAD-BG OOD, 2016. - Том 4 Педагошки науки. – стр 80-85.
  7. Љубова, Т.Н. Нови образовни стандарди: карактеристики за имплементација [Текст] / Т.Н. Лубова, Д.Р. Исламгулов // Современ научен билтен. – 2015. – Т. 7. – бр. 1. – стр. 79-84.
  8. Љубова, Т.Н. Организација на самостојна работа на ученици [Текст] / Т.Н. Лубова, Д.Р. Исламгулов // Имплементација на образовни програми за високо образование во рамките на Сојузниот државен образовен стандард за високо образование: материјали од серуската научна и методолошка конференција во рамките на посетата на состанокот на Националниот медицински совет за управување со животната средина и вода користење на Сојузната образовна институција во високообразовниот систем. / Башкирски државен аграрен универзитет. - Уфа, 2016. - стр. 214-219.
  9. Љубова, Т.Н. Основата за имплементација на сојузниот државен образовен стандард е пристапот заснован на компетентност [Текст] / Т.Н. Лубова, Д.Р. Исламгулов, И.Р. Исламгулова // Современ научен билтен. – 2015. – Т. 7. – бр. 1. – стр. 85-93.
  10. Саубанова, Л.М. Ниво на демографско оптоварување [Текст] / Л.М. Саубанова, Т.Н. Лубова // Актуелни прашања на економско-статистички истражувања и информатички технологии: збирка на статии. научни Уметност: посветена на 40-годишнината од создавањето на одделот за „Статистика и информациски системи во економијата“ / Државниот аграрен универзитет на Башкир. - Уфа, 2011. - стр. 321-322.
  11. Фахрулина, А.Р. Статистичка анализа на инфлацијата во Русија [Текст] / А.Р. Фахрулина, Т.Н. Лубова // Актуелни прашања на економско-статистички истражувања и информатички технологии: збирка на статии. научни Уметност: посветена на 40-годишнината од создавањето на одделот за „Статистика и информациски системи во економијата“ / Државниот аграрен универзитет на Башкир. - Уфа, 2011. - стр. 323-324.
  12. Фархутдинова, А.Т. Пазар на труд во Република Башкортостан во 2012 година [Електронски ресурс] / А.Т. Фархутдинова, Т.Н. Лубова // Студентски научен форум. Материјали на V меѓународна студентска електронска научна конференција: електронска научна конференција (електронска колекција). Руската академија за природни науки. 2013 година.

Дефиниција на корелациска анализа

При решавање на проблеми од економска природа, имено прогнозирање, често се користи корелациона анализа. Се заснова на некои вредности на случајна променлива, претставена со променлива која зависи од случајот и може да земе некои вредности со одредена веројатност. Во овој случај, соодветниот закон за дистрибуција може да ја покаже фреквенцијата на специфичните вредности во нивната целина. Анализата на корелација во статистиката се заснова на стохастичка зависност при спроведување на истражување за односот помеѓу одредени економски показатели.

Видови на корелација анализа

Анализата на корелација функционира и со функционални (целосни) и со искривени од други фактори (нецелосни) зависности на оваа врска. Пример од првиот тип (функционална зависност) е производството и потрошувачката на готови производи во услови на недостиг. Може да се види нецелосен однос, на пример, помеѓу продуктивноста на трудот и стажот на работниците. Во исто време, поголемото искуство влијае на неговиот квалитет, но под влијание на одредени фактори (здравје или образование), оваа зависност се нарушува.

Користење на корелација анализа во статистиката

Анализата на корелација е широко користена во математичката статистика.

Во исто време, неговата главна задача е да ја одреди блискоста на поврзаноста и карактерот помеѓу независните (факторијални) и зависните (резултативни) карактеристики во еден процес или феномен. Корелација се открива само со голема факторска споредба. Така, неговата затегнатост може да се одреди со користење на одреден коефициент на корелација, специјално пресметан и лоциран во интервалот [-1;+1]. Природата на врската помеѓу овие показатели може да се определи со корелационото поле. Во случај кога Y е зависна карактеристика, X е независна карактеристика, тогаш кога се зема секој случај во форма X(j), корелацијата поле ќе има координати (x j;y j).

Анализа на корелација во економијата

Економската активност на деловните субјекти зависи од огромен број различни фактори. Во овој случај, неопходно е да се разгледа нивниот комплекс, бидејќи секој од нив одделно не може да го одреди феноменот што се проучува во целост. Затоа, само збир на фактори во нивната блиска меѓусебна врска дава јасна претстава за предметот што се проучува. Анализата на мултиваријантна корелација може да се состои од неколку фази. Пред сè, оние фактори со помош на кои се одредува максималното влијание врз индикаторот што се проучува, а најзначајните се избираат за анализа. Втората фаза вклучува собирање и проценка на првичните информации кои се неопходни за анализа на корелација. Во третата, се изучува карактерот и се моделира односот помеѓу крајните показатели и другите фактори. Со други зборови, генерираната математичка равенка е поткрепена, која најпрецизно ја изразува суштината на анализираната зависност. И последната фаза вклучува евалуација на резултатите од корелационата анализа со нејзината практична примена.