Spearman statistik detaljeret prøve. Historien om udviklingen af ​​rangkorrelationskoefficienten

Spearman-rangkorrelationsmetoden giver dig mulighed for at bestemme tætheden (styrken) og retningen af ​​korrelationen mellem to karakteristika eller to profiler (hierarkier) af karakteristika.

For at beregne rangkorrelation er det nødvendigt at have to rækker af værdier,

som kan rangeres. Sådanne serier af værdier kunne være:

1) to tegn målt i samme gruppe af forsøgspersoner;

2) to individuelle hierarkier af egenskaber identificeret i to forsøgspersoner ved brug af det samme sæt af karaktertræk;

3) to gruppehierarkier af karakteristika,

4) individuelle og gruppehierarkier af karakteristika.

Først rangeres indikatorerne separat for hver af karakteristikaene.

Som regel tildeles en lavere rang til en lavere attributværdi.

I det første tilfælde (to karakteristika) rangeres individuelle værdier for den første egenskab opnået af forskellige emner, og derefter individuelle værdier for den anden karakteristik.

Hvis to karakteristika er positivt beslægtede, vil forsøgspersoner, der har lave rangeringer i den ene af dem, have lave rangeringer i den anden, og fag, der har høje rangeringer i

et af karakteristikaene vil også have høje rangeringer for det andet karakteristika. For at beregne rs er det nødvendigt at bestemme forskellene (d) mellem rækkerne opnået af et givet emne for begge egenskaber. Så transformeres disse indikatorer d på en bestemt måde og trækkes fra 1. End

Jo mindre forskellen er mellem rækkerne, jo større r'er vil være, jo tættere vil den være på +1.

Hvis der ikke er nogen sammenhæng, vil alle rækker blive blandet, og der vil ikke være nogen

ingen korrespondance. Formlen er designet således, at rs i dette tilfælde vil være tæt på 0.

I tilfælde af en negativ sammenhæng mellem lav rækker af emner på en egenskab

høje rækker på et andet grundlag vil svare, og omvendt. Jo større uoverensstemmelsen er mellem forsøgspersonernes rangeringer på to variable, jo tættere er rs på -1.

I det andet tilfælde (to individuelle profiler), individuelle

værdier opnået af hvert af de 2 emner for et bestemt (identisk for dem begge) sæt karakteristika. Den første rang vil blive givet til funktionen med den laveste værdi; den anden rang er en funktion med en højere værdi osv. Det er klart, at alle karakteristika skal måles i de samme enheder, ellers er rangering umulig. For eksempel er det umuligt at rangere indikatorer på Cattell Personality Inventory (16PF), hvis de er udtrykt i "rå" point, da værdiintervallerne for forskellige faktorer er forskellige: fra 0 til 13, fra 0 til

20 og fra 0 til 26. Vi kan ikke sige, hvilken faktor der vil tage førstepladsen med hensyn til sværhedsgrad, før vi bringer alle værdierne til en enkelt skala (oftest er dette vægskalaen).

Hvis de individuelle hierarkier for to emner er positivt beslægtede, så vil træk, der har lave ranger i det ene af dem, have lave rangeringer i det andet, og omvendt. For eksempel, hvis et emnes faktor E (dominans) har den laveste rang, så skal et andet emnes faktor også have en lav rang, hvis et emnes faktor C

(følelsesmæssig stabilitet) har den højeste rang, så skal det andet emne også have

denne faktor har en høj rang osv.

I det tredje tilfælde (to gruppeprofiler) er gruppegennemsnitsværdierne opnået i 2 grupper af forsøgspersoner rangeret i henhold til et bestemt sæt karakteristika, identisk for de to grupper. I det følgende er ræsonnementet det samme som i de to foregående sager.

I tilfælde 4 (individuelle og gruppeprofiler) rangeres de individuelle værdier for emnet og gruppegennemsnitsværdierne separat i henhold til det samme sæt karakteristika, som opnås som regel ved at ekskludere dette individuelle emne - han deltager ikke i den gruppegennemsnitsprofil, som han vil blive sammenlignet med individuelle profil. Rangkorrelation vil teste, hvor ensartede individuelle og gruppeprofiler er.

I alle fire tilfælde bestemmes betydningen af ​​den resulterende korrelationskoefficient af antallet af rangordnede værdier N. I det første tilfælde vil dette tal falde sammen med stikprøvestørrelsen n. I det andet tilfælde vil antallet af observationer være antallet af funktioner, der udgør hierarkiet. I tredje og fjerde tilfælde er N også antallet af sammenlignede træk, og ikke antallet af forsøgspersoner i grupper. Detaljerede forklaringer er givet i eksemplerne. Hvis den absolutte værdi af rs når eller overstiger en kritisk værdi, er korrelationen pålidelig.

Hypoteser.

Der er to mulige hypoteser. Den første gælder for sag 1, den anden for de tre andre sager.

Første version af hypoteser

H0: Korrelationen mellem variable A og B er ikke forskellig fra nul.

H1: Korrelationen mellem variable A og B er signifikant forskellig fra nul.

Anden version af hypoteser

H0: Korrelationen mellem hierarki A og B er ikke forskellig fra nul.

H1: Korrelationen mellem hierarki A og B er signifikant forskellig fra nul.

Begrænsninger af rangkorrelationskoefficienten

1. For hver variabel skal der fremlægges mindst 5 observationer. Den øvre grænse for prøven bestemmes af de tilgængelige tabeller over kritiske værdier.

2. Spearmans rangkorrelationskoefficient rs med et stort antal identiske rækker for en eller begge sammenlignede variable giver grove værdier. Ideelt set bør begge korrelerede serier repræsentere to sekvenser af divergerende værdier. Hvis denne betingelse ikke er opfyldt, er det nødvendigt at foretage en justering for lige rang.

Spearmans rangkorrelationskoefficient beregnes ved hjælp af formlen:

Hvis der i begge sammenlignede rangserier er grupper af samme rækker, før beregning af rangkorrelationskoefficienten er det nødvendigt at foretage korrektioner for de samme rækker Ta og Tv:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

hvor a er volumenet af hver gruppe af identiske rækker i rækkefølgen A, b er volumenet af hver

grupper af identiske rang i rangrækken B.

For at beregne den empiriske værdi af rs, brug formlen:

Beregning af Spearmans rangkorrelationskoefficient rs

1. Bestem, hvilke to karakteristika eller to hierarkier af karakteristika, der vil deltage i

sammenligning som variable A og B.

2. Rangér værdierne for variabel A, og tildel rang 1 til den mindste værdi, i overensstemmelse med rangordningsreglerne (se P.2.3). Indtast rækkerne i den første kolonne i tabellen i rækkefølge efter testpersonernes antal eller karakteristika.

3. Rangér værdierne af variabel B i overensstemmelse med de samme regler. Indtast rækkerne i den anden kolonne i tabellen i rækkefølge efter antallet af emner eller karakteristika.

5. Kvadrat for hver forskel: d2. Indtast disse værdier i den fjerde kolonne i tabellen.

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

hvor a er volumen af ​​hver gruppe af identiske rækker i række A; c – volumen af ​​hver gruppe

identiske rækker i række B.

a) i mangel af identiske rækker

rs  1 − 6 ⋅

b) i nærværelse af identiske rækker

Σd 2  T  T

r  1 − 6 ⋅ a in,

hvor Σd2 er summen af ​​kvadrerede forskelle mellem rækker; Ta og TV - rettelser til samme

N – antal emner eller funktioner, der deltager i ranglisten.

9. Bestem ud fra tabellen (se bilag 4.3) de kritiske værdier af rs for en given N. Hvis rs overstiger den kritiske værdi eller i det mindste er lig med den, er korrelationen signifikant forskellig fra 0.

Eksempel 4.1 Ved bestemmelse af graden af ​​afhængighed af alkoholindtagelsesreaktionen af ​​den oculomotoriske reaktion i testgruppen blev data opnået før og efter indtagelse af alkohol. Afhænger forsøgspersonens reaktion af rustilstanden?

Eksperimentresultater:

Før: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. Efter: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Lad os formulere hypoteser:

H0: sammenhængen mellem graden af ​​afhængighed af reaktionen før og efter indtagelse af alkohol adskiller sig ikke fra nul.

H1: sammenhængen mellem graden af ​​afhængighed af reaktionen før og efter indtagelse af alkohol er signifikant forskellig fra nul.

Tabel 4.1. Beregning af d2 for Spearmans rangkorrelationskoefficient rs ved sammenligning af oculomotoriske reaktionsindikatorer før og efter eksperimentet (N=17)

værdier

værdier

Da vi har gentagne rækker, vil vi i dette tilfælde anvende formlen justeret for identiske rækker:

Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

Тb =((23-2)+(23-2)+(33-3))/12=3

Lad os finde den empiriske værdi af Spearman-koefficienten:

rs = 1-6*((767,75+6+3)/(17*(172-1)))=0,05

Ved hjælp af tabellen (bilag 4.3) finder vi de kritiske værdier af korrelationskoefficienten

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Vi får

rs=0,05∠rcr(0,05)=0,48

Konklusion: H1 hypotese forkastes og H0 accepteres. De der. sammenhæng mellem grad

afhængigheden af ​​reaktionen før og efter indtagelse af alkohol adskiller sig ikke fra nul.

Lommeregneren nedenfor beregner Spearman-rangkorrelationskoefficienten mellem to stokastiske variable. Den teoretiske del, for ikke at blive distraheret fra lommeregneren, er traditionelt placeret under den.

tilføje import Eksport mode_edit slette

Ændringer i tilfældige variable

arrow_upwardarrow_downward xarrow_upwardarrow_downward Y
Sidestørrelse: 5 10 20 50 100 chevron_venstre chevron_right

Ændringer i tilfældige variable

Importer data Importfejl

Du kan bruge et af disse symboler til at adskille felter: Tab, ";" eller "," Eksempel: -50.5;-50.5

Import Tilbage Annuller

Metoden til beregning af Spearman-rangkorrelationskoefficienten er faktisk beskrevet meget enkelt. Dette er den samme Pearson-korrelationskoefficient, kun beregnet ikke for resultaterne af målinger af tilfældige variabler selv, men for deres rangværdier.

Det er,

Det eneste, der er tilbage, er at finde ud af, hvad rangværdier er, og hvorfor alt dette er nødvendigt.

Hvis elementerne i en variationsserie er arrangeret i stigende eller faldende rækkefølge, så rang element vil være dets nummer i denne ordnede serie.

Lad os for eksempel have en variationsserie (17,26,5,14,21). Lad os sortere dets elementer i faldende rækkefølge (26,21,17,14,5). 26 har plads 1, 21 har plads 2 osv. Variationsrækken af ​​rangværdier vil se sådan ud (3,1,5,4,2).

Det vil sige, at når man beregner Spearman-koefficienten, omdannes de oprindelige variationsrækker til variationsrækker af rangværdier, hvorefter Pearson-formlen anvendes på dem.

Der er en subtilitet - rangen af ​​gentagne værdier tages som gennemsnittet af rækkerne. Det vil sige, for serien (17, 15, 14, 15) vil rækken af ​​rangværdier se ud som (1, 2,5, 4, 2,5), da det første element lig med 15 har rang 2, og det andet element har rang 3, og .

Hvis der ikke er nogen gentagne værdier, det vil sige, at alle værdier i rangserien er tal fra området fra 1 til n, kan Pearson-formlen forenkles til

Nå, forresten, er denne formel oftest givet som en formel til beregning af Spearman-koefficienten.

Hvad er essensen af ​​overgangen fra værdierne selv til deres rangværdier?
Pointen er, at man ved at studere korrelationen af ​​rangværdier kan bestemme, hvor godt afhængigheden af ​​to variable er beskrevet af en monoton funktion.

Koefficientens fortegn angiver retningen af ​​forholdet mellem variablerne. Hvis tegnet er positivt, så har Y-værdier en tendens til at stige, når X-værdier stiger; hvis tegnet er negativt, så har Y-værdierne en tendens til at falde, når X-værdierne stiger. Hvis koefficienten er 0, er der ingen tendens. Hvis koefficienten er 1 eller -1, så har forholdet mellem X og Y form af en monoton funktion - det vil sige, når X stiger, øges Y også, eller omvendt, når X stiger, falder Y.

Det vil sige, at i modsætning til Pearson-korrelationskoefficienten, som kun kan afsløre en lineær afhængighed af en variabel af en anden, kan Spearman-korrelationskoefficienten afsløre en monoton afhængighed, hvor en direkte lineær sammenhæng ikke detekteres.

Lad mig forklare med et eksempel. Lad os antage, at vi undersøger funktionen y=10/x.
Vi har følgende X- og Y-mål
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
For disse data er Pearson-korrelationskoefficienten -0,4686, det vil sige, at forholdet er svagt eller fraværende. Men Spearman-korrelationskoefficienten er strengt taget lig med -1, hvilket synes at antyde for forskeren, at Y har en streng negativ monoton afhængighed af X.

I de tilfælde, hvor målingerne af de undersøgte egenskaber udføres på en ordensskala, eller formen af ​​sammenhængen adskiller sig fra lineær, udføres undersøgelsen af ​​sammenhængen mellem to stokastiske variable ved hjælp af rangkorrelationskoefficienter. Overvej Spearman rangkorrelationskoefficienten. Når du beregner det, er det nødvendigt at rangere (ordre) prøvemulighederne. Rangordning er grupperingen af ​​eksperimentelle data i en bestemt rækkefølge, enten stigende eller faldende.

Rangeringsoperationen udføres i henhold til følgende algoritme:

1. En lavere værdi tildeles en lavere rang. Den højeste værdi tildeles en rang, der svarer til antallet af rangerede værdier. Den mindste værdi tildeles en rang på 1. For eksempel, hvis n=7, vil den største værdi få en rang på 7, undtagen i tilfælde, der er fastsat i den anden regel.

2. Hvis flere værdier er ens, så tildeles de en rang, der er gennemsnittet af de rangeringer, de ville modtage, hvis de ikke var ens. Som et eksempel kan du overveje en stigende-ordnet prøve bestående af 7 elementer: 22, 23, 25, 25, 25, 28, 30. Værdierne 22 og 23 vises én gang hver, så deres rækker er henholdsvis R22=1, og R23=2. Værdien 25 vises 3 gange. Hvis disse værdier ikke blev gentaget, så ville deres rækker være 3, 4, 5. Derfor er deres R25-rangering lig med det aritmetiske middelværdi af 3, 4 og 5: . Værdierne 28 og 30 gentages ikke, så deres rækker er henholdsvis R28=6 og R30=7. Endelig har vi følgende korrespondance:

3. Den samlede sum af rækker skal falde sammen med den beregnede, som bestemmes af formlen:

hvor n er det samlede antal rangordnede værdier.

En uoverensstemmelse mellem de faktiske og de beregnede rangsummer vil indikere en fejl, der er begået ved beregning af rang eller opsummering af rang. I dette tilfælde skal du finde og rette fejlen.

Spearmans rangkorrelationskoefficient er en metode, der gør det muligt at bestemme styrken og retningen af ​​forholdet mellem to træk eller to hierarkier af træk. Brugen af ​​rangkorrelationskoefficienten har en række begrænsninger:

  • a) Den forudsatte korrelationsafhængighed skal være monoton.
  • b) Volumenet af hver prøve skal være større end eller lig med 5. For at bestemme den øvre grænse for prøven skal du bruge tabeller med kritiske værdier (Tabel 3 i tillægget). Den maksimale værdi af n i tabellen er 40.
  • c) Under analysen er det sandsynligt, at der kan opstå et stort antal identiske rækker. I dette tilfælde skal der foretages en ændring. Det mest gunstige tilfælde er, når begge prøver under undersøgelse repræsenterer to sekvenser af divergerende værdier.

For at udføre en korrelationsanalyse skal forskeren have to prøver, der kan rangeres, for eksempel:

  • - to karakteristika målt i samme gruppe af forsøgspersoner;
  • - to individuelle hierarkier af træk identificeret i to forsøgspersoner ved brug af det samme sæt træk;
  • - to gruppehierarkier af karakteristika;
  • - individuelle og gruppehierarkier af karakteristika.

Vi begynder beregningen ved at rangere de undersøgte indikatorer separat for hver af egenskaberne.

Lad os analysere et tilfælde med to tegn målt i samme gruppe af forsøgspersoner. Først rangeres de individuelle værdier opnået af forskellige fag i henhold til den første egenskab, og derefter rangeres de individuelle værdier efter den anden karakteristik. Hvis lavere rækker af en indikator svarer til lavere rækker af en anden indikator, og højere rækker af en indikator svarer til større rækker af en anden indikator, så er de to karakteristika positivt relaterede. Hvis højere rækker af en indikator svarer til lavere rækker af en anden indikator, er de to karakteristika negativt relaterede. For at finde r'er bestemmer vi forskellene mellem rækkerne (d) for hvert emne. Jo mindre forskellen er mellem rækkerne, desto tættere vil rangkorrelationskoefficienten rs være på "+1". Hvis der ikke er nogen sammenhæng, vil der ikke være nogen overensstemmelse mellem dem, derfor vil rs være tæt på nul. Jo større forskellen er mellem rækkerne af forsøgspersoner på to variable, jo tættere på "-1" vil værdien af ​​rs-koefficienten være. Således er Spearman rangkorrelationskoefficienten et mål for ethvert monotont forhold mellem de to karakteristika, der undersøges.

Lad os overveje tilfældet med to individuelle hierarkier af træk identificeret i to emner ved hjælp af det samme sæt træk. I denne situation er de individuelle værdier opnået af hvert af de to emner rangeret i henhold til et bestemt sæt af karakteristika. Funktionen med den laveste værdi skal tildeles den første rang; karakteristikken med en højere værdi er den anden rang osv. Der bør udvises særlig omhu for at sikre, at alle attributter måles i de samme enheder. For eksempel er det umuligt at rangere indikatorer, hvis de er udtrykt i forskellige "pris"-punkter, da det er umuligt at bestemme, hvilken af ​​faktorerne der vil tage førstepladsen med hensyn til sværhedsgrad, indtil alle værdier er bragt til en enkelt skala. Hvis træk, der har lav rang i et af fagene, også har lav rang i et andet, og omvendt, så hænger de enkelte hierarkier positivt sammen.

I tilfælde af to gruppehierarkier af karakteristika rangeres de gennemsnitlige gruppeværdier opnået i to grupper af emner i henhold til det samme sæt karakteristika for de undersøgte grupper. Dernæst følger vi algoritmen givet i tidligere tilfælde.

Lad os analysere en sag med et individuelt og gruppehierarki af karakteristika. De begynder med at rangordne de individuelle værdier for emnet og de gennemsnitlige gruppeværdier i henhold til det samme sæt af karakteristika, som blev opnået, ekskluderet emnet, der ikke deltager i det gennemsnitlige gruppehierarki, da hans individuelle hierarki vil være sammenlignet med det. Rangkorrelation giver os mulighed for at vurdere graden af ​​konsistens af individuelle og gruppehierarki af karaktertræk.

Lad os overveje, hvordan betydningen af ​​korrelationskoefficienten bestemmes i de ovenfor anførte tilfælde. I tilfælde af to karakteristika vil det blive bestemt af stikprøvestørrelsen. I tilfælde af to individuelle trækhierarkier afhænger betydningen af ​​antallet af træk, der indgår i hierarkiet. I de sidste to tilfælde er signifikans bestemt af antallet af karakteristika, der undersøges, og ikke af antallet af grupper. Således er betydningen af ​​rs i alle tilfælde bestemt af antallet af rangordnede værdier n.

Når du kontrollerer den statistiske signifikans af rs, bruges tabeller med kritiske værdier af rangkorrelationskoefficienten, kompileret for forskellige antal rangerede værdier og forskellige signifikansniveauer. Hvis den absolutte værdi af rs når eller overstiger en kritisk værdi, så er korrelationen pålidelig.

Når man overvejer den første mulighed (et tilfælde med to tegn målt i samme gruppe af forsøgspersoner), er følgende hypoteser mulige.

H0: Korrelationen mellem variablene x og y er ikke forskellig fra nul.

H1: Korrelationen mellem variablene x og y er signifikant forskellig fra nul.

Hvis vi arbejder med nogen af ​​de tre resterende tilfælde, så er det nødvendigt at fremsætte endnu et par hypoteser:

H0: Korrelationen mellem hierarkierne x og y er ikke forskellig fra nul.

H1: Korrelationen mellem hierarkierne x og y er signifikant forskellig fra nul.

Rækkefølgen af ​​handlinger ved beregning af Spearman-rangkorrelationskoefficienten rs er som følger.

  • - Bestem hvilke to træk eller to hierarkier af træk der vil deltage i sammenligningen som variable x og y.
  • - Rangér værdierne for variablen x, og tildel rang 1 til den mindste værdi i overensstemmelse med rangordningsreglerne. Placer rækkerne i den første kolonne i tabellen i rækkefølge efter testpersoner eller karakteristika.
  • - Rangér værdierne af variablen y. Placer rækkerne i den anden kolonne i tabellen i rækkefølge efter testpersoner eller karakteristika.
  • - Beregn forskellene d mellem rækkerne x og y for hver række i tabellen. Placer resultaterne i den næste kolonne i tabellen.
  • - Beregn de kvadratiske forskelle (d2). Placer de resulterende værdier i den fjerde kolonne i tabellen.
  • - Beregn summen af ​​kvadratforskelle? d2.
  • - Hvis der forekommer identiske rækker, beregnes korrektionerne:

hvor tx er volumenet af hver gruppe af identiske rækker i prøve x;

ty er volumenet af hver gruppe af identiske rækker i prøve y.

Beregn rangkorrelationskoefficienten afhængigt af tilstedeværelsen eller fraværet af identiske rækker. Hvis der ikke er identiske rækker, beregnes rangkorrelationskoefficienten rs ved hjælp af formlen:

Hvis der er identiske rækker, beregnes rangkorrelationskoefficienten rs ved hjælp af formlen:

hvor?d2 er summen af ​​kvadrerede forskelle mellem rækker;

Tx og Ty - korrektioner for lige rang;

n er antallet af emner eller funktioner, der deltager i rangeringen.

Bestem de kritiske værdier for rs fra bilagstabel 3 for et givet antal emner n. En signifikant forskel fra nul af korrelationskoefficienten vil blive observeret, forudsat at rs ikke er mindre end den kritiske værdi.

Tildeling af rangkorrelationskoefficient

Spearman rangkorrelationsmetoden giver dig mulighed for at bestemme tætheden (styrken) og retningen af ​​korrelationen mellem to tegn eller to profiler (hierarkier) tegn.

Beskrivelse af metoden

For at beregne rangkorrelation er det nødvendigt at have to rækker af værdier, der kan rangeres. Sådanne serier af værdier kunne være:

1) to tegn målt i samme gruppe af forsøgspersoner;

2) to individuelle hierarkier af karakteristika, identificeret i to emner i henhold til det samme sæt af karakteristika (f.eks. personlighedsprofiler ifølge R.B. Cattells 16-faktor spørgeskema, hierarki af værdier ifølge R. Rokeachs metode, rækkefølge af præferencer ved valg mellem flere alternativer osv.) ;

3) to gruppehierarkier af træk;

4) individuel og gruppe hierarki af funktioner.

Først rangeres indikatorerne separat for hver af karakteristikaene. Som regel tildeles en lavere rang til en lavere attributværdi.

Lad os overveje tilfælde 1 (to tegn). Her rangeres de individuelle værdier for den første egenskab opnået af forskellige fag, og derefter de individuelle værdier for den anden egenskab.

Hvis to karakteristika er positivt beslægtede, så vil forsøgspersoner, der har lave rangeringer på den ene af dem, have lave rangeringer på den anden, og forsøgspersoner, der har høje rangeringer på en af ​​karakteristikaene, vil også have høje rangeringer på den anden karakteristik. At tælle r s det er nødvendigt at bestemme forskellene (d) mellem rækkerne opnået af et givet emne for begge karakteristika. Derefter transformeres disse indikatorer d på en bestemt måde og trækkes fra 1. Jo mindre forskellen mellem rækkerne er, jo større vil r s være, jo tættere vil den være på +1.

Hvis der ikke er nogen sammenhæng, vil alle rækkerne blive blandet, og der vil ikke være nogen overensstemmelse mellem dem. Formlen er designet således, at i dette tilfælde r s, vil være tæt på 0.

I tilfælde af en negativ korrelation vil lave rangeringer af forsøgspersoner på én egenskab svare til høje rangeringer på en anden egenskab og omvendt.

Jo større uoverensstemmelsen er mellem forsøgspersonernes rækker på to variable, jo tættere er r s på -1.

Lad os overveje case 2 (to individuelle profiler). Her er de individuelle værdier opnået af hvert af de 2 emner rangeret i henhold til et bestemt (identisk for dem begge) sæt af karakteristika. Den første rang vil blive givet til funktionen med den laveste værdi; den anden rang er en funktion med en højere værdi osv. Det er klart, at alle karakteristika skal måles i de samme enheder, ellers er rangering umulig. For eksempel er det umuligt at rangere indikatorer på Cattell Personality Inventory (16 PF), hvis de er udtrykt i "rå" punkter, da værdiintervallerne er forskellige for forskellige faktorer: fra 0 til 13, fra 0 til 20 og fra 0 til 26. Vi kan ikke sige, hvilken faktor der vil indtage førstepladsen i med hensyn til sværhedsgrad indtil Vi vil ikke bringe alle værdierne til en enkelt skala (oftest er dette vægskalaen).

Hvis de individuelle hierarkier for to emner er positivt beslægtede, så vil træk, der har lave ranger i det ene af dem, have lave rangeringer i det andet, og omvendt. For eksempel, hvis et emnes faktor E (dominans) har den laveste rang, så skal et andet emnes faktor have en lav rang; hvis et emnes faktor C (emotionel stabilitet) har den højeste rang, så skal det andet emne have en høj rang på denne faktor rang, osv.

Lad os overveje case 3 (to gruppeprofiler). Her er de gennemsnitlige gruppeværdier opnået i 2 grupper af emner rangeret i henhold til et bestemt sæt karakteristika, identisk for de to grupper. I det følgende er ræsonnementet det samme som i de to foregående sager.

Lad os overveje case 4 (individuelle og gruppeprofiler). Her er individets individuelle værdier og gruppegennemsnitsværdierne rangeret separat efter det samme sæt af karakteristika, som opnås som regel ved at ekskludere dette individuelle emne - han deltager ikke i gruppegennemsnittet profil, som hans individuelle profil vil blive sammenlignet med. Rangkorrelation vil teste, hvor ensartede individuelle og gruppeprofiler er.

I alle fire tilfælde bestemmes betydningen af ​​den resulterende korrelationskoefficient af antallet af rangordnede værdier N. I det første tilfælde vil dette tal falde sammen med stikprøvestørrelsen n. I det andet tilfælde vil antallet af observationer være antallet af funktioner, der udgør hierarkiet. I tredje og fjerde tilfælde N- dette er også antallet af funktioner, der sammenlignes, og ikke antallet af emner i grupper. Detaljerede forklaringer er givet i eksemplerne.

Hvis den absolutte værdi af r s når eller overstiger en kritisk værdi, er korrelationen pålidelig.

Hypoteser

Der er to mulige hypoteser. Den første gælder for sag 1, den anden for de tre andre sager.

Første version af hypoteser

H 0: Korrelationen mellem variable A og B adskiller sig ikke fra nul.

H 1: Korrelationen mellem variable A og B er signifikant forskellig fra nul.

Anden version af hypoteser

H 0: Korrelationen mellem hierarki A og B adskiller sig ikke fra nul.

H1: Korrelationen mellem hierarki A og B er signifikant forskellig fra nul.

Grafisk fremstilling af rangkorrelationsmetoden

Oftest præsenteres korrelationsforholdet grafisk i form af en sky af punkter eller i form af linjer, der afspejler den generelle tendens til at placere punkter i rummet af to akser: aksen for træk A og træk B (se fig. 6.2) ).

Lad os prøve at afbilde rangkorrelation i form af to rækker af rangordnede værdier, som er forbundet i par med linjer (fig. 6.3). Hvis rækkerne for egenskab A og egenskab B falder sammen, så er der en vandret linje mellem dem; hvis rækkerne ikke falder sammen, så bliver linjen skrå. Jo større uoverensstemmelsen er mellem rækkerne, jo mere skrå bliver linjen. Til venstre i fig. Figur 6.3 viser den højest mulige positive korrelation (r =+1,0) - i praksis er dette en "stige". I midten er der en nulkorrelation - en fletning med uregelmæssige vævninger. Alle rækkerne er blandet her. Til højre er den højeste negative korrelation (r s = -1,0) - et net med en regelmæssig sammenvævning af linjer.

Ris. 6.3. Grafisk repræsentation af rangkorrelation:

a) høj positiv korrelation;

b) nul korrelation;

c) høj negativ korrelation

Begrænsningerrangkoefficientsammenhænge

1. For hver variabel skal der fremlægges mindst 5 observationer. Den øvre grænse for prøven bestemmes af de tilgængelige tabeller over kritiske værdier (tabel XVI bilag 1), nemlig N40.

2. Spearmans rangkorrelationskoefficient r s med et stort antal identiske rækker for en eller begge sammenlignede variable giver grove værdier. Ideelt set bør begge korrelerede serier repræsentere to sekvenser af divergerende værdier. Hvis denne betingelse ikke er opfyldt, er det nødvendigt at foretage en justering for lige rang. Den tilsvarende formel er givet i eksempel 4.

Eksempel 1 - korrelationmellem totegn

I en undersøgelse, der simulerer aktiviteten af ​​en flyveleder (Oderyshev B.S., Shamova E.P., Sidorenko E.V., Larchenko N.N., 1978), blev en gruppe af fag, studerende fra fakultetet for fysik ved Leningrad State University, trænet, før de startede arbejdet med simulator. Forsøgspersonerne skulle løse problemer med at vælge den optimale banetype til en given flytype. Er antallet af fejl begået af forsøgspersoner i en træningssession relateret til indikatorer for verbal og nonverbal intelligens målt ved hjælp af D. Wechslers metode?

Tabel 6.1

Indikatorer for antallet af fejl i træningssessionen og indikatorer for niveauet af verbal og non-verbal intelligens blandt fysikstuderende (N=10)

Emne

Antal fejl

Verbal intelligensindeks

Nonverbal Intelligence Index

Lad os først prøve at besvare spørgsmålet om, hvorvidt indikatorer for antallet af fejl og verbal intelligens er relateret.

Lad os formulere hypoteser.

H 0: Korrelationen mellem antallet af fejl i en træningssession og niveauet af verbal intelligens adskiller sig ikke fra nul.

H 1 : Korrelationen mellem antallet af fejl i en træningssession og niveauet af verbal intelligens er statistisk signifikant forskellig fra nul.

Dernæst skal vi rangordne begge indikatorer, tildele en lavere rang til den mindre værdi, derefter beregne forskellene mellem de rangeringer, som hvert emne modtog for de to variable (attributter), og kvadrere disse forskelle. Lad os lave alle de nødvendige beregninger i tabellen.

I tabel. 6.2 den første kolonne til venstre viser værdierne for antallet af fejl; den næste kolonne viser deres rækker. Den tredje kolonne fra venstre viser scorerne for verbal intelligens; den næste kolonne viser deres rækker. Den femte fra venstre præsenterer forskellene d mellem rangeringen på variabel A (antal fejl) og variabel B (verbal intelligens). Den sidste kolonne viser de kvadrerede forskelle - d 2 .

Tabel 6.2

Beregning d 2 for Spearmans rangkorrelationskoefficient r s ved sammenligning af indikatorer for antallet af fejl og verbal intelligens blandt fysikstuderende (N=10)

Emne

Variabel A

antal fejl

Variabel B

verbal intelligens.

d (rang A -

J 2

Individuel

værdier

Individuel

værdier

Spearmans rangkorrelationskoefficient beregnes ved hjælp af formlen:

Hvor d - forskellen mellem rækkerne på to variabler for hvert emne;

N- antal rangerede værdier, c. i dette tilfælde antallet af fag.

Lad os beregne den empiriske værdi af r s:

Den opnåede empiriske værdi af r s er tæt på 0. Ikke desto mindre bestemmer vi de kritiske værdier af r s ved N = 10 ifølge tabel. XVI tillæg 1:

Svar: H 0 accepteres. Korrelationen mellem antallet af fejl i en træningssession og niveauet af verbal intelligens adskiller sig ikke fra nul.

Lad os nu prøve at besvare spørgsmålet om, hvorvidt indikatorer for antallet af fejl og nonverbal intelligens er relateret.

Lad os formulere hypoteser.

H 0: Korrelationen mellem antallet af fejl i en træningssession og niveauet af nonverbal intelligens adskiller sig ikke fra 0.

H 1: Korrelationen mellem antallet af fejl i en træningssession og niveauet af nonverbal intelligens er statistisk signifikant forskellig fra 0.

Resultaterne af ranking og sammenligning af ranker er vist i tabel. 6.3.

Tabel 6.3

Beregning d 2 for Spearmans rangkorrelationskoefficient r s ved sammenligning af indikatorer for antallet af fejl og non-verbal intelligens blandt fysikstuderende (N=10)

Emne

Variabel A

antal fejl

Variabel E

nonverbal intelligens

d (rang A -

d 2

Individuel

Individuel

værdier

værdier

Vi husker, at for at bestemme betydningen af ​​r s, er det ligegyldigt, om det er positivt eller negativt, kun dens absolutte værdi er vigtig. I dette tilfælde:

r s em

Svar: H 0 accepteres. Korrelationen mellem antallet af fejl i en træningssession og niveauet af nonverbal intelligens er tilfældig, r s adskiller sig ikke fra 0.

Vi kan dog være opmærksomme på en bestemt tendens negativ sammenhæng mellem disse to variable. Vi kunne muligvis bekræfte dette til et statistisk signifikant niveau, hvis vi øgede stikprøvestørrelsen.

Eksempel 2 - sammenhæng mellem individuelle profiler

I en undersøgelse dedikeret til problemerne med værdiomlægning blev hierarkier af terminale værdier identificeret ifølge M. Rokeachs metode blandt forældre og deres voksne børn (Sidorenko E.V., 1996). Rangerne af terminalværdier opnået under undersøgelsen af ​​et mor-datter-par (mor - 66 år, datter - 42 år) er vist i tabel. 6.4. Lad os prøve at bestemme, hvordan disse værdihierarkier korrelerer med hinanden.

Tabel 6.4

Ranger af terminalværdier i henhold til M. Rokeachs liste i de individuelle hierarkier af mor og datter

Terminalværdier

Rang af værdier i

Rang af værdier i

d 2

mors hierarki

datters hierarki

1 Aktivt aktivt liv

2 Livsvisdom

3 Sundhed

4 Interessant arbejde

5 Naturens og kunstens skønhed

7 Økonomisk sikkert liv

8 At have gode og loyale venner

9 Offentlig anerkendelse

10 Erkendelse

11 Produktivt liv

12 Udvikling

13 Underholdning

14 Frihed

15 Lykkeligt familieliv

16 Andres lykke

17 Kreativitet

18 Selvtillid

Lad os formulere hypoteser.

H 0: Korrelationen mellem mor og datter terminalværdihierarkier er ikke forskellig fra nul.

H 1: Korrelationen mellem mor og datter terminalværdihierarkier er statistisk signifikant forskellig fra nul.

Da rangeringen af ​​værdier antages af selve forskningsproceduren, kan vi kun beregne forskellene mellem rækkerne af 18 værdier i to hierarkier. I 3. og 4. kolonne i tabel. 6.4 præsenterer forskellene d og kvadraterne af disse forskelle d 2 .

Vi bestemmer den empiriske værdi af r s ved hjælp af formlen:

Hvor d - forskelle mellem rangordener for hver af variablerne, i dette tilfælde for hver af terminalværdierne;

N- antallet af variabler, der danner hierarkiet, i dette tilfælde antallet af værdier.

For dette eksempel:

Ifølge tabel. XVI Bilag 1 bestemmer de kritiske værdier:

Svar: H 0 afvises. H 1 accepteres. Korrelationen mellem hierarkierne af terminalværdier for mor og datter er statistisk signifikant (s<0,01) и является положительной.

Ifølge tabel. 6.4 kan vi fastslå, at de vigtigste forskelle forekommer i værdierne "Lykkeligt familieliv", "Offentlig anerkendelse" og "Sundhed", rækken af ​​andre værdier er ret tæt på hinanden.

Eksempel 3 - Korrelation mellem to gruppehierarkier

Joseph Wolpe giver i en bog skrevet sammen med sin søn (Wolpe J., Wolpe D., 1981) en ordnet liste over de mest almindelige "ubrugelige" frygt, som han kalder det, hos det moderne menneske, som ikke bærer en signalere mening og kun forstyrre at leve et fuldt liv og handle. I en hjemlig undersøgelse foretaget af M.E. Rakhova (1994) 32 forsøgspersoner skulle vurdere på en 10-trins skala, hvor relevant denne eller hin type frygt fra Wolpes liste var for dem 3 . Den undersøgte prøve bestod af studerende fra de hydrometeorologiske og pædagogiske institutter i St. Petersborg: 15 drenge og 17 piger i alderen 17 til 28 år, gennemsnitsalder 23 år.

Data opnået på en 10-punkts skala blev beregnet i gennemsnit over 32 forsøgspersoner, og gennemsnittet blev rangeret. I tabel. Tabel 6.5 viser rangeringsindikatorerne opnået af J. Volpe og M. E. Rakhova. Er rangeringssekvenserne for de 20 typer frygt sammenfaldende?

Lad os formulere hypoteser.

H 0: Korrelationen mellem ordnede lister over typer af frygt i de amerikanske og indenlandske prøver adskiller sig ikke fra nul.

H 1: Korrelationen mellem ordnede lister over typer af frygt i de amerikanske og indenlandske prøver er statistisk signifikant forskellig fra nul.

Alle beregninger relateret til beregning og kvadrering af forskellene mellem rækkerne af forskellige typer frygt i to prøver er præsenteret i tabel. 6.5.

Tabel 6.5

Beregning d for Spearman-rangkorrelationskoefficienten ved sammenligning af ordnede lister over typer frygt i amerikanske og indenlandske prøver

Typer af frygt

Rang i amerikansk prøve

Rang på russisk

Frygt for at tale offentligt

Frygt for at flyve

Frygt for at lave en fejl

Frygt for fiasko

Frygt for misbilligelse

Frygt for afvisning

Frygt for onde mennesker

Frygt for ensomhed

Frygt for blod

Frygt for åbne sår

Tandlæges frygt

Frygt for injektioner

Frygt for at tage prøver

Frygt for politiet ^milits)

Frygt for højder

Frygt for hunde

Frygt for edderkopper

Frygt for forkrøblede mennesker

Frygt for hospitaler

Bange for mørket

Vi bestemmer den empiriske værdi af r s:

Ifølge tabel. XVI Appendiks 1 bestemmer vi de kritiske værdier af g s ved N=20:

Svar: H 0 accepteres. Korrelationen mellem ordnede lister over typer af frygt i de amerikanske og indenlandske prøver når ikke niveauet af statistisk signifikans, det vil sige, at den ikke adskiller sig signifikant fra nul.

Eksempel 4 - sammenhæng mellem individuelle og gruppegennemsnitsprofiler

Et udsnit af indbyggere i Sankt Petersborg i alderen fra 20 til 78 år (31 mænd, 46 kvinder), balanceret efter alder på en sådan måde, at personer over 55 år udgjorde 50 % af de 4, blev bedt om at besvare spørgsmålet: "Hvad er udviklingsniveauet for hver af følgende? kvaliteter, der kræves for en stedfortræder for byforsamlingen i St. Petersborg?" (Sidorenko E.V., Dermanova I.B., Anisimova O.M., Vitenberg E.V., Shulga A.P., 1994). Bedømmelsen blev foretaget på en 10-skala. Sideløbende hermed blev en stikprøve af stedfortrædere og kandidater til suppleanter til byforsamlingen i Skt. Petersborg (n=14) undersøgt. Individuel diagnostik af politiske figurer og kandidater blev udført ved hjælp af Oxford Express Video Diagnostic System ved hjælp af det samme sæt personlige egenskaber, som blev præsenteret for et udvalg af vælgere.

I tabel. 6.6 viser gennemsnitsværdierne opnået for hver af kvaliteterne V stikprøve af vælgere ("referenceserier") og individuelle værdier for en af ​​byforsamlingens stedfortrædere.

Lad os prøve at afgøre, hvor meget den individuelle profil af en K-va stedfortræder korrelerer med referenceprofilen.

Tabel 6.6

Gennemsnitlige referencevurderinger af vælgere (n=77) og individuelle indikatorer for K-va-deputeret på 18 personlige egenskaber ved ekspresvideodiagnostik

Kvalitetsnavn

Gennemsnitlige Benchmark Voter Scores

Individuelle indikatorer for K-va stedfortræder

1. Generelt kulturniveau

2. Indlæringsevne

4. Evnen til at skabe nye ting

5.. Selvkritik

6. Ansvar

7. Uafhængighed

8. Energi, aktivitet

9. Bestemmelse

10. Selvkontrol, selvkontrol

I. Vedholdenhed

12. Personlig modenhed

13. Anstændighed

14. Humanisme

15. Evne til at kommunikere med mennesker

16. Tolerance over for andres meninger

17. Fleksibilitet i adfærd

18. Evne til at gøre et positivt indtryk

Tabel 6.7

Beregning d 2 for Spearman-rangkorrelationskoefficienten mellem referencen og individuelle profiler af stedfortræderens personlige egenskaber

Kvalitetsnavn

kvalitetsrangering i referenceprofilen

Række 2: kvalitetsrangering i individuel profil

d 2

1 Ansvar

2 Anstændighed

3 Evne til at kommunikere med mennesker

4 Selvkontrol, selvkontrol

5 Generelt kulturniveau

6 Energi, aktivitet

8 Selvkritik

9 Uafhængighed

10 Personlig modenhed

Og beslutsomhed

12 Indlæringsevne

13 Humanisme

14 Tolerance over for andres meninger

15 Modstand

16 Fleksibilitet i adfærd

17 Evne til at gøre et positivt indtryk

18 Evne til at skabe nye ting

Som det kan ses af tabel. 6.6, varierer vælgernes vurderinger og individuelle stedfortræderindikatorer i forskellige intervaller. Faktisk blev vælgernes vurderinger opnået på en 10-punkts skala, og individuelle indikatorer på ekspresvideodiagnostik måles på en 20-punkts skala. Rangering giver os mulighed for at konvertere begge måleskalaer til en enkelt skala, hvor måleenheden er 1 rang, og den maksimale værdi er 18 ranger.

Rangering, som vi husker, skal udføres separat for hver række af værdier. I dette tilfælde er det tilrådeligt at tildele en lavere rang til en højere værdi, så du med det samme kan se, hvor den eller den kvalitet rangerer med hensyn til vigtighed (for vælgere) eller med hensyn til sværhedsgrad (for en suppleant).

Rangeringsresultaterne er vist i tabel. 6.7. Kvaliteterne er listet i en rækkefølge, der afspejler referenceprofilen.

Lad os formulere hypoteser.

H 0: Sammenhængen mellem den individuelle profil for en K-va suppleant og referenceprofilen konstrueret efter vælgernes vurderinger afviger ikke fra nul.

H 1: Sammenhængen mellem den individuelle profil for en K-va suppleant og referenceprofilen konstrueret efter vælgernes vurderinger er statistisk signifikant forskellig fra nul. Da der i begge sammenlignede rangeringsserier er

grupper af identiske rækker, før man beregner rangkoefficienten

korrelationer skal korrigeres for de samme rækker af Ta og T b :

Hvor A - volumen af ​​hver gruppe af identiske rækker i række A,

b - volumen af ​​hver gruppe af identiske rækker i rækkefølge B.

I dette tilfælde er der i række A (referenceprofil) en gruppe af identiske rækker - kvaliteterne "indlæringsevne" og "humanisme" har samme rang 12,5; derfor, EN=2.

Ta =(23-2)/12=0,50.

I række B (individuel profil) er der to grupper af identiske rækker, mens b 1 =2 Og b 2 =2.

Ta =[(2 3 -2)+(2 3 -2)]/12=1,00

For at beregne den empiriske værdi r s bruger vi formlen

I dette tilfælde:

Bemærk, at hvis vi ikke havde foretaget korrektionen for lige rækker, så ville værdien af ​​r s kun have været (0,0002) højere:

Med et stort antal identiske rækker kan ændringer i r 5 være meget mere signifikante. Tilstedeværelsen af ​​identiske rækker betyder en lavere grad af differentiering af ordnede variable og derfor mindre mulighed for at vurdere graden af ​​sammenhæng mellem dem (Sukhodolsky G.V., 1972, s. 76).

Ifølge tabel. XVI Appendiks 1 bestemmer vi de kritiske værdier af r, ved N = 18:

Svar: Hq afvises. Sammenhængen mellem en K-va-suppleants individuelle profil og den referenceprofil, der opfylder vælgernes krav, er statistisk signifikant (p.<0,05) и является положи­тельной.

Fra tabel. 6.7 er det klart, at K-v suppleanten har en lavere rang på Evne til at kommunikere med mennesker-skalaen og højere rang på Determination og Persistence-skalaen end foreskrevet af valgstandarden. Disse uoverensstemmelser forklarer hovedsageligt et lille fald i de opnåede rs.

Lad os formulere en generel algoritme til beregning af r s.

Korrelationsanalyse er en metode, der gør det muligt at detektere afhængigheder mellem et vist antal tilfældige variable. Formålet med korrelationsanalyse er at identificere en vurdering af styrken af ​​forbindelser mellem sådanne tilfældige variabler eller træk, der karakteriserer bestemte virkelige processer.

I dag foreslår vi at overveje, hvordan Spearman korrelationsanalyse bruges til visuelt at vise kommunikationsformerne i praktisk handel.

Spearman-korrelation eller grundlag for korrelationsanalyse

For at forstå, hvad korrelationsanalyse er, skal du først forstå begrebet korrelation.

På samme tid, hvis prisen begynder at bevæge sig i den retning, du har brug for, skal du låse dine positioner op i tide.


Til denne strategi, som er baseret på korrelationsanalyse, er handelsinstrumenter med en høj grad af korrelation bedst egnede (EUR/USD og GBP/USD, EUR/AUD og EUR/NZD, AUD/USD og NZD/USD, CFD-kontrakter og lignende).

Video: Anvendelse af Spearman-korrelation på Forex-markedet