Løgne, modbydelige løgne og statistik. Løgne, forbandede løgne og statistik

.
Den fulde version af denne aforisme: "Der er tre typer løgne: løgne, forbandede løgne og statistik." (Engelsk)Der er tre slags løgne: løgne, forbandede løgne og statistik). Dets forfatterskab tilskrives forskellige mennesker, og det vandt berømmelse takket være M. Twain efter udgivelsen af ​​"A Chapter of My Autobiography" i North American Review den 5. juli 1907: "Tallene er vildledende," skrev han, " Det har jeg lært af min egen erfaring; Disraeli talte med rette om dette: "Der er tre typer løgne: løgne, forbandede løgne og statistik." Nogle mener, at den oprindelige sætning lød som "Der er en gammel vittighed om, at der er tre slags løgnere: almindelige løgnere, uhyrlige løgnere og videnskabelige eksperter," og først senere begyndte at sige noget lidt anderledes: "Der er tre grader af løgne: løgne, skamløse (åbenbare) løgne og statistik."
Det er usandsynligt, at det er så vigtigt, hvem der er forfatteren til denne aforisme; det vigtige er, at det godt illustrerer situationen med, hvad "ekspert" læger siger til de fleste mennesker med alvorlige (og ikke så alvorlige) sygdomme.

****
I 1992 diagnosticerede læger den berømte amerikanske palæontolog og biolog Stephen Gould med kræft (peritoneal mesotheliom) og rapporterede, at med denne diagnose lever de i gennemsnit i 8 måneder. Gould fik styr på sine affærer, men gav ikke op, men begyndte at gennemgå behandling - operation, kemoterapi og stråling. Og han døde. Om tyve år.
.
To år efter diagnosen blev annonceret i magasinet Discover, publicerede han sin artikel "The Median Isn't the Message", hvori han tydeligt beskrev, hvordan statistikker og konkrete tilfælde fra livet hænger sammen. Den originale tekst er på linket, nedenfor er en næsten komplet oversættelse og så mine kommentarer.

.
Forord til artiklen - S. Dunn (Steve Dunn, skaberen af ​​hjemmesiden http://cancerguide.org, til hvem læger diagnosticerede stadium 4 nyrekræft, hvorefter nyren blev fjernet. Efter en sådan "behandling" ledede han en meget aktiv livsstil i 17 år, blev gift, fik børn, var involveret i bjergbestigning og skiløb, døde i august 2005 af en helt anden sygdom (infektiøs meningitis).

.
Stephen Jay Gould var en indflydelsesrig evolutionsbiolog, underviser ved Harvard University og forfatter til mindst et dusin populære bøger om forskellige videnskabsområder.
Så vidt jeg kan se, er denne artikel den klogeste, mest humane artikel, der nogensinde er skrevet om kræft og statistik. Det er en modgift både til dem, der siger, at "statistikker ikke betyder noget", og til dem, der har for vane at udsige "dødsdomme" over patienter, der står over for dystre prognoser. Enhver, der leder efter svar i den officielle medicinske litteratur, vil finde der "forfærdelige statistikker" for næsten enhver sygdom. Enhver, der læser denne artikel, vil påtage sig håb.

Tro ikke på medianen "The Median er" t det Besked"
.
På det seneste er mit liv konstant blevet illustreret af to berømte vittigheder af Mark Twain. Jeg gemmer en for nu til slutningen af ​​denne artikel, og den anden (nogle gange tilskrevet Disraeli) taler om tre typer løgne, hver værre end den sidste - løgne, forbandede løgne og statistik.
.
Lad os overveje et standardeksempel på at "smøre" sandheden i rum eller tid - hvilket viste sig at være meget relevant for min personlige historie. Statistik genkender forskellige måder at definere "gennemsnit" eller "gennemsnitlig tendens". Vores sædvanlige definitionsbegreb gennemsnits værdi er ret simpelt - sammenlæg værdierne af alle elementerne og divider den resulterende sum med antallet af elementer (100 slik indsamlet af fem børn på Halloween giver 20 slik til hvert barn i denne ideelle verden). - et andet mål for den gennemsnitlige tendens, er værdien af ​​funktionen i midten af ​​grafen. Hvis jeg for eksempel rangerer fem børn efter højde, vil det mellemste barn være kortere end de to foregående og højere end de næste to (dog kan disse to små børn have problemer med at dele slik i en gruppe med længere børn...).
.
En anden måde at illustrere dette på er, at en politisk leder måske stolt fremsætter udtalelsen: "Vores borgeres gennemsnitlige indkomst er 15.000 dollars om året", som en oppositionsleder kan svare til: "Men halvdelen af ​​vores borgere har en reel indkomst på mindre end 10.000 $ om året." Og de vil begge have ret, selvom ingen af ​​dem bruger statistik med lidenskabsløs objektivitet. Den første taler om aritmetisk gennemsnit , anden - o median (det aritmetiske gennemsnit er større end medianen i sådanne tilfælde, fordi én millionær kan opveje hundredvis af fattige, når man beregner gennemsnittet, men han kan kun opveje én fattigmand, når man beregner medianen).
.
Jo vigtigere (dybere, farligere, vanskeligere osv.) spørgsmålet er, jo større mistillid og foragt for statistik, når man overvejer det. Mange mennesker tillader en tragisk og uacceptabel kløft mellem deres hjerte og sind, deres følelser (fornemmelser) og deres intellekt. I nogle moderne traditioner lægges der tværtimod for meget vægt på følelser som grundlag for handling, mens intellektet er henvist til baggrunden som et "forældet værktøj". Statistik betegnes ofte som "fjenden" i denne absurde dikotomi.
.
Denne artikel er en personlig historie om venskab med korrekt fortolket statistik, der er inspirerende og giver håb. Dette er en kort historie om nytten af ​​upartisk videnskabelig viden og det faktum, at hovedet og hjertet er koordinatorer for handlingerne i én krop, én person.
.
I juli 1982 lærte jeg, at jeg havde , en sjælden og alvorlig form for kræft. Da jeg kom ud af anæstesien efter operationen, var mit første spørgsmål til lægen og kemoterapilægen: “Hvad er den bedste litteratur om lungehindekræft?” Hvortil jeg fik et svar med en klar diplomatisk overtone, at der ikke stod noget i den medicinske litteratur, der var virkelig værd at læse.
.
Nå, selvfølgelig er det lige så effektivt at råde en videnskabsmand til at holde sig væk fra bøger som at råde homo sapiens til at være kysk og afholde sig fra sex. Så snart jeg kunne gå, gik jeg direkte til Harvard Medical Library og skrev en forespørgsel på computeren om alt, . En time senere, omgivet af al tilgængelig litteratur om abdominal lungehindekræft, forstod jeg, hvorfor min læge havde givet mig så humane råd. I al den litteratur, jeg fandt, kunne informationen ikke være mere entydig: Mesotheliom er uhelbredelig, med en gennemsnitlig dødelighed på kun otte måneder efter diagnosen. i cirka femten minutter, så smilede han og sagde til sig selv: så derfor vil de ikke lade mig læse noget! Gudskelov, så begyndte mit sind at virke igen.
.
Jeg stødte på et klassisk eksempel på hvornår " Og det har direkte betydning for kampen mod kræft. Måske fordi vores mentale tilstand "føder" immunsystemet, men mennesker med samme type kræft, forskellige i alder, social klasse, betingelser for at modtage lægehjælp generelt - har en positiv holdning til livet, en stærk vilje og livsmål - og leve længere, vil de helt sikkert kæmpe eller i det mindste lede efter veje ud af sygdommen, og ikke bare passivt acceptere alt, som læger siger. Et par måneder senere spurgte jeg Medawar Sir, min personlige videnskabelige guru og nobelprisvinder i immunologi, hvad der kunne være den bedste opskrift på succes mod kræft? "Personlighed af en sangvinsk person," svarede han kort. Heldigvis (da du ikke kan ændre dig selv på kort tid og med ét specifikt mål), har jeg altid været en afbalanceret og selvsikker person med netop denne type karakter.
.
Dette rejser et dilemma for læger: når alt kommer til alt, hvis en persons personlige holdning til, hvad der sker med ham, er så vigtig, hvorfor så lave så dystre konklusioner (forudsigelser? ..), især når kun få mennesker har tilstrækkelig forståelse for principperne for statistik at vurdere hvad Faktisk betyder dette eller hint udsagn? Personligt havde jeg denne forståelse, og jeg er overbevist om, at dette spillede en vigtig rolle i at redde mit liv. Viden er reel kraft!
.
Kort sagt kan det første (og måske det vigtigste) spørgsmål være: hvad betyder udtrykket "median dødelighed er otte måneder"? Jeg formoder, at de fleste mennesker uden stor statistisk viden ville oversætte denne sætning til "Jeg er nok død om otte måneder" - hvilket netop er den springende konklusion, der bør undgås, fordi... Selve holdningen til situationen og prognoserne er af stor betydning.
Jeg var selvfølgelig ikke overlykkelig, men sådan tolkede jeg heller ikke dataene. Min tekniske baggrund tillod mig at have et andet perspektiv på den "otte måneders mediale dødelighedsrate."
.
Vi bærer stadig den historiske byrde af Platons arv, idet vi stræber efter en forklaring på alt, efter klare definitioner og distinktioner, og forsøger således for eksempel at finde en entydig "begyndelse af livet" eller en præcis definition af døden, selvom naturen ofte ser ud til at os som et kontinuum med en glidende overgang af den ene til den anden. Denne platoniske arv, med dens vægt på klare distinktioner og adskillelse af udelelige, fører os til falske skøn over statistiske data. Kort sagt opfatter vi middelværdien og medianen som en hård "virkelighed", og tværtimod tager vi ikke højde for en hel række forskellige variabler og målingens ufuldkommenheder. Hvis du blot tager medianen som en given ting og overvejer, hvad der er omkring den for en dybere analyse og beregning, så kan fortolkningen "Jeg er nok død om otte måneder" miste sin relevans. (den modsatte situation er i øvrigt også mulig - E.M.)
.
Men alle evolutionsbiologer, som jeg også er af, ved, at det er variationen af ​​visse parametre, der er den uforanderlige essens af alt levende. Det er forandringer, variationer af det samme, der er den barske virkelighed. Den statistiske middelværdi og median er blot abstraktioner. Så jeg så på lungehindekræftstatistikken på en helt anden måde – og ikke kun fordi jeg er en optimist, der stræber efter at se selve doughnutsen i stedet for hullet, men først og fremmest fordi jeg ved, at kun variation er virkelighed. Og jeg var nødt til at placere mig blandt disse forskellige variationer.
.
Da jeg lærte om medianen på otte måneder, var min første intellektuelle reaktion, "fantastisk, halvdelen af ​​mennesker lever længere end de otte måneder. Hvad med mine chancer for at komme ind i denne halvdel? Efter en times nervøse og hektiske beregninger kom jeg lettet frem til konklusionen: mine chancer er pokkers gode. Jeg havde hver af de egenskaber, der gør mig mere tilbøjelig til at leve længere: Jeg var ung; min sygdom blev diagnosticeret på et relativt tidligt tidspunkt; Jeg kan få bedre medicinsk behandling; Jeg vil leve; Jeg ved, hvordan jeg skal fortolke dataene korrekt, og jeg er ikke modløs.
.
Et andet teknisk problem gav mig også endnu mere komfort. Jeg indså straks, at den faktiske fordeling af variationen ved "8-måneders medianen" næsten helt sikkert ville være, hvad statistikere kalder "højre skæv" (med en symmetrisk fordeling er profilen af ​​grafen til venstre for medianen et spejlbillede af profilen til højre; med skævhed er fordelingen på den ene halvdel mere "aflang" ).
.

.
Jeg begrundede, at i tilfældet med mit lungehindekræft skulle grafen have haft en højre skævhed (positiv skævhed), fordi den del af grafen til venstre for medianen trods alt kun beskriver de tilfælde, hvor lungehindekræft diagnosticeres enten posthumt eller kort tid før en persons død. Der er således ikke mange muligheder for at falde inden for dette interval, da det kun er mellem nul og otte måneder. Men den øverste (eller højre) halvdel kan strække sig i mange år, selvom ingen af ​​de diagnosticerede personer i sidste ende overlever. Fordelingen skal have præcis denne skævhed, og jeg skal vide, hvor langt grafens "hale" er placeret - for jeg er allerede nået frem til, at min gunstige "patientprofil" gjorde mig til en god kandidat til denne halvdel af skemaet.
.
Fordelingen er faktisk stærkt forvrænget til højre; den har en lang "hale", omend ikke så stor i amplitude, men strækker sig adskillige år ud over medianen på otte måneder. Jeg så ikke længere nogen grund til, hvorfor jeg ikke skulle være i denne hale, og jeg tog et meget langt lettelsens suk. Min tekniske viden hjalp mig også denne gang. Jeg læste skemaet rigtigt. Jeg stillede det rigtige spørgsmål og fandt svarene. Jeg modtog efter al sandsynlighed den mest værdifulde af alle mulige gaver under eksisterende forhold - betydelig tid. Intet holdt mig tilbage, og intet kunne tvinge mig til straks at følge Esajas' ord til Ezekias - "Sørg for dit hus, for du skal dø og ikke leve!"
.
En ting mere om statistiske fordelinger: den nuværende "officielle" graf gælder kun for et meget specifikt sæt omstændigheder og viser overlevelsesraten for lungehindekræft under konventionelle behandlingsregimer. Men hvis omstændighederne ændrer sig, kan fordelingen også ændre sig. Jeg fik ordineret en eksperimentel behandlingsprotokol, og hvis Fortune smiler, vil jeg være i den første gruppe af en ny fordeling med en høj median og den højre "hale" af grafen, som varer indtil døden af ​​naturlige årsager i høj alder.
.
Efter min mening er det blevet for moderne at betragte accept af døden for at være ensbetydende med indre værdighed. Jeg er selvfølgelig enig i Prædikenernes prædikener i, at "der er en tid til at elske og en tid til at dø", og når min livskilde løber tør, håber jeg at møde min afslutning roligt og med værdighed. I de fleste tilfælde foretrækker jeg dog at have en anden opfattelse, nemlig at livet skal kæmpes for.
.
Valget af våben i denne kamp er meget bredt, men intet er mere effektivt end humor. Min død blev annonceret på et møde med mine kolleger i Skotland, og jeg havde stor glæde af at læse min egen nekrolog, skrevet af en af ​​mine bedste venner (det kan i øvrigt næppe betragtes som en ulykke, at han er statistiker og at han troede på min uundgåelige død, fordi jeg ikke forventede at finde mig så langt i den rigtige "hale" af ovenstående graf). Denne hændelse var dog den første, der gav mig en chance for at grine efter at have hørt min diagnose. Tænk bare, jeg gentog næsten en anden berømt aforisme af M. Twain: "rygter om min død er stærkt overdrevne."

Efterord af S. Dunn
.
Desværre døde S. Gould i maj 2002 i en alder af 60 år, men han levede yderligere tyve meget produktive år efter sin diagnose og oversteg dermed den "statistiske" otte måneders median overlevelsesrate med tredive gange! Selvom han døde af kræft, var det ikke den samme mesotheliom, men en helt anden type.
I marts 2002 udgav Dr. Gould sin 1.342 sider lange bog, Opus Magnum - The Structure of Evolutionary Theory. Og det virker meget logisk, at Dr. Gould, en af ​​verdens mest produktive videnskabsmænd og forfattere, var i stand til at færdiggøre den endelige beretning om sine videnskabelige aktiviteter og beretningen om sin filosofi lige i tide. Denne bog er for lang for den almindelige person – men S. D. Goulds arbejde vil leve videre. Især, håber jeg, artiklen " DetMedianer"tdetBesked".

***********
Faktisk vil der praktisk talt ikke være nogen kommentarer fra mig til denne artikel - hverken om "eksperimentelle behandlingsprotokoller" eller om "lægers profetier" - der er allerede meget materiale om dette i min LiveJournal. Men der kommer separate indlæg om, at statistik ofte bliver tolket fuldstændig "skævt".
.
Jeg vil bare bemærke, at det ikke er tilfældigt, at Dr. Gould i denne artikel nævnte udtrykket "patientprofil" - da han også brugte ordene "sangvinsk personlighed", har dette at gøre med psykologi, og ikke kun med en persons økonomiske tilstand eller hans sociale status. Intet sker tilfældigt i denne verden. For et par dage siden så jeg et indlæg på LiveJournal med titlen "The Role of Personality in Oncology", hvor links blev givet til eksperimenter (ja, de samme statistikker), og den endelige konklusion var, at denne rolle er "for overdrevet." Men uanset hvor meget individuelle borgere ønsker at isolere sig fra deres psyke (fra deres personlighed), uanset hvor meget de ønsker at tro, at sygdommen "kommer ned fra et sted ovenfra af årsager uden for min kontrol", og kommenterer alt dette med ord som "Jeg har allerede fået nok af det." alle disse troende på kræftens psykologiske natur" - du kan ikke smide ordene ud af sangen - du kan ikke løbe væk fra dig selv.
.
Men næste indlæg handler om dette.
.
Være sund. Lev med humor.

Mark Twain

Sandsynlighedslærens love er ikke abstrakte, men udtrykker matematisk de virkelige mønstre af massetilfældige naturfænomener.

Udviklingen af ​​metoder til registrering, beskrivelse og analyse af statistiske eksperimentelle data opnået som følge af observation af massetilfældige fænomener er genstand for MATEMATISK STATISTIK.

1

Bestemmelse af fordelingsloven for en stokastisk variabel ud fra statistiske data.

Da vi i praksis har at gøre med en begrænset mængde eksperimentelle data, vil resultaterne af observationer altid indeholde et element af tilfældighed.

Derfor opstår opgaven med at udjævne statistiske data og beskrive dem ved hjælp af simple analytiske afhængigheder.

2

Test af plausibilitet af hypoteser.

Denne opgave er relateret til den forrige. For eksempel kan den besvare spørgsmålet: er resultaterne af et eksperiment i overensstemmelse med hypotesen om, at den stokastiske variabel adlyder en given fordelingslov?

3

Bestemmelse af ukendte parametre fordeling

Ofte er det nødvendigt at bestemme ikke selve loven om SW-fordeling på basis af eksperimentelle data, men nogle numeriske karakteristika. I et lille antal eksperimenter bestemmes kun "estimerede" værdier af disse parametre, dvs. sådanne omtrentlige værdier, der i gennemsnit fører til mindre fejl end

Marketingafdelingen på en tøjfabrik gennemførte en undersøgelse blandt 100 kunder. Blandt undersøgelsens spørgsmål var spørgsmål om herredragter. Behandling af spørgeskemaerne gav følgende resultater om præferencer:

Efter fremstillingssted: 40% - indenlandsk, 60% - importeret.

2. Efter pris i amerikanske dollars:

« Løgne, forbandede løgne og statistik"(fulde version: Der er tre typer løgne: løgne, forbandede løgne og statistik., Engelsk Der er tre slags løgne: løgne, forbandede løgne og statistik ) - en erklæring tilskrevet den britiske premierminister Benjamin Disraeli, og den blev berømt takket være Mark Twain efter offentliggørelsen af ​​"A Chapter of My Autobiography" i North American Review den 5. juli 1907: "Tall er vildledende," skrev han. , "Jeg er overbevist om dette af personlig erfaring; Disraeli talte med rette om dette: "Der er tre typer løgne: løgne, forbandede løgne og statistik." Denne sætning optræder dog ikke i Disraelis værker. Hun var heller ikke kendt hverken i hans levetid eller kort efter hans død. Fra moderne idéers synspunkt er den mest sandsynlige kandidat til forfatterskab Charles Dilk (1843-1911).

Dette ordsprog er blevet tilskrevet mange andre end Disraeli: journalisten og politikeren Henry Labouchere (1831-1912) og Leonard Courtenay (1832-1918), som brugte udtrykket i 1895. To år senere blev han præsident for Royal Statistical Society.

Det er nu kendt, at den første brug af sætningen var i et brev skrevet den 8. juni 1891 og offentliggjort den 13. juni 1891 i National Observer (s.93(-94): NATIONAL PENSIONS London, 8. juni, 1891) : "Herre, ... meget vittigt observeret, "at der er tre typer løgne: den første er usandhed, den anden er direkte løgn, og endelig er det værste statistik." Lidt senere, i oktober 1891, sendte en person under pseudonymet "St Swithin" i tidsskriftet Notes and Queries et spørgsmål om forfatterskabet af denne sætning, hvilket indikerer dens udbredte brug allerede i disse dage. I oktober 1891 brugte Charles W. Dilke, uden nogen tilskrivning, denne udtalelse to gange. "Sir Charles Dilke (1843-1911) sagde forleden, at efter hans mening kan 'løgne' klassificeres i stigende grad som: hvide løgne, løgne og statistik" (The Bristol Mercury and Daily Post, mandag den 19. oktober 1891 G. ). Dr. E.R.L. Gould, der brugte sætningen i 1892, citerede også Charles Dilkes forfatterskab: "Sir Charles Dilke havde i en vis forstand ret, da han sagde: 'Der er tre niveauer af løgne - fiktion, løgne og statistik...'."

Som Robert Giffen (assistentredaktør af The Economist og 1882-84 præsident for Statistical Society) nævner i 1892, er udsagnet "om statistik" kun en fortolkning af sætningen "Der er en gammel vittighed om, at der er tre slags løgnere: almindelige bedragere, uhyrlige løgnere og videnskabelige eksperter. Senere begyndte de at sige tingene lidt anderledes: Der er tre grader af løgne: løgne, skamløse løgne og statistik.” .

Oprindelsen af ​​originalen ("om eksperter") tilskrives en tidligere periode end udsagnet "om statistik", nemlig i tidsskriftet Nature dateret 26. november 1885 (bemærk at Disraeli allerede var død på dette tidspunkt) på side 74. finde: "... Det faldt en velkendt advokat, der i øjeblikket er dommer, ind at opdele vidner i tre grupper: simple løgnere, forbandede løgnere og eksperter."

Noter


Wikimedia Foundation. 2010.

Se, hvad "Løgn, åbenlyse løgne og statistik" er i andre ordbøger:

    Den mest nøjagtige af alle pseudovidenskaber. Jin Ko-statistikker kan bevise alt, selv sandheden. Noel Moynihan Statistik er videnskaben om, hvordan du uden at være i stand til at tænke og forstå kan få tal til at gøre det. Vasily Klyuchevsky Statistik er som en badedragt...

    Der er fire typer løgne: løgne, forbandede løgne, statistik og citater. Du skal ikke lyve skamløst; men nogle gange er undvigelse nødvendig. Margaret Thatcher Tro kun på halvdelen af ​​det du ser og intet af det du hører. engelsk ordsprog... ... Konsolideret encyklopædi af aforismer

    Histogram (metode til grafiske billeder) Dette udtryk har andre betydninger, med ... Wikipedia

    Statistikker- (Statistik) Statistik er en generel teoretisk videnskab, der studerer kvantitative ændringer i fænomener og processer. Statsstatistikker, statistiske tjenester, Rosstat (Goskomstat), statistiske data, forespørgselsstatistik, salgsstatistik,... ... Investor Encyclopedia

    - (1835 1910) Den amerikanske forfatter Hell er det eneste virkelig betydningsfulde kristne samfund i universet. En bankmand er en person, der vil låne dig en paraply på en solskinsdag og tage den væk i det øjeblik, det begynder at regne. Bill... ... Konsolideret encyklopædi af aforismer

    Citat: forkert gentagelse af en andens ord. Ambrose Bierce-citat er en risiko under andres ansvar. Vladislav Grzeszczyk Hvis du bliver citeret, er du allerede nogen. Hvis nogen stjæler fra dig, er du en fremragende person. Men ægte herlighed begynder først, når du... Konsolideret encyklopædi af aforismer

    Garry Kasparov Garry Kimovich Kasparov Garry Kasparov, 2007 Fødselsdato: 13. april 1963 (46 år) Fødested ... Wikipedia

Der er et meget "skægget" ordsprog. Du har sikkert hørt hende. Så…

Der er tre typer løgne:

  1. Slem løgn
  2. Statistikker

Normalt på dette tidspunkt siger de ordet "skovl", og alle griner. Men lad os se på de fakta, der lige nu blinker i de seneste nyheder.

Fakta #1

"Levada-Center" gennemførte en social undersøgelse (russere i alle aldre blev undersøgt), som viste det det mest populære sociale netværk i vores land er Odnoklassniki. Den består ca 76 % af de adspurgte.

Fedt nok! Vi løber hurtigt for at åbne en konto der! For dem, der er i tanken, er hvordan man registrerer sig hos Odnoklassniki beskrevet meget detaljeret på akak.ru på linket. Dette er et websted, der indeholder instruktioner om, hvordan man gør hvad.

Men disse er, som du forstår, statistikker leveret af Levada Center.

Faktum #2

  • Det mest populære netværk ifølge deres data er VKontakte. Kommer ind i det 38 millioner besøgende Per dag.
  • Odnoklassniki har 30 millioner besøgende.
  • "Min verden" - 16 mio.

Spørgsmål #1: Hvem skal man tro?

Fordi det er en statistik tredje slags løgn, så kan du ikke stole på nogen. Hvordan kan du beregne populariteten af ​​et socialt netværk udelukkende baseret på indirekte data?

Undersøgelse. Hvad viste han? Kun fokusgruppepræferencer.

Hvor blev hun udvalgt? Hvordan blev du interviewet? I hvilken region? Sagde de sandheden?

Ifølge meningsmålinger bruger 100% af russerne internettet! Undersøgelsen er foretaget på hjemmesiden.

Antal besøgende pr. dag. Hvad viser det?

Forestil dig den gennemsnitlige kontormedarbejder. Han har VKontakte installeret på sin telefon, han tager dertil fra arbejde og så om aftenen hjemmefra. Dette er allerede 3 besøgende med forskellig IP, browser osv.

Samtidig har Odnoklassniki en ældre målgruppe. Det betyder, at mobilapplikationer og adgang fra kontoret er lukket for dem.

Worpos #2: Hvad skal man gøre med disse oplysninger?

Konklusion nr. 1- Du kan ikke stole blindt på statistik!

Konklusion nr. 2— Det er klart, at de mest populære sociale netværk er VKontakte og Odnoklassniki. Jeg tror, ​​at LJ (selvom de er "sociale medier") også er i top tre.

Konklusion nr. 3— Hvis du har noget at fortælle eller tilbyde folk, skal du oprette konti på de mest populære sociale netværk. Du kan bestemt ikke gå galt.

Efterord

Som slagordet fra Dr. House (tv-serien "Dr. House") siger: "...Alle lyver...". Husk dette.

Og Doktor Lexium var med dig
Husk, at behovet for at tænke med dit eget hoved endnu ikke er aflyst.

Webstedet fandt ud af, hvad procentdelen af ​​statistisk dataforfalskning er i videnskabelige artikler om psykologi, hvilke fejl der blev afsløret af verifikationsprogrammet, og hvordan det ligner T9.

Programmer kan ikke kun postmoderne sangtekster, en sti på Londons undergrund, simulere processer i en bank, men også lede efter fejl i uærlige eller uopmærksomme psykologers arbejde. webstedet fortæller, hvordan en computer identificerer unøjagtigheder i videnskabelige artikler, og hvad dette kan føre til.

Den moderne psykologis glans og fattigdom

Ved at balancere mellem "hverdagsvisdom" og filosofiske og metafysiske kategorier på en tynd tråd af konsistente data, er "sjælens videnskab" konstant i fare for udskejelser. Det har aldrig været let at grave ind i menneskers indre verden (hvis du ikke overvejer den anatomiske side af problemet), så psykologers forskning er svær at verificere. Med et meget subjektivt studiefag skærer psykologi i nogle af dens grene og sektioner med medicin og neurobiologi, og i andre går ud over det videnskabelige: selv Doktor i psykologi og vicedirektør for Institut for Psykologi ved Det Russiske Videnskabsakademi Andrei Yurevich definerede psykologiens plads mellem videnskab og paravidenskab. Selv når de anvendes i overensstemmelse med alle regler for videnskabelig metodologi, giver psykologiske tilgange nogle gange ikke tilfredsstillende resultater. Hvis man i et mere omhyggeligt og langsigtet arbejde med én person kan antage sagens unikke karakter og konstatere, at det er umuligt at ekstrapolere konklusioner til alle mennesker, så er det i en stor gruppe svært at forstå, hvad samlede spørgsmål og svar egentlig betyder. for hver deltager i undersøgelsen. Derudover kan forsøgspersoner altid have interne grunde til at skjule nogle oplysninger og besvare spørgsmål ikke helt ærligt. Derfor kan refleksion (vende en persons opmærksomhed indad) ikke betragtes som et værktøj, der gør det muligt at opnå absolut pålidelig information. om en computeralgoritme, der identificerede potentielle fejl i næsten otte tusinde psykologiske artikler (og dette kun i perioden fra 1985 til 2013 og kun i otte videnskabelige psykologiske tidsskrifter) fungerede som en pind, der satte gang i en gedehamsebo, der allerede var urolig på grund af konstant kontrovers . Under ledelse af Michelle Nuyten blev 30.717 artikler analyseret, hvoraf 16.695 brugte statistiske data. Halvdelen af ​​disse papirer havde mindst én formodet statistisk fejl, der blev påpeget af programmet.

Når der gennemføres en undersøgelse af en stor gruppe af emner, anvendes statistiske metoder til bearbejdning. Det populære ordsprog "der er tre slags løgne: løgne, forbandede løgne og statistikker", hvis forfatterskab er så vagt, at Mark Twain for mere end hundrede år siden tilskrev det til Benjamin Disraeli (men var ikke længere sikker på, hvor det faktisk kom fra) , er ikke så langt fra sandheden. Inden for menneskelig viden, hvor det er så svært at skabe teorier med pålidelig forudsigelseskraft (husk den samme Sigmund Freud eller Alfred Adler), er risikoen for utilsigtede fejl og fristelsen til bevidst at "justere" det faktiske resultat til det ønskede resultat. er ret høj.

Hvordan en computer tog uærlige psykologer på fersk gerning

Programmet, der bekræftede gyldigheden af ​​denne ironiske observation, hedder Statcheck. Den analyserer P-værdien, en mængde, som forskere bruger til at teste statistiske hypoteser. Denne figur viser, hvor sandsynligt resultatet er, hvis nulhypotesen, der ligger til grund for undersøgelsen, er sand. Papiret, som blev offentliggjort i tidsskriftet Behavior Research Methods, viser, at programmet vurderede validiteten af ​​mere end 258.000 p-værdier (omtrent 11 pr. videnskabelig artikel) på to timer, og fandt ud af, at 13 % af papirerne indeholdt en fejl, der "vendt" modtagne data. Som et resultat, for eksempel, P< 0,05 превращается в P = 0,05, или некоторые знаки после запятой просто отбрасываются, а не влияют на следующий знак по правилам округления чисел. Казалось бы, такое маленькое различие не должно серьезно влиять на результат, однако чаще всего P = 0,05 принимается как пограничное значение между статистически достоверным и недостоверным результатом. В итоге малейшее отклонение в одну или в другую сторону делает вывод в статье ложноположительным или ложноотрицательным.

I starten arbejdede programmet med litteratur generelt, men en af ​​undersøgelsens medforfattere, Chris Hartgerink, specialist i videnskabelig metode fra Tilburg University (Holland), foreslog at fokusere på mere specifikke tekster – videnskabelige artikler. Senere, i august i år, uploadede han 50.000 artikler til verifikation og postede resultaterne på Pub Peer (et forum for forskere, hvor de ofte diskuterer offentliggjorte videnskabelige artikler), hvilket forårsagede en enorm resonans i det professionelle samfund. Ifølge Hutgerink vil sådanne indlæg informere forfattere om mulige fejl og "vil bringe meget mere fordel for videnskaben end blot et datadump." Ikke alle er enige med ham, som Monia Bakers diskussionsartikel i Nature beretter. Nogle videnskabsmænd, herunder repræsentanter for den tyske psykologforening, advarer om, at falske negative resultater (her mener vi en computer, der retter korrekte data for forkerte) kan skade videnskabsmænds omdømme i stedet for at hjælpe udviklingen af ​​psykologi som en videnskab. Den administrerende direktør for Association for Psychological Science i Washington reagerede på publikationen ved at sige, at han fordømte den "endemiske bagvaskelse" af psykologer på blogs og sociale medier, hvilket gjorde det klart, at offentliggørelse af resultaterne af en computeranalyse med mulige fejl bør betragtes som en fornærme.

Statcheck og P-værdi: hvem er i brændkammeret, hvem er i toppen?

På den anden side fremmer sådanne indlæg begrebet åben videnskab (i øvrigt har både Nuyten og Hartgerink priser fra organisationer, der tilskynder til udviklingen af ​​dette felt), hvilket vil gøre det muligt at finde og korrigere statistiske unøjagtigheder hurtigere. Ifølge Nick Brown, en psykologisk videnskabsmand ved University of Groningham i Holland, vil sådanne algoritmer kun hjælpe, hvis forskere læser dem og vurderer dem fra eksperters synspunkt, snarere end blot at være mistroisk over for et tidsskrift, der udgav tvivlsomme artikler med fejl.

I øjeblikket har flere tusinde mennesker, inspireret af denne mulighed, downloadet dette program, skrevet i programmeringssproget R, gratis.

Statcheck kan dog selv lave fejl, som Thomas Schmidt slår fast i sin kritik af programmet. For eksempel tager den ikke altid højde for de nødvendige statistiske fejl og kan nogle gange ikke forstå, om P-værdien eller den relative parameter er forkert i artiklen. Efter at have scannet to artikler med en masse statistiske data fandt han ud af, at programmet ikke kunne evaluere 43 parametre, kontrollerede 137 og identificerede 35 som "potentielt forkerte." To af disse var fejl, der ikke påvirkede resultatet, tre var fejl i andre parametre, der ikke var relateret til P-værdien, og de resterende 30 var resultatet af "falske alarmer."

Nogle psykologiske tidsskrifter er endda begyndt at opgive p-værdien til at teste validiteten af ​​hypoteser, idet de anser denne parameter for at være utilstrækkelig pålidelig.

Skaberne selv benægter ikke, at deres program "aldrig vil være så nøjagtigt som at kontrollere manuelt", men de understreger hastigheden af ​​dets arbejde: hvis det tager omkring ti minutter at kontrollere pålideligheden af ​​P-værdien af ​​en gennemsnitlig psykologisk artikel, så kan programmet klare dusinvis af tusinder i løbet af få timer, hvilket er uundværligt for at udføre en metaanalyse eller indledende verifikation af artikler sendt til redaktører af videnskabelige tidsskrifter. Redaktionen af ​​tidsskriftet Psychological Science har brugt det i denne egenskab siden juli i år. De sammenligner dette program med Word- eller T9-korrekturlæsere, hvis absurditet alle griner af, men få ville gå med til at give op. Ligesom disse auto-korrektorer kan Statcheck efter deres mening betragtes som "et praktisk værktøj, der nogle gange siger dumme ting."