Løgn, sjofel løgn og statistikk. Løgn, jævla løgn og statistikk

.
Den fullstendige versjonen av denne aforismen: "Det er tre typer løgner: løgner, fordømte løgner og statistikk." (Engelsk)Det er tre typer løgner: løgner, fordømte løgner og statistikk). Dens forfatterskap tilskrives forskjellige mennesker, og den fikk berømmelse takket være M. Twain etter publiseringen av "A Chapter of My Autobiography" i North American Review 5. juli 1907: "Tallene er villedende," skrev han, " Jeg har lært dette av egen erfaring; Disraeli snakket med rette om dette: "Det er tre typer løgner: løgner, fordømte løgner og statistikk." Noen mener at den opprinnelige frasen hørtes ut som "Det er en gammel vits om at det er tre typer løgnere: vanlige løgnere, opprørende løgnere og vitenskapelige eksperter," og begynte først senere å si noe litt annerledes: "Det er tre grader av løgner: løgner, skamløse (åpenbare) løgner og statistikk."
Det er usannsynlig at det er så viktig hvem som er forfatteren av denne aforismen.

****
I 1992 diagnostiserte leger den berømte amerikanske paleontologen og biologen Stephen Gould med kreft (peritoneal mesothelioma) og rapporterte at personer med denne diagnosen lever i gjennomsnitt i 8 måneder. Gould ordnet sakene sine, men ga seg ikke, men begynte å gjennomgå behandling - kirurgi, cellegift og stråling. Og han døde. Om tjue år.
.
To år etter at diagnosen ble kunngjort i magasinet Discover, publiserte han artikkelen sin "The Median Isn't the Message", der han tydelig beskrev hvordan statistikk og spesifikke tilfeller fra livet forholder seg. Den originale teksten er på lenken nedenfor nesten fullstendig oversettelse og så mine kommentarer.

.
Forord til artikkelen - S. Dunn (Steve Dunn, skaperen av nettstedet http://cancerguide.org, til hvem leger diagnostiserte stadium 4 nyrekreft, hvoretter nyren ble fjernet. Etter en slik "behandling" ledet han en veldig aktiv livsstil i 17 år, giftet seg, fikk barn, var involvert i fjellklatring og ski. Døde i august 2005 av en helt annen sykdom (smittsom hjernehinnebetennelse).

.
Stephen Jay Gould var en innflytelsesrik evolusjonsbiolog, foreleser ved Harvard University og forfatter av minst et dusin populære bøker om ulike vitenskapsfelt.
Så vidt jeg kan se, er denne artikkelen den klokeste, mest humane artikkelen som noen gang er skrevet om kreft og statistikk. Det er en motgift både til de som sier at "statistikk ikke betyr noe" og til de som har for vane å uttale "dødsdommer" over pasienter som står overfor alvorlige prognoser. Alle som leter etter svar i den offisielle medisinske litteraturen vil finne "forferdelig statistikk" for nesten enhver sykdom. Alle som leser denne artikkelen vil ta på seg håp.

Ikke tro medianen "The Median Er n" t de Beskjed"
.
I det siste har livet mitt blitt konstant illustrert av to kjente vitser av Mark Twain. Jeg skal spare en for nå til slutten av denne artikkelen, og den andre (noen ganger tilskrevet Disraeli) snakker om tre typer løgner, hver verre enn den forrige - løgner, fordømte løgner og statistikk.
.
La oss vurdere et standardeksempel på å "smøre" sannheten i rom eller tid - som viste seg å være veldig relevant for min personlige historie. Statistikk gjenkjenner forskjellige måter å definere "gjennomsnittlig" eller "gjennomsnittlig tendens". Vårt vanlige definisjonsbegrep gjennomsnittlig verdi er ganske enkelt - legg sammen verdiene til alle elementene og del den resulterende summen med antall elementer (100 godteri samlet av fem barn på Halloween gir 20 godteri til hvert barn i denne ideelle verdenen). - et annet mål på gjennomsnittlig tendens, er verdien av funksjonen i midten av grafen. Hvis jeg for eksempel rangerer fem barn etter høyde, vil det mellomste barnet være kortere enn de to foregående og høyere enn de to neste (dog kan disse to lave barna ha problemer med å dele godteri i en gruppe med lengre barn...).
.
En annen måte å illustrere dette på er at en politisk leder kan stolt komme med uttalelsen: «Gjennomsnittsinntekten til våre innbyggere er $15 000 i året», som en opposisjonsleder kan svare til, «Men halvparten av våre innbyggere har en reell inntekt på mindre enn 10 000 dollar i året." Og de vil begge ha rett, selv om ingen av dem bruker statistikk med lidenskapelig objektivitet. Den første snakker om aritmetisk gjennomsnitt , andre - o median (det aritmetiske gjennomsnittet er større enn medianen i slike tilfeller fordi én millionær kan veie opp for hundrevis av fattige når man beregner gjennomsnittet, men han kan bare veie opp for én fattig når man beregner medianen).
.
Jo viktigere (dypere, farligere, vanskeligere osv.) spørsmålet er, jo større mistillit og forakt for statistikk når man vurderer det. Mange mennesker tillater et tragisk og uakseptabelt gap mellom deres hjerte og sinn, deres følelser (sensasjoner) og deres intellekt. I noen moderne tradisjoner er det tvert imot lagt for mye vekt på følelser som grunnlag for handling, mens intellektet er henvist til bakgrunnen som et «utdatert verktøy». Statistikk blir ofte kalt "fienden" i denne absurde todelingen.
.
Denne artikkelen er en personlig historie om vennskap med riktig tolket statistikk som er inspirerende og gir håp. Dette er en kort historie om nytten av objektiv vitenskapelig kunnskap og det faktum at hodet og hjertet er koordinatorer for handlingene til én kropp, én personlighet.
.
I juli 1982 fikk jeg vite at jeg hadde , en sjelden og alvorlig form for kreft. Da jeg kom ut av narkosen etter operasjonen, var mitt første spørsmål til legen og cellegiftlegen: «Hva er den beste litteraturen om mesothelioma?», som jeg fikk svar på med en klar diplomatisk tone om at det ikke sto noe i medisinsk litteratur som var virkelig verdt å lese.
.
Vel, selvfølgelig, å råde en vitenskapsmann til å holde seg unna bøker er like effektivt som å råde homo sapiens til å være kysk og avstå fra sex. Så snart jeg kunne gå, gikk jeg rett til Harvard Medical Library og skrev inn et spørsmål på datamaskinen om alt, . En time senere, omgitt av all tilgjengelig litteratur om abdominal mesothelioma, forsto jeg hvorfor legen min hadde gitt meg så humane råd. I all litteraturen jeg fant kunne ikke informasjonen være mer entydig: Mesothelioma er uhelbredelig, med en median dødelighet på bare åtte måneder etter diagnosen. i omtrent femten minutter, så smilte han og sa til seg selv: så derfor lar de meg ikke lese noe! Takk Gud, da begynte tankene mine å virke igjen.
.
Jeg kom over et klassisk eksempel på når " Og dette har direkte betydning for kampen mot kreft. Kanskje fordi vår mentale tilstand "mater" immunsystemet, men mennesker med samme type kreft, forskjellig i alder, sosial klasse, betingelser for å motta medisinsk behandling generelt - har en positiv holdning til livet, en sterk vilje og livsmål - og leve lenger, vil de definitivt kjempe eller i det minste lete etter veier ut av sykdommen, og ikke bare passivt akseptere alt som er sagt av leger. Noen måneder senere spurte jeg Medawar Sir, min personlige vitenskapelige guru og nobelprisvinner i immunologi, hva som kan være den beste oppskriften på suksess mot kreft? "Personlighet av en sanguin person," svarte han kort. Heldigvis (siden du ikke kan endre deg selv på kort tid og med ett spesifikt mål), har jeg alltid vært en balansert og selvsikker person med akkurat denne typen karakter.
.
Dette reiser et dilemma for leger: når alt kommer til alt, hvis en persons personlige holdning til hva som skjer med ham er så viktig, hvorfor gjøre slike dystre konklusjoner (spådommer?..?), spesielt når bare noen få mennesker har nok forståelse av prinsippene for statistikk for å vurdere hva Faktisk betyr dette eller det utsagnet? Personlig hadde jeg denne forståelsen, og jeg er overbevist om at dette spilte en viktig rolle for å redde livet mitt. Kunnskap er ekte makt!
.
Kort oppsummert kan det første (og kanskje det viktigste) spørsmålet være: hva betyr egentlig uttrykket "median dødelighet er åtte måneder"? Jeg mistenker at de fleste, uten mye statistisk kunnskap, ville oversatt denne setningen som "Jeg er sannsynligvis død om åtte måneder" - som er akkurat den hoppende konklusjonen som bør unngås fordi... Selve holdningen til situasjonen og til prognoser er av stor betydning.
Jeg var selvfølgelig ikke overlykkelig, men jeg tolket heller ikke dataene slik. Min tekniske bakgrunn tillot meg å ha et annet perspektiv på "åtte måneders medial dødelighet."
.
Vi bærer fortsatt på den historiske byrden av Platons arv, og streber etter en forklaring av alt, etter klare definisjoner og distinksjoner, og prøver dermed for eksempel å finne en entydig "begynnelse av livet" eller en presis definisjon av døden, selv om naturen ofte ser ut til å oss som et kontinuum med en jevn overgang av en til en annen. Denne platoniske arven, med sin vekt på klare distinksjoner og separasjon av udelelige, fører oss til falske estimater av statistiske data. Kort sagt, vi oppfatter gjennomsnittet og medianen som en hard "realitet", og tvert imot tar vi ikke hensyn til en hel rekke forskjellige variabler og ufullkommenhet i målingen. Hvis du bare tar medianen som en gitt og vurderer hva som er rundt den for en dypere analyse og beregning, kan tolkningen "Jeg vil sannsynligvis være død om åtte måneder" miste sin relevans. (forresten, den motsatte situasjonen er også mulig - E.M.)
.
Men alle evolusjonsbiologer, som jeg også er, vet at det er variasjonen til visse parametere som er den uforanderlige essensen av alt levende. Det er endringer, variasjoner av det samme som er den harde virkeligheten. Det statistiske gjennomsnittet og medianen er bare abstraksjoner. Så jeg så på mesothelioma-statistikken på en helt annen måte – og ikke bare fordi jeg er en optimist som streber etter å se selve smultringen i stedet for hullet, men først og fremst fordi jeg vet at kun variasjon er virkelighet. Og jeg måtte plassere meg blant disse forskjellige variantene.
.
Da jeg fikk vite om medianen på åtte måneder, var min første intellektuelle reaksjon: «bra, halvparten av menneskene lever lenger enn de åtte månedene. Hva med sjansene mine for å komme inn i denne omgangen? Etter en time med nervøse og frenetiske beregninger, kom jeg lettet til konklusjonen: Sjansene mine er jævla gode. Jeg hadde hver av egenskapene som gjør det mer sannsynlig at jeg lever lenger: Jeg var ung; sykdommen min ble diagnostisert på et relativt tidlig stadium; Jeg kan få bedre medisinsk behandling; Jeg vil leve; Jeg vet hvordan jeg skal tolke dataene riktig, og jeg er ikke motløs.
.
Et annet teknisk problem ga meg også mer komfort. Jeg skjønte umiddelbart at den faktiske fordelingen av variasjon ved "åttemåneders medianen" nesten helt sikkert ville være det statistikere kaller "høyreskjev" (med en symmetrisk fordeling er profilen til grafen til venstre for medianen et speilbilde av profilen til høyre; med skjevhet er fordelingen på den ene halvdelen mer "langstrakt" ).
.

.
Jeg begrunnet at i tilfellet med mesotheliom, burde grafen vært skjev til høyre (positiv skjevhet), fordi den delen av grafen til venstre for medianen tross alt bare beskriver de tilfellene når mesothelioma diagnostiseres enten posthumt eller kort tid før en persons død. Dermed er det ikke mange muligheter for å falle inn i dette området, siden det kun er mellom null og åtte måneder. Men den øvre (eller høyre) halvdelen kan forlenges i mange år, selv om ingen av personene som blir diagnostisert til slutt overlever. Fordelingen skal ha akkurat denne rette skjevheten, og jeg trenger å vite hvor langt "halen" av grafen er plassert - fordi jeg allerede har kommet til den konklusjon at min gunstige "pasientprofil" gjorde meg til en god kandidat for denne halvdelen av timeplanen.
.
Fordelingen er faktisk sterkt forvrengt til høyre; den har en lang "hale", om enn ikke så stor i amplitude, men strekker seg flere år utover medianen på åtte måneder. Jeg så ikke lenger noen grunn til at jeg ikke skulle være i denne halen, og jeg tok et veldig langt lettelsens sukk. Min tekniske kunnskap hjalp meg også denne gangen. Jeg leste diagrammet riktig. Jeg stilte det riktige spørsmålet og fant svarene. Jeg mottok, etter all sannsynlighet, den mest verdifulle av alle mulige gaver under eksisterende forhold - betydelig tid. Ingenting holdt meg tilbake og ingenting kunne tvinge meg til umiddelbart å følge Jesajas ord til Hiskia - "Sett ditt hus i stand, for du skal dø og ikke leve!"
.
En ting til om statistiske fordelinger: den nåværende "offisielle" grafen gjelder bare for et veldig spesifikt sett av omstendigheter og viser overlevelsesraten for mesothelioma under konvensjonelle behandlingsregimer. Men dersom omstendighetene endrer seg, kan også fordelingen endres. Jeg ble foreskrevet en eksperimentell behandlingsprotokoll, og hvis Fortune smiler, vil jeg være i den første gruppen av en ny fordeling med høy median og høyre "hale" av grafen, som varer til døden av naturlige årsaker i alderdommen.
.
Etter min mening har det blitt for moderne å betrakte aksept av døden som ensbetydende med indre verdighet. Jeg er selvfølgelig enig i prekenene til Predikeren om at «det er en tid å elske og en tid for å dø», og når livskilden min er tørr, håper jeg å møte min ende rolig og med verdighet. I de fleste tilfeller foretrekker jeg imidlertid å ha en annen oppfatning, nemlig at livet må kjempes for.
.
Valget av våpen i denne kampen er veldig bredt, men ingenting er mer effektivt enn humor. Min død ble annonsert på et møte med mine kolleger i Skottland, og jeg hadde stor glede av å lese min egen nekrolog, skrevet av en av mine beste venner (det kan forresten neppe betraktes som en ulykke at han er statistiker og at han trodde på min uunngåelige død, fordi jeg ikke forventet å finne meg så langt i høyre "hale" av grafen ovenfor). Denne hendelsen var imidlertid den første som ga meg en sjanse til å le etter å ha hørt diagnosen min. Bare tenk, jeg gjentok nesten en annen berømt aforisme av M. Twain: "ryktene om min død er sterkt overdrevet."

Etterord av S. Dunn
.
Dessverre døde S. Gould i mai 2002 i en alder av 60 år, men han levde ytterligere tjue meget produktive år etter diagnosen og overskred dermed den "statistiske" åtte måneders median overlevelsesraten med tretti ganger! Selv om han døde av kreft, var det ikke samme mesotheliom, men en helt annen type.
I mars 2002 publiserte Dr. Gould sin 1342 sider lange bok, Opus Magnum - The Structure of Evolutionary Theory. Og det virker veldig logisk at Dr. Gould, en av verdens mest produktive vitenskapsmenn og forfattere, var i stand til å fullføre den endelige beretningen om sin vitenskapelige virksomhet og beretningen om sin filosofi akkurat i tide. Denne boken er for lang for den vanlige person – men S. D. Goulds arbeid vil leve videre. Spesielt håper jeg artikkelen " DeMedianEr n"tdeBeskjed".

***********
Faktisk vil det være praktisk talt ingen kommentarer fra meg til denne artikkelen - verken om "eksperimentelle behandlingsprotokoller" eller om "legers profetier" - det er allerede mye materiale om dette i LiveJournal. Men det kommer egne innlegg om at statistikk ofte tolkes helt «skjevt».
.
Jeg vil bare merke meg at det ikke er tilfeldig at Dr. Gould i denne artikkelen nevnte uttrykket "pasientprofil" - siden han også brukte ordene "sangvinsk personlighet", har dette med psykologi å gjøre, og ikke bare med en persons økonomiske tilstand eller hans sosiale status. Ingenting skjer ved en tilfeldighet i denne verden. For et par dager siden så jeg et innlegg på LiveJournal med tittelen "The Role of Personality in Oncology", der lenker ble gitt til eksperimenter (ja, den samme statistikken) og den endelige konklusjonen var at denne rollen er "for overdrevet." Men uansett hvor mye individuelle borgere ønsker å isolere seg fra sin psyke (fra sin personlighet), uansett hvor mye de ønsker å tro at sykdommen "kommer ned fra et sted ovenfra av grunner utenfor min kontroll", og kommenterer alt dette med ord som "Jeg har allerede fått nok av det."
.
Men neste innlegg handler om dette.
.
Vær sunn. Lev med humor.

Mark Twain

Sannsynlighetslærens lover er ikke abstrakte, men uttrykker matematisk de virkelige mønstrene til massetilfeldige naturfenomener.

Utviklingen av metoder for å registrere, beskrive og analysere statistiske eksperimentelle data oppnådd som et resultat av observasjon av tilfeldige massefenomener er gjenstand for MATEMATISK STATISTIKK.

1

Bestemmelse av fordelingsloven for en tilfeldig variabel fra statistiske data.

Siden vi i praksis må forholde oss til en begrenset mengde eksperimentelle data, vil resultatene av observasjoner alltid inneholde et element av tilfeldighet.

Derfor oppstår oppgaven med å jevne ut statistiske data og beskrive dem ved hjelp av enkle analytiske avhengigheter.

2

Tester plausibiliteten til hypoteser.

Denne oppgaven er relatert til den forrige. For eksempel kan den svare på spørsmålet: er resultatene av et eksperiment i samsvar med hypotesen om at den tilfeldige variabelen overholder en gitt distribusjonslov?

3

Bestemmelse av ukjente parameterfordeling

Ofte er det nødvendig å bestemme ikke selve loven om SW-fordeling på grunnlag av eksperimentelle data, men noen numeriske egenskaper I et lite antall eksperimenter bestemmes bare "estimerte" verdier av disse parameterne, dvs. slike omtrentlige verdier som i gjennomsnitt fører til mindre feil enn

Markedsavdelingen til en klesfabrikk gjennomførte en spørreundersøkelse blant 100 kunder. Blant undersøkelsesspørsmålene var spørsmål om herredresser. Behandling av spørreskjemaene ga følgende resultater om preferanser:

Etter produksjonssted: 40% - innenlands, 60% - importert.

2. Etter kostnad i amerikanske dollar:

« Løgn, jævla løgn og statistikk"(fullversjon: Det er tre typer løgner: løgn, fordømte løgner og statistikk., Engelsk Det er tre typer løgner: løgner, fordømte løgner og statistikk ) - en uttalelse tilskrevet den britiske statsministeren Benjamin Disraeli, og den ble berømt takket være Mark Twain etter publiseringen av "A Chapter of My Autobiography" i North American Review 5. juli 1907: "Tall er villedende," skrev han , «Jeg er overbevist om dette av personlig erfaring; Disraeli snakket med rette om dette: "Det er tre typer løgner: løgner, fordømte løgner og statistikk." Imidlertid vises ikke denne frasen i Disraelis verk. Hun var heller ikke kjent verken i løpet av hans levetid eller kort tid etter hans død. Fra moderne ideers synspunkt er den mest sannsynlige kandidaten for forfatterskap Charles Dilk (1843-1911).

Dette ordtaket er blitt tilskrevet mange andre enn Disraeli: journalisten og politikeren Henry Labouchere (1831-1912) og Leonard Courtenay (1832-1918), som brukte uttrykket i 1895. To år senere ble han president i Royal Statistical Society.

Det er nå kjent at den første bruken av uttrykket var i et brev skrevet 8. juni 1891 og publisert 13. juni 1891 i National Observer (s.93(-94): NATIONAL PENSIONS London, 8. juni 1891) : "Sir, ... observerte veldig vittig "at det er tre typer løgner: den første er usannhet, den andre er direkte løgn, og til slutt, det verste er statistikk." Litt senere, i oktober 1891, i tidsskriftet Notes and Queries, sendte en person under pseudonymet "St Swithin" et spørsmål om forfatterskapet til denne frasen, noe som indikerer dens utbredte bruk allerede i disse dager. I oktober 1891 brukte Charles W. Dilke, uten noen tilskrivning, denne uttalelsen to ganger. "Sir Charles Dilke (1843-1911) sa her om dagen at etter hans mening kan 'løgn' klassifiseres i økende grad som: hvite løgner, løgner og statistikk" (The Bristol Mercury and Daily Post, mandag 19. oktober 1891 G. ). Dr. E.R.L. Gould, som brukte uttrykket i 1892, siterte også Charles Dilkes forfatterskap: "Sir Charles Dilke hadde rett i en viss forstand da han sa: 'Det er tre nivåer av løgner - fiksjon, løgner og statistikk...'."

Som Robert Giffen (assistentredaktør av The Economist og 1882-84 president for Statistical Society) nevner i 1892, er utsagnet "om statistikk" bare en tolkning av uttrykket "Det er en gammel vits om at det er tre typer løgnere: vanlige bedragere, opprørende løgnere og vitenskapelige eksperter. Senere begynte de å si ting litt annerledes: det er tre grader av løgn: løgn, skamløse løgner og statistikk.» .

Opprinnelsen til originalen («om eksperter») tilskrives en tidligere periode enn utsagnet «om statistikk», nemlig i tidsskriftet Nature datert 26. november 1885 (merk at Disraeli allerede var død på dette tidspunktet) på side 74. finne: "... Det falt opp for en kjent advokat, for tiden dommer, å dele vitner i tre grupper: enkle løgnere, fordømte løgnere og eksperter."

Notater


Wikimedia Foundation. 2010.

Se hva "løgner, åpenbare løgner og statistikk" er i andre ordbøker:

    Den mest nøyaktige av alle pseudovitenskaper. Jin Ko-statistikk kan bevise hva som helst, til og med sannheten. Noel Moynihan-statistikk er vitenskapen om hvordan du, uten å være i stand til å tenke og forstå, kan få tall til å gjøre det. Vasily Klyuchevsky Statistikk er som en badedrakt...

    Det er fire typer løgner: løgner, fordømte løgner, statistikk og siteringer. Du skal ikke lyve skamløst; men noen ganger er unnvikelse nødvendig. Margaret Thatcher Tro bare halvparten av det du ser og ingenting av det du hører. Engelsk ordtak ... ... Konsolidert leksikon av aforismer

    Histogram (metode for grafiske bilder) Dette begrepet har andre betydninger, med ... Wikipedia

    Statistikk- (Statistikk) Statistikk er en generell teoretisk vitenskap som studerer kvantitative endringer i fenomener og prosesser. Statsstatistikk, statistikktjenester, Rosstat (Goskomstat), statistiske data, spørringsstatistikk, salgsstatistikk,... ... Investor Encyclopedia

    - (1835 1910) Den amerikanske forfatteren Hell er det eneste virkelig betydningsfulle kristne fellesskapet i universet. En bankmann er en person som vil låne deg en paraply på en solrik dag og ta den bort i det øyeblikket det begynner å regne. Bill... ... Konsolidert leksikon av aforismer

    Sitat: feil repetisjon av andres ord. Sitat om Ambrose Bierce er en risiko under andres ansvar. Vladislav Grzeszczyk Hvis du blir sitert, er du allerede noen. Hvis noen stjeler fra deg, er du en enestående person. Men ekte ære begynner først når du... Konsolidert leksikon av aforismer

    Garry Kasparov Garry Kimovich Kasparov Garry Kasparov, 2007 Fødselsdato: 13. april 1963 (46 år) Fødested ... Wikipedia

Det er et veldig "skjeggete" ordtak. Du hørte henne sikkert. Så…

Det er tre typer løgner:

  1. Ekkel løgn
  2. Statistikk

Vanligvis på dette tidspunktet sier de ordet "spade", og alle ler. Men la oss se på fakta som for tiden blinker i de siste nyhetene.

Faktum #1

"Levada-senteret" gjennomførte en sosial undersøkelse (russere i alle aldre ble undersøkt), som viste det det mest populære sosiale nettverket i vårt land er Odnoklassniki. Den består ca 76 % av de spurte.

Kul! Vi prøver å åpne en konto der! For de som er i tanken, er hvordan du registrerer deg hos Odnoklassniki beskrevet i detalj på akak.ru på lenken. Dette er et nettsted som inneholder instruksjoner om hvordan du gjør hva.

Men disse, som du forstår, er statistikk levert av Levada Center.

Faktum #2

  • Det mest populære nettverket i henhold til deres data er VKontakte. Kommer inn i det 38 millioner besøkende per dag.
  • Odnoklassniki har 30 millioner besøkende.
  • "Min verden" - 16 millioner.

Spørsmål #1: Hvem skal jeg tro?

Fordi det er en statistikk tredje typen løgn, da kan du ikke stole på noen. Hvordan kan du beregne populariteten til et sosialt nettverk utelukkende basert på indirekte data?

Undersøkelse. Hva viste han? Kun fokusgruppepreferanser.

Hvor ble hun valgt ut? Hvordan ble du intervjuet? I hvilken region? Sa de sannheten?

Ifølge meningsmålinger bruker 100 % av russerne Internett! Undersøkelsen ble gjennomført på nettsiden.

Antall besøkende per dag. Hva viser det?

Se for deg den gjennomsnittlige kontorarbeideren. Han har VKontakte installert på telefonen sin, han drar dit fra jobb, og så om kvelden hjemmefra. Dette er allerede 3 besøkende med forskjellige IP-er, nettlesere osv.

Samtidig har Odnoklassniki en eldre målgruppe. Dette betyr at mobilapplikasjoner og tilgang fra kontoret er stengt for dem.

Worpos #2: Hva skal jeg gjøre med denne informasjonen?

Konklusjon nr. 1- Du kan ikke stole blindt på statistikk!

Konklusjon nr. 2— Tydeligvis er de mest populære sosiale nettverkene VKontakte og Odnoklassniki. Jeg tror at LJ (selv om de er «sosiale medier») også er på topp tre.

Konklusjon nr. 3— Hvis du har noe å fortelle eller tilby folk, opprett kontoer på de mest populære sosiale nettverkene. Du kan definitivt ikke gå galt.

Etterord

Som slagordet til Dr. House (TV-serien "Dr. House") sier: "...Alle lyver...". Husk dette.

Og doktor Lexium var med deg
Husk at behovet for å tenke med eget hode ennå ikke er kansellert.

Nettstedet fant ut hva som er prosentandelen av statistiske dataforfalskning i vitenskapelige artikler om psykologi, hvilke feil som ble avslørt av verifiseringsprogrammet og hvordan det ligner på T9.

Programmer kan ikke bare postmoderne sangtekster, en bane på London Underground, simulere prosesser i en bank, men også se etter feil i arbeidet til uærlige eller uoppmerksomme psykologer. nettstedet forteller hvordan en datamaskin identifiserer unøyaktigheter i vitenskapelige artikler og hva dette kan føre til.

Den moderne psykologiens glans og fattigdom

Balanserer mellom "hverdagsvisdom" og filosofiske og metafysiske kategorier på en tynn tråd av konsistente data, er "sjelens vitenskap" konstant i fare for utskeielser. Å grave inn i menneskers indre verden (hvis du ikke vurderer den anatomiske siden av saken) har aldri vært lett, så forskningen til psykologer er vanskelig å verifisere. Med et veldig subjektivt studiefag, skjærer psykologi i noen av dens grener og seksjoner med medisin og nevrobiologi, og i andre går utover det vitenskapelige: til og med doktor i psykologi og visedirektør for Institutt for psykologi ved det russiske vitenskapsakademiet Andrei Yurevich definerte psykologiens plass mellom vitenskap og paravitenskap. Selv når de brukes i henhold til alle reglene for vitenskapelig metodikk, gir psykologiske tilnærminger noen ganger ikke tilfredsstillende resultater. Hvis man i mer forsiktig og langsiktig arbeid med én person kan anta sakens egenart og slå fast at det er umulig å ekstrapolere konklusjoner til alle mennesker, så er det i en stor gruppe vanskelig å forstå hva enhetlige spørsmål og svar faktisk betyr for hver deltaker i studien. I tillegg kan forsøkspersoner alltid ha interne grunner til å skjule noe informasjon og svare på spørsmål som ikke er helt ærlig. Derfor kan refleksjon (vender en persons oppmerksomhet innover) ikke betraktes som et verktøy som lar en få absolutt pålitelig informasjon. om en dataalgoritme som identifiserte potensielle feil i nesten åtte tusen psykologiske artikler (og dette bare i perioden fra 1985 til 2013 og bare i åtte vitenskapelige psykologiske tidsskrifter) fungerte som en pinne som hisset opp et hornets rede, allerede plaget på grunn av konstant kontrovers . Under ledelse av Michelle Nuyten ble 30 717 artikler analysert, hvorav 16 695 brukte statistiske data. Halvparten av disse papirene hadde minst én mistenkt statistisk feil som ble påpekt av programmet.

Når det gjennomføres en studie på en stor gruppe emner, brukes statistiske metoder for bearbeiding. Det populære ordtaket «det finnes tre typer løgner: løgner, fordømte løgner og statistikk», hvis forfatterskap er så vagt at for mer enn hundre år siden tilskrev Mark Twain det til Benjamin Disraeli (men var ikke lenger sikker på hvor det faktisk kom fra) , er ikke så langt fra sannheten. I feltet menneskelig kunnskap, hvor det er så vanskelig å lage teorier med pålitelig prediksjonskraft (husk den samme Sigmund Freud eller Alfred Adler), er risikoen for utilsiktede feil og fristelsen til bevisst å "justere" det faktiske resultatet til det ønskede resultatet. er ganske høy.

Hvordan en datamaskin tok uærlige psykologer på fersk gjerning

Programmet som bekreftet gyldigheten av denne ironiske observasjonen heter Statcheck. Den analyserer P-verdien, en mengde som forskere bruker for å teste statistiske hypoteser. Denne figuren viser hvor sannsynlig resultatet er hvis nullhypotesen som ligger til grunn for studien er sann. Artikkelen, som ble publisert i tidsskriftet Behavior Research Methods, viser at programmet vurderte gyldigheten av mer enn 258 000 p-verdier (omtrent 11 per vitenskapelig artikkel) på to timer, og fant at 13 % av artikler inneholdt en feil som "snudde" mottatte data. Som et resultat, for eksempel, P< 0,05 превращается в P = 0,05, или некоторые знаки после запятой просто отбрасываются, а не влияют на следующий знак по правилам округления чисел. Казалось бы, такое маленькое различие не должно серьезно влиять на результат, однако чаще всего P = 0,05 принимается как пограничное значение между статистически достоверным и недостоверным результатом. В итоге малейшее отклонение в одну или в другую сторону делает вывод в статье ложноположительным или ложноотрицательным.

Opprinnelig jobbet programmet med litteratur generelt, men en av studiens medforfattere, Chris Hartgerink, spesialist i vitenskapelig metodikk fra Tilburg University (Nederland), foreslo å fokusere på mer spesifikke tekster – vitenskapelige artikler. Senere, i august i år, lastet han opp 50 000 artikler for verifisering og la ut resultatene på Pub Peer (et forum for forskere hvor de ofte diskuterer publiserte vitenskapelige artikler), noe som forårsaket en enorm resonans i fagmiljøet. Ifølge Hutgerink vil slike innlegg informere forfattere om mulige feil og "vil gi mye mer fordel for vitenskapen enn bare en datadump." Ikke alle er enige med ham, som Monia Bakers diskusjonsartikkel i Nature melder. Noen forskere, inkludert representanter for den tyske psykologforeningen, advarer om at falske negative resultater (her mener vi en datamaskin som korrigerer korrekte data for feil) kan skade forskernes rykte i stedet for å hjelpe utviklingen av psykologi som vitenskap. Administrerende direktør for Association for Psychological Science i Washington svarte på publikasjonen med å si at han fordømte den "endemiske bakvaskelsen" av psykologer på blogger og sosiale medier, og gjorde det klart at publisering av resultatene av en dataanalyse med mulige feil bør betraktes som en fornærmelse.

Statcheck og P-verdi: hvem er i brannboksen, hvem er i toppen?

På den annen side fremmer slike innlegg begrepet åpen vitenskap (for øvrig har både Nuyten og Hartgerink priser fra organisasjoner som oppmuntrer til utvikling av dette feltet), noe som vil gjøre det mulig å raskt finne og korrigere statistiske unøyaktigheter. I følge Nick Brown, en psykologisk forsker ved University of Groningham i Nederland, vil slike algoritmer bare hjelpe hvis forskere leser dem og vurderer dem fra eksperters synspunkt, i stedet for bare å være mistroende til et tidsskrift som publiserte tvilsomme artikler med feil.

For øyeblikket har flere tusen mennesker, inspirert av denne muligheten, lastet ned dette programmet, skrevet på programmeringsspråket R, gratis.

Statcheck selv kan imidlertid gjøre feil, som Thomas Schmidt slår fast i sin kritikk av programmet. For eksempel tar den ikke alltid hensyn til de nødvendige statistiske feilene og kan noen ganger ikke forstå hva som er galt i artikkelen: P-verdien eller den relative parameteren. Etter å ha skannet to artikler med mye statistiske data, fant han ut at programmet ikke klarte å evaluere 43 parametere, sjekket 137 og identifiserte 35 som "potensielt feil". To av disse var feil som ikke påvirket resultatet, tre var feil i andre parametere som ikke var relatert til P-verdien, og de resterende 30 var et resultat av «falske alarmer».

Noen psykologiske tidsskrifter begynner til og med å forlate p-verdien for å teste gyldigheten av hypoteser, og anser denne parameteren for å være utilstrekkelig pålitelig.

Skaperne selv benekter ikke at programmet deres "aldri vil være så nøyaktig som å sjekke manuelt", men de understreker hastigheten på arbeidet: hvis det tar omtrent ti minutter å sjekke påliteligheten til P-verdien til en gjennomsnittlig psykologisk artikkel, da kan programmet takle titusenvis i løpet av få timer, noe som er uunnværlig for å gjennomføre en metaanalyse eller innledende verifisering av artikler sendt til redaktører av vitenskapelige tidsskrifter. Redaktørene av tidsskriftet Psychological Science har brukt det i denne egenskapen siden juli i år. De sammenligner dette programmet med Word- eller T9-korrekturlesere, som alle ler av absurditeten, men få vil gå med på å gi opp. I likhet med disse autokorrigererne kan Statcheck, etter deres mening, betraktes som "et praktisk verktøy som noen ganger sier dumme ting."