Valed, alatud valed ja statistika. Valed, neetud valed ja statistika

.
Selle aforismi täisversioon: "Valed on kolme tüüpi: valed, neetud valed ja statistika." (Inglise)Valet on kolme tüüpi: valed, neetud valed ja statistika). Selle autorsus omistatakse erinevatele inimestele ja see saavutas kuulsuse tänu M. Twainile pärast seda, kui 5. juulil 1907 Põhja-Ameerika ülevaates avaldati "A Chapter of My Autobiography": "Numbrid on petlikud," kirjutas ta, " Olen seda õppinud oma kogemusest; Disraeli rääkis sellest õigesti: "Valed on kolme tüüpi: valed, neetud valed ja statistika." Mõned usuvad, et esialgne fraas kõlas nii: "On üks vana nali, et valetajaid on kolme tüüpi: tavalised valetajad, ennekuulmatud valetajad ja teaduseksperdid", ja alles hiljem hakkasid nad ütlema midagi veidi erinevat: "Valetel on kolm astet: valed, häbematud (jultunud) valed ja statistika."
Vaevalt on nii oluline, kes on selle aforismi autor, oluline on see, et see illustreerib hästi olukorda sellega, mida "ekspertarstid" ütlevad enamikule tõsiste (ja mitte nii tõsiste) haigustega inimestele.

****
1992. aastal diagnoosisid arstid kuulsal Ameerika paleontoloogil ja bioloogil Stephen Gouldil vähi (peritoneaalne mesotelioom) ja teatasid, et selle diagnoosiga elavad nad keskmiselt 8 kuud. Gould pani oma asjad korda, kuid ei andnud alla, vaid hakkas läbima ravi – operatsiooni, keemiaravi ja kiiritusravi. Ja ta suri. Kahekümne aasta pärast.
.
Kaks aastat pärast diagnoosi avalikustamist ajakirjas Discover avaldas ta oma artikli "Mediaan ei ole sõnum", milles kirjeldas selgelt, kuidas statistika ja konkreetsed juhtumid elust seostuvad. Algtekst asub lingil , allpool on peaaegu täielik tõlge ja seejärel minu kommentaarid.

.
Artikli eessõna - S. Dunn (Steve Dunn, veebilehe http://cancerguide.org looja, kellele arstid diagnoosisid 4. staadiumi neeruvähi, mille järel neer eemaldati. Pärast sellist “ravi” juhtis ta väga aktiivset elustiili 17 aastat , abiellus, sai lapsi, tegeles mägironimise ja suusatamisega, suri augustis 2005 hoopis teistsugusesse haigusesse (nakkuslik meningiit).

.
Stephen Jay Gould oli mõjukas evolutsioonibioloog, Harvardi ülikooli õppejõud ja vähemalt tosina populaarse raamatu autor erinevatest teadusvaldkondadest.
Niipalju kui ma aru saan, on see artikkel kõige targem ja inimlikum artikkel, mis eales vähi ja statistika kohta kirjutatud. See on vastumürk nii neile, kes ütlevad, et „statistika ei oma tähtsust”, kui ka neile, kellel on kombeks kuulutada „surmaotsus” patsientidele, kes seisavad silmitsi kohutavate prognoosidega. Igaüks, kes otsib vastuseid ametlikust meditsiinikirjandusest, leiab sealt “kohutava statistika” peaaegu iga haiguse kohta. Kõik, kes seda artiklit loevad, saavad lootust.

Ärge uskuge mediaani "The Mediaan Isn" t a sõnum"
.
Viimasel ajal on mu elu pidevalt illustreerinud Mark Twaini kaks kuulsat nalja. Ühe jätan praegu selle artikli lõppu ja teine ​​(mõnikord omistatakse Disraelile) räägib kolme tüüpi valedest, millest igaüks on hullem kui eelmine – valed, neetud valed ja statistika.
.
Vaatleme standardnäidet tõe ruumis või ajas “määrimisest”, mis osutus minu isikliku loo jaoks väga asjakohaseks. Statistika tunneb ära erinevad viisid "keskmise" või "keskmise tendentsi" määratlemiseks. Meie tavaline määratluskontseptsioon keskmine väärtus on üsna lihtne - liitke kõigi elementide väärtused ja jagage saadud summa elementide arvuga (100 kommi, mille viis last Halloweeni ajal kogusid, annab selles ideaalses maailmas igale lapsele 20 kommi). - veel üks keskmise tendentsi mõõt on graafiku keskel oleva funktsiooni väärtus. Näiteks kui panen viis last pikkuse järgi järjestatama, on keskmine laps kahest eelmisest lühem ja kahest järgmisest pikem (nendel kahel lühikesel lapsel võib aga olla probleeme kommi jagamisega rühmas, kus on pikemad lapsed...).
.
Teine viis selle illustreerimiseks on see, et poliitiline liider võib uhkusega teha avalduse: "Meie kodanike keskmine sissetulek on 15 000 dollarit aastas", millele opositsiooniliider võib vastata: "Kuid poolte meie kodanike tegelik sissetulek on väiksem kui 10 000 dollarit aastas." Ja neil mõlemal on õigus, kuigi kumbki ei kasuta statistikat kiretu objektiivsusega. Esimene räägib sellest aritmeetiline keskmine , teine ​​- o mediaan (aritmeetiline keskmine on sellistel juhtudel mediaanist suurem, sest üks miljonär võib keskmist arvutades kaaluda üles sadu vaeseid, kuid mediaani arvutamisel võib ta kaaluda vaid ühe vaese).
.
Mida olulisem (sügavam, ohtlikum, raskem jne) küsimus, seda suurem on usaldamatus ja põlgus statistika vastu selle kaalumisel. Paljud inimesed lubavad traagilist ja vastuvõetamatut lõhet oma südame ja mõistuse, tunnete (sensatsioonide) ja intellekti vahel. Vastupidi, mõnes kaasaegses traditsioonis asetatakse liiga palju rõhku tunnetele kui tegevuse alustele, samas kui intellekt tõrjutakse tagaplaanile kui "aegunud tööriist". Statistikat nimetatakse selles absurdses dihhotoomias sageli "vaenlaseks".
.
See artikkel on isiklik lugu sõprusest õigesti tõlgendatud statistikaga, mis inspireerib ja annab lootust. See on lühike lugu erapooletu teadusliku teadmise kasulikkusest ja sellest, et pea ja süda on ühe keha, ühe inimese tegevuse koordinaatorid.
.
Juulis 1982 sain teada, et mul oli , haruldane ja tõsine vähivorm. Kui pärast operatsiooni anesteesiast välja tulin, oli mu esimene küsimus arstile ja keemiaravi arstile: “Milline on parim mesotelioomialane kirjandus?”, millele sain selge diplomaatilise varjundiga vastuse, et meditsiinikirjanduses pole midagi sellist, oli tõesti lugemist väärt.
.
Muidugi, kui soovitada teadlasel raamatutest eemale hoida, on sama tõhus kui homo sapiens'i soovitamine olla karskus ja hoiduda seksist. Niipea kui sain kõndida, läksin otse Harvardi meditsiiniraamatukogusse ja sisestasin arvutisse päringu kõige kohta, . Tund hiljem, olles ümbritsetud kogu saadaolevast kirjandusest kõhu mesotelioomi kohta, sain aru, miks mu arst mulle nii inimlikku nõu andis. Kogu kirjanduses, mille ma leidsin, ei saanud teave olla ühemõttelisem: Mesotelioom on ravimatu, keskmine suremus on vaid kaheksa kuud pärast diagnoosimist. umbes viisteist minutit, siis ta naeratas ja ütles endamisi: sellepärast nad ei lase mul midagi lugeda! Jumal tänatud, siis hakkas mu mõistus uuesti tööle.
.
Sain klassikalise näite, millal " Ja sellel on otsene seos vähivastases võitluses. Võib-olla sellepärast, et meie vaimne seisund “toidab” immuunsüsteemi, kuid sama tüüpi vähihaigetel, erineva vanuse, sotsiaalse klassi, arstiabi saamise tingimuste poolest üldiselt - on positiivne ellusuhtumine, tugev tahe ja elueesmärgid. - ja elavad kauem, võitlevad nad kindlasti haigusega või vähemalt otsivad sellest väljapääsu, mitte ei võta lihtsalt passiivselt vastu kõike, mida arstid on öelnud. Mõni kuu hiljem küsisin Medawar Sirilt, mu isiklikult teadusgurult ja Nobeli immunoloogiapreemia laureaadilt, milline võiks olla parim retsept vähivastaseks eduks? "Sangviiniku isiksus," vastas ta lühidalt. Õnneks (kuna end lühikese ajaga ja ühe kindla eesmärgiga muuta ei saa) olen alati olnud tasakaalukas ja enesekindel, täpselt sellise iseloomuga inimene.
.
See tõstatab arstide jaoks dilemma: lõppude lõpuks, kui inimese isiklik suhtumine temaga toimuvasse on nii oluline, siis milleks teha nii süngeid järeldusi (ennustusi? ..), eriti kui vähestel inimestel on statistika põhimõtetest piisavalt arusaamist. hinnata mida Tegelikult kas see või teine ​​väide tähendab? Minul isiklikult oli selline arusaam ja ma olen veendunud, et see mängis minu elu päästmisel olulist rolli. Teadmised on tõelised jõudu!
.
Lühidalt võib esimene (ja võib-olla kõige olulisem) küsimus olla: mida täpselt tähendab fraas "suremuse keskmine tase on kaheksa kuud"? Ma kahtlustan, et enamik inimesi ilma suuremate statistiliste teadmisteta tõlgiks selle fraasi "tõenäoliselt olen kaheksa kuu pärast surnud" - see on täpselt hüppeline järeldus, mida tuleks vältida, sest... Väga oluline on suhtumine olukorda ja prognoosidesse.
Muidugi ei olnud ma üliõnnelik, aga ma ei tõlgendanud andmeid ka nii. Minu tehniline taust võimaldas mul näha „kaheksa kuu mediaalset suremust” teistmoodi.
.
Endiselt kanname endas Platoni pärandi ajaloolist koormat, püüdledes kõige seletuse, selgete määratluste ja eristuste poole, püüdes nii näiteks leida üheselt mõistetavat “elu algust” või täpset surma määratlust, kuigi loodus näib sageli meid kui kontiinumi sujuva üleminekuga ühelt teisele. See platooniline pärand oma rõhuasetusega selgetele eristustele ja jagamatute eraldamisele viib meid statistiliste andmete valehinnanguteni. Lühidalt, me tajume keskmist ja mediaani kui kõva "reaalsust" ja vastupidi, me ei võta arvesse tervet rida erinevaid muutujaid ja mõõtmise ebatäiuslikkust. Kui võtta mediaan lihtsalt etteantuna ja võtta sügavamaks analüüsiks ja arvutamiseks arvesse seda, mis selle ümber on, siis võib tõlgendus “tõenäoliselt kaheksa kuu pärast surnud” kaotada oma aktuaalsuse. (muide, võimalik on ka vastupidine olukord - E.M.)
.
Kuid kõik evolutsioonibioloogid, kellest mina ka kuulun, teavad, et just teatud parameetrite muutlikkus on kogu elusolendite muutumatu olemus. Just muutused, sama asja variatsioonid on karm reaalsus. Statistiline keskmine ja mediaan on lihtsalt abstraktsioonid. Nii ma vaatasin mesotelioomi statistikat hoopis teistmoodi – ja mitte ainult sellepärast, et olen optimist, kes püüab augu asemel näha sõõrikut ennast, vaid ennekõike sellepärast, et tean, et ainult variatsioon on reaalsus. Ja ma pidin end paigutama nende erinevate variatsioonide hulka.
.
Kui sain teada kaheksa kuu mediaanist, oli minu esimene intellektuaalne reaktsioon: "Suurepärane, pooled inimesed elavad kauem kui see kaheksa kuud. Kuidas on lood minu võimalustega sellele poolajale pääseda? Pärast tund aega kestnud närvilisi ja meeletuid arvutusi jõudsin kergendatult järeldusele: minu võimalused on pagana head. Mul olid kõik omadused, mis panevad mind suurema tõenäosusega kauem elama: olin noor; minu haigus diagnoositi suhteliselt varajases staadiumis; ma saan paremat arstiabi; Ma tahan elada; Ma tean, kuidas andmeid õigesti tõlgendada ja see mind ei heiduta.
.
Veel lisas mugavust mulle ka teine ​​tehniline probleem. Sain kohe aru, et tegelik variatsioonijaotus "kaheksa kuu mediaanil" oleks peaaegu kindlasti see, mida statistikud nimetavad "paremale viltuseks" (sümmeetrilise jaotuse korral on mediaanist vasakul olev graafiku peegelpilt profiil paremale; viltu, jaotus ühel poolel on "piklikum").
.

.
Põhjendasin, et minu mesotelioomi puhul oleks pidanud graafik olema parempoolse kaldega (positiivne viltu), sest lõppude lõpuks kirjeldab mediaanist vasakul olev graafiku osa ainult neid juhtumeid, kui mesotelioomi diagnoositakse kas postuumselt või veidi aega enne inimese surma. Seega pole palju võimalusi sellesse vahemikku sattuda, kuna see on ainult nulli ja kaheksa kuu vahel. Kuid ülemine (või parem) pool võib kesta mitu aastat, isegi kui ükski diagnoositud inimestest ei jää lõpuks ellu. Jaotus peaks olema täpselt selle õige kaldega ja ma pean teadma, kui kaugel graafiku “saba” asub – kuna olen juba jõudnud järeldusele, et minu soodne "patsiendi profiil" tegi minust hea kandidaadi selle poole ajakava jaoks.
.
Jaotus on tõepoolest tugevalt paremale poole moonutatud; sellel on pikk “saba”, ehkki mitte nii suure amplituudiga, kuid ulatub mitu aastat üle kaheksa kuu mediaani. Ma ei näinud enam põhjust, miks ma ei peaks selles sabas olema ja ohkasin väga pikalt. Minu tehnilised teadmised aitasid mind ka seekord. Lugesin diagrammi õigesti. Küsisin õige küsimuse ja leidsin vastused. Suure tõenäosusega sain olemasolevatel tingimustel kõige väärtuslikuma kingituse - märkimisväärse aja. Miski ei hoidnud mind tagasi ega sundinud mind kohe järgima Jesaja sõnu Hiskijale - "Tee oma maja korda, sest sa sured ega jää elama!"
.
Veel üks asi statistilise jaotuse kohta: praegune "ametlik" graafik kehtib ainult väga konkreetsete asjaolude kohta ja näitab mesotelioomi ellujäämise määra tavapäraste ravirežiimide korral. Aga kui asjaolud muutuvad, võib muutuda ka jaotus. Mulle määrati eksperimentaalne raviprotokoll ja kui Fortuuna naeratab, siis olen uue jaotuse esimesse gruppi, millel on kõrge mediaan ja graafiku õige “saba”, mis kestab kuni vanaduses loomulikul põhjusel surmani.
.
Minu meelest on muutunud liiga moeks pidada surmaga nõustumist võrdväärseks sisemise väärikusega. Muidugi nõustun Koguja jutlustega, et “on aeg armastada ja aeg surra” ning kui mu eluallikas kuivab, loodan oma lõpu rahulikult ja väärikalt vastu võtta. Enamasti eelistan siiski teist arvamust, nimelt elu eest tuleb võidelda.
.
Relvade valik selles võitluses on väga lai, kuid miski pole tõhusam kui huumor. Minu surmast teatati kolleegide kohtumisel Šotimaal ja mul oli suur rõõm lugeda minu enda järelhüüet, mille kirjutas üks mu parimaid sõpru (muide, vaevalt saab seda õnnetuseks pidada, et ta on statist ja et ta uskus minu vältimatusse surma, sest ma ei lootnud, et leian mind seni ülaltoodud graafiku õigest "sabast"). See juhtum oli aga esimene, mis andis mulle võimaluse pärast diagnoosi kuulmist naerda. Mõelda vaid, ma kordasin peaaegu üht teist M. Twaini kuulsat aforismi: "kuulujutud minu surma kohta on tugevalt liialdatud."

S. Dunni järelsõna
.
Kahjuks suri S. Gould 2002. aasta mais 60-aastaselt, kuid ta elas pärast diagnoosi saamist veel kakskümmend väga produktiivset aastat ja ületas seega "statistilise" kaheksa kuu keskmise elulemuse 30 korda! Kuigi ta suri vähki, ei olnud tegemist sama mesotelioomiga, vaid hoopis teist tüüpi.
2002. aasta märtsis avaldas dr Gould oma 1342-leheküljelise raamatu Opus Magnum – The Structure of Evolutionary Theory. Ja tundub väga loogiline, et dr Gould, üks maailma viljakamaid teadlasi ja kirjanikke, suutis oma teadusliku tegevuse lõpparuande ja oma filosoofia ülevaate õigel ajal valmis saada. See raamat on tavainimese jaoks liiga pikk – aga S. D. Gouldi looming elab edasi. Eriti loodan, et artikkel " TheMediaanIsn"taSõnum".

***********
Tegelikult ei saa ma selle artikli kohta praktiliselt mingeid kommentaare - ei "eksperimentaalsete raviprotokollide" ega "arstide ettekuulutuste" kohta - minu LiveJournalis on selle kohta juba palju materjali. Kuid sellest, et statistikat tõlgendatakse sageli täiesti "vilti", tuleb eraldi postitusi.
.
Tahan lihtsalt märkida, et pole juhus, et dr Gould mainis selles artiklis fraasi "patsiendi profiil" - kuna ta kasutas ka sõnu "sangviiniline isiksus", siis on see seotud psühholoogiaga, mitte ainult inimese finantsseisundiga. seisundit või tema sotsiaalset staatust. Midagi ei juhtu siin maailmas juhuslikult. Paar päeva tagasi nägin LiveJournalis postitust pealkirjaga “Isiksuse roll onkoloogias”, kus viidi eksperimentide juurde (jah, see sama statistika) ja lõppjäreldus oli, et see roll on “liiga liialdatud”. Kuid ükskõik kui palju üksikud kodanikud ka ei tahaks oma psüühikast (oma isiksusest) isoleerida, ükskõik kui väga nad ka ei tahaks uskuda, et haigus "tuleb kuskilt ülevalt alla minust sõltumatutel põhjustel", kommenteerides seda kõike sõnadega. nagu "Mul on sellest juba küllalt." kõik need vähi psühholoogilisse olemusse uskujad" - laulust ei saa sõnu välja visata - enda eest ei saa põgeneda.
.
Aga järgmine postitus räägib sellest.
.
Ole tervislik. Ela huumoriga.

Mark Twain

Tõenäosusteooria seadused ei ole abstraktsed, vaid väljendavad matemaatiliselt massiliste juhuslike loodusnähtuste tegelikke mustreid.

Massi juhuslike nähtuste vaatlemise tulemusena saadud statistiliste eksperimentaalsete andmete salvestamise, kirjeldamise ja analüüsimise meetodite väljatöötamine on teemaks. MATEMAATILINE STATISTIKA.

1

Juhusliku suuruse jaotusseaduse määramine statistiliste andmete põhjal.

Kuna praktikas peame tegelema piiratud hulga eksperimentaalsete andmetega, sisaldavad vaatlustulemused alati juhuse elementi.

Seetõttu tekib ülesanne statistiliste andmete silumine ja nende kirjeldamine lihtsate analüütiliste sõltuvuste abil.

2

Hüpoteeside usutavuse kontrollimine.

See ülesanne on seotud eelmisega. Näiteks võib see vastata küsimusele: kas katse tulemused on kooskõlas hüpoteesiga, et juhuslik suurus järgib antud jaotusseadust?

3

Tundmatute parameetrite jaotuse määramine

Tihti tuleb katseandmete põhjal määrata mitte SW jaotuse seadust ennast, vaid mõningaid arvulisi karakteristikuid.Väikese arvu katsete puhul määratakse ainult nende parameetrite “hinnangulised” väärtused, s.t. sellised ligikaudsed väärtused, mis viivad keskmiselt väiksemate vigadeni kui

Rõivatehase turundusosakond viis läbi küsitluse 100 kliendi seas. Küsitlusküsimuste hulgas oli küsimusi meeste ülikondade kohta. Küsimustike töötlemine andis eelistuste kohta järgmised tulemused:

Tootmiskoha järgi: 40% - kodumaine, 60% - imporditud.

2. Kulu järgi USA dollarites:

« Valed, neetud valed ja statistika"(täisversioon: Valet on kolme tüüpi: valed, neetud valed ja statistika., Inglise Valet on kolme tüüpi: valed, neetud valed ja statistika ) - Briti peaministrile Benjamin Disraelile omistatud avaldus, mis sai kuulsaks tänu Mark Twainile pärast raamatu "Minu autobiograafia peatükk" avaldamist Põhja-Ameerika ülevaates 5. juulil 1907: "Arvud on petlikud," kirjutas ta. , „Olen ​​selles isiklikust kogemusest veendunud; Disraeli rääkis sellest õigesti: "Valed on kolme tüüpi: valed, neetud valed ja statistika." Seda fraasi aga Disraeli teostes ei esine. Samuti ei tuntud teda ei tema eluajal ega vahetult pärast tema surma. Tänapäeva ideede seisukohalt on kõige tõenäolisem autorkandidaat Charles Dilk (1843-1911).

Seda ütlust on omistatud paljudele teistele peale Disraeli: ajakirjanikule ja poliitikule Henry Labouchere'ile (1831-1912) ja Leonard Courtenayle (1832-1918), kes kasutas seda väljendit 1895. aastal. Kaks aastat hiljem sai temast Kuningliku Statistikaühingu president.

Nüüdseks on teada, et seda fraasi kasutati esmakordselt kirjas, mis kirjutati 8. juunil 1891 ja avaldati 13. juunil 1891 ajakirjas National Observer (lk 93(-94): NATIONAL PENSIONS London, 8th June 1891) : "Härra, ... märkis väga vaimukalt, "et valesid on kolme tüüpi: esimene on ebatõde, teine ​​on otsene valed ja lõpuks on kõige hullem statistika." Veidi hiljem, oktoobris 1891, saatis ajakirjas Notes and Queries pseudonüümi "St Swithin" all olev isik küsimuse selle fraasi autorluse kohta, mis viitab selle laialdasele kasutamisele juba neil päevil. 1891. aasta oktoobris kasutas Charles W. Dilke seda väidet kaks korda ilma igasuguse omistamiseta. "Sir Charles Dilke (1843-1911) ütles eile, et tema arvates võib "valed" liigitada üha suuremal määral järgmiselt: valged valed, valed ja statistika" (The Bristol Mercury ja Daily Post, Monday, October 19 1891 G. ). Dr. E.R.L. Gould, kes kasutas seda väljendit 1892. aastal, viitas ka Charles Dilke autorlusele: "Sir Charles Dilke'il oli teatud mõttes õigus, kui ta ütles: "Valedel on kolm tasandit – väljamõeldis, valed ja statistika...".

Nagu Robert Giffen (The Economisti abitoimetaja ja 1882-84 Statistical Society president) mainib 1892. aastal, on väide "statistika kohta" vaid tõlgendus lausest "On vana nali, et valetajaid on kolme tüüpi: tavalised petised, ennekuulmatud valetajad ja teaduseksperdid. Hiljem hakkasid nad asju veidi teisiti rääkima: valedel on kolm astet: valed, häbematud valed ja statistika. .

Originaali päritolu (“ekspertide kohta”) on omistatud varasemale perioodile kui väide “statistika kohta”, nimelt ajakirjas Nature 26. novembril 1885 (pange tähele, et Disraeli oli selleks ajaks juba surnud), lk 74. leida: "... Ühel tuntud advokaadil, praegu kohtunikul, tuli pähe jagada tunnistajad kolme rühma: lihtsad valetajad, neetud valetajad ja eksperdid."

Märkmed


Wikimedia sihtasutus. 2010. aasta.

Vaadake, mis on "valed, jultunud valed ja statistika" teistes sõnaraamatutes:

    Kõigist pseudoteadustest kõige täpsem. Jin Ko statistika suudab tõestada kõike, isegi tõde. Noel Moynihani statistika on teadus selle kohta, kuidas saate arvud seda teha ilma, et oleksite võimelised mõtlema ja aru saama. Vassili Kljutševski Statistika on nagu ujumistrikoo...

    Valet on nelja tüüpi: valed, neetud valed, statistika ja tsitaadid. Sa ei tohiks häbitult valetada; kuid mõnikord on vaja kõrvalehoidmist. Margaret Thatcher Uskuge ainult poolt sellest, mida näete ja mitte midagi sellest, mida kuulete. Inglise vanasõna...... Aforismide koondentsüklopeedia

    Histogramm (graafiliste kujutiste meetod) Sellel terminil on muid tähendusi, ... Wikipedia

    Statistika- (Statistika) Statistika on üldteoreetiline teadus, mis uurib kvantitatiivseid muutusi nähtustes ja protsessides. Riigistatistika, statistikateenused, Rosstat (Goskomstat), statistilised andmed, päringustatistika, müügistatistika,... ... Investorite entsüklopeedia

    - (1835 1910) Ameerika kirjanik Hell on ainus tõeliselt oluline kristlik kogukond universumis. Pankur on inimene, kes laenab sulle päikesepaistelisel päeval vihmavarju ja viib selle ära, kui vihma hakkab. Bill...... Aforismide koondentsüklopeedia

    Tsitaat: kellegi teise sõnade vale kordamine. Ambrose Bierce Quote on risk kellegi teise vastutusel. Vladislav Grzeszczyk Kui teid tsiteeritakse, olete juba keegi. Kui keegi sinult varastab, oled sa silmapaistev inimene. Kuid tõeline hiilgus algab alles siis, kui... Aforismide koondentsüklopeedia

    Garri Kasparov Garri Kimovitš Kasparov Garri Kasparov, 2007 Sünniaeg: 13. aprill 1963 (46-aastane) Sünnikoht ... Wikipedia

On väga "habemega" ütlus. Kindlasti kuulsid sa teda. Nii…

Valet on kolme tüüpi:

  1. Kurb vale
  2. Statistika

Tavaliselt öeldakse sel hetkel sõna “labidas” ja kõik naeravad. Aga vaatame fakte, mis praegu viimastes uudistes vilksatavad.

Fakt nr 1

"Levada keskus" korraldas sotsiaaluuringu (küsitleti igas vanuses venelasi), mis näitas, et meie riigi populaarseim suhtlusvõrgustik on Odnoklassniki. See koosneb ligikaudu 76% vastanutest.

Lahe! Jookseme kiiresti sinna kontot avama! Nende jaoks, kes on paagis, kirjeldatakse Odnoklassnikis registreerumist üksikasjalikult saidil akak.ru lingil. See on sait, mis sisaldab juhiseid selle kohta, mida teha.

Aga see, nagu aru saate, on Levada keskuse statistika.

Fakt nr 2

  • Nende andmete järgi on kõige populaarsem võrk VKontakte. Tuleb sisse 38 miljonit külastajat päeva kohta.
  • Odnoklassnikis on 30 miljonit külastajat.
  • "Minu maailm" - 16 miljonit.

Küsimus nr 1: keda uskuda?

Sest see on statistika kolmandat tüüpi vale, siis ei saa kedagi usaldada. Kuidas arvutada sotsiaalvõrgustiku populaarsust ainult kaudsete andmete põhjal?

Küsitlus. Mida ta näitas? Ainult fookusgrupi eelistused.

Kuhu ta välja valiti? Kuidas teid intervjueeriti? Millises piirkonnas? Kas nad rääkisid tõtt?

Arvamusküsitluste järgi kasutab 100% venelastest internetti! Küsitlus viidi läbi veebilehel.

Külastajate arv päevas. Mida see näitab?

Kujutage ette keskmist kontoritöötajat. Tal on telefoni installitud VKontakte, ta läheb sinna töölt ja siis õhtul kodust. See on juba 3 erineva IP, brauseriga jne külastajat.

Samal ajal on Odnoklassnikil vanem sihtrühm. See tähendab, et mobiilirakendused ja ligipääs kontorist on nende jaoks suletud.

Worpos nr 2: mida selle teabega teha?

Järeldus nr 1- Statistikat ei saa pimesi usaldada!

Järeldus nr 2— Ilmselt on kõige populaarsemad suhtlusvõrgustikud VKontakte ja Odnoklassniki. Arvan, et esikolmikus on ka LJ (kuigi need on “sotsiaalmeedia”).

Järeldus nr 3— Kui teil on inimestele midagi rääkida või pakkuda, looge kontod populaarseimatesse suhtlusvõrgustikesse. Kindlasti ei saa eksida.

Järelsõna

Nagu ütleb Dr House’i (telesari “Dr. House”) lööklause: “...Kõik valetavad...”. Mäleta seda.

Ja doktor Lexium oli teiega
Pea meeles, et vajadus oma peaga mõelda pole veel tühistatud.

Sait selgitas välja, milline on statistiliste andmete võltsimise protsent psühholoogiaalastes teadustöödes, milliseid vigu kontrolliprogramm paljastas ja kuidas see sarnaneb T9-ga.

Saated ei saa mitte ainult postmodernsete laulusõnadega, Londoni metroo teekonnaga, simuleerida protsesse pangas, vaid otsida ka vigu ebaausate või tähelepanematute psühholoogide töös. sait räägib, kuidas arvuti tuvastab teaduslikes tööde ebatäpsused ja milleni see võib viia.

Kaasaegse psühholoogia sära ja vaesus

“Argitarkuse” ning filosoofiliste ja metafüüsiliste kategooriate vahel järjepidevate andmete peenikesel niidil balansseeriv “hingeteadus” on pidevalt liialduste ohus. Inimeste sisemaailma süvenemine (kui mitte arvestada probleemi anatoomilist külge) pole kunagi olnud lihtne, seega on psühholoogide uuringuid raske kontrollida. Omades väga subjektiivset õppeainet, ristub psühholoogia mõnes harus ja sektsioonis meditsiini ja neurobioloogiaga ning teistes ulatub teaduslikust kaugemale: isegi psühholoogiadoktor ja Venemaa Teaduste Akadeemia Psühholoogia Instituudi asedirektor Andrei Jurevitš määratles psühholoogia koha teaduse ja parateaduse vahel. Isegi kui neid rakendatakse vastavalt teadusliku metoodika reeglitele, ei anna psühholoogilised lähenemisviisid mõnikord rahuldavaid tulemusi. Kui hoolikamas ja pikaajalisemas töös ühe inimesega võib eeldada juhtumi unikaalsust ja tõdeda, et järeldusi pole võimalik kõigile inimestele ekstrapoleerida, siis suures grupis on raske aru saada, mida ühtsed küsimused ja vastused tegelikult tähendavad. iga uuringus osaleja kohta. Lisaks võivad katsealustel alati olla sisemised põhjused, miks varjata mõnda teavet ja vastata küsimustele mitte täiesti ausalt. Seetõttu ei saa refleksiooni (inimese tähelepanu sissepoole pööramist) pidada vahendiks, mis võimaldab saada absoluutselt usaldusväärset teavet. arvutialgoritmi kohta, mis tuvastas ligi kaheksa tuhande psühholoogilise artikli võimalikud vead (ja seda ainult ajavahemikul 1985–2013 ja ainult kaheksas psühholoogilises teadusajakirjas), töötas nagu pulk, mis ajas üles sarvepesa, mis oli niigi pideva vaidluse tõttu hädas. . Michelle Nuyteni eestvedamisel analüüsiti 30 717 artiklit, millest 16 695 kasutas statistilisi andmeid. Pooltel neist paberitest oli vähemalt üks kahtlustatav statistiline viga, millele programm osutas.

Kui uuring viiakse läbi suurel hulgal teemadel, kasutatakse töötlemiseks statistilisi meetodeid. Populaarne ütlus "valed on kolme tüüpi: valed, neetud valed ja statistika", mille autor on nii ebamäärane, et enam kui sada aastat tagasi omistas Mark Twain selle Benjamin Disraelile (kuid polnud enam kindel, kust see tegelikult pärit on). , pole tõest nii kaugel. Inimteadmiste valdkonnas, kus on nii raske luua usaldusväärse ennustamisjõuga teooriaid (meenutagem sedasama Sigmund Freudi või Alfred Adlerit), on juhusliku eksimise oht ja kiusatus tegelik tulemus tahtlikult soovitud tulemusele „kohandada“. on üsna kõrge.

Kuidas arvuti tabas ebaausad psühholoogid teolt

Programm, mis kinnitas selle iroonilise tähelepaneku paikapidavust, kannab nime Statcheck. See analüüsib P-väärtust, suurust, mida teadlased kasutavad statistiliste hüpoteeside kontrollimiseks. See joonis näitab, kui tõenäoline on tulemus, kui uuringu aluseks olev nullhüpotees on tõene. Ajakirjas Behavior Research Methods avaldatud artikkel näitab, et programm hindas kahe tunni jooksul enam kui 258 000 p-väärtuse (ligikaudu 11 teadustöö kohta) kehtivust, leides, et 13% artiklitest sisaldas viga, mis "pööratud" vastuvõetud andmed. Selle tulemusena näiteks P< 0,05 превращается в P = 0,05, или некоторые знаки после запятой просто отбрасываются, а не влияют на следующий знак по правилам округления чисел. Казалось бы, такое маленькое различие не должно серьезно влиять на результат, однако чаще всего P = 0,05 принимается как пограничное значение между статистически достоверным и недостоверным результатом. В итоге малейшее отклонение в одну или в другую сторону делает вывод в статье ложноположительным или ложноотрицательным.

Algselt töötas programm üldiselt kirjandusega, kuid üks uuringu kaasautoritest, Tilburgi ülikooli (Holland) teadusmetodoloogia spetsialist Chris Hartgerink soovitas keskenduda spetsiifilisematele tekstidele – teadusartiklitele. Hiljem, selle aasta augustis, laadis ta kontrollimiseks üles 50 000 artiklit ja postitas tulemused Pub Peeri (teadlaste foorum, kus nad sageli avaldatud teadusartikleid arutavad), põhjustades professionaalses ringkonnas tohutut vastukaja. Hutgerinki sõnul teavitavad sellised postitused autoreid võimalikest vigadest ja "toovad teadusele palju rohkem kasu kui lihtsalt andmeprügi". Kõik ei nõustu temaga, nagu teatab Monia Bakeri aruteluartikkel ajakirjas Nature. Mõned teadlased, sealhulgas Saksa Psühholoogide Assotsiatsiooni esindajad, hoiatavad, et valenegatiivsed tulemused (siinkohal peame silmas arvutit, mis parandab õigeid andmeid valede jaoks) võib pigem kahjustada teadlaste mainet kui aidata kaasa psühholoogia kui teaduse arengule. Washingtoni psühholoogiateaduste assotsiatsiooni tegevdirektor vastas väljaandele, öeldes, et mõistab hukka psühholoogide "endeemilise teotamise" ajaveebides ja sotsiaalmeedias, tehes selgeks, et arvutianalüüsi tulemuste avaldamist koos võimalike vigadega tuleks käsitleda solvang.

Statcheck ja P-väärtus: kes on koldes, kes üleval?

Teisalt propageerivad sellised postitused avatud teaduse kontseptsiooni (muide, nii Nuytenil kui Hartgerinkil on selle valdkonna arengut soodustavate organisatsioonide auhinnad), mis võimaldab statistilisi ebatäpsusi kiiremini üles leida ja parandada. Hollandi Groninghami ülikooli psühholoogiateadlase Nick Browni sõnul aitavad sellised algoritmid ainult siis, kui teadlased loevad neid ja hindavad neid ekspertide vaatenurgast, mitte ei usalda lihtsalt ajakirja, mis avaldas küsitavaid artikleid. vead.

Hetkel on sellest võimalusest inspireerituna selle R programmeerimiskeeles kirjutatud programmi tasuta alla laadinud mitu tuhat inimest.

Statcheck ise võib aga teha vigu, nagu Thomas Schmidt oma programmi kriitikas nendib. Näiteks ei võta see alati arvesse vajalikke statistilisi vigu ja mõnikord ei saa aru, mis artiklis valesti on: P-väärtus või suhteline parameeter. Pärast kahe suure hulga statistiliste andmetega artiklite skannimist leidis ta, et programm ei suutnud hinnata 43 parameetrit, kontrollis 137 ja tuvastas 35 kui potentsiaalselt valed. Kaks neist olid vead, mis ei mõjutanud tulemust, kolm olid vead muudes parameetrites, mis ei olnud seotud P-väärtusega, ja ülejäänud 30 olid "valehäirete" tagajärjed.

Mõned psühholoogiaajakirjad on hakanud isegi loobuma p-väärtusest hüpoteeside paikapidavuse kontrollimisel, pidades seda parameetrit ebapiisavalt usaldusväärseks.

Loojad ise ei eita, et nende programm "ei ole kunagi nii täpne kui käsitsi kontrollimine", kuid nad rõhutavad selle töö kiirust: kui ühe keskmise psühholoogilise artikli P-väärtuse usaldusväärsuse kontrollimiseks kulub kümmekond minutit, siis saab programm mõne tunniga hakkama kümnete tuhandetega, mis on hädavajalik teadusajakirjade toimetajatele saadetud artiklite metaanalüüsi või esmase kontrolli läbiviimiseks. Ajakirja Psychological Science toimetajad on seda selles ametis kasutanud alates selle aasta juulist. Nad võrdlevad seda programmi Wordi või T9 korrektoritega, mille absurdsuse üle kõik naeravad, kuid vähesed oleksid nõus alla andma. Nagu neid automaatkorrektoreid, võib ka Statchecki nende arvates pidada "mugavaks tööriistaks, mis mõnikord ütleb rumalusi".