Kłamstwa, podłe kłamstwa i statystyki. Kłamstwa, cholerne kłamstwa i statystyki

.
Pełna wersja tego aforyzmu: „Istnieją trzy rodzaje kłamstw: kłamstwa, przeklęte kłamstwa i statystyki”. (Język angielski)Istnieją trzy rodzaje kłamstw: kłamstwa, przeklęte kłamstwa i statystyki). Jego autorstwo przypisuje się różnym osobom, a sławę zyskało dzięki M. Twainowi po opublikowaniu 5 lipca 1907 roku w „North American Review” „A Chapter of My Autobiography”: „Liczby są zwodnicze” – pisał – „ Nauczyłem się tego z własnego doświadczenia; Disraeli słusznie o tym mówił: „Są trzy rodzaje kłamstw: kłamstwa, przeklęte kłamstwa i statystyki”. Niektórzy uważają, że oryginalne zdanie brzmiało tak: „Istnieje stary dowcip, że istnieją trzy rodzaje kłamców: zwykli kłamcy, bezczelni kłamcy i eksperci naukowi”, a dopiero później zaczęto mówić coś nieco innego: „Istnieją trzy stopnie kłamstwa: kłamstwa, bezwstydne (rażące) kłamstwa i statystyki.”
Jest mało prawdopodobne, aby było aż tak istotne, kto jest autorem tego aforyzmu, ważne jest to, że dobrze ilustruje on sytuację tym, co „eksperci” lekarze mówią większości osób cierpiących na poważne (i mniej poważne) choroby.

****
W 1992 roku lekarze zdiagnozowali u słynnego amerykańskiego paleontologa i biologa Stephena Goulda raka (międzybłoniaka otrzewnej) i podali, że z tą diagnozą żyją średnio 8 miesięcy. Gould uporządkował swoje sprawy, ale nie poddał się, ale zaczął poddawać się leczeniu - operacji, chemioterapii i radioterapii. I umarł. Za dwadzieścia lat.
.
Dwa lata po ogłoszeniu diagnozy w czasopiśmie Discover opublikował artykuł „Mediana nie jest przesłaniem”, w którym jasno opisał, jak powiązane są statystyki i konkretne przypadki z życia. Oryginał tekstu znajduje się pod linkiem, poniżej znajduje się link prawie kompletne tłumaczenie, a potem moje komentarze.

.
Przedmowa do artykułu – S. Dunn (Steve Dunn, twórca strony internetowej http://cancerguide.org, któremu lekarze zdiagnozowali raka nerki w stadium 4, po którym usunięto nerkę. Po takim „leczeniu” prowadził bardzo aktywną działalność prowadziłem przez 17 lat tryb życia, ożeniłem się, urodziłem dzieci, uprawiałem turystykę górską i narciarstwo, zmarłem w sierpniu 2005 roku na zupełnie inną chorobę (zakaźne zapalenie opon mózgowo-rdzeniowych).

.
Stephen Jay Gould był wpływowym biologiem ewolucyjnym, wykładowcą na Uniwersytecie Harvarda i autorem co najmniej kilkunastu popularnych książek z różnych dziedzin nauki.
O ile wiem, ten artykuł jest najmądrzejszym i najbardziej humanitarnym artykułem, jaki kiedykolwiek napisano na temat raka i statystyk. Jest antidotum zarówno dla tych, którzy twierdzą, że „statystyka nie ma znaczenia”, jak i dla tych, którzy mają w zwyczaju wydawanie „wyroków śmierci” na pacjentów ze fatalnymi rokowaniami. Każdy, kto szuka odpowiedzi w oficjalnej literaturze medycznej, znajdzie tam „straszne statystyki” dotyczące niemal każdej choroby. Każdy, kto przeczyta ten artykuł, nabierze nadziei.

Nie wierz medianie „The Mediana jest" T the Wiadomość"
.
Ostatnio moje życie nieustannie ilustrują dwa słynne dowcipy Marka Twaina. Jedno zachowam na koniec tego artykułu, a drugie (czasami przypisywane Disraeliemu) mówi o trzech rodzajach kłamstw, każde gorsze od poprzedniego – kłamstwach, przeklętych kłamstwach i statystykach.
.
Rozważmy standardowy przykład „rozmazywania” prawdy w przestrzeni lub czasie – co okazało się bardzo istotne dla mojej osobistej historii. Statystyka rozpoznaje różne sposoby definiowania „średniej” lub „przeciętnej tendencji”. Nasza zwykła koncepcja definicji Średnia wartość jest dość proste - dodaj wartości wszystkich elementów i podziel uzyskaną sumę przez liczbę elementów (100 cukierków zebranych przez pięcioro dzieci w Halloween daje każdemu dziecku 20 cukierków w tym idealnym świecie). - kolejną miarą średniej tendencji jest wartość funkcji znajdującej się pośrodku wykresu. Na przykład, jeśli uszereguję pięcioro dzieci według wzrostu, środkowe dziecko będzie niższe od dwójki poprzednich i wyższe od dwójki kolejnych (jednak ta dwójka niskich dzieci może mieć problemy z podzieleniem się słodyczami w grupie z wyższymi dziećmi...).
.
Innym sposobem zilustrowania tego jest stwierdzenie przywódcy politycznego z dumą: „Średni dochód naszych obywateli wynosi 15 000 dolarów rocznie”, na co przywódca opozycji mógłby odparć: „Ale połowa naszych obywateli ma realny dochód niższy niż 10 000 dolarów rocznie.” I obaj będą mieli rację, chociaż żaden z nich nie używa statystyk w sposób bezstronny i obiektywny. O czym mówi pierwszy Średnia arytmetyczna , drugie - o mediana (średnia arytmetyczna jest w takich przypadkach większa od mediany, gdyż jeden milioner może przy obliczaniu średniej przeważyć setki biednych, ale przy obliczaniu mediany może przewyższyć tylko jednego biedaka).
.
Im ważniejsze (głębsze, bardziej niebezpieczne, trudne itp.) pytanie, tym większa nieufność i pogarda dla statystyki przy jego rozpatrywaniu. Wiele osób pozwala na tragiczną i niedopuszczalną przepaść pomiędzy swoim sercem i umysłem, uczuciami (odczuciami) i intelektem. Przeciwnie, w niektórych współczesnych tradycjach zbyt duży nacisk kładzie się na uczucia jako podstawę działania, podczas gdy intelekt schodzi na dalszy plan jako „przestarzałe narzędzie”. W tej absurdalnej dychotomii statystyki często określa się mianem „wroga”.
.
Artykuł ten to osobista historia przyjaźni z prawidłowo zinterpretowanymi statystykami, które inspirują i dają nadzieję. To krótka opowieść o przydatności bezstronnej wiedzy naukowej oraz o tym, że głowa i serce są koordynatorami działań jednego ciała, jednej osoby.
.
W lipcu 1982 roku dowiedziałem się, że tak , rzadką i poważną postać raka. Kiedy wyszedłem ze znieczulenia po operacji, moim pierwszym pytaniem do lekarza i chemioterapeuty było: „Jaka jest najlepsza literatura na temat międzybłoniaka?”, na co otrzymałem odpowiedź z wyraźnym wydźwiękiem dyplomatycznym, że w literaturze medycznej nie ma nic, co by to wskazywało na to, że naprawdę warto było przeczytać.
.
Cóż, oczywiście doradzanie naukowcowi, aby trzymał się z daleka od książek, jest tak samo skuteczne, jak doradzanie homo sapiens, aby zachowywał czystość i powstrzymywał się od seksu. Gdy tylko mogłem chodzić, poszedłem prosto do Biblioteki Medycznej Harvarda i wpisałem do komputera zapytanie o wszystko, . Godzinę później, w otoczeniu całej dostępnej literatury na temat międzybłoniaka jamy brzusznej, zrozumiałam, dlaczego mój lekarz udzielił mi tak humanitarnej rady. W całej literaturze, którą znalazłem, informacja nie mogła być bardziej jednoznaczna: Międzybłoniak jest chorobą nieuleczalną, a średni wskaźnik śmiertelności wynosi zaledwie osiem miesięcy od rozpoznania. przez jakieś piętnaście minut, po czym uśmiechnął się i powiedział sobie: dlatego nie pozwalają mi nic czytać! Dzięki Bogu, wtedy mój umysł znów zaczął pracować.
.
Natknąłem się na klasyczny przykład kiedy " A to ma bezpośrednie przełożenie na walkę z nowotworem. Być może dlatego, że nasz stan psychiczny „karmi” układ odpornościowy, ale osoby chore na ten sam typ nowotworu, różniące się wiekiem, klasą społeczną, warunkami korzystania z opieki medycznej w ogóle – mają pozytywne nastawienie do życia, silną wolę i cele życiowe – i żyć dłużej, na pewno będą walczyć lub przynajmniej szukać sposobów wyjścia z choroby, a nie tylko biernie akceptować wszystko, co mówią lekarze. Kilka miesięcy później zapytałem Medawara Sir, mojego osobistego guru naukowego i zdobywcę Nagrody Nobla w dziedzinie immunologii, jaki może być najlepszy przepis na sukces w walce z rakiem? „Osobowość osoby optymistycznej” – odpowiedział krótko. Na szczęście (bo nie da się zmienić siebie w krótkim czasie i mając jeden konkretny cel) zawsze byłam osobą zrównoważoną i pewną siebie, o dokładnie takim charakterze.
.
Rodzi to dylemat przed lekarzami: w końcu, jeśli osobiste podejście człowieka do tego, co go spotyka, jest tak ważne, po co wyciągać tak ponure wnioski (przepowiednie?..), zwłaszcza gdy tylko nieliczni mają wystarczające zrozumienie zasad statystyki ocenić co W rzeczywistości czy oznacza to czy tamto stwierdzenie? Osobiście miałam takie zrozumienie i jestem przekonana, że ​​odegrało to ważną rolę w uratowaniu mi życia. Wiedza jest prawdziwa siła!
.
Krótko mówiąc, pierwsze (i być może najważniejsze) pytanie mogłoby brzmieć: co dokładnie oznacza wyrażenie „mediana współczynnika umieralności wynosi osiem miesięcy”? Podejrzewam, że większość ludzi, bez dużej wiedzy statystycznej, przetłumaczyłaby to zdanie jako „Prawdopodobnie umrę za osiem miesięcy” – jest to dokładnie ten pochopny wniosek, którego należy unikać, ponieważ… Bardzo istotne jest samo podejście do sytuacji i prognoz.
Oczywiście nie byłem zachwycony, ale też nie interpretowałem danych w ten sposób. Moje zaplecze techniczne pozwoliło mi spojrzeć z innej perspektywy na „ośmiomiesięczny współczynnik śmiertelności przyśrodkowej”.
.
Wciąż dźwigamy historyczny ciężar spuścizny Platona, zabiegając o wyjaśnienie wszystkiego, o jasne definicje i rozróżnienia, próbując w ten sposób na przykład znaleźć jednoznaczny „początek życia” czy precyzyjną definicję śmierci, choć natura często wydaje się nas jako kontinuum z płynnym przejściem jednego do drugiego. To dziedzictwo platońskie, kładące nacisk na wyraźne rozróżnienia i oddzielenie niepodzielnych, prowadzi nas do fałszywych szacunków danych statystycznych. Krótko mówiąc, średnią i medianę postrzegamy jako twardą „rzeczywistość”, a wręcz przeciwnie, nie bierzemy pod uwagę całego szeregu różnych zmiennych i niedoskonałości pomiaru. Jeśli po prostu przyjmiesz medianę jako coś oczywistego i weźmiesz pod uwagę otoczenie wokół niej w celu głębszej analizy i obliczeń, wówczas interpretacja „Prawdopodobnie umrę za osiem miesięcy” może stracić na znaczeniu. (nawiasem mówiąc, możliwa jest również sytuacja odwrotna - E.M.)
.
Ale wszyscy biolodzy ewolucyjni, do których należę, wiedzą, że to zmienność pewnych parametrów jest niezmienną istotą wszystkich żywych istot. Surową rzeczywistością są zmiany, odmiany tego samego. Średnia statystyczna i mediana to tylko abstrakcje. Spojrzałem więc na statystyki dotyczące międzybłoniaka zupełnie inaczej – i to nie tylko dlatego, że jestem optymistą, który stara się widzieć sam pączek, a nie dziurę, ale przede wszystkim dlatego, że wiem, że rzeczywistość stanowi tylko odmiana. Musiałem umiejscowić się pomiędzy tymi różnymi odmianami.
.
Kiedy dowiedziałam się o medianie ośmiu miesięcy, moją pierwszą intelektualną reakcją było: „świetnie, połowa ludzi żyje dłużej niż te osiem miesięcy. A co z moimi szansami na dostanie się na tę połowę? Po godzinie nerwowych i gorączkowych obliczeń z ulgą doszedłem do wniosku: moje szanse są cholernie duże. Miałem każdą z cech, które zwiększały prawdopodobieństwo, że będę żył dłużej: byłem młody; moja choroba została zdiagnozowana na stosunkowo wczesnym etapie; Mogę uzyskać lepsze leczenie; Chcę żyć; Wiem jak prawidłowo interpretować dane i nie zniechęcam się.
.
Jeszcze większy komfort dodała mi kolejna kwestia techniczna. Od razu zdałem sobie sprawę, że rzeczywisty rozkład zmienności na „ośmiomiesięcznej medianie” prawie na pewno będzie tym, co statystycy nazywają „przekrzywionym w prawo” (przy rozkładzie symetrycznym profil wykresu na lewo od mediany jest lustrzanym odbiciem profil po prawej stronie; przy skośności rozkład na jedną połowę jest bardziej „wydłużony” ).
.

.
Doszedłem do wniosku, że w przypadku mojego międzybłoniaka wykres powinien być przesunięty w prawo (skośność dodatnia), bo przecież część wykresu na lewo od mediany opisuje tylko te przypadki, w których międzybłoniak jest diagnozowany pośmiertnie lub pośmiertnie. na krótki czas przed śmiercią człowieka. Zatem nie ma zbyt wielu możliwości, aby znaleźć się w tym przedziale, ponieważ wynosi on tylko od zera do ośmiu miesięcy. Ale górna (lub prawa) połowa może rozciągać się przez wiele lat, nawet jeśli żadna ze zdiagnozowanych osób ostatecznie nie przeżyje. Rozkład powinien mieć dokładnie tę skos prawostronny, a ja muszę wiedzieć jak daleko znajduje się „ogon” wykresu – bo doszedłem już do wniosku, że mój korzystny „profil pacjenta” uczyniło mnie dobrym kandydatem na tę połowę harmonogramu.
.
Rozkład rzeczywiście jest mocno zniekształcony w prawo, ma długi „ogon”, choć nie tak dużej amplitudy, ale rozciągający się o kilka lat poza medianę wynoszącą osiem miesięcy. Nie widziałem już powodu, dla którego nie miałbym być w tym ogonie i odetchnąłem z ulgą bardzo długo. Moja wiedza techniczna pomogła mi i tym razem. Czytam wykres poprawnie. Zadałem właściwe pytanie i znalazłem odpowiedzi. Otrzymałem najprawdopodobniej najcenniejszy ze wszystkich możliwych prezentów w istniejących warunkach - znaczny czas. Nic mnie nie powstrzymywało i nic nie było w stanie zmusić, abym natychmiast poszedł za słowami Izajasza skierowanymi do Ezechiasza: „Uporządkuj swój dom, bo umrzesz i nie będziesz żył!”
.
Jeszcze jedna rzecz na temat rozkładów statystycznych: obecny „oficjalny” wykres dotyczy tylko bardzo określonego zestawu okoliczności i pokazuje wskaźnik przeżycia międzybłoniaka w przypadku konwencjonalnych schematów leczenia. Jeśli jednak zmienią się okoliczności, dystrybucja również może się zmienić. Przepisano mi eksperymentalny protokół leczenia i jeśli Fortune się uśmiechnie, znajdę się w pierwszej grupie nowego rozkładu z wysoką medianą i prawym „ogonem” wykresu, który trwa aż do śmierci z przyczyn naturalnych w starszym wieku.
.
Moim zdaniem zbyt modne stało się traktowanie akceptacji śmierci jako równoznacznej z wewnętrzną godnością. Zgadzam się oczywiście z kazaniami Kaznodziei, że „jest czas kochania i czas umierania”, a kiedy wyschnie moje źródło życia, mam nadzieję, że dojdę do końca spokojnie i z godnością. W większości przypadków wolę jednak mieć inne zdanie, a mianowicie, że o życie trzeba walczyć.
.
Wybór broni w tej walce jest bardzo szeroki, ale nic nie działa skuteczniej niż humor. O mojej śmierci ogłoszono na spotkaniu moich kolegów w Szkocji, a ja z wielką przyjemnością przeczytałem własny nekrolog, napisany przez jednego z moich najlepszych przyjaciół (swoją drogą, trudno uznać to za przypadek, że jest on statystykiem i że wierzył w moją nieuniknioną śmierć, bo nie spodziewałem się, że do tej pory znajdę mnie w prawym „ogonie” powyższego wykresu). Jednak to wydarzenie było pierwszym, które dało mi szansę na roześmianie się po usłyszeniu mojej diagnozy. Pomyśl, prawie powtórzyłem inny słynny aforyzm M. Twaina: „plotki o mojej śmierci są mocno przesadzone”.

Posłowie S. Dunna
.
Niestety, S. Gould zmarł w maju 2002 roku w wieku 60 lat, ale od postawienia diagnozy przeżył kolejne dwadzieścia bardzo produktywnych lat i tym samym przekroczył trzydziestokrotnie „statystyczną” medianę przeżycia ośmiomiesięcznego! Choć zmarł na raka, nie był to ten sam międzybłoniak, a zupełnie inny typ.
W marcu 2002 roku dr Gould opublikował swoją liczącą 1342 strony książkę Opus Magnum – The Structure of Evolutionary Theory. I wydaje się bardzo logiczne, że dr Gould, jeden z najpłodniejszych naukowców i pisarzy na świecie, był w stanie w samą porę sporządzić ostateczny opis swojej działalności naukowej i opis swojej filozofii. Ta książka jest za długa dla przeciętnego człowieka, ale dzieło S. D. Goulda pozostanie żywe. Zwłaszcza, mam nadzieję, artykuł „ TheMedianajest"TtheWiadomość".

***********
Tak naprawdę praktycznie nie będzie moich komentarzy na temat tego artykułu - ani na temat „protokołów leczenia eksperymentalnego”, ani na temat „przepowiedni lekarzy” - w moim LiveJournal jest już dużo materiałów na ten temat. Ale o tym, że statystyki często są interpretowane zupełnie „krzywo”, będą już osobne wpisy.
.
Chcę tylko zauważyć, że to nie przypadek, że w tym artykule dr Gould wspomniał o wyrażeniu „profil pacjenta” – ponieważ użył także słów „osobowość optymistyczna”, ma to związek z psychologią, a nie tylko z sytuacją finansową danej osoby jego stan lub status społeczny. Na tym świecie nic nie dzieje się przypadkowo. Kilka dni temu na LiveJournal widziałem post zatytułowany „Rola osobowości w onkologii”, w którym podano linki do eksperymentów (tak, te same statystyki) i końcowy wniosek był taki, że ta rola jest „zbyt przesadzona”. Ale niezależnie od tego, jak bardzo poszczególni obywatele chcą odizolować się od swojej psychiki (od swojej osobowości), niezależnie od tego, jak bardzo chcą wierzyć, że choroba „schodzi skądś z góry z przyczyn od mnie niezależnych”, komentując to wszystko słowami typu: „Mam już tego dość”. Ci wszyscy wyznawcy psychologicznej natury raka” – nie da się wyrzucić słów z piosenki – nie da się od siebie uciec.
.
Ale o tym będzie następny post.
.
Bądź zdrów. Żyj z humorem.

Marka Twaina

Prawa teorii prawdopodobieństwa nie są abstrakcyjne, ale matematycznie wyrażają rzeczywiste wzorce masowych, losowych zjawisk naturalnych.

Przedmiotem opracowania jest rozwój metod rejestracji, opisu i analizy statystycznych danych eksperymentalnych uzyskanych w wyniku obserwacji masowych zjawisk losowych STATYSTYKA MATEMATYCZNA.

1

Wyznaczanie prawa rozkładu zmiennej losowej na podstawie danych statystycznych.

Ponieważ w praktyce mamy do czynienia z ograniczoną ilością danych eksperymentalnych, wyniki obserwacji zawsze będą zawierały element przypadku.

Powstaje zatem zadanie wygładzenia danych statystycznych i opisania ich za pomocą prostych zależności analitycznych.

2

Sprawdzanie wiarygodności hipotez.

To zadanie jest powiązane z poprzednim. Może na przykład odpowiedzieć na pytanie: czy wyniki eksperymentu są zgodne z hipotezą, że zmienna losowa spełnia dane prawo rozkładu?

3

Wyznaczanie rozkładu nieznanych parametrów

Często konieczne jest określenie nie samego prawa rozkładu SW na podstawie danych eksperymentalnych, ale niektórych charakterystyk numerycznych.W niewielkiej liczbie eksperymentów wyznaczane są jedynie „oszacowane” wartości tych parametrów, tj. takie przybliżone wartości, które prowadzą średnio do mniejszych błędów niż

Dział marketingu fabryki odzieży przeprowadził ankietę wśród 100 klientów. Wśród pytań ankietowych znalazły się pytania dotyczące garniturów męskich. Przetwarzanie kwestionariuszy dało następujące wyniki dotyczące preferencji:

Według miejsca produkcji: 40% - kraj, 60% - import.

2. Według kosztów w dolarach amerykańskich:

« Kłamstwa, cholerne kłamstwa i statystyki"(pełna wersja: Istnieją trzy rodzaje kłamstw: kłamstwa, przeklęte kłamstwa i statystyki., Język angielski Istnieją trzy rodzaje kłamstw: kłamstwa, przeklęte kłamstwa i statystyki ) – wypowiedź przypisana brytyjskiemu premierowi Benjaminowi Disraeli, która stała się sławna dzięki Markowi Twainowi po opublikowaniu 5 lipca 1907 roku w „North American Review” „Rozdziału mojej autobiografii”: „Liczby są zwodnicze” – napisał „Jestem o tym przekonany z własnego doświadczenia; Disraeli słusznie o tym mówił: „Są trzy rodzaje kłamstw: kłamstwa, przeklęte kłamstwa i statystyki”. Jednak to zdanie nie pojawia się w pracach Disraelego. Nie była też znana ani za jego życia, ani wkrótce po jego śmierci. Z punktu widzenia idei współczesnych najbardziej prawdopodobnym kandydatem na autorstwo jest Charles Dilk (1843-1911).

Powiedzenie to przypisywano nie tylko Disraelemu, ale także wielu innym osobom: dziennikarzowi i politykowi Henry’emu Labouchere (1831–1912) oraz Leonardowi Courtenayowi (1832–1918), który użył tego określenia w 1895 r. Dwa lata później został prezesem Królewskiego Towarzystwa Statystycznego.

Obecnie wiadomo, że wyrażenie to zostało po raz pierwszy użyte w liście napisanym 8 czerwca 1891 r. i opublikowanym 13 czerwca 1891 r. w National Observer (s. 93(-94): NATIONAL PENSIONS Londyn, 8 czerwca 1891 r.). : „Proszę pana, ... bardzo dowcipnie zauważył, „że istnieją trzy rodzaje kłamstw: pierwszy to nieprawda, drugi to zwykłe kłamstwa i wreszcie najgorsze są statystyki”. Nieco później, w październiku 1891 roku, w czasopiśmie „Notes and Queries” osoba występująca pod pseudonimem „St Swithin” zadała pytanie o autorstwo tego wyrażenia, co wskazuje na jego powszechne użycie już w tamtych czasach. W październiku 1891 roku Charles W. Dilke bez podania źródła użył tego stwierdzenia dwukrotnie. „Sir Charles Dilke (1843-1911) powiedział pewnego dnia, że ​​jego zdaniem „kłamstwa” można w coraz większym stopniu klasyfikować jako: białe kłamstwa, kłamstwa i statystyki” (The Bristol Mercury i Daily Post, poniedziałek, 19 października 1891 r. G. ). Dr. E.R.L. Gould, który użył tego wyrażenia w 1892 r., również przytoczył autorstwo Charlesa Dilke: „Sir Charles Dilke miał w pewnym sensie rację, kiedy powiedział: «Istnieją trzy poziomy kłamstwa – fikcja, kłamstwa i statystyki...»”.

Jak Robert Giffen (zastępca redaktora The Economist i w latach 1882-84 prezes Towarzystwa Statystycznego) wspomina w 1892 r., stwierdzenie „o statystyce” jest jedynie interpretacją wyrażenia „Istnieje stary żart, że są trzy rodzaje kłamców: zwykli oszuści, bezczelni kłamcy i eksperci naukowi. Później zaczęli mówić trochę inaczej: są trzy stopnie kłamstwa: kłamstwa, bezwstydne kłamstwa i statystyki”. .

Pochodzenie oryginału („o ekspertach”) przypisuje się okresowi wcześniejszemu niż stwierdzenie „o statystyce”, a mianowicie w czasopiśmie Nature z 26 listopada 1885 r. (zauważ, że Disraeli już wtedy nie żył) na s. 74 znaleźć: „...Pewnemu znanemu prawnikowi, obecnie sędziemu, przyszło do głowy podzielić świadków na trzy grupy: prostych kłamców, przeklętych kłamców i ekspertów”.

Notatki


Fundacja Wikimedia. 2010.

Zobacz, co „Kłamstwa, jawne kłamstwa i statystyki” znajdują się w innych słownikach:

    Najdokładniejsza ze wszystkich pseudonauk. Statystyki Jin Ko mogą udowodnić wszystko, nawet prawdę. Statystyka Noela Moynihana to nauka o tym, jak – nie będąc w stanie myśleć i rozumieć – można sprawić, że zrobią to liczby. Wasilij Klyuchevsky Statystyka jest jak kostium kąpielowy...

    Istnieją cztery rodzaje kłamstw: kłamstwa, przeklęte kłamstwa, statystyki i cytaty. Nie powinieneś bezwstydnie kłamać; ale czasem uniki są konieczne. Margaret Thatcher Uwierz tylko w połowę tego, co widzisz i nic w tym, co słyszysz. Przysłowie angielskie... ... Skonsolidowana encyklopedia aforyzmów

    Histogram (metoda obrazów graficznych) Termin ten ma inne znaczenia, z… Wikipedią

    Statystyka- (Statystyka) Statystyka jest ogólną nauką teoretyczną, która bada ilościowe zmiany w zjawiskach i procesach. Statystyka państwowa, usługi statystyczne, Rosstat (Goskomstat), dane statystyczne, statystyki zapytań, statystyki sprzedaży,... ... Encyklopedia inwestorów

    - (1835 1910) Amerykański pisarz Piekło jest jedyną naprawdę znaczącą wspólnotą chrześcijańską we Wszechświecie. Bankier to osoba, która pożyczy Ci parasol w słoneczny dzień i zabierze go, gdy zacznie padać. Rachunek... ... Skonsolidowana encyklopedia aforyzmów

    Cytat: nieprawidłowe powtórzenie cudzych słów. Cytat Ambrose Bierce to ryzyko, na które odpowiedzialność ponosi ktoś inny. Władysław Grzeszczyk Jeśli jesteś cytowany, to już jesteś kimś. Jeśli ktoś Cię okrada, jesteś wyjątkową osobą. Ale prawdziwa chwała zaczyna się dopiero wtedy, gdy... Skonsolidowana encyklopedia aforyzmów

    Garry Kasparow Garry Kimovich Kasparow Garry Kasparow, 2007 Data urodzenia: 13 kwietnia 1963 (46 lat) Miejsce urodzenia ... Wikipedia

Jest takie „brodate” powiedzenie. Na pewno ją słyszałeś. Więc…

Istnieją trzy rodzaje kłamstw:

  1. Paskudne kłamstwo
  2. Statystyka

Zwykle w tym momencie pada słowo „łopata” i wszyscy się śmieją. Ale spójrzmy na fakty, które obecnie migają w najnowszych wiadomościach.

Fakt nr 1

„Centrum Lewady” przeprowadziła ankietę społeczną (badano Rosjan w każdym wieku), która to wykazała najpopularniejszą siecią społecznościową w naszym kraju są Odnoklassniki. Składa się w przybliżeniu 76% respondentów.

Fajny! Biegniemy pilnie otworzyć tam konto! Dla tych, którzy są w zbiorniku, sposób rejestracji w Odnoklassnikach opisano szczegółowo na akak.ru pod linkiem. To jest witryna zawierająca instrukcje, jak co zrobić.

Ale, jak rozumiesz, są to statystyki dostarczone przez Centrum Lewady.

Fakt nr 2

  • Według ich danych najpopularniejszą siecią jest VKontakte. Wchodzi w to 38 milionów odwiedzających na dzień.
  • Odnoklassniki odwiedza 30 milionów osób.
  • „Mój świat” – 16 milionów.

Pytanie nr 1: Komu wierzyć?

Bo to statystyka trzeci rodzaj kłamstwa, to nie możesz nikomu ufać. Jak obliczyć popularność sieci społecznościowej wyłącznie na podstawie danych pośrednich?

Ankieta. Co pokazał? Tylko preferencje grupy fokusowej.

Gdzie została wybrana? W jaki sposób udzielono ci wywiadu? W jakim regionie? Czy mówili prawdę?

Według sondaży z Internetu korzysta 100% Rosjan! Ankieta została przeprowadzona na stronie internetowej.

Liczba odwiedzających dziennie. Co to pokazuje?

Wyobraź sobie przeciętnego pracownika biurowego. Ma zainstalowany VKontakte na swoim telefonie, idzie tam z pracy, a wieczorem z domu. To już 3 gości z innym adresem IP, przeglądarką itp.

Jednocześnie Odnoklassniki mają starszą grupę docelową. Oznacza to, że aplikacje mobilne i dostęp z urzędu są dla nich zamknięte.

Worpos #2: Co zrobić z tymi informacjami?

Wniosek nr 1- Nie można ślepo ufać statystykom!

Wniosek nr 2— Oczywiście najpopularniejszymi sieciami społecznościowymi są VKontakte i Odnoklassniki. Myślę, że LJ (mimo że to „media społecznościowe”) również znajduje się w pierwszej trójce.

Wniosek nr 3— Jeśli masz coś do powiedzenia lub zaoferowania innym, utwórz konta w najpopularniejszych sieciach społecznościowych. Zdecydowanie nie możesz się pomylić.

Posłowie

Jak mówi powiedzenie Dr. House’a (serial „Dr. House”): „…Wszyscy kłamią…”. Pamiętaj to.

A doktor Lexium był z tobą
Pamiętajcie, że potrzeba myślenia własną głową nie została jeszcze odwołana.

Serwis dowiedział się, jaki jest procent fałszowania danych statystycznych w pracach naukowych z zakresu psychologii, jakie błędy wykrył program weryfikacyjny i na czym polega jego podobieństwo do T9.

Programy potrafią nie tylko postmodernistyczne teksty piosenek, ścieżkę w londyńskim metrze, symulować procesy w banku, ale także wyszukiwać błędy w pracy nieuczciwych lub nieuważnych psychologów. na stronie opisano, w jaki sposób komputer identyfikuje nieścisłości w artykułach naukowych i do czego może to prowadzić.

Blask i ubóstwo współczesnej psychologii

Balansując pomiędzy „codzienną mądrością” a kategoriami filozoficznymi i metafizycznymi na cienkiej nitce spójnych danych, „nauce o duszy” stale grozi niebezpieczeństwo ekscesów. Zagłębianie się w wewnętrzny świat ludzi (jeśli nie bierze się pod uwagę anatomicznej strony zagadnienia) nigdy nie było łatwe, dlatego badania psychologów są trudne do zweryfikowania. Mając bardzo subiektywny przedmiot studiów, psychologia w niektórych jej gałęziach i sekcjach krzyżuje się z medycyną i neurobiologią, a w innych wykracza poza dziedzinę naukową: nawet doktor psychologii i zastępca dyrektora Instytutu Psychologii Rosyjskiej Akademii Nauk Andriej Jurewicz zdefiniował miejsce psychologii pomiędzy nauką a paranauką. Nawet stosowane zgodnie ze wszystkimi zasadami metodologii naukowej podejścia psychologiczne czasami nie dają zadowalających rezultatów. Jeśli w bardziej uważnej i długotrwałej pracy z jedną osobą można założyć wyjątkowość przypadku i stwierdzić, że nie da się ekstrapolować wniosków na wszystkich ludzi, to w dużej grupie trudno zrozumieć, co tak naprawdę oznaczają ujednolicone pytania i odpowiedzi dla każdego uczestnika badania. Ponadto badani mogą zawsze mieć wewnętrzne powody, aby ukryć pewne informacje i odpowiadać na pytania nie do końca szczerze. Dlatego refleksji (zwrócenia uwagi do wewnątrz) nie można uważać za narzędzie pozwalające na uzyskanie absolutnie wiarygodnych informacji. o algorytmie komputerowym, który identyfikował potencjalne błędy w prawie ośmiu tysiącach artykułów psychologicznych (i to tylko w okresie od 1985 do 2013 roku i tylko w ośmiu naukowych czasopismach psychologicznych) działał jak kij, który wzburzył gniazdo szerszeni, już niespokojne z powodu ciągłych kontrowersji . Pod przewodnictwem Michelle Nuyten przeanalizowano 30 717 artykułów, z czego 16 695 wykorzystało dane statystyczne. W połowie tych artykułów wystąpił co najmniej jeden podejrzany błąd statystyczny, który został wykryty przez program.

Jeżeli badanie przeprowadza się na dużej grupie osób, do przetwarzania wykorzystuje się metody statystyczne. Popularne powiedzenie „istnieją trzy rodzaje kłamstw: kłamstwa, przeklęte kłamstwa i statystyki”, którego autorstwo jest tak niejasne, że ponad sto lat temu Mark Twain przypisał je Benjaminowi Disraeli (ale nie był już pewien, skąd właściwie się wzięło) , nie jest tak dalekie od prawdy. W dziedzinie wiedzy ludzkiej, gdzie tak trudno tworzyć teorie o wiarygodnej mocy predykcyjnej (pamiętajcie tego samego Zygmunta Freuda czy Alfreda Adlera) ryzyko przypadkowego błędu i pokusa celowego „dopasowania” rzeczywistego wyniku do pożądanego jest dość wysoki.

Jak komputer przyłapał na gorącym uczynku nieuczciwych psychologów

Program, który potwierdził słuszność tej ironicznej obserwacji, nazywa się Statcheck. Analizuje wartość P, wielkość używaną przez naukowców do testowania hipotez statystycznych. Liczba ta pokazuje, jak prawdopodobny jest wynik, jeśli hipoteza zerowa leżąca u podstaw badania jest prawdziwa. Artykuł opublikowany w czasopiśmie Behaviour Research Methods pokazuje, że program ocenił ważność ponad 258 000 wartości p (około 11 na artykuł naukowy) w ciągu dwóch godzin i stwierdził, że 13% artykułów zawierało błąd, który „odwrócił” odebrane dane. W efekcie np. P< 0,05 превращается в P = 0,05, или некоторые знаки после запятой просто отбрасываются, а не влияют на следующий знак по правилам округления чисел. Казалось бы, такое маленькое различие не должно серьезно влиять на результат, однако чаще всего P = 0,05 принимается как пограничное значение между статистически достоверным и недостоверным результатом. В итоге малейшее отклонение в одну или в другую сторону делает вывод в статье ложноположительным или ложноотрицательным.

Początkowo program pracował ogólnie z literaturą, jednak jeden ze współautorów badania, Chris Hartgerink, specjalista metodologii naukowej z Uniwersytetu w Tilburgu (Holandia), zasugerował skupienie się na tekstach bardziej szczegółowych – artykułach naukowych. Później, w sierpniu tego roku, przesłał do weryfikacji 50 000 artykułów, a wyniki zamieścił na Pub Peer (forum naukowców, na którym często omawiają opublikowane artykuły naukowe), wywołując ogromny oddźwięk w środowisku zawodowym. Zdaniem Hutgerinka takie posty poinformują autorów o możliwych błędach i „przyniosą nauce znacznie więcej korzyści niż tylko zrzut danych”. Nie wszyscy się z nim zgadzają, jak donosi artykuł dyskusyjny Moni Baker w Nature. Część naukowców, w tym przedstawiciele Niemieckiego Towarzystwa Psychologicznego, ostrzegają, że wyniki fałszywie ujemne (mamy tu na myśli komputer poprawiający dane prawidłowe na nieprawidłowe) mogą raczej zaszkodzić reputacji naukowców niż pomóc w rozwoju psychologii jako nauki. Dyrektor wykonawczy Association for Psychological Science w Waszyngtonie w odpowiedzi na publikację stwierdził, że potępia „endemiczne oczernianie” psychologów na blogach i w mediach społecznościowych, dając jasno do zrozumienia, że ​​publikowanie wyników analizy komputerowej, wskazujących na możliwe błędy, powinno być zabronione. uznane za zniewagę.

Statcheck i wartość P: kto jest w palenisku, kto jest na górze?

Z drugiej strony takie posty promują koncepcję otwartej nauki (swoją drogą zarówno Nuyten, jak i Hartgerink mają nagrody od organizacji zachęcających do rozwoju tej dziedziny), co pozwoli szybko znaleźć i skorygować nieścisłości statystyczne. Według Nicka Browna, psychologa z Uniwersytetu w Groningham w Holandii, takie algorytmy pomogą tylko wtedy, gdy badacze je przeczytają i ocenią z punktu widzenia ekspertów, a nie po prostu okażą się nieufni wobec czasopisma, które opublikowało wątpliwe artykuły z błędy.

W tej chwili kilka tysięcy osób zainspirowanych tą możliwością pobrało za darmo ten program napisany w języku programowania R.

Jednak sam Statcheck może popełniać błędy, jak stwierdza w swojej krytyce programu Thomas Schmidt. Na przykład nie zawsze bierze pod uwagę niezbędne błędy statystyczne i czasami nie może zrozumieć, co jest nie tak w artykule: wartość P lub parametr względny. Po przejrzeniu dwóch artykułów zawierających dużą ilość danych statystycznych stwierdził, że program nie ocenił 43 parametrów, sprawdził 137 i zidentyfikował 35 jako „potencjalnie nieprawidłowe”. Dwa z nich to błędy, które nie miały wpływu na wynik, trzy to błędy w innych parametrach niezwiązanych z wartością P, a pozostałe 30 było wynikiem „fałszywych alarmów”.

Niektóre czasopisma psychologiczne zaczynają nawet odchodzić od wartości p na potrzeby badania słuszności hipotez, uznając ten parametr za niewystarczająco wiarygodny.

Sami twórcy nie zaprzeczają, że ich program „nigdy nie będzie tak dokładny jak sprawdzanie ręczne”, ale podkreślają szybkość jego działania: jeśli sprawdzenie wiarygodności wartości P jednego przeciętnego artykułu psychologicznego zajmie około dziesięciu minut, wówczas program jest w stanie obsłużyć w ciągu kilku godzin kilkadziesiąt tysięcy, co jest niezbędne do przeprowadzenia metaanalizy lub wstępnej weryfikacji artykułów przesyłanych do redaktorów czasopism naukowych. Redaktorzy czasopisma Psychological Science wykorzystują go w tym charakterze od lipca tego roku. Porównują ten program z korektorami Worda czy T9, z którego absurdu wszyscy się śmieją, ale niewielu zgodzi się na to. Ich zdaniem, podobnie jak te autokorekty, Statcheck można uznać za „wygodne narzędzie, które czasami mówi głupie rzeczy”.