Лъжи, долни лъжи и статистики. Лъжи, проклети лъжи и статистики

.
Пълната версия на този афоризъм: "Има три вида лъжи: лъжи, проклети лъжи и статистика." (английски)Има три вида лъжи: лъжи, проклети лъжи и статистика).Авторството му се приписва на различни хора и той придоби известност благодарение на М. Твен след публикуването на „Глава от моята автобиография“ в North American Review на 5 юли 1907 г.: „Числата са измамни“, пише той, „ Научих това от собствен опит; Дизраели правилно говори за това: "Има три вида лъжи: лъжи, проклети лъжи и статистика." Някои смятат, че първоначалната фраза е звучала като „Има стара шега, че има три вида лъжци: обикновени лъжци, възмутителни лъжци и научни експерти“, и едва по-късно започва да казва нещо малко по-различно: „Има три степени на лъжата: лъжи, безсрамни (явни) лъжи и статистики."
Едва ли е важно кой е авторът на този афоризъм, важното е, че той добре илюстрира ситуацията с това, което лекарите „вещи“ казват на повечето хора със сериозни (и не толкова) заболявания.

****
През 1992 г. лекари диагностицираха известния американски палеонтолог и биолог Стивън Гулд с рак (перитонеален мезотелиом) и съобщиха, че с тази диагноза живеят средно 8 месеца. Гулд подреди делата си, но не се отказа, а започна да се подлага на лечение - операция, химиотерапия и лъчетерапия. И той умря. След двадесет години.
.
Две години след обявяването на диагнозата в списание Discover той публикува статията си „Медианата не е посланието“, в която ясно описва връзката между статистиката и конкретните случаи от живота. Оригиналният текст е на линка, по-долу е почти пълен превод и след това моите коментари.

.
Предговор към статията - С. Дън (Стив Дън, създател на уебсайта http://cancerguide.org, когото лекарите диагностицираха с рак на бъбреците в стадий 4, след което бъбрекът беше отстранен. След такова „лечение“ той води много активен начин на живот от 17 години, омъжи се, роди деца, занимаваше се с алпинизъм и ски Умира през август 2005 г. от съвсем друга болест (инфекциозен менингит).

.
Стивън Джей Гулд беше влиятелен еволюционен биолог, преподавател в Харвардския университет и автор на поне дузина популярни книги в различни области на науката.
Доколкото мога да кажа, тази статия е най-мъдрата, най-хуманната статия, писана някога за рака и статистиката. Това е противоотрова както за онези, които казват, че „статистиката няма значение“, така и за онези, които имат навика да произнасят „смъртни присъди“ на пациенти, изправени пред тежки прогнози. Всеки, който търси отговори в официалната медицинска литература, ще намери там „ужасна статистика“ за почти всяко заболяване. Всеки, който прочете тази статия, ще се надява.

Не вярвайте на медианата „The Медиана не е" t на съобщение"
.
Напоследък животът ми непрекъснато се илюстрира от два известни шеги на Марк Твен. Засега ще запазя една за края на тази статия, а втората (понякога приписвана на Дизраели) говори за три вида лъжи, всяка по-лоша от предишната - лъжи, проклети лъжи и статистика.
.
Нека разгледаме един стандартен пример за „размазване“ на истината в пространството или времето – който се оказа много подходящ за моята лична история. Статистиката разпознава различни начини за дефиниране на „средно“ или „средна тенденция“. Нашата обичайна концепция за дефиниция средна стойност е съвсем проста - съберете стойностите на всички елементи и разделете получената сума на броя на елементите (100 бонбона, събрани от пет деца на Хелоуин, дават 20 бонбона на всяко дете в този идеален свят).
.
- друга мярка за средна тенденция е стойността на функцията в средата на графиката. Например, ако класирам пет деца по височина, средното дете ще бъде по-ниско от предишните две и по-високо от следващите две (тези две ниски деца обаче може да имат проблеми с споделянето на бонбони в група с по-високи деца...). Друг начин да се илюстрира това е, че политически лидер може гордо да направи изявлението: „Средният доход на нашите граждани е 15 000 долара на година“, на което опозиционен лидер може да отвърне: „Но половината от нашите граждани имат реален доход под 10 000 долара на година. И двамата ще бъдат прави, въпреки че никой от тях не използва статистика с безстрастна обективност. Първият говори за средно аритметично , второ - о медиана
.
Колкото по-важен (по-дълбок, по-опасен, труден и т.н.) е въпросът, толкова по-голямо е недоверието и пренебрежението към статистиката при разглеждането му. Много хора допускат трагична и неприемлива пропаст между сърцето и ума, чувствата (усещанията) и интелекта си. В някои съвременни традиции, напротив, твърде много се набляга на чувствата като основа за действие, докато интелектът е изместен на заден план като „остарял инструмент“. Статистиката често е етикетирана като „враг“ в тази абсурдна дихотомия.
.
Тази статия е лична история за приятелство с правилно интерпретирана статистика, която е вдъхновяваща и дава надежда. Това е кратка история за полезността на безпристрастното научно познание и факта, че главата и сърцето са координатори на действията на едно тяло, една личност.
.
През юли 1982 г. научих, че имам , рядка и сериозна форма на рак. Когато излязох от упойка след операцията, първият ми въпрос към лекаря и лекаря по химиотерапия беше: „Коя е най-добрата литература за мезотелиома?“ На което получих отговор с ясен дипломатичен оттенък, че в медицинската литература няма нищо подобно наистина си заслужаваше четенето.
.
Е, разбира се, съветването на учен да стои далеч от книгите е също толкова ефективно, колкото съветването на хомо сапиенс да бъде целомъдрен и да се въздържа от секс. Веднага щом можех да ходя, отидох направо в медицинската библиотека на Харвард и въведох запитване в компютъра за всичко, . Един час по-късно, заобиколен от цялата налична литература за абдоминалния мезотелиом, разбрах защо моят лекар ми е дал такъв хуманен съвет. В цялата литература, която намерих, информацията не може да бъде по-недвусмислена: Мезотелиомът е нелечим, като средната смъртност е само осем месеца след диагностицирането. за около петнадесет минути, след което се усмихна и си каза: значи затова не ми дават да прочета нищо! Слава Богу, тогава умът ми отново започна да работи.
.
Попаднах на класически пример кога " А това има пряко отношение към борбата с рака. Може би защото психическото ни състояние „храни” имунната система, но хората с един и същи вид рак, различни по възраст, социална класа, условия за получаване на медицинска помощ, като цяло – имат положително отношение към живота, силна воля и житейски цели - и живеят по-дълго, те определено ще се борят или поне ще търсят начини за излизане от болестта, а не просто пасивно да приемат всичко, казано от лекарите. Няколко месеца по-късно попитах Медавар сър, моят личен научен гуру и носител на Нобелова награда по имунология, каква би могла да бъде най-добрата рецепта за успех срещу рака? „Личност на сангвиник“, отговори той кратко. За щастие (тъй като не можеш да промениш себе си за кратко време и с една конкретна цел), винаги съм бил уравновесен и самоуверен човек с точно такъв характер.
.
Това поставя пред лекарите дилема: все пак, ако е толкова важно личното отношение на човек към това, което му се случва, защо да правим толкова мрачни заключения (прогнози?..), особено когато малцина разбират достатъчно принципите на статистиката. да оцени какво Всъщностозначава ли това или онова твърдение? Лично аз имах това разбиране и съм убеден, че това изигра важна роля за спасяването на живота ми. Знанието е истинско сила!
.
Накратко, първият (и може би най-важният) въпрос може да бъде: какво точно означава фразата „средната смъртност е осем месеца“? Подозирам, че повечето хора, без много статистически познания, биха превели тази фраза като „Вероятно ще съм мъртъв след осем месеца“ - което е точно прибързаното заключение, което трябва да се избягва, защото... Самото отношение към ситуацията и прогнозите е от голямо значение.
Разбира се, не се зарадвах, но и не тълкувах данните по този начин. Моят технически опит ми позволи да имам различна гледна точка върху „осеммесечната средна смъртност“.
.
Ние все още носим историческото бреме на наследството на Платон, стремейки се към обяснение на всичко, към ясни дефиниции и разграничения, като по този начин се опитваме например да намерим недвусмислено „начало на живота“ или точна дефиниция на смъртта, въпреки че природата често изглежда ни като континуум с плавен преход от едно към друго. Това платоново наследство, с неговия акцент върху ясните разграничения и разделянето на неделимите, ни води до фалшиви оценки на статистическите данни. Накратко, ние възприемаме средната стойност и медианата като твърда „реалност“ и напротив, не вземаме предвид цял набор от различни променливи и несъвършенствата на измерването. Ако просто приемете медианата като даденост и разгледате какво е около нея за по-задълбочен анализ и изчисление, тогава тълкуването „Вероятно ще бъда мъртъв след осем месеца“ може да загуби своята релевантност. (между другото, възможна е и обратната ситуация - Е.М.)
.
Но всички еволюционни биолози, сред които съм и аз, знаят, че именно променливостта на определени параметри е неизменната същност на всички живи същества. Именно промените, вариациите на едно и също нещо са суровата реалност. Статистическата средна стойност и медианата са просто абстракции. Така че погледнах на статистиката за мезотелиома по съвсем различен начин - и не само защото съм оптимист, който се стреми да види самата поничка вместо дупката, но преди всичко защото знам, че само вариацията е реалност. И аз трябваше да се поставя сред тези различни вариации.
.
Когато научих за медианата от осем месеца, първата ми интелектуална реакция беше: „Страхотно, половината хора живеят по-дълго от тези осем месеца. Какви са шансовете ми да вляза в тази половина? След час нервни и трескави пресмятания стигнах до заключението с облекчение: шансовете ми са дяволски добри. Имах всяка от характеристиките, които ме правят по-вероятно да живея по-дълго: бях млад; заболяването ми беше диагностицирано в сравнително ранен стадий; мога да получа по-добро медицинско лечение; искам да живея; Знам как правилно да интерпретирам данните и не съм обезсърчен.
.
Друг технически проблем също ми добави повече комфорт. Веднага разбрах, че действителното разпределение на вариацията при „осеммесечната медиана“ почти сигурно ще бъде това, което статистиците наричат ​​„дясно изкривено“ (при симетрично разпределение профилът на графиката вляво от медианата е огледален образ на профила вдясно; при изкривяване разпределението върху едната половина е по-"удължено").
.

.
Разсъждавах, че в случая с моя мезотелиом графиката трябваше да има изкривяване надясно (положително изкривяване), защото в крайна сметка частта от графиката вляво от медианата описва само онези случаи, когато мезотелиомът е диагностициран посмъртно или малко преди смъртта на човек. Следователно няма много възможности да попаднете в този диапазон, тъй като той е само между нула и осем месеца. Но горната (или дясната) половина може да продължи много години, дори ако никой от диагностицираните хора в крайна сметка не оцелее. Разпределението трябва да има точно това дясно изкривяване и трябва да знам докъде се намира „опашката“ на графиката - защото вече стигнах до извода, че моето благоприятно "профил на пациента"направи ме добър кандидат за тази половина от графика.
.
Разпределението наистина е силно изкривено вдясно; има дълга „опашка“, макар и не толкова голяма по амплитуда, но удължена няколко години отвъд медианата от осем месеца. Вече не виждах причина да не съм в тази опашка и въздъхнах много дълго на облекчение. Техническите ми познания ми помогнаха и този път. Прочетох графиката правилно. Зададох правилния въпрос и намерих отговорите. Получих, по всяка вероятност, най-ценния от всички възможни подаръци при съществуващите условия - значително време. Нищо не ме задържаше и нищо не можеше да ме принуди незабавно да последвам думите на Исая към Езекия - „Направи ред в дома си, защото ще умреш и няма да живееш!”
.
Още нещо относно статистическите разпределения: текущата „официална“ графика се отнася само за много специфичен набор от обстоятелства и показва процента на преживяемост за мезотелиом при конвенционални схеми на лечение. Но ако обстоятелствата се променят, разпределението също може да се промени. Предписаха ми експериментален протокол за лечение и ако Fortune се усмихне, ще бъда в първа група на ново разпределение с висока медиана и дясна „опашка“ на графиката, което продължава до смърт от естествена смърт в напреднала възраст.
.
Според мен стана твърде модерно приемането на смъртта да се счита за равносилно на вътрешно достойнство. Разбира се, съгласен съм с проповедите на Еклесиаст, че „има време за любов и време за умиране“ и когато изворът ми на живот пресъхне, се надявам да посрещна края си спокойно и с достойнство. В повечето случаи обаче предпочитам да съм на друго мнение, а именно, че за живота трябва да се бори.
.
Изборът на оръжия в тази битка е много широк, но нищо не е по-ефективно от хумора. Смъртта ми беше обявена на среща на колегите ми в Шотландия и с голямо удоволствие прочетох собствения си некролог, написан от един от най-добрите ми приятели (между другото, едва ли може да се смята за случайност, че той е статистик и че той вярваше в моята неизбежна смърт, защото не очаквах да ме намери толкова далеч в дясната „опашка“ на горната графика). Тази случка обаче беше първата, която ми даде възможност да се посмея, след като чух диагнозата си. Само си помислете, почти повторих друг известен афоризъм на М. Твен: „слуховете за моята смърт са силно преувеличени“.

Послеслов от С. Дън
.
За съжаление, С. Гулд почина през май 2002 г. на 60-годишна възраст, но той живя още двадесет много продуктивни години след диагнозата си и по този начин надхвърли „статистическата“ осеммесечна средна степен на преживяемост с тридесет пъти! Въпреки че почина от рак, това не беше същият мезотелиом, а съвсем различен вид.
През март 2002 г. д-р Гулд публикува книгата си от 1342 страници, Opus Magnum – Структурата на еволюционната теория. И изглежда много логично д-р Гулд, един от най-плодотворните учени и писатели в света, да е успял да завърши окончателния разказ за своята научна дейност и своята философия точно навреме. Тази книга е твърде дълга за обикновения човек, но работата на С. Д. Гулд ще продължи да живее. Особено, надявам се, статията " TheМедианане е"tнаСъобщение".

***********
Всъщност няма да има практически никакви коментари от мен по тази статия - нито за „протоколи за експериментално лечение“, нито за „пророчества на лекари“ - вече има много материали за това в моя LiveJournal. Но ще има отделни публикации за това, че статистиката често се тълкува напълно „криво“.
.
Искам само да отбележа, че неслучайно в тази статия д-р Гулд спомена фразата „профил на пациента” – тъй като той използва и думите „сангвинична личност”, това е свързано с психологията, а не само с финансовото състояние на човека състояние или социален статус. Нищо не се случва случайно на този свят. Преди няколко дни видях публикация в LiveJournal, озаглавена „Ролята на личността в онкологията“, където бяха дадени връзки към експерименти (да, същата статистика) и крайното заключение беше, че тази роля е „твърде преувеличена“. Но колкото и да искат отделните граждани да се изолират от своята психика (от своята личност), колкото и да им се иска да вярват, че болестта „слиза отнякъде отгоре по независещи от мен причини“, коментирайки всичко това с думи като „Вече имам достатъчно от това.“ всички тези вярващи в психологическата природа на рака“ - не можете да изхвърлите думите от песента - не можете да избягате от себе си.
.
Но следващата публикация е за това.
.
Бъдете здрави. Живей с хумор.

Марк Твен

Законите на теорията на вероятностите не са абстрактни, а математически изразяват реалните модели на масови случайни природни явления.

Разработването на методи за запис, описание и анализ на статистически експериментални данни, получени в резултат на наблюдение на масови случайни явления, е предмет на МАТЕМАТИЧЕСКА СТАТИСТИКА.

1

Определяне на закона за разпределение на случайна величина от статистически данни.

Тъй като на практика трябва да работим с ограничено количество експериментални данни, резултатите от наблюденията винаги ще съдържат елемент на случайност.

Следователно възниква задачата да се изгладят статистическите данни и да се опишат с помощта на прости аналитични зависимости.

2

Тестване на правдоподобността на хипотезите.

Тази задача е свързана с предишната. Например, може да отговори на въпроса: дали резултатите от експеримент са в съответствие с хипотезата, че случайната променлива се подчинява на даден закон за разпределение?

3

Определяне на разпределение на неизвестни параметри

Често е необходимо да се определи не самият закон на разпределението на SW въз основа на експериментални данни, а някои числени характеристики В малък брой експерименти се определят само „оценени“ стойности на тези параметри, т.е. такива приблизителни стойности, които водят средно до по-малки грешки от

Маркетинговият отдел на фабрика за облекло проведе проучване сред 100 клиенти. Сред въпросите на анкетата бяха въпроси за мъжки костюми. Обработката на въпросниците даде следните резултати относно предпочитанията:

По място на производство: 40% - вътрешни, 60% - вносни.

2. По цена в щатски долари:

« Лъжи, проклети лъжи и статистики"(пълна версия: Има три вида лъжи: лъжи, проклети лъжи и статистика., английски Има три вида лъжи: лъжи, проклети лъжи и статистика ) - изявление, приписвано на британския министър-председател Бенджамин Дизраели и станало известно благодарение на Марк Твен след публикуването на „Глава от моята автобиография“ в North American Review на 5 юли 1907 г.: „Цифрите са измамни“, пише той , „Убеден съм в това от личен опит; Дизраели правилно говори за това: "Има три вида лъжи: лъжи, проклети лъжи и статистика." Тази фраза обаче не се появява в произведенията на Дизраели. Освен това тя не беше известна нито през живота му, нито малко след смъртта му. От гледна точка на съвременните идеи най-вероятният кандидат за авторство е Чарлз Дилк (1843-1911).

Тази поговорка се приписва на много други освен Дизраели: журналистът и политик Хенри Лабушер (1831-1912) и Леонард Кортни (1832-1918), който използва фразата през 1895 г. Две години по-късно става президент на Кралското статистическо общество.

Вече е известно, че първото използване на фразата е в писмо, написано на 8 юни 1891 г. и публикувано на 13 юни 1891 г. в National Observer (стр.93(-94): НАЦИОНАЛНИ ПЕНСИИ Лондон, 8 юни 1891 г.) : „Господине, ... много остроумно отбеляза, „че има три вида лъжи: първата е неистина, втората е откровена лъжа и накрая най-лошото нещо е статистиката.“ Малко по-късно, през октомври 1891 г., в списанието Notes and Queries човек под псевдонима "St Swithin" изпрати въпрос за авторството на тази фраза, което показва широкото й използване още в онези дни. През октомври 1891 г. Чарлз У. Дилке, без никакво приписване, използва това твърдение два пъти. „Сър Чарлз Дилке (1843-1911) каза онзи ден, че според него „лъжите“ могат да бъдат класифицирани във все по-голяма степен като: бели лъжи, лъжи и статистика“ (The Bristol Mercury и Daily Post, понеделник, 19 октомври 1891 G. ). д-р E.R.L. Гулд, който използва фразата през 1892 г., също цитира авторството на Чарлз Дилке: „Сър Чарлз Дилке беше прав в известен смисъл, когато каза: „Има три нива на лъжата – измислица, лъжа и статистика...“.

Както Робърт Гифен (помощник редактор на The Economist и 1882-84 президент на Статистическото дружество) споменава през 1892 г., твърдението „за статистиката“ е само тълкуване на фразата „Има една стара шега, че има три вида лъжци: обикновени измамници, безобразни лъжци и научни експерти. По-късно започнаха да говорят нещата малко по-различно: има три степени на лъжа: лъжа, безсрамна лъжа и статистика. .

Произходът на оригинала („за експертите“) се приписва на по-ранен период от твърдението „за статистиката“, а именно в списание Nature от 26 ноември 1885 г. (имайте предвид, че Дизраели вече е починал по това време) на страница 74 ние намерете: „... На един известен адвокат, в момента съдия, му хрумна да раздели свидетелите на три групи: обикновени лъжци, проклети лъжци и експерти.“

Бележки


Фондация Уикимедия.

2010 г.

    Вижте какво е „Лъжи, явни лъжи и статистика“ в други речници:

    Най-точната от всички псевдонауки. Статистиката на Jin Ko може да докаже всичко, дори истината. Ноел Мойнихан Статистиката е наука за това как, без да можете да мислите и разбирате, можете да накарате числата да го направят. Василий Ключевски Статистиката е като бански... Има четири вида лъжи: лъжи, проклети лъжи, статистика и цитати. Не трябва да лъжете безсрамно; но понякога е необходима уклончивост. Маргарет Тачър Вярвайте само на половината от това, което виждате, и на нищо от това, което чувате. английска поговорка......

    Консолидирана енциклопедия на афоризмите

    Хистограма (метод на графични изображения) Този термин има и други значения, с ... WikipediaСтатистика - (Статистика) Статистиката е общотеоретична наука, която изучава количествените промени в явленията и процесите. Държавна статистика, статистически услуги, Росстат (Goskomstat), статистически данни, статистика на заявките, статистика на продажбите,... ...

    Енциклопедия на инвеститора Има четири вида лъжи: лъжи, проклети лъжи, статистика и цитати. Не трябва да лъжете безсрамно; но понякога е необходима уклончивост. Маргарет Тачър Вярвайте само на половината от това, което виждате, и на нищо от това, което чувате. английска поговорка......

    - (1835 1910) Американският писател Адът е единствената наистина значима християнска общност във Вселената. Банкерът е човек, който ще ви заеме чадър в слънчев ден и ще ви го вземе в момента, в който започне да вали. Бил... ... Има четири вида лъжи: лъжи, проклети лъжи, статистика и цитати. Не трябва да лъжете безсрамно; но понякога е необходима уклончивост. Маргарет Тачър Вярвайте само на половината от това, което виждате, и на нищо от това, което чувате. английска поговорка......

    Цитат: некоректно повторение на чужди думи. Цитатът на Амброуз Биърс е риск под чужда отговорност. Vladislav Grzeszczyk Ако ви цитират, вие вече сте някой. Ако някой ви краде, вие сте изключителен човек. Но истинската слава започва само когато...

Има една много „брада“ поговорка. Със сигурност сте я чули. така че...

Има три вида лъжи:

  1. Гнусна лъжа
  2. Статистика

Обикновено в този момент казват думата „лопата“ и всички се смеят.Но нека да разгледаме фактите, които в момента блестят в последните новини.

Факт #1

"Левада-център"проведе социално проучване (руснаци от всички възрасти бяха анкетирани), което показа, че Най-популярната социална мрежа у нас е Odnoklassniki. Състои се приблизително 76% от анкетираните.

Готино! Бягаме спешно да отворим сметка там! За тези, които са в резервоара, как да се регистрирате в Odnoklassniki е описано много подробно на akak.ru на връзката. Това е сайт, който съдържа инструкции как да направите какво.

Но това, както разбирате, е статистика, предоставена от Левада център.

Факт #2

  • Най-популярната мрежа според техните данни е VKontakte. Влиза в него 38 милиона посетителина ден.
  • Odnoklassniki има 30 милиона посетители.
  • "Моят свят" - 16 милиона.

Въпрос №1: На кого да вярваме?

Защото това е статистика трети вид лъжа, тогава не можете да се доверите на никого. Как можете да изчислите популярността на една социална мрежа само въз основа на косвени данни?

Проучване.Какво показа? Само предпочитания за фокус група.

Къде е избрана? Как ви интервюираха? В кой регион? Дали казваха истината?

Според проучвания на общественото мнение 100% от руснаците използват интернет! Анкетата е проведена на сайта.

Брой посетители на ден.Какво показва?

Представете си средния офис работник. Той има инсталиран VKontakte на телефона си, отива там от работа, а след това вечер от вкъщи. Това вече са 3 посетители с различно IP, браузър и т.н.

В същото време Odnoklassniki има по-възрастна целева аудитория. Това означава, че за тях са затворени мобилните приложения и достъпът от офиса.

Worpos #2: Какво да правя с тази информация?

Заключение №1- Не можете да се доверявате сляпо на статистиката!

Заключение №2— Очевидно най-популярните социални мрежи са VKontakte и Odnoklassniki. Мисля, че LJ (въпреки че са „социални медии“) също е в челната тройка.

Заключение №3— Ако имате какво да кажете или предложите на хората, създайте акаунти в най-популярните социални мрежи. Определено няма да сгрешите.

Послеслов

Както се казва в крилатата фраза на д-р Хаус (телевизионния сериал „Д-р Хаус”), „...Всички лъжат...”. Запомнете това.

И доктор Лексиум беше с вас
Не забравяйте, че необходимостта да мислите със собствената си глава все още не е отменена.

Сайтът разбра какъв е процентът на фалшификация на статистически данни в научни статии по психология, какви грешки са разкрити от програмата за проверка и как тя е подобна на T9.

Програмите могат не само постмодерни текстове на песни, пътека в лондонското метро, ​​да симулират процеси в банка, но и да търсят грешки в работата на нечестни или невнимателни психолози. сайтът разказва как компютърът идентифицира неточности в научни статии и до какво може да доведе това.

Блясъкът и бедността на съвременната психология

Балансирайки между „всекидневната мъдрост“ и философските и метафизични категории върху тънка нишка от последователни данни, „науката за душата“ е постоянно застрашена от ексцесии. Копаенето във вътрешния свят на хората (ако не вземете предвид анатомичната страна на въпроса) никога не е било лесно, така че изследванията на психолозите са трудни за проверка. Имайки много субективен предмет на изследване, психологията в някои от своите клонове и раздели се припокрива с медицината и невробиологията, а в други надхвърля научното: дори докторът по психология и заместник-директор на Института по психология на Руската академия на науките Андрей Юревич определя мястото на психологията между науката и паранауката. Дори когато се прилагат по всички правила на научната методология, психологическите подходи понякога не дават задоволителни резултати. Ако при по-внимателна и продължителна работа с един човек може да се приеме уникалността на случая и да се заяви, че е невъзможно да се екстраполират изводи към всички хора, то в голяма група е трудно да се разбере какво всъщност означават единни въпроси и отговори за всеки участник в проучването. В допълнение, субектите винаги могат да имат вътрешни причини да скрият някаква информация и да отговарят на въпроси не напълно честно. Следователно рефлексията (насочване на вниманието на човек навътре) не може да се счита за инструмент, който позволява да се получи абсолютно надеждна информация.

Когато се провежда изследване върху голяма група субекти, се използват статистически методи за обработка. Популярната поговорка „има три вида лъжи: лъжи, проклети лъжи и статистика“, чието авторство е толкова неясно, че преди повече от сто години Марк Твен я приписва на Бенджамин Дизраели (но вече не беше сигурен откъде всъщност идва) , не е толкова далеч от истината. В областта на човешкото познание, където е толкова трудно да се създават теории с надеждна предсказваща сила (спомнете си същия Зигмунд Фройд или Алфред Адлер), рискът от случайна грешка и изкушението умишлено да „коригирате“ действителния резултат към желания е доста висока.

Как компютър хвана нечестни психолози в престъпление

Програмата, която потвърди валидността на това иронично наблюдение, се нарича Statcheck. Той анализира P-стойността, величина, която учените използват за тестване на статистически хипотези. Тази фигура показва колко вероятен е резултатът, ако нулевата хипотеза, залегнала в изследването, е вярна. Статията, публикувана в списанието Behavior Research Methods, показва, че програмата е оценила валидността на повече от 258 000 p-стойности (приблизително 11 на научна статия) за два часа, установявайки, че 13% от статиите съдържат грешка, която "обърнати" получени данни. В резултат на това, например, П< 0,05 превращается в P = 0,05, или некоторые знаки после запятой просто отбрасываются, а не влияют на следующий знак по правилам округления чисел. Казалось бы, такое маленькое различие не должно серьезно влиять на результат, однако чаще всего P = 0,05 принимается как пограничное значение между статистически достоверным и недостоверным результатом. В итоге малейшее отклонение в одну или в другую сторону делает вывод в статье ложноположительным или ложноотрицательным.

Първоначално програмата работи с литературата като цяло, но един от съавторите на изследването, Крис Хартгеринк, специалист по научна методология от Тилбургския университет (Холандия), предложи да се съсредоточим върху по-конкретни текстове - научни статии. По-късно, през август тази година, той качи 50 000 статии за проверка и публикува резултатите в Pub Peer (форум за учени, където те често обсъждат публикувани научни статии), предизвиквайки огромен резонанс в професионалната общност. Според Hutgerink подобни публикации ще информират авторите за възможни грешки и „ще донесат много повече полза за науката, отколкото просто изхвърляне на данни“. Не всички са съгласни с него, както съобщава дискусионната статия на Мония Бейкър в Nature. Някои учени, включително представители на Германската асоциация на психологите, предупреждават, че фалшивите отрицателни резултати (тук имаме предвид компютър, коригиращ правилните данни за неверни) могат да навредят на репутацията на учените, а не да помогнат за развитието на психологията като наука. Изпълнителният директор на Асоциацията за психологическа наука във Вашингтон отговори на публикацията, като каза, че осъжда „ендемичното хулене“ на психолози в блогове и социални медии, като изясни, че публикуването на резултатите от компютърен анализ с възможни грешки трябва да се счита за обида.

Statcheck и P-стойност: кой е в пещта, кой е на върха?

От друга страна, такива постове насърчават концепцията за отворена наука (между другото и Nuyten, и Hartgerink имат награди от организации, които насърчават развитието на тази област), което ще позволи по-бързото откриване и коригиране на статистически неточности. Според Ник Браун, учен-психолог от университета в Гронингам в Холандия, подобни алгоритми ще помогнат само ако изследователите ги прочетат и оценят от гледна точка на експерти, вместо просто да се отнасят с недоверие към списание, публикувало съмнителни статии с грешки.

В момента няколко хиляди души, вдъхновени от тази възможност, са изтеглили безплатно тази програма, написана на езика за програмиране R.

Самият Statcheck обаче може да прави грешки, както заявява Томас Шмид в критиките си към програмата. Например, той не винаги взема предвид необходимите статистически грешки и понякога не може да разбере какво не е наред в статията: P-стойността или относителния параметър. След като сканира две статии с много статистика, той установи, че програмата не е успяла да оцени 43 параметъра, проверила е 137 и е идентифицирала 35 като „потенциално неправилни“. Две от тях бяха грешки, които не повлияха на резултата, три бяха грешки в други параметри, които не са свързани с P-стойността, а останалите 30 бяха резултат от „фалшиви аларми“.

Някои психологически списания дори започват да изоставят p-стойността за тестване на надеждността на хипотезите, считайки този параметър за недостатъчно надежден.

Самите създатели не отричат, че тяхната програма „никога няма да бъде толкова точна, колкото ръчната проверка“, но подчертават скоростта на нейната работа: ако са необходими около десет минути, за да се провери надеждността на P-стойността на една средна психологическа статия, тогава програмата може да се справи с десетки хиляди за броени часове, което е необходимо за извършване на мета-анализ или първоначална проверка на статии, изпратени до редактори на научни списания. Той се използва в това си качество от юли тази година от редакторите на списанието Psychological Science. Те сравняват тази програма с Word или T9 коректори, на чиято абсурдност всички се смеят, но малцина биха се съгласили да се откажат. Подобно на тези автокоректори, Statcheck според тях може да се счита за „удобен инструмент, който понякога казва глупави неща“.