Розрахунки репрезентативної вибірки.

Вибірка-це безліч даних, взятих за допомогою певних процедур з генеральної сукупності для дослідницького аналізу. Репрезентативність - це властивість відтворення ставлення до цілому з його частини. Інакше, це можливість поширення ставлення до частини на ціле, яке цю частину включає у собі.

Репрезентативність вибірки - це показник, який полягає в тому, що вибірка має повно і достовірно відображати ознаки тієї сукупності, частиною якої вона є. Її також можна визначати як властивість вибірки найповніше представляти характеристики генеральної сукупності, суттєві з погляду мети дослідження.

Припустимо, що генеральна сукупність — усі учні школи (900 осіб із 30 класів, по 30 осіб у кожному класі). Об'єкт дослідження – ставлення школярів до куріння. Вибіркова сукупність, що складається з 90 учнів, лише набагато гірше представить усю сукупність, ніж вибірка з тих самих 90 учнів, куди б увійшли з кожного класу по 3 учні. Головна причина – нерівний розподіл за віком. Таким чином, у першому випадку репрезентативність вибірки буде низькою. У другому випадку – високою.

У соціології кажуть, що існує репрезентативність вибірки та її нерепрезентативність.

Як приклад нерепрезентативної вибірки можна навести класичний випадок, що стався 1936 року у США під час президентських виборів.

Журнал «Літерарі дайджест», який до цього дуже успішно прогнозував результати попередніх виборів, цього разу помилився у своїх прогнозах, хоча розіслав кілька мільйонів письмових питань передплатникам, а також респондентам, яких вони обрали з телефонних книг та зі списків реєстрації автомобілів. У 1/4 бюлетенів, які повернулися заповнені назад, голоси розподілилися наступним чином: 57% віддали першість кандидату від республіканців на ім'я Альф Лендон, а 41% віддали перевагу чинному президенту - демократу Франкліну Рузвельту.

Насправді на виборах переміг Ф. Рузвельт, який набрав майже 60% голосів. Помилка «Літерарі дайджест» була наступною. Вони захотіли збільшити репрезентативність вибірки . А оскільки вони знали, що більшість їхніх передплатників відносять себе до республіканців, то вони вирішили розширити вибірку за рахунок респондентів, які вони вибрали з телефонних книг та автомобільних реєстраційних списків. Але вони не врахували існуючих реалій і фактично відібрали ще більше прихильників республіканців, бо за часів мати автомобілі та телефони міг дозволити собі середній та вищий клас. А це й були переважно республіканці, а не демократи.

Існують різні види вибірки: проста випадкова, серійна, типова, механічна та комбінована.

Проста випадкова вибірка полягає у відборі з усієї сукупності досліджуваних одиниць навмання без будь-якої системи.

Механічну вибірку застосовують тоді, коли у генеральній сукупності є впорядкованість, наприклад, є певна послідовність одиниць працівників, виборчі списки, номери телефонів респондентів, номери квартир та будинків та інше).

Типовий відбір використовується тоді, коли всю сукупність можна поділити на групи за типами. Працюючи з населенням такими можуть бути, наприклад, освітні, вікові, соціальні групи, щодо підприємств - галузь чи окрема організація та інших.

Серійний відбір зручний тоді, коли одиниці об'єднані у невеликі серії чи групи. Такою серією можуть бути партії готової продукції, шкільні класи та інші групи.

Комбінована вибірка передбачає використання всіх попередніх видів вибірки у тій чи іншій комбінації.

Фактично ми розпочнемо не з одного, а з трьох питань: що таке вибірка? коли вона є репрезентативною? що вона є?

Сукупність – це будь-яка група людей, організацій, які цікавлять нас подій, щодо яких ми хочемо зробити висновки, а випадок,або об'єкт, – будь-який елемент такої сукупності 1 .Вибірка - Будь-яка підгрупа сукупності випадків (об'єктів), виділена для аналізу. Якщо ми захочемо вивчити діяльність законодавців штату щодо прийняття рішень, ми могли б дослідити таку діяльність у законодавчих органах штатів Віргінія, Північна Кароліна та Південна Кароліна, а не у всіх п'ятдесяти штатах і, виходячи з цього, поширитиотримані дані на генеральну сукупність, з якої було обрано ці три штати. Якщо ми хочемо дослідити систему переваг виборців Пенсільванії, ми могли б це зробити, опитавши 50 робітників компанії “Ю. С. Стіл” у Пітсбурзі, та поширити результати опитування на всіх виборців штату. Аналогічно, якщо ми хочемо виміряти розумові здібності студентів коледжів, ми могли б протестувати всіх гравців захисту, зареєстрованих у штаті Огайо в даному футбольному сезоні, а потім поширити отримані результати на генеральну сукупність, частиною якої вони є. У кожному прикладі ми діємо в такий спосіб: встановлюємо підгрупу всередині генеральної сукупності, досить докладно вивчаємо цю підгрупу, чи вибірку, і поширюємо наші результати протягом усього сукупність. Це і є основними етапами формування вибірки.

Однак цілком очевидним, що кожна з цих вибірок має істотний недолік. Наприклад, хоча законодавчі органи Віргінії, Північної Кароліни і Південної Кароліни і є частиною сукупності законодавчих органів штатів, вони з історичних, географічних і політичних причин, швидше за все, діятимуть дуже схожим чином і інакше, ніж законодавчі органи таких від них штатів, як Нью-Йорк, Небраска та Аляска. Хоча п'ятдесят робітників-сталіварників у Пітсбурзі дійсно можуть бути виборцями штату Пенсільванія, вони в силу соціально-економічного статусу, освіти та життєвого досвіду, цілком можливо, матимуть погляди, відмінні від поглядів багатьох інших людей, які так само є виборцями. І так само, хоча футболісти штату Огайо і є студентами коледжів, вони з різних причин цілком можуть відрізнятися від інших студентів. Іншими словами, хоча кожна з цих підгруп дійсно є вибіркою, члени кожної їх систематично відрізняються від більшості інших членів сукупності, з якої вони обрані. Як окрема група жодна з них не є типовою з точки зору розподілу ознак думок, мотивів поведінки та характеристик у генеральній сукупності, з якою вона асоціюється. Відповідно, політологи сказали б, що жодна з цих вибірок не є репрезентативною.

Репрезентативна вибірка - Це така вибірка, в якій всі основні ознаки генеральної сукупності, з якої вилучена дана вибірка, представлені приблизно в тій самій пропорції або з тією самою частотою, з якою ця ознака виступає в цій генеральній сукупності. Таким чином, якщо 50% усіх законодавчих органів штатів збираються лише раз на два роки, приблизно половина складу репрезентативної вибірки законодавчих органів штатів має бути такого типу. Якщо 30% виборців Пенсільванії належать до "синіх комірців", близько 30% репрезентативної вибірки для цих виборців (а не 100%, як у наведеному вище прикладі) мають бути з числа “синіх комірців”. І якщо 2% усіх студентів коледжів є спортсменами, приблизно та сама частина репрезентативної вибірки студентів коледжів повинна припадати на спортсменів. Іншими словами, репрезентативна вибірка є мікрокосмом, меншою за розміром, але точну модель генеральної сукупності, яку вона повинна відображати. У тій мірі, як і вибірка є репрезентативної, висновки, засновані на вивченні цієї вибірки, можна без жодних побоювань вважати застосовними до вихідної сукупності. Це поширення результатів і є те, що ми називаємо генералізованість.

Можливо, пояснити це допоможе графічна ілюстрація. Припустимо, ми хочемо вивчати моделі членства у політичних групах серед дорослого населення США. На рис.5.1 зображено три кола, поділені на шість рівних секторів. Рис.5.1а представляє всю аналізовану сукупність. Члени сукупності розкласифіковані відповідно до політичних груп (таких, як партії та групи інтересів), до яких вони належать. У цьому прикладі кожен дорослий належить щонайменше до однієї і не більше ніж шести політичних груп; і ці шість рівнів членства однаково поширені в сукупності (звідси рівні сектора). Припустимо, ми хочемо дослідити мотиви вступу людей у ​​групу, вибір групи та моделі участі, проте через обмеженість ресурсів ми можемо обстежити лише одного з кожних шести членів сукупності. Кого відібрати для аналізу?

Мал. 5.1. Формування вибірки з генеральної сукупності

Одну з можливих вибірок заданого об'єму ілюструє заштрихована область на рис.5.1б, проте вона не відображає структуру сукупності. Якби ми робили узагальнення на основі цієї вибірки, ми дійшли б висновку: (1) що всі дорослі американці належать до п'яти політичних груп та (2) що вся групова поведінка американців збігається з поведінкою тих, хто належить саме до п'яти груп. Однак ми знаємо, що перший висновок не є вірним, і це може зародити в нас сумнів щодо валідності другого. Таким чином, вибірка, зображена на рис.5.1б, нерепрезентативна, оскільки вона відбиває розподіл даного властивості сукупності (часто званого параметром ) відповідно до його реального поширення. Про таку вибірку кажуть, що вона зміщена у напрямку дочленам п'яти груп або зміщена в напрямку відрешти моделей членства у групах. Спираючись на таку зміщену вибірку, ми зазвичай приходимо до хибних висновків щодо генеральної сукупності.

Найяскравіше це може бути продемонстровано на прикладі катастрофи, що спіткала у 30-х роках журнал “Літерарі дайджест”, який організував опитування громадської думки щодо результатів виборів. "Літерарі дайджест" являв собою періодичне видання, в якому передруковувалися редакційні статті з газет та інші матеріали, що відображали громадськість; цей журнал був дуже популярним на початку століття. Починаючи з 1920 р. журнал проводив широкомасштабне загальнонаціональне опитування, в ході якого більш ніж мільйону осіб поштою розсилалися виборчі бюлетені з проханням відзначити, чия кандидатура на майбутніх президентських виборах для них краща. Протягом кількох років результати опитування, що проводилися журналом, виявлялися настільки точними, що опитування, проведене у вересні, здавалося, робило вибори у листопаді малоістотними. Та й як при такій великій вибірці могла статися помилка? Однак у 1936 р. саме це й трапилося: з великою перевагою голосів (60:40) перемогу передбачили кандидату від республіканської партії Альфу Ландону. На виборах Ландон програв інваліду – Франкліну Д. Рузвельту – практично з тим самим результатом, з яким мав перемогти. Довіра до “Літерарі дайджест” була настільки підірвана, що невдовзі після цього журнал перестав виходити. Що сталося? Все дуже просто: у голосуванні, проведеному “Дайджестом”, використовувалася зміщена вибірка. Поштові листівки розсилалися людям, чиї імена було вилучено із двох джерел: телефонних довідників та списків реєстрації автомобілів. І хоча раніше цей метод відбору не надто відрізнявся від інших методів, зовсім по-іншому було тепер тепер, під час Великої депресії 1936 р., коли менш заможні виборці, найбільш ймовірна опора Рузвельта, не могли дозволити собі мати телефон, не кажучи вже про автомобілі. Таким чином, фактично вибірка, що використовувалася в опитуванні, організованому "Дайджест", була зміщена у бік тих, хто, швидше за все, повинен був виступати за республіканців, і при цьому ще дивно, що Рузвельт мав такий гарний результат.

Як вирішити цю проблему? Повертаючись до прикладу, порівняємо вибірку на рис.5.1б з вибіркою на рис.5.1в. В останньому випадку для аналізу також відібрано шосту частину сукупності, однак кожен з основних типів сукупності представлений у вибірці в тій пропорції, в якій він представлений у всій сукупності. Така вибірка демонструє, що один із кожних шести дорослих американців належить до однієї політичної групи, один із шести – до двох тощо. Така вибірка також дозволить виявити інші відмінності між її членами, які могли б співвідноситися за участю в різних групах. Таким чином, вибірка, представлена ​​на рис.5.1в, є репрезентативною вибіркою для аналізованої сукупності.

Звичайно, цей приклад є спрощеним принаймні з двох надзвичайно важливих точок зору. По-перше, більшість сукупностей, які цікавлять політологів, різноманітніше, ніж та, що наведена у прикладі. Люди, документи, уряди, організації, рішення тощо. відрізняються один від одного не по одному, а за набагато більшим числом ознак. Таким чином, репрезентативна вибірка має бути такою, щоб кожназ основних, відмінна від інших область була представлена ​​пропорційно її частці разом. По-друге, ситуація, коли реальний розподіл змінних, або ознак, які ми хочемо виміряти, заздалегідь невідомо, зустрічається набагато частіше, ніж протилежна, – можливо, він не вимірювався у попередньому переписі населення. Таким чином, репрезентативна вибірка має бути побудована так, щоб вона могла точно відображати існуючий розподіл навіть тоді, коли ми не в змозі прямо оцінити її валідність. Процедура формування вибірки повинна мати внутрішню логіку, здатну переконати нас, що якби ми в змозі порівняти вибірку з переписом, вона справді виявилася б репрезентативною.

Щоб забезпечити можливість точного відображення складної організації цієї сукупності та певний ступінь упевненості в тому, що запропоновані процедури здатні зробити це, дослідники звертаються до методів статистики. При цьому вони діють у двох напрямках. По-перше, використовуючи певні правила (внутрішню логіку), дослідники вирішують питання про те, які саме конкретні об'єкти їм вивчати, що саме включати у конкретну вибірку. По-друге, використовуючи зовсім інші правила, вони вирішують скільки об'єктів вибрати. Ми не детально вивчатимемо ці численні правила, розглянемо лише їх роль у політологічному дослідженні. Почнемо розгляд зі стратегій вибору об'єктів, що утворюють репрезентативну вибірку.

Поняття репрезентативності часто зустрічається у статистичних звітах і під час підготовки виступів та доповідей. Мабуть, без неї важко уявити якийсь із видів подачі інформації на огляд.

Репрезентативність – що це?

Репрезентативність відображає, наскільки обрані об'єкти або частини відповідають змісту та змісту сукупності даних, з якої вони були обрані.

Інші визначення

Поняття репрезентативності можна розкривати у різних контекстах. Але за своїм змістом репрезентативність - це відповідність рис і властивостей обраних одиниць із загальної сукупності, які точно відбивають характеристики всієї генеральної бази даних загалом.

Також репрезентативність інформації визначають як здатність вибіркових даних представити параметри та властивості сукупності, важливі з точки зору дослідження.

Репрезентативна вибірка

Принцип формування вибірки полягає у обранні найбільш важливих і точно відображають властивості загальної сукупності даних. Для цього використовуються різні методи, які дозволяють отримувати точні результати та загальне уявлення про використання лише вибіркових матеріалів, що описують якості всіх даних.

Таким чином, немає потреби вивчати весь матеріал, а достатньо розглянути вибіркову репрезентативність. Що це таке? Це вибірка окремих даних для того, щоб мати поняття про загальну масу інформації.

Їх залежно від способу розрізняють як ймовірнісні та неймовірнісні. Імовірнісна - це вибірка, яка проводиться шляхом обчислення найважливіших та найцікавіших даних, які є надалі представниками генеральної сукупності. Це обдуманий вибір чи випадкова вибірка, проте обгрунтована своїм змістом.

Неймовірна - це один з різновидів випадкової вибірки, що складається за принципом звичайної лотереї. У такому разі не враховується думка того, хто складає таку вибірку. Використовується лише сліпий жереб.

Вірогідна вибірка

Імовірнісні вибірки також можуть поділятися на кілька видів:

  • Одна з найпростіших і найзрозуміліших принципів - це нерепрезентативна вибірка. Наприклад, такий спосіб часто використовується під час проведення соціальних опитувань. При цьому учасники опитування не вибираються з натовпу за певними ознаками, і отримання інформації проводиться у перших 50 людей, які взяли участь у ньому.
  • Навмисні вибірки відрізняються тим, що мають низку вимог і умов при відборі, проте все ж таки покладаються на випадковий збіг, не маючи на меті досягнення хорошої статистики.
  • Вибірка на основі квот - це ще одна з варіацій неймовірної вибірки, яка часто використовується для дослідження великих сукупностей даних. Для неї використовується безліч умов та норм. Підбираються об'єкти, які мають їм відповідати. Тобто на прикладі соціального опитування можна припустити, що опитано буде 100 осіб, але тільки думку деякої кількості людей, які відповідатимуть встановленим вимогам, будуть враховані при складанні статистичного звіту.

Імовірнісні вибірки

Для ймовірнісних вибірок обчислюється ряд параметрів, яким об'єкти у вибірці будуть відповідати, і серед них у різний спосіб можуть обиратися саме ті факти та дані, які будуть представлені як репрезентативність даних вибірки. Такими способами обчислення необхідних даних може бути:

  • Проста довільна вибірка. Полягає в тому, що серед обраного сегмента випадковим методом лотереї вибирається необхідна кількість даних, які будуть репрезентативною вибіркою.
  • Систематична та випадкова вибірка дає можливість скласти систему обчислення необхідних даних на основі випадково вибраного сегмента. Таким чином, якщо перше випадкове число, яке вказує на порядковий номер даних, вибраних із загальної сукупності, буде 5, то наступними даними, які будуть обрані, можуть стати, наприклад, 15, 25, 35 тощо. Цей приклад наочно пояснює, що навіть випадковий вибір може ґрунтуватися на систематичних обчислення необхідних вихідних даних.

Вибірка споживачів

Осмислена вибірка - це спосіб, який полягає у розгляді кожного окремого сегмента, і на підставі його оцінки складається сукупність, що відображає характеристики та властивості загальної бази даних. Таким чином, набирається більша кількість даних, що відповідають вимогам репрезентативної вибірки. Можна легко відібрати кілька варіантів, які не увійдуть до загальної кількості, не втративши при цьому якість відібраних даних, що становлять загальну сукупність. У такий спосіб визначається репрезентативність результатів дослідження.

Розмір вибірки

Не останнє питання, яке необхідно вирішити, – це розмір вибірки для репрезентативного уявлення генеральної сукупності. Розмір вибірки який завжди залежить від кількості вихідників у генеральній сукупності. Проте репрезентативність вибіркової сукупності безпосередньо залежить від цього, наскільки сегментів може бути у результаті розділений результат. Чим більше таких сегментів, тим більше даних потрапляє у результативну вибірку. Якщо результати вимагають загального позначення і вимагають конкретики, тоді, відповідно, вибірка стає менше, оскільки, не вдаючись у деталі, інформація викладається більш поверхово, отже, її прочитання буде загальним.

Поняття помилки репрезентативності

Помилка репрезентативності – це конкретні розбіжності між характеристиками генеральної сукупності та вибіркових даних. Під час проведення будь-якого вибіркового дослідження неможливо отримати абсолютно точні дані, як із повному дослідженні генеральних сукупностей і вибірки, представленої лише частиною відомостей і параметрів, тоді як детальне вивчення можливе лише за дослідженні всієї сукупності. Таким чином, неминучі деякі похибки та помилки.

Види помилок

Розрізняють деякі помилки, які виникають при складанні репрезентативної вибірки:

  • Систематичні.
  • Випадкові.
  • Навмисні.
  • Ненавмисні.
  • Стандартні.
  • Граничні.

Підставою появи випадкових помилок то, можливо несплошний характер дослідження загальної сукупності. Зазвичай випадкова помилка репрезентативності має незначний розмір та характер.

Систематичні помилки тим часом виникають у разі порушення правил відбору даних із загальної сукупності.

Середня помилка – це різниця між усередненими значеннями вибірки та основною сукупністю. Вона залежить від кількості одиниць у вибірці. Вона обернено пропорційна Тоді чим більше обсяг, тим менше значення середньої помилки.

Гранична помилка – це найбільша можлива різниця між усередненими значеннями зробленої вибірки та загальною сукупністю. Така помилка характеризується як максимум можливих помилок за умов їх появи.

Навмисні та ненавмисні помилки репрезентативності

Помилки усунення даних бувають навмисними і ненавмисними.

Тоді причинами появи навмисних помилок є підхід до вибору даних методом визначення тенденцій. Ненавмисні помилки виникають ще на стадії підготовки вибіркового спостереження, формування репрезентативної вибірки. Для недопущення подібних помилок необхідно створити хорошу основу для вибірки, яка становить списки одиниць відбору. Вона має повністю відповідати цілям проведення вибірки, бути достовірною, що охоплює всі аспекти дослідження.

Валідність, надійність, репрезентативність. Розрахунок помилок

Розрахунок помилки репрезентативності (Мм) середньої арифметичної величини (М).

Середнє квадратичне відхилення: чисельність вибірки (>30).

Помилка репрезентативності (Мр) та (Р): чисельність вибірки (n>30).

У тому випадку, коли доводиться вивчати сукупність, де кількість вибірки мала і становить менше 30 одиниць, тоді кількість спостережень стане меншою на одну одиницю.

Величина помилки прямо порційна обсягу вибірки. Репрезентативність інформації та обчислення ступеня можливості складання точного прогнозу відбиває певна величина граничної помилки.

Репрезентативні системи

Не тільки в процесі оцінки подачі інформації використовується репрезентативна вибірка, а й сама людина, яка отримує інформацію, використовує репрезентативні системи. Таким чином, мозок обробляє деяке створюючи репрезентативну вибірку з усього потоку інформації, щоб якісно і швидко оцінити дані, що подаються і зрозуміти суть питання. Відповісти на запитання: «Репрезентативність – що це?» - У масштабах людської свідомості досить просто. Для цього мозок використовує всі підвладні залежно від того, яку саме інформацію необхідно вичленувати із загального потоку. Таким чином, розрізняють:

  • Візуальну репрезентативну систему, де застосовуються органи зорового сприйняття ока. Люди, які часто використовують подібну систему, називаються візуалами. За допомогою цієї системи людина опрацьовує інформацію, що надходить у вигляді зображень.
  • Аудіальна репрезентативна система. Головний орган, який використовується – це слух. Інформація, що подається у вигляді звукових файлів або мови, обробляють саме цією системою. Люди, які краще сприймають інформацію на слух, називаються аудіалами.
  • Кінестетична репрезентативна система є обробкою потоку інформації, шляхом сприйняття його за допомогою нюхових і дотикових каналів.
  • Дигітальна репрезентативна система використовується разом з іншими як засіб отримання інформації ззовні. сприйняття та осмислення отриманих даних.

Отже, репрезентативність – що це? Проста вибірка з багатьох чи невід'ємна процедура при обробці інформації? Однозначно можна сказати, що репрезентативність багато в чому визначає наше сприйняття потоків даних, допомагаючи вичленувати з нього найвагоміші та значущі.

Один із головних компонентів ретельно продуманого дослідження – визначення вибірки та що таке репрезентативна вибірка. Це як у прикладі з тортом. Не обов'язково ж з'їдати весь десерт, щоб зрозуміти його смак? Досить невеликої частини.

Так ось, торт – це генеральна сукупність (Тобто всі респонденти, які підходять для опитування). Вона може бути виражена територіально, наприклад, лише жителі Московської області. Гендерно – лише жінки. Або мати обмеження за віком – росіяни віком від 65 років.

Вирахувати генеральну сукупність складно: потрібно мати дані перепису населення чи попередніх оціночних опитувань. Тому зазвичай генеральну сукупність «прикидають», та якщо з отриманого числа вираховують вибіркову сукупністьабо вибірку.

Що таке репрезентативна вибірка?

Вибірка- Це чітко визначена кількість респондентів. Її структура має максимально збігатися зі структурою генеральної сукупності за основними характеристиками відбору.

Наприклад, якщо потенційні респонденти – все населення Росії, де 54% — це жінки, а 46% — чоловіки, то вибірка повинна містити таке саме відсоткове співвідношення. Якщо збіг параметрів відбувається, вибірку можна назвати репрезентативною. Це означає, що неточності та помилки у дослідженні зводяться до мінімуму.

Обсяг вибірки визначається з урахуванням вимог точності та економічності. Ці вимоги обернено пропорційні одна одній: що більше обсяг вибірки, то точніше результат. У цьому що вища точність, тим більше витрат необхідно проведення дослідження. І навпаки, що менше вибірка, то менше на неї витрат, тим менш точно і більш випадково відтворюються властивості генеральної сукупності.

Тому для обчислення обсягу вибору соціологами було винайдено формулу та створено спеціальний калькулятор:

Довірча ймовірністьі довірча похибка

Що означають терміни « довірча ймовірність» та « довірча похибка»? Довірча ймовірність – це показник точності вимірів. А довірча похибка – можлива помилка результатів дослідження. Наприклад, при генеральній сукупності понад 500 00 осіб (припустимо, що проживають у Новокузнецьку) вибірка дорівнюватиме 384 особи за довірчої ймовірності 95% і похибки 5% АБО (при довірчому інтервалі 95±5%).

Що з цього випливає? При проведенні 100 досліджень з такою вибіркою (384 особи) у 95 відсотків випадків відповіді, що одержуються, за законами статистики будуть знаходитися в межах ±5% від вихідного. І ми отримаємо репрезентативну вибірку із мінімальною ймовірністю статистичної помилки.

Після того, як підрахунок обсягу вибірки виконано, можна подивитися чи є достатня кількість респондентів у демо-версії Панелі Анкетолога. А як провести панельний опитування можна докладніше дізнатися.

Репрезентативність вибірки

Найменування параметра Значення
Тема статті: Репрезентативність вибірки
Рубрика (тематична категорія) Психологія

Вимоги до вибірки

До вибірки застосовується ряд обов'язкових вимог, визначених, перш за все, цілями та завданнями дослідження. Планування експерименту має включати облік, як обсягу вибірки, так і ряду її особливостей. Так, у психологічних дослідженнях важлива вимога однорідностівибірки. Воно означає, що психолог, вивчаючи, наприклад, підлітків, неспроможна, включати у цю вибірку дорослих людей. Навпаки, дослідження, виконане шляхом вікових зрізів, принципово передбачає наявність різновікових випробуваних. При цьому і в даному випадку має дотримуватися однорідність вибірки, але вже за іншими критеріями, насамперед таким, як вік, стать. Підставами для формування однорідної вибірки можуть бути різні характеристики, такі, як рівень інтелекту, національність, відсутність певних захворювань і т.д., виходячи з цілої дослідження.

У загальній статистиці є поняття повторноїі безповторнийвибірки, або, інакше кажучи, вибірки із поверненням та без повернення. Як приклад наводиться, як правило, вибір кулі, що дістається з будь-якої ємності. У разі вибірки з поверненням кожна вибрана куля знову повертається в ємність і, отже, має бути обрана знову. При безповторному виборі одного разу обрана куля відкладається убік і більше не може брати участь у вибірці. У психологічних дослідженнях можна знайти аналоги подібного роду способам організації вибіркового дослідження, оскільки психологу нерідко доводиться кілька разів тестувати тих самих випробуваних за допомогою однієї і тієї ж методики. При цьому, строго кажучи, повторною у цьому випадку є процедура тестування. Вибірка випробуваних при повній тотожності складу у разі повторних досліджень завжди матиме деякі відмінності, зумовлені функціональною та віковою мінливістю, властивою всім людям. Подібна вибірка за характером проведення процедури є повторною, хоча сенс терміну тут, очевидно, інший, ніж у випадку із кулями.

Важливо підкреслити, що всі вимоги до будь-якої вибірки зводяться до того, що на її базі психологом повинна бути отримана найбільш повна, неспотворена інформація про особливості генеральної сукупності, з якої взята ця вибірка. Іншими словами, вибірка повинна якомога повніше відображати характеристики генеральної сукупності, що вивчається.

Склад експериментальної вибірки повинен представляти (моделювати) генеральну сукупність, оскільки висновки, отримані в експерименті, передбачається надалі перенести на всю генеральну сукупність. З цієї причини вибірка повинна мати особливу якість - репрезентативністю, що дозволяє поширити отримані у ньому висновки протягом усього генеральну сукупність.

Репрезентативність вибірки дуже важлива, проте з об'єктивних причин дотримуватися її вкрай складно. Так, добре відомий факт, що від 70% до 90% усіх психологічних досліджень поведінки людини проводилися в США в 60-х роках XX століття з випробуваними-студентами коледжів, причому більшість з них були студентами психологами. У лабораторних дослідженнях, що виконуються на тваринах, найбільш поширеним об'єктом вивчення є щури. З цієї причини невипадково психологію називали раніше «наукою про студентів-другокурсників і білих щурів». Студенти психологічних коледжів становлять всього 3% від загальної чисельності населення США. Очевидно, що вибірка студентів нерепрезентативна як модель, що претендує на представництво всього населення країни.

Репрезентативнавибірка, або, як ще кажуть, представницькавибірка, - це така вибірка, в якій всі основні ознаки генеральної сукупності представлені приблизно в тій же пропорції і з тією самою частотою, з якою ця ознака виступає в цій генеральній сукупності. Іншими словами, репрезентативна вибірка є меншою за розміром, але точною моделлю тієї генеральної сукупності, яку вона повинна відображати. Тією мірою, якою вибірка є репрезентативною, висновки, засновані на вивченні цієї вибірки, можна з великою часткою впевненості вважати застосовними до всієї генеральної сукупності. Це поширення результатів прийнято називати генералізованість.

В ідеалі репрезентативна вибірка повинна бути такою, щоб кожна з базових характеристик, що вивчаються психологом, рис, особливостей особистості і т.п. була б представлена ​​в ній пропорційно до цих же особливостей у генеральній сукупності. Згідно з цими вимогами, процедура формування вибірки повинна мати внутрішню логіку, здатну переконати дослідника, що при порівнянні з генеральною сукупністю вона дійсно виявиться репрезентативною, представницькою.

У своїй конкретній діяльності психолог діє наступним чином: встановлює підгрупу (вибірку) всередині генеральної сукупності, докладно вивчає цю вибірку (проводить з нею експериментальну роботу), а потім, якщо це дозволяють результати статистичного аналізу, поширює отримані висновки на всю генеральну сукупність. Це і є основними етапами роботи психолога з вибіркою.

Початківець психолог повинен мати на увазі помилку, що часто повторюється: щоразу, коли він здійснює збір будь-яких даних будь-яким методом і з будь-якого джерела, у нього завжди з'являється спокуса поширити свої висновки на всю генеральну сукупність. Для того щоб уникнути подібної помилки, потрібно не просто мати здоровий глузд, але, перш за все, добре володіти основними поняттями математичної статистики.

Репрезентативність вибірки - поняття та види. Класифікація та особливості категорії "Репрезентативність вибірки" 2017, 2018.