Метод точечных и точностных диаграмм. Основные статистические параметры большой и малой выборочной совокупности и их характеристика Формула малой выборки

При контроле качества товаров в экономических исследованиях эксперимент может проводиться на основе малой выборки.

Под малой выборкой понимается несплошное статистическое обследование, при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности. Объем малой выборки обычно не превышает 30 единиц и может доходить до 4 - 5 единиц.

Средняя ошибка малой выборки вычисляется по формуле:

,

где
- дисперсия малой выборки.

При определении дисперсии число степеней свободы равно n-1:

.

Предельная ошибка малой выборки
определяется по формуле

При этом значение коэффициента доверия t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n. Для отдельных значений t и n доверительная вероятность малой выборки определяется по специальным таблицам Стьюдента (Табл. 9.1.), в которых даны распределения стандартизированных отклонений:

.

Поскольку при проведении малой выборки в качестве доверительной вероятности практически принимается значение 0,59 или 0,99, то для определения предельной ошибки малой выборки
используются следующие показания распределения Стьюдента:

Способы распространения характеристик выборки на генеральную совокупность.

Выборочный метод чаще всего применяется для получения характеристик генеральной совокупности по соответствующим показателям выборки. В зависимости от целей исследований это осуществляется или прямым пересчётом показателей выборки для генеральной совокупности, или посредством расчёта поправочных коэффициентов.

Способ прямого пересчёта. Он состоит в том, что показатели выборочной долиили среднейраспространяется на генеральную совокупность с учётом ошибки выборки.

Так, в торговле определяется количество поступивших в партии товара нестандартных изделий. Для этого (с учётом принятой степени вероятности) показатели доли нестандартных изделий в выборке умножаются на численность изделий во всей партии товара.

Способ поправочных коэффициентов . Применяется в случаях, когда целью выборочного метода является уточнение результатов сплошного учета.

В статистической практике этот способ используется при уточнении данных ежегодных переписей скота, находящегося у населения. Для этого после обобщения данных сплошного учета практикуется 10%-ное выборочное обследование с определением так называемого “процента недоучета”.

Способы отбора единиц из генеральной совокупности.

В статистике применяются различные способы формирования выборочных совокупностей, что обусловливается задачами исследования и зависит от специфики объекта изучения.

Основным условием проведения выборочного обследования является предупреждение возникновения систематических ошибок, возникающих вследствие нарушения принципа равных возможностей попадания в выборку каждой единицы генеральной совокупности. Предупреждение систематических ошибок достигается в результате применения научно обоснованных способов формирования выборочной совокупности.

Существуют следующие способы отбора единиц из генеральной совокупности:

1) индивидуальный отбор - в выборку отбираются отдельные единицы;

2) групповой отбор - в выборку попадают качественно однородные группы или серии изучаемых единиц;

3) комбинированный отбор - это комбинация индивидуального и группового отбора.

Способы отбора определяются правилами формирования выборочной совокупности.

Выборка может быть:

Собственно-случайная;

Механическая;

Типическая;

Серийная;

Комбинированная.

Собственно-случайная выборка состоит в том, что выборочная совокупность образуется в результате случайного (непреднамеренного) отбора отдельных единиц из генеральной совокупности. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.

Доля выборки есть отношение числа единиц выборочной совокупности n к численности единиц генеральной совокупности N, т.е.

.

Так, при 5%-ной выборке из партии товара в 2 000 ед. численность выборки n составляет 100 ед. (5*2000:100), а при 20%-ной выборке она составит 400 ед. (20*2000:100) и т.д.

Механическая выборка состоит в том, что отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы (группы). При этом размер интервала в генеральной совокупности равен обратной величине доли выборки.

Так, при 2%-ной выборке отбирается каждая 50-я единица (1:0,02), при 5%-ной выборке - каждая 20-я единица (1:0,05) и т.д.

Таким образом, в соответствии с принятой долей отбора, генеральная совокупность как бы механически разбивается на равновеликие группы. Из каждой группы в выборку отбирается лишь одна единица.

Важной особенностью механической выборки является то, что формирование выборочной совокупности можно осуществить, не прибегая к составлению списков. На практике часто используют тот порядок, в котором фактически размещаются единицы генеральной совокупности. Например, последовательность выхода готовых изделий с конвейера или поточной линии, порядок размещения единиц партии товара при хранении, транспортировке, реализации и т.д.

Типическая выборка. При типической выборке генеральная совокупность вначале расчленяется на однородные типические группы. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.

Типическая выборка обычно применяется при изучении сложных статистических совокупностей. Например, при выборочном обследовании производительности труда работников торговли, состоящих из отдельных групп по квалификации.

Важной особенностью типической выборки является то, что она дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность.

Для определения средней ошибки типической выборки используются формулы:

повторный отбор

,

бесповторный отбор

,

Дисперсия определяется по следующим формулам:

,

При одноступенчатой выборке каждая отобранная единица сразу же подвергается изучению по заданному признаку. Так обстоит дело при собственно-случайной и серийной выборке.

При многоступенчатой выборке производят подбор из генеральной совокупности отдельных групп, а из групп выбираются отдельные единицы. Так производится типическая выборка с механическим способом отбора единиц в выборочную совокупность.

Комбинированная выборка может быть двухступенчатой. При этом генеральная совокупность сначала разбивается на группы. Затем производят отбор групп, а внутри последних осуществляется отбор отдельных единиц.

Статистической обработки данных на персональных компьютерах и больших ЭВМ. Есть специальные программы, предназначенные для обучения студентов, которые содержат подробные объяснения всех процедур и тесты для проверки их усвоения.  

Как уже отмечалось, в случае малой выборки только для нормально распределенной генеральной совокупности могут быть рассчитаны и доверительные вероятности , и доверительные пределы генеральной средней.  

При малых выборках расчет средней возможной ошибки основан на выборочных дисперсиях , поэтому  

Малые выборки широко используются для решения задач , связанных с испытанием статистических гипотез, особенно гипотез о средних величинах.  

Например, по выборке объемом 32 единицы получен парный коэффициент корреляции 0,319. Число степеней свободы для него равно 30, поскольку в расчете г участвуют две величины, значения которых закреплены - J и у. За счет этого мы теряем две степени свободы 32 - 2. Так как критическое значение для 30 степеней свободы равно (при уровне значимости 0,05) 0,3494, то полученное значение ниже критического по модулю. Соответственно, гипотеза о связи признаков надежно не доказана. Неверен вывод и об отсутствии связи - он также надежно не доказан. Из табл. 5 приложения видно, что при малой выборке надежно можно установить только тесные связи, а при большой численности совокупности, например, 102 единицы, надежно измеряются и слабые связи. Этот вывод важен для практической работы по корреляционному анализу.  

Это говорит о том, что в среднем фактическое число пациентов в 1.5 раза больше прогнозного значения означает, что используемая модель прогнозирования обычно недооценивает число обращающихся пациентов. В этом случае, возможно, стоит проанализировать примененную модель и внести в нее корректировки. В идеале средняя ошибка равна нулю, т. е. отрицательные и положительные значения ошибки компенсируют друг друга . Однако мы должны сказать, что в нашем примере значение средней получено по очень малой выборке. Больший объем выборки , например, данные за целый год, позволит нам определить вероятную точность прогнозирования с большей степенью достоверности.  

Средняя и предельная ошибки малой выборки определяются по формулам  

Для полного ряда из 15 значений критерий однородности (Var Проверка нормальности для усеченной совокупности данных (по 7 оставшимся магазинам) показывает, что все три ряда значений нормальны Правда, при этом вызывает сомнение правомочность использования статистических процедур на столь малой выборке. Однако если отвлечься от этого факта, то и в этом случае зависимость вида z = а + Ь х + Ь2у не даст аналитику значимой информации, поскольку между факторами хну наблюдается сильная взаимозависимость (мультиколлинеарность) - об этом свидетельствует высокое значение парного коэффициента корреляции (на усеченной выборке г = -0,88).  

После предварительного составления анкеты ее необходимо опробовать на малой выборке для выявления возможных ошибок. Опробование отличается от предварительного поиска. Поиск помогает уточнить план исследования при опробовании разработанный план подвергается испытанию и оценке стоимости его осуществления. Если результаты опробования признаются удовлетворительными, готовая анкета используется для проведения исследования на соответствующей выборке.  

По приведенным данным оценка регрессионной зависимости Рц(руп), о которой говорилось выше, может быть представлена в виде корреляционного уравнения , исходя из какой-либо установленной формы статистической связи для всего выделенного интервала времени в 26 лет. Построение регрессий для более коротких временных периодов было бы ненадежным именно из-за небольшого объема выборки (малая выборка).  

Распределение нормированных отклонений в малой выборке. Значения t, для которых вероятность)=р  

Если Ek> О, то кривая островершинная, при Ek Метод моментов, как правило, приводит к состоятельным оценкам . Однако при малых выборках оценки могут оказаться значительно смещенными и малоэффективными. Метод моментов достаточно эффективен для оценки параметров нормально распределенных случайных величин.  

В ряде случаев в качестве главного аргумента при определении объема выборки используется стоимость проведения обследования. Так, в бюджете маркетинговых исследований предусматриваются затраты на проведение определенных обследований, которые нельзя превышать. Очевидно, что ценность получаемой информации не принимается при этом в расчет. Однако в ряде случаев и малая выборка может дать достаточно точные результаты.  

Если по результатам малой выборки можно однозначно заключить, что партия является годной или, наоборот, негодной, то контроль качества обходится очень небольшими затратами. Если же первая выборка не дает четкого ответа, можно взять другую выборку - единая большая выборка образцов даст более точный результат. Принцип контроля может быть следующим  

Исходя из предположения, что генеральная совокупность , из которой взята исследуемая выборка, имеет гладкую кривую распределения , естественно считать, что появляющиеся при группировании провалы и выбросы являются случайным "шумом", порождаемым случайностью попадания тех или иных значений в малую выборку. Укрупнение интервалов группирования - метод фильтрации этого случайного "шума". Однако при слишком протяженных интервалах "фильтруется" уже не "шум", а сам "сигнал", т. е. начинают сглаживаться особенности искомого закона распределения .  

По каждому из отмеченных видов и разновидностей документов собираются их копии, полученные изготовлением дополнительного экземпляра при подготовке соответствующего документа на пишущей или вычислительной машине . В собранной малой выборке порядка 30 копий документов по каждому виду или разновидности, охватывающих ос-  

Как поступать с малыми выборками  

Таким образом, двусторонний доверительный интервал для малой выборки будет представлен так  

Корень наших трудностей в выборке. Как Лейбниц когда-то напомнил Бернулли, природа столь разнообразна и столь сложна, что нам трудно делать правильные выводы из того, что мы наблюдаем. Нам доступны только крохи действительности, и это ведет нас к ошибочным выводам, или мы интерпретируем малые выборки как полноценное отражение характеристик большой совокупности.  

Качество действующих на предприятии норм по прогрессивности характеризуется уровнем их напряженности. Рассеяние численности рабочих по индивидуальной производительности труда обычно близко к так называемому нормальному распределению и почти симметрично (с некоторой асимметрией вправо) отклоняется в обе стороны от среднего уровня их выполнения. При этом с увеличением численности рабочих отклонения в индивидуальной производительности труда от средней все в большей мере компенсируются и погашаются. Исходя из формулы предельной ошибки выборки , можно с достаточной достоверностью утверждать, что если максимальное отклонение индивидуальной производительности труда отдельных рабочих от среднеотраслевого уровня не превышает М %, то по теории вероятностей предел отклонений средней производительности труда случайно-отобранных п рабочих от средней будет равен М/ п %, или с поправкой на малую выборку от большой N совокупности  

Последнюю причину иногда удается устранить введением соответствующих коррективов. Так, для интервальных оценок погрешности по малому (п нормального распределения (см. с. 50) используют квантили статистического распределения Стьюдента (табл. 6), характерного для малой выборки из нормальной совокупности (при неизвестных т и а).  

Поверхностный взгляд на проблему, малые выборки для исследования, когда отдельные части заменяют всю проблему.  

Однако способ вычисления yt, xt приводит к потере первого наблюдения (если мы не обладаем предшествующим ему наблюдением). Число степеней свободы уменьшится на единицу, что при больших выборках не так существенно, но при малых выборках может привести к потере эффективности . Эта проблема обычно преодолевается с помощью поправки Прайса-Выношена  

Для оценки малой выборки используются исправленное среднеквадратическое отклонение малой выборки и закон распределения вероятностей Стъюдента.  

Теория малых выборок разработана английским статистиком В. Госсетом (писавшим под псевдонимом Стьюдент) в начале XX в. В 1908 г. им построено специальное распределение, которое позволяет и при малых выборках соотносить / и доверительную вероятность F(t). При п > 100 таблицы распределения Стьюдента дают те же результаты, что и таблицы интеграла вероятностей Лапласа , при 30

Критерий правдоподобия является несмещенным и состоятельным, при больших выборках -2-log X имеет распределение хи-квадрат (hi-squared distribution) с г

  • 6. Виды статистических группировок, их познавательное значение.
  • 7.Статистические таблицы: виды, правила построения, приемы чтения
  • 8.Абсолютные величины: виды, познавательное значение. Условия научного использования абсолютных и относительных показателей.
  • 9. Средние величины: содержание, типы, виды, научные условия применения.
  • 11.Свойства дисперсии. Правило сложения (разложения) дисперсии и его использование в статистическом анализе.
  • 12.Виды статистических графиков по содержанию решаемых задач и способам построения.
  • 13. Ряды динамики: виды, показатели анализа.
  • 14. Методы выявления тенденции в динамических рядах.
  • 15. Индексы: определение, основные элементы индексов, задачи, решаемые при помощи индексов, система индексов в статистике.
  • 16. Правила построения динамических и территориальных индексов.
  • 17. Основы теории выборочного метода.
  • 18. Теория малых выборок.
  • 19. Способы отбора единиц в выборочную совокупность.
  • 20.Виды связей, статистические методы анализа взаимосвязей, понятие корреляции.
  • 21.Содержание корреляционного анализа, корреляционные модели.
  • 22.Оценка силы (тесноты) корреляционной связи.
  • 23. Система показателей социально-экономической статистики.
  • 24. Основные группировки и классификации в социально-экономической статистике.
  • 25. Национальное богатство: содержание категории и состав.
  • 26. Содержание земельного кадастра. Показатели состава земель по формам собственности, целевому назначению и видам угодий.
  • 27. Классификация основных фондов, способы оценки и переоценки, показатели движения, состояния и использования.
  • 28. Задачи статистики труда. Понятие и содержание основных категорий рынка труда.
  • 29. Статистика использования рабочей силы и рабочего времени.
  • 30. Показатели производительности труда и методы анализа.
  • 31. Показатели производства продукции растениеводства и урожайности с.-х. Культур и угодий.
  • 32.Показатели производства продукции животноводства и продуктивности сельскохозяйственных животных.
  • 33.Статистика общественных затрат и себестоимости продукции.
  • 34.Статистика оплаты труда и расходов на рабочую силу.
  • 35.Статистика валовой продукции и доходов.
  • 36.Показатели движения и реализации продукции сельского хозяйства.
  • 37.Задачи статистического анализа сельскохозяйственных предприятий.
  • 38.Статистика цен и товаров отраслей народного хозяйства: задачи и методы анализа.
  • 39.Статистика рынка товаров и услуг.
  • 40.Статистика показателей общественного производства.
  • 41.Статистический анализ цен потребительского рынка.
  • 42.Статистика инфляции и основные показатели ее оценки.
  • 43.Задачи статистики финансов предприятий.
  • 44.Основные показатели финансовых результатов предприятий.
  • 45.Задачи статистики государственного бюджета.
  • 46. Система показателей статистики государственного бюджета.
  • 47. Система показателей статистики денежного обращения.
  • 48. Статистика состава и структуры денежной массы в стране.
  • 49. Основные задачи банковской статистики.
  • 50.Основные показатели банковской статистики.
  • 51.Понятие и классификация кредита. Задачи его статистического изучения.
  • 52.Система показателей статистики кредита.
  • 53.Основные показатели и методы анализа сберегательного дела.
  • 54.Задачи статистики фондового рынка и ценных бумаг.
  • 56.Статистика товарных бирж: задачи и система показателей.
  • 57.Система национальных счетов: понятия, основные категории и классификация.
  • 58.Основные принципы построения снс.
  • 59.Основные макроэкономические показатели – содержание, методы определения.
  • 60.Межотраслевой баланс: понятия, задачи, виды моб.
  • 62.Статистика доходов и расходов населения
  • 18. Теория малых выборок.

    При большом числе единиц выборочной совокупности (n >100) распределение случайных ошибок выборочной средней в соответствии с теоремой А.М.Ляпунова нормально или приближается к нормальному по мере увеличения числа наблюдений.

    Однако в практике статистического исследования в условиях рыночной экономики все чаще приходится сталкиваться с малыми выборками.

    Малой выборкой называется такое выборочное наблюдение, численность единиц которого не превышает 30.

    При оценке результатов малой выборки величина генеральной совокупности не используется. Для определения возможных пределов ошибки пользуются критерием Стьюдента.

    Величина σ вычисляется на основе данных выборочного наблюдения.

    Данная величина используется лишь для исследуемой совокупности, а не в качестве приближенной оценки σ в генеральной совокупности.

    Вероятностная оценка результатов малой выборки отличается от оценки в большой выборке тем, что при малом числе наблюдений распределение вероятностей для средней зависит от числа отобранных единиц.

    Однако для малой выборки величина коэффициента доверия t по другому связана с вероятностной оценкой, чем при большой выборке (так как, закон распределения отличается от нормального).

    Согласно установленному Стьюдентом закону распределения, вероятная ошибка распределения зависит как от величины коэффициента доверия t , так и от объема выборки В.

    Средняя ошибка малой выборки вычисляется по формуле:

    где - дисперсия малой выборки.

    В МВ коэффициент n/(n-1) нужно брать во внимание и обязательно корректировать. При определении дисперсии S2 число степеней свободы равно:

    .

    Предельная ошибка малой выборки определяется по формуле

    При этом значение коэффициента доверия t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n. Для отдельных значений t и n доверительная вероятность малой выборки определяется по специальным таблицам Стьюдента, в которых даны распределения стандартизированных отклонений:

    Вероятностная оценка результатов МВ отличается от оценки в БВ тем что при малом числе наблюдений распределение вероятностей для средней зависит от числа отобранных единиц

    19. Способы отбора единиц в выборочную совокупность.

    1. Выборочная совокупность должна быть достаточно большой по численности.

    2. Структура выборочной совокупности должна наилучшим образом отражать структуру гнеральной совокупности

    3. Способ отбора должен быть случайным

    В зависимости от того участвуют ли отобранные единицы в выборке различают метод - бесповторный и повторный.

    Бесповторным называется такой отбор, при котором попавшая в выборку единица не возвращается в совокупность, из которой осуществляется дальнейший отбор.

    Расчет средней ошибки бесповторной случайной выборки:

    Расчет предельной ошибки бесповторной случайной выборки:

    При повторном отборе попавшая в выборку единица после регистрации наблюдаемых признаков возвращается в исходную (генеральную) совокупность для участия в дальнейшей процедуре отбора.

    Расчет средней ошибки повторной простой случайной выборки производится следующим образом:

    Расчет предельной ошибки повторной случайной выборки:

    Вид формирования выборочной совокупности подразделяется на - индивидуальный, групповой и комбинированный.

    Способ отбора – определяет конкретный механизм выборки единиц из генеральной совокупности и подразделяется на: собственно – случайный; механический; типический; серийный; комбинированный.

    Собственно – случайный наиболее распространенный способ отбора в случайной выборке, его еще называют методом жеребьевки, при нем на каждую единицу статистической совокупности заготовляется билет с порядковым номером. Далее в случайном порядке отбирается необходимое количество единиц статистической совокупности. При этих условиях каждая из них имеет одинаковую вероятность попасть в выборку.

    Механическая выборка . Применяется в тех случаях, когда генеральная совокупность каким – либо образом упорядочена т. е. имеется определенная последовательность в расположении единиц.

    Для определения средней ошибки механической выборки используется формула средней ошибки при собственно – случайном бесповторном отборе.

    Типический отбор . Используется когда все единицы генеральной совокупности можно разбить на несколько типических групп. Типический отбор предполагает выборку единиц из каждой группы собственно – случайным или механическим способом.

    Для типической выборки величина стандартной ошибки зависит от точности определения групповых средних. Так, в формуле предельной ошибки типической выборки учитывается средняя из групповых дисперсий, т.е.

    Серийный отбор . Применяется в тех случаях, когда единицы совокупности объединены в небольшие группы или серии. Сущность серийной выборки заключается в собственно случайном либо механическом отборе серий, внутри которых производится сплошное обследование единиц.

    При серийной выборке величина ошибки выборки зависит не от числа исследуемых единиц, а от числа обследованных серий (s) и от величины межгрупповой дисперсии:

    Комбинированный отбор может проходить одну или несколько ступеней. Выборка называется одноступенчатой, если отобранные однажды единицы совокупности подвергаются изучению.

    Выборка называется многоступенчатой , если отбор совокупности проходит по ступеням, последовательным стадиям, причем каждая ступень, стадия отбора имеет свою единицу отбора.

    "

    Метод малых выборок

    Основным достоинством метода малых выборок является возможность оценить динамику процесса во времени с сокращением времени на вычислительные процедуры.

    Случайным образом отбирают мгновенные выборки в определенные периоды времени объемом от 5 до 20 единиц. Период отбора проб устанавливается опытным путем и зависит от устойчивости процесса, определенной при анализе априорной информации.

    Для каждой мгновенной выборки определяют основные статистические характеристики. Мгновенные выборки и их основные статистические характеристики представлены в приложении Б.

    Выдвигается и проверяется гипотеза об однородности дисперсии выборок при помощи одного из возможного критерия (критерий Фишера).

    Проверка гипотезы об однородности выборочных характеристик.

    Для проверки значимости различия между средними арифметическими в 2-х сериях измерений вводят меру G. Расчеты приведены в приложении В

    Правило принятия решения формулируется следующим образом:

    где tр - значение квантиля нормированного распределения при заданной доверительной вероятности Р, ? = 0,095, n = 10, tр =2,78.

    При выполнении неравенства подтверждается гипотеза о том, что разница между выборочными средними не значима.

    Поскольку неравенство выполняется во всех случаях, то гипотеза о том, что разница между выборочными средними не значима подтверждается.

    Для проверки гипотезы об однородности выборочных дисперсий вводят меру F0 как отношение несмещенных оценок дисперсий результатов 2-х серий измерений. Причем большую из 2-х оценок принимают за числитель и если Sx1>Sx2, то

    Результаты расчетов приведены в приложении В.

    Затем задаются значениями доверительной вероятности Р и определяют значения F(K1; K2; ?/2) при К1 =n1 - 1 и K2=n2 - 1.

    При Р=0,025 и К1=10-1=4 и К2=10-1=4 F (9;9;0,025/2) =4,1.

    Правило принятия решения: если F(K1; K2; ?/2)>F0, то гипотеза об однородности дисперсий в двух выборках принимается.

    Поскольку условие F(K1; K2; ?/2) > F0 выполняется во всех случаях, то гипотеза об однородности дисперсий принимается.

    Таким образом, гипотеза об однородности дисперсий выборок подтверждается, что свидетельствует о стабильности процесса; гипотеза об однородности выборочных средних по методу сравнения средних подтверждается, это означает, что центр рассеивания не изменился и процесс находится в стабильном состоянии.

    Метод точечных и точностных диаграмм

    В течение определенного времени берут мгновенные выборки, объемом от 3 до 10 изделий и определяют статистические характеристики каждой выборки.

    Полученные данные наносят на диаграммы, по оси абсцисс которых отложено время? или номера k выборок, а по оси ординат - индивидуальные значения хк или значение одной из статистических характеристик (выборочное среднее арифметическое, выборочное среднее квадратическое отклонение). Кроме того, на диаграмме проводят две горизонтальные линии Тв и Тн, ограничивающие поле допуска изделия.

    Мгновенные выборки приведены в приложении В.


    Рисунок 1 точностная диаграмма

    Диаграмма наглядно отображает ход производственного процесса. По ней можно судить о том, что производственный процесс является нестабильным

    Помимо собственно случайной выборки с ее четким вероятностным обоснованием существуют и другие выборки, которые не являются абсолютно случайными, однако широко применяются. Следует заметить, что строгое применение собственно случайного отбора единиц из генеральной совокупности далеко не всегда возможно на практике. К таким выборкам относятся механическая выборка, типическая, серийная (или гнездовая), многофазовая и ряд других.

    Редко бывает, чтобы генеральная совокупность была однородной, это скорее исключение, нежели правило. Поэтому при наличии в составе генеральной совокупности различных типов явления часто желательно обеспечить более равномерное представительство в выборочной совокупности различных типов. Эта цель успешно достигается при применении типической выборки. Главная трудность заключается в том, что мы должны иметь дополнительную информацию о всей генеральной совокупности, что в ряде случаев является затруднительным.

    Типическую выборку называют еще расслоенной или стратифицированной выборкой; ее применяют также в целях более равномерного представления в выборке различных районов, и в этом случае выборку называют районированной.

    Итак, иод типической выборкой понимается такая выборка, при которой генеральная совокупность разделена на типические подгруппы, сформированные по одному или нескольким существенным признакам (например, население разделено на 3-4 подгруппы по величине среднедушевого дохода или но уровню образования - начальное, среднее, высшее и т.п.). Далее из всех типических групп можно вести отбор единиц в выборку несколькими способами, формируя:

    • а) типическую выборку с равномерным размещением, где из разных типов (слоев) отбирается равное число единиц. Эта схема работает хорошо, если в генеральной совокупности слои (типы) не очень сильно отличаются друг от друга по числу единиц;
    • б) типическую выборку с пропорциональным размещением, когда требуется (в отличие от равномерного размещения), чтобы доля (%) отбора для всех слоев была бы одинаковой (например, 5 или 10%);
    • в) типическую выборку с оптимальным размещением, когда учитывается степень вариации признаков в различных группах генеральной совокупности. При таком размещении пропорция отбора для групп с большой колеблемостью признака увеличивается, что в итоге приводит к уменьшению случайной ошибки.

    Формула средней ошибки при типическом отборе похожа на обычную ошибку выборки для собственно случайной выборки с той лишь разницей, что вместо общей дисперсии проставляется средняя из частных внутригрупповых дисперсий, что, естественно, приводит к уменьшению погрешности по сравнению с собственно случайной выборкой. Однако ее применение не всегда возможно (по многим причинам). Если нет необходимости в большой точности, легче и дешевле использовать серийную выборку.

    Серийная (гнездовая) выборка состоит в том, что в выборку отбираются не единицы совокупности (например, студенты), а отдельные серии, или гнезда (например, учебные группы). Говоря иначе, при серийном (гнездовом) отборе единица наблюдения и единица отбора не совпадают: отбираются некоторые группы примыкающих друг к другу единиц (гнезда), а обследованию подлежат входящие в состав этих гнезд единицы. Так, например, при выборочном обследовании жилищных условий мы можем в случайном порядке выбрать некоторое число домовладений (единица отбора) и выяснить далее жилищные условия проживающих в этих домах семей (единицы наблюдения).

    Серии (гнезда) состоят из единиц, связанных между собой территориально (районы, города и т.д.), организационно (предприятия, цеха и г.д.) или во времени (например, совокупность единиц выработанной за данный отрезок времени продукции).

    Серийный отбор может быть организован в форме одноступенчатого, двухступенчатого или многоступенчатого отбора.

    Случайно отобранные серии подвергаются сплошному исследованию. Таким образом, серийная выборка состоит из двух этапов случайного отбора серий и сплошного изучения этих серий. Серийный отбор дает значительную экономию в силах и средствах и поэтому часто используется на практике. Ошибка серийного отбора отличается от ошибки собственно случайного отбора гем, что вместо значения общей дисперсии используется межсерийная (межгрупповая) дисперсия, а вместо объема выборки - количество серий. Точность обычно не очень велика, но в ряде случаев это допустимо. Серийная выборка может быть повторной и бесповторной, а серии - равновеликими и неравновеликими.

    Серийная выборка может быть организована по разным схемам. Например, можно сформировать выборочную совокупность в два этапа: сначала в случайном порядке выбираются подлежащие обследованию серии, затем из каждой отобранной серии также в случайном порядке отбирается определенное количество единиц, подлежащих непосредственному наблюдению (измерению, взвешиванию и пр.). Ошибка такой выборки будет зависеть от ошибки серийного отбора и от ошибки индивидуального отбора, т.е. многоступенчатый отбор дает, как правило, менее точные результаты по сравнению с одноступенчатым, что объясняется возникновением ошибок репрезентативности на каждой ступени выборки. В этом случае требуется использовать формулу ошибки выборки для комбинированного отбора.

    Другой формой отбора является многофазовый отбор (1, 2, 3 фазы, или этапа). Этот отбор по своей структуре отличается от многоступенчатого, так как при многофазовом отборе пользуются на каждой фазе одними и теми же единицами отбора. Ошибки при многофазовом отборе рассчитывают на каждой фазе отдельно. Главная особенность двухфазовой выборки состоит в том, что выборки отличаются друг от друга по трем критериям в зависимости: 1) от доли единиц, изученных на первой фазе выборки и вновь включенных во вторую и последующие фазы; 2) от соблюдения равенства шансов каждой единицы выборки первой фазы вновь быть объектом изучения; 3) от величины интервала, отделяющего фазы друг от друга.

    Остановимся еще на одном виде отбора, а именно механическом (или систематическом). Этот отбор является, вероятно, самым распространенным. Это объясняется, видимо, тем, что из всех приемов выбора данный прием является простейшим. В частности, он значительно проще, чем случайный отбор, предполагающий умение пользоваться таблицами случайных чисел, и не требует дополнительных сведений о генеральной совокупности и ее структуре. К тому же механический отбор тесно переплетается с пропорциональным стратифицированным отбором, что приводит к снижению ошибки выборки.

    Например, применение механического отбора членов жилищного кооператива из списка, составленного в порядке поступления в данный кооператив, обеспечит пропорциональное представительство членов кооператива с разным стажем. Использование этого же приема для отбора респондентов из списка лиц, составленного по алфавиту, обеспечивает равные шансы для фамилий, начинающихся на разные буквы, и т.п. Использование табельных или иных списков на предприятиях или в учебных заведениях и др. может обеспечить необходимую пропорциональность в представительстве работников с разным стажем. Заметим, что механический отбор широко применяется в социологии, при изучении общественного мнения и др.

    В целях снижения величины ошибки и особенно расходов на проведение выборочного исследования широко используются разные комбинации отдельных видов отбора (механического, серийного, индивидуального, многофазового и т.п.). В таких случаях следует рассчитывать более сложные ошибки выборок, которые состоят из ошибок, имеющих место на разных этапах исследования.

    Малая выборка - это совокупность единиц меньше 30. Малые выборки встречаются на практике довольно часто. Например, число заболеваний редкими болезнями или число единиц, обладающих редким признаком; кроме того, к малой выборке прибегают, когда исследование стоит дорого или исследование связано с уничтожением продукции или образцов. Широкое применение малые выборки получили в сфере обследования качества продукции. Теоретические основы для определения ошибок малой выборки были заложены английским ученым У. Госсетом (псевдоним Стьюдент).

    Необходимо помнить, что при определении ошибки для малой выборки следует вместо численности выборки брать величину (п - 1) или же до определения средней ошибки выборки рассчитывать так называемую исправленную дисперсию выборки (в знаменателе вместо п следует ставить (п - 1)). Отметим, что такая поправка делается только один раз - при расчете выборочной дисперсии или при определении ошибки. Величина (п - 1) носит название степени свободы. Кроме того, нормальное распределение заменяется ^-распределением (распределением Стыодента), которое табулировано и зависит от количества степеней свободы. Единственным параметром распределения Стыодента является величина (п - 1). Еще раз подчеркнем, что поправка (п - 1) важна и существенна лишь при малых но численности выборочных совокупностях; при yi > 30 и выше различие сходит на нет, приближаясь к нулю.

    До сих пор шла речь о случайных выборках, т.е. таких, когда выбор единиц из генеральной совокупности производится случайно (или почти случайно) и все единицы имеют равную (или почти равную) вероятность попасть в выборку. Однако отбор единиц может быть основан на принципе неслучайного отбора, когда во главу угла ставится принцип доступности и целенаправленности. В таких случаях нельзя говорить о репрезентативности полученной выборки, а исчисление ошибок репрезентативности можно производить, лишь имея сведения о генеральной совокупности.

    Известны несколько схем формирования неслучайной выборки, которые получили значительное распространение и используются главным образом в социологических исследованиях: отбор доступных единиц наблюдения, отбор по нюрнбергскому методу, целевая выборка при определении экспертов и др. Важное значение имеет также квотная выборка, которая формируется исследователем по небольшому количеству существенных параметров и дает очень близкое совпадение с генеральной совокупностью. Говоря иначе, квотный отбор должен обеспечить исследователю почти полное совпадение выборочной и генеральной совокупностей по избранным им параметрам. Целенаправленное достижение близости двух совокупностей но ограниченному кругу показателей достигается, как правило, с помощью выборки существенно меньшего объема, чем при использовании случайного отбора. Именно это обстоятельство делает квотный отбор привлекательным для исследователя, не имеющего возможности ориентироваться на самовзвеши- вающуюся случайную выборку большого объема. Следует добавить, что сокращение объема выборки чаще всего сочетается с уменьшением денежных затрат и сроков проведения исследования, что увеличивает преимущества указанного способа отбора. Отметим также, что при квотной выборке имеется довольно значительная предварительная информация о структуре генеральной совокупности. Главное преимущество здесь состоит в том, что объем выборки существенно меньше, чем при случайной выборке. Выделенные признаки (чаще всего социально-демографические - пол, возраст, образование) должны тесно коррелировать с изучаемыми характеристиками генеральной совокупности, т.е. объекта исследования.

    Как уже указывалось, выборочный метод дает возможность получить сведения о генеральной совокупности с гораздо меньшими затратами средств, времени и усилий, чем при сплошном наблюдении. Понятно также, что сплошное изучение всей генеральной совокупности в ряде случаев невозможно, например при проверке качества продукции, образцы которой уничтожаются.

    Вместе с этим, однако, следует указать, что генеральная совокупность не является полностью «черным ящиком» и кое-какими сведениями о ней мы все же располагаем. Проводя, например, выборочное исследование, касающееся жизни, быта, имущественного положения, доходов и расходов студентов, их мнений, интересов и т.п., мы все же располагаем сведениями об общей их численности, группировке по полу, возрасту, семейному положению, местожительству, курсе обучения и другими характеристиками. Эти сведения всегда используются в выборочном исследовании.

    Существует несколько разновидностей распространения выборочных характеристик на генеральную совокупность: способ прямого пересчета и способ поправочных коэффициентов. Пересчет выборочных характеристик производится, как правило, с учетом доверительных интервалов и может быть выражен в абсолютных и относительных величинах.

    Здесь вполне уместно подчеркнуть, что большая часть статистической информации, касающейся экономической жизни общества в самых разных ее проявлениях и видах, основана на выборочных данных. Конечно, они дополняются и данными сплошного учета, и сведениями, полученными в результате переписей (населения, предприятий и пр.). Так, например, все сведения бюджетной статистики (о доходах и расходах населения), приводимые Росстатом, основаны на данных выборочного исследования. Сведения о ценах, размерах производства, объемах торговли, выраженные в соответствующих индексах, также в значительной мере основаны на выборочных данных.