Этапы социально статистического исследования. Статистическое наблюдение: понятие, основные формы

Результатом первого этапа статистического исследования -- статистического наблюдения -- являются сведения, характеризующие каждую единицу статистической совокупности. Однако, возможности отразить закономерности и тенденции динамики изучаемых явлений с помощью даже самой полной характеристики единичных фактов ограничены. Такие данные получают только в результате статистической сводки. Сводка - это упорядочение, систематизация и обобщение статистических данных, полученных при статистическом наблюдении. Только надлежащая обработка статистического материала позволяет выявить сущность социально-экономических явлений, характерные черты и существенные особенности отдельных типов, обнаружить закономерности и тенденции их развития. Различают сводку простую и групповую, или сводку в узком и широком понимании. Простая сводка -- это подсчет общих итогов в группах и подгруппах и оформление этого материала в таблицы. В результате простой сводки статистических данных можно определить количество предприятий, общую численность персонала, объем произведенной продукции в денежном выражении. Эти общие итоги носят в основном информативный характер. Они дают обобщенную характеристику совокупности в виде абсолютных величин.

Групповая сводка, или сводка в широком понимании, представляет собой сложный процесс по многосторонней обработке первичных статистических данных, т.е. данных, полученных в результате наблюдения. Он включает группировку статистических данных, разработку системы показателей для характеристики групп, подсчет групповых и общих итогов, расчет обобщающих показателей. Задача статистической сводки как второго этапа статистического исследования - получение обобщающих показателей для информационно-справочных и аналитических целей. Сводка массовых статистических данных осуществляется по заранее разработанным программе и плану. В процессе разработки программы определяются подлежащее и сказуемое сводки. Подлежащее -- это объект исследования, расчлененный на группы и подгруппы. Сказуемое -- показатели, которые характеризуют подлежащее сводки. Программа сводки определяется задачами статистического исследования.

Статистическая сводка выполняется по заранее составленному плану. В плане сводки решаются вопросы о способах проведения работы по обобщению информации -- вручную или механизированным способом, о последовательности отдельных операций сводки. Устанавливаются сроки выполнения каждого этапа и сводки в целом, а также способы изложения результатов сводки. Это могут быть ряды распределения, статистические таблицы и статистические графики.

Основные этапы статистического исследования

Рассмотрим самый важный метод статистики – статистическое наблюдение.

Использование различных способов и приемов статистической методологии

предполагает наличие исчерпывающей и достоверной информации об изучаемом

объекте. Исследование массовых общественных явлений включает этапы сбора

статистической информации и ее первичной обработки, сведения и группировки

результатов наблюдения в определенные совокупности, обобщения и анализа

полученных материалов.

На первом этапе статистического исследования формируются первичные

статистические данные, или исходная статистическая информация, которая

является фундаментом будущего статистического здания. Чтобы здание было

прочным, добротной и качественной должна быть его основа. Если при сборе

первичных статистических данных допущена ошибка или материал оказался

недоброкачественным, это повлияет на правильность и достоверность как

теоретических, так и практических выводов. Поэтому, статистическое

наблюдение от начальной до завершающей стадии - получения итоговых

материалов - должно быть тщательно продуманным и четко ооганизованным.

Статистическое наблюдение дает исходный материал для обобщения, началом

которого служит сводка. Если при статистическом наблюдении о каждой его

единице получают сведения, характеризующие ее с многих сторон, то данные

сводки характеризуют всю статистическую совокупность и отдельные ее части.

На этой стадии совокупность делится по признакам различия и объединяется по

признакам сходства, подсчитываются суммарные показатели по группам и в

целом. С помощью метода группировок изучаемые явления делятся на важнейшие

типы, характерные группы и подгруппы по существенным признакам. С помощью

группировок ограничивают качественно однородные в существенном отношении

совокупности, что является предпосылкой для определения и применения

обобщающих показателей.

На заключительном этапе анализа с помощью обобщающих показателей

рассчитываются относительные и средние величины, дается сводная оценка

вариации признаков, характеризуется динамика явлений, применяются индексы,

балансовые построения, рассчитываются показатели, характеризующие тесноту

связей в изменении признаков. С целью наиболее рационального и наглядного

изложения цифрового материала он представляется в виде таблиц и графиков.

3.Статистическое наблюдение: понятие, основные формы.

Это научно-организ.работа по сбору данных. Формы:стат. 1) отчетность, кот. базируется на докум.учете. с 98 г введены 4 унифицир.формы федер.гос.набл-ния: ФП-1 (выпуск пр-ции), ФП-2 (инвестизм), ФП-3 (фин.состояние орг-ций), ФП-4 (числ-ть раб-ков, труд), 2) специально организ.набл-ние (перепись), 3) регистр – это с-ма пок-лей, кот.хар-т кажд.ед-цу набл-ния: регистры нас-ния, пр-тий, строек и подряд.орг-ций, розн.и оптов.торговли. Виды набл-ния: 1) сплошное, несплошное (выборочн., цензовые основанные на методе осн. массива, монограф.). Набл-ние бывает текущее, период., единовремен. Способы набл-ния: непосредств., документал., опрос (экспедиц., анкетный, явочный, корреспонд.). Стат.набл-ния проводятся по плану, кот.вкл-т в себя: программно-методолог.вопросы (цели, задачи), организ.вопросы (время, место). В рез-те, проведенных набл-ний возникают погрешности, кот снижают точность набл-ний, поэтому проводится контроль данных (логический и счетный). В рез-те проверки достовер.данных выявл-тся след.ошибки набл-ний: случ. ошибки (ошибки регистрации), преднамер.ошибки, непреднамер. (систем.и несистем.), ошибки репрезентативности (представительности).

Програмно-методологические вопросы статистического наблюдения.

Программно-методологические вопросы статистического наблюдения

Каждое наблюдение проводится с конкретной целью. При его проведении необходимо установить, что подлежит обследованию. Надо решить следующие вопросы:

Объект наблюдения – совокупность предметов, явлений, у которых должны быть собраны сведения. При определении объекта указываются его основные отличительные черты (признаки). Всякий объект массовых наблюдений состоит их отдельных единиц, поэтому надо решить вопрос о том, каков тот элемент совокупности, который послужит единицей наблюдения.

Единица наблюдения – это составной элемент объекта, который является носителем признаков, подлежащих регистрации и основой счета.

Ценз – это определенные количественные ограничения для объекта наблюдения.

Признак – это свойство, которое характеризует определенные черты и особенности, присущие единицам изучаемой совокупности.

Организационные вопросы статистического наблюдения.

Программа наблюдения оформляется в виде бланков (анкет, формуляров), в которые заносятся первичные данные. Необходимым дополнением бланков является инструкция, которая разъясняет смысл вопросов.

К организационным вопросам программы относятся:

сроки наблюдения;

критический момент наблюдения;

подготовительные работы;

Срок наблюдения, к которому относят регистрируемые сведения. Называется объективным временем наблюдения. Это м.б. определенный период времени (сутки, декада, месяц) или определенный момент. Момент, к которому относятся регистрируемые сведения, называется критическим моментом наблюдения.

Например, критическим моментом микропереписи 94г. был 0.00 ч. в ночь с 13-14 февраля. Устанавливая критический момент наблюдения, м. с фотографической точностью определить истинное положение дел.

Подготовительные работы предусматривают обеспечение наблюдения документами, а также составление списка отчетных единиц, бланков, инструкций.

Документы м. заполнятся в ходе наблюдения или по его результатам.

Важное место в системе подготовительных работ имеет подбор и подготовка кадров, а также проведение инструктажа с теми, кто будет участвовать в проведении наблюдения.

В основе любого статистического исследования лежат три взаимосвязанных этапа работы:

1) статистическое наблюдение;

2) сводка и группировка данных наблюдения;

3) научная обработка и анализ результатов сводки. Каждая последующая стадия статистического исследования может быть проведена при условии, что были осуществлены предшествующие (предшествующая) ей стадии работы.

Статистическое наблюдение – это первая стадия статистического исследования.

Статистическое наблюдение – это планомерное, научно организованное собирание сведений о той или иной совокупности общественных и, в частности, экономических явлений или процессов.

Статистические наблюдения весьма многообразны и различаются характером исследуемых явлений, формой организации, временем наблюдения, полнотой охвата изучаемых явлений. В связи с этим была проведена классификация статистических наблюдений по отдельным признакам .

1. По форме организации статистические наблюдения делятся на отчетность и специально организованные статистические наблюдения.

Отчетность – это основная организационная форма статистического наблюдения, которая сводится к собиранию сведений от предприятий, учреждений и организаций о различных сторонах их деятельности на специальных бланках, называемых отчетами. Отчетность носит обязательный характер. Отчетность делится на основную и текущую в зависимости от продолжительности периода, относительно которого она составляется.

Основная отчетность также называется годовой и содержит наиболее широкий круг показателей, охватывающих все стороны деятельности предприятия.

Текущая отчетность представляется в течение года за различные по продолжительности промежутки времени.

Однако существуют данные, которые принципиально невозможно получить на основе отчетности и данные, которые нецелесообразно включать в нее. Именно для получения этих двух видов данных используются специально организованные статистические наблюдения – различного рода обследования и переписи.

Статистические обследования – это такие специально организованные наблюдения, при которых исследуемая совокупность явлений подвергается наблюдению в течение определенного периода времени.

Перепись – это такая форма специально организованного статистического наблюдения, при котором исследуемая совокупность явлений наблюдается на какую‑либо дату (на некоторый момент).

2. По признаку времени все статистические наблю дения делятся на непрерывные и прерывные.

Непрерывное (текущее) статистическое наблюдение – это наблюдение, которое осуществляется во времени непрерывно. При данном виде наблюдения отдельные явления, факты, события регистрируются по мере их возникновения.


Прерывное статистическое наблюдение – это наблюдение, при котором наблюдаемые явления, факты, события регистрируются не непрерывно, а через периоды времени равной или неравной продолжительности. Различают две разновидности прерывного наблюдения – периодическое и единовременное. Периодическим называется прерывное наблюдение, которое проводится через периоды времени равной продолжительности. Единовременным называется наблюдение, которое проводится через периоды времени неравной продолжительности или имеющие разовый характер.

3. По признаку полноты охвата изучаемой массы явлений, фактов, событий статистические наблюдения делятся на сплошные и несплошные, или частичные.

Сплошное наблюдение имеет целью учет всех без исключения явлений, фактов, событий, образующих исследуемую совокупность.

Несплошное наблюдение имеет целью учет лишь некоторой части явлений, фактов, событий, образующих исследуемую совокупность.

Понятие об исследовании количественных сторон объектов и явлений сформировалось давно, с момента развития у человека элементарных навыков работы с информацией. Однако, термин «статистика», дошедший до нашего времени заимствован гораздо позднее из латинского языка и происходит от слова «status», что означает «определенное состояние вещей». «Status» употреблялось также в значении «политическое состояние» и закрепилось почти во всех европейских языках именно в этом смысловом значении: английское «state», немецкое «Staat», итальянское «stato» и производное от него «statistа» - знаток государства.

Широкое применение слово «статистика» получило в XVIII веке и применялось в значение «государствоведение». Статистикой называют отрасль практической деятельности, направленной на собирание, обработку, анализ и предоставление в публичное пользование данных о явлениях и процессах общественной жизни.

Анализ - это метод научного исследования объекта путем рассмотрения его отдельных сторон и составных частей.

Экономико-статистический анализ - это разработка методики, основанной на широком применении традиционных статистических и математико-статистических методов, с целью контроля адекватного отражения исследуемых явлений и процессов.

Этапы статистического исследования. Статистическое исследование проходит в три этапа:

  • 1) статистическое наблюдение;
  • 2) сводка полученных данных;
  • 3) статистический анализ.

На первом этапе с помощью метода массовых наблюдений собирают первичные статистические данные.

На втором этапе статистического исследования собранные данные подвергаются первичной обработки, сводке и группировке. Метод группировок позволяет выделить однородные совокупности, разделить их на группы и подгруппы. Сводка - это получение итогов по совокупности в целом и отдельным ее группам и подгруппам.

Результаты группировки и сводки излагаются в виде статистических таблиц. Основное содержание этого этапа заключается в переходе от характеристик каждой единицы наблюдения к сводным характеристикам совокупности в целом или ее групп.

На третьем этапе полученные сводные данные анализируются методом обобщающих показателей (абсолютные, относительные и средние величины, показатели вариации, индексные системы, методы математической статистики, табличный метод, графический метод и др.).

Основы статистического анализа:

  • 1) утверждение фактов и установление их оценки;
  • 2) выявление характерных особенностей и причин явления;
  • 3) сравнение явления с нормативными, плановыми и другими явлениями, которые приняты за базу сравнения;
  • 4) формулирование выводов, прогнозов, предположений и гипотез;
  • 5) статистическая проверка выдвинутых предположений (гипотез).

Анализ и обобщение статистических данных - заключительный этап статистического исследования, конечной целью которого является получение теоретических выводов и практических заключений о тенденциях и закономерностях изучаемых социально-экономических явлений и процессов. Задачами статистического анализа являются: определение и оценка специфики и особенностей изучаемых явлений и процессов, изучение их структуры, взаимосвязей и закономерностей их развития.

Статистический анализ данных проводится в неразрывной связи теоретического, качественного анализа сущности исследуемых явлений и соответствующего количественного инструментария, изучения их структуры, связей и динамики.

Статистический анализ - исследование характерных особенностей структуры, связи явлений, тенденций, закономерностей развития социально-экономических явлений, для чего используются специфические экономико-статистические и математико-статистические методы. Статистический анализ завершается интерпретаций полученных результатов.

В статистическом анализе признаки подразделяются по характеру влияния друг на друга:

  • 1. Признак-результат - признак, анализируемый в данном исследовании. Индивидуальные размеры такого признака у отдельных элементов совокупности подвержены влиянию одного или нескольких других признаков. Другим словами, признак-результат рассматривается как следствие взаимодействия других факторов;
  • 2. Признак-фактор - признак, оказывающий влияние на исследуемый признак (признак-результат). Причем зависимость между признаком-фактором и признаком-результатом может быть количественно определенна. Синонимами данного термина в статистике являются, «факторный признак», «фактор». Следует различать понятия признака-фактора и признака-веса. Признаком-весом называют такой признак, который необходимо учесть при расчетах. Но, признак-вес не оказывает влияния на исследуемый признак. Признак-фактор может рассматриваться как признак-вес, т. е., учитываться при расчетах, но не всякий признак-вес является признаком-фактором. Например, при исследовании в группе студентов зависимости между временем подготовки к экзамену и количеством баллов, полученных на экзамене должен учитываться и третий признак: «Количество человек, аттестованных на определенный балл». Последний признак не является влияющим на результат, однако, будет включен в аналитические расчеты. Именно такой признак и называется признаком-весом, а не признаком-фактором.

Прежде чем приступить к анализу, необходимо проверить, соблюдены ли условия, обеспечивающие его достоверность и правильность:

  • - Достоверность первичных цифровых данных;
  • - Полнота охвата изучаемой совокупности;
  • - Сопоставимость показателей (по единицам учета, территории, методике подсчета).

Основными понятиями статистического анализа являются:

  • 1. Гипотеза;
  • 2. Решающая функция и решающее правило;
  • 3. Выборка из генеральной совокупности;
  • 4. Оценка характеристик генеральной совокупности;
  • 5. Доверительный интервал;
  • 6. Тренд;
  • 7. Статистическая взаимосвязь.

Анализ является завершающей стадией статистического исследования, сутью которой является выявление взаимосвязей и закономерностей изучаемого явления, формулировка выводов и предложений.

2.1 Схема проведения статистического исследования

Системы статистического анализа данных – это современный эффективный инструмент статистического исследования. Широкие возможности для обработки статистических данных имеют специальные системы статистического анализа, а также универсальные средства – Excel, Matlab, Mathcad и др..

Но даже самый совершенный инструмент не может заменить исследователя, который должен сформулировать цель исследования, провести сбор данных, выбрать методы, подходы, модели и средства проведения обработки и анализа данных, а также интерпретировать полученные результаты.

На рисунке 2.1 представлена схема проведения статистического исследования.

Рис.2.1 - Принципиальная схема статистического исследования

Исходным пунктом статистического исследования является формулировка проблемы. При ее определении учитывается цель исследования, определяется, какая информация необходима и как она будет использоваться при принятии решения.

Само статистическое исследование начинается с подготовительного этапа. В ходе подготовительного этапа аналитики изучают техническое задание – документ, составляемый заказчиком исследования. В техническом задании должны быть четко сформулированы цели исследования:

    определен объект исследования;

    перечислены предположения и гипотезы, которые в ходе исследования должны быть подтверждены или опровергнуты;

    описано то, как будут использоваться результаты исследования;

    сроки, в которые исследование должно быть проведено и бюджет исследования.

На основе технического задания разрабатывается структура аналитического отчета - то, в каком виде должны быть представлены результаты исследования, а также программа статистического наблюдения . Программа представляет собой перечень признаков, подлежащих регистрации в процессе наблюдения (или вопросов на которые должны быть получены достоверные ответы по каждой обследуемой единице наблюдения). Содержание программы определяется как особенностями наблюдаемого объекта и целями исследования, так и методами, выбранными аналитиками для дальнейшей обработки собранной информации.

Основной этап статистического исследования включает сбор необходимых данных и их анализ.

Финальным этапом исследования является составление аналитического отчета и предоставление его заказчику.

На рис. 2.2 представлена схема статистического анализа данных.

Рис.2.2 – Основные этапы статистического анализа

2.2 Сбор статистической информации

Сбор материалов подразумевает анализ технического задания исследования, определение источников необходимой информации и (при необходимости) разработку анкет. При исследовании источников информации все требуемые данные разделяют на первичные (данные, которых нет в наличии и которые должны быть собраны непосредственно для данного исследования), и вторичные (собранные ранее для иных целей).

Сбор вторичных данных часто называют "кабинетным" или "библиотечным" исследованием.

Примеры сбора первичных данных: наблюдения за посетителями магазина, анкетирование пациентов больницы, обсуждение проблемы на совещании.

Вторичные данные делят на внутренние и внешние.

Примеры источников внутренних вторичных данных:

    информационная система организации (включающая в себя бухгалтерскую подсистему, подсистему управления продажами, CRM (CRM-система, сокращение от англ. Customer Relationship Management) - прикладное программное обеспечение для организаций, предназначенное для автоматизации стратегий взаимодействия с заказчиками) и другие);

    ранее проведенные исследования;

    письменные отчеты сотрудников.

Примеры источников внешних вторичных данных:

    отчеты органов статистики и других государственных учреждений;

    отчеты маркетинговых агентств, профессиональных ассоциаций и т.п.;

    электронные базы данных (адресные справочники, ГИС и т.п.);

    библиотеки;

    средства массовой информации.

Основными выходными данными на этапе сбора данных являются:

    планируемый объем выборки;

    структура выборки (наличие и размер квот);

    вид статистического наблюдения (сбор данных опрос, анкетирование, измерение, эксперимент, экспертиза, др.);

    информация о параметрах опроса (например, возможность факта фальсификации анкет);

    схема кодировки переменных в базе данных программы, выбранной для обработки;

    план-схема преобразования данных;

    план-схема используемых статистических процедур.

Этот же этап включает непосредственно процедуру анкетирования. Разумеется, анкеты разрабатываются только для получения первичной информации.

Полученные данные должны быть соответствующим образом отредактированы и подготовлены. Каждая анкета или форма наблюдения проверяется и, если нужно, корректируется. Каждому ответу присваиваются числовые или буквенные коды – производится кодировка информации. Подготовка данных включает в себя редактирование, расшифровку и проверку данных, их кодирование и необходимые преобразования.

2.3 Определение характеристик выборки

Как правило, данные, собранные в результате статистического наблюдения для проведения статистического анализа являются выборочной совокупностью. Последовательность преобразования данных в процесс статистического исследования можно схематично представить следующим образом (рис. 2.3)

Рис 2.3 Схема преобразования статистических данных

Анализируя выборку, можно делать выводы о генеральной совокупности, представленной выборкой.

Окончательное определение общих параметров выборки производят, когда все анкеты собраны. Оно включает:

    определение реального количества респондентов,

    определение структуры выборки,

    распределение по месту опроса,

    установление доверительного уровня статистической надежности выборки,

    расчет статистической ошибки и определение репрезентативности выборки.

Реальное количество респондентов может оказаться большим либо меньшим запланированного. Первый вариант лучше для анализа, но невыгоден заказчику исследования. Второй может отрицательно сказаться на качестве исследования, а, следовательно, невыгоден ни аналитикам, ни заказчикам.

Структура выборки может быть случайной или неслучайной (респонденты отбирались на основе заранее известного критерия, например методом квотирования). Случайные выборки априори являются репрезентативными. Неслучайные выборки могут быть намерено нерепрезентативными относительно генеральной совокупности, но давать важную информацию для исследований. В этом случае также следует внимательно отнестись к фильтрационным вопросам анкеты, которые предназначены специально для отсеивания неподходящих под требования респондентов.

Для определения точности оценивания , прежде всего, необходимо установить уровень доверительной вероятности (95% или 99%). Тогда максимальная статистическая ошибка выборки рассчитывается как

или
,

где - объем выборки,- вероятность наступления исследуемого события (попадание респондента в выборку),- вероятность обратного события (непопадания респондента в выборку),- коэффициент доверительной вероятности,
- дисперсия признака.

В таблице 2.4 приведены наиболее употребляемые значения доверительной вероятности и коэффициентов доверительной вероятности.

Таблица 2.4

2.5 Обработка данных на компьютере

Анализ данных с применением компьютера включает выполнение ряда необходимых шагов.

1. Определение структуры исходных данных.

2. Ввод данных в компьютер в соответствии с их структурой и требованиями программы. Редактирование и преобразование данных.

3. Задание метода обработки данных в соответствии с задачами исследования.

4. Получение результата обработки данных. Его редактирование и сохранение в нужном формате.

5. Интерпретация результата обработки.

Шаги 1 (подготовительный) и 5 (заключительный) не способна выполнить ни одна компьютерная программа - их исследователь делает сам. Шаги 2-4 выполняются исследователем с использованием программы, но именно исследователь определяет необходимые процедуры редактирования и преобразования данных, методы обработки данных, а также формат представления результатов обработки. Помощь компьютера (шаги 2–4) заключается, в конечном итоге, в переходе от длинной последовательности чисел к более компактной. На «вход» компьютера исследователь подает массив исходных данных, который недоступен осмыслению, но пригоден для компьютерной обработки (шаг 2). Затем исследователь дает программе команду на обработку данных в соответствии с поставленной задачей и структурой данных (шаг 3). На «выходе» он получает результат обработки (шаг 4) - тоже массив данных, только уже меньший, доступный осмыслению и содержательной интерпретации. При этом исчерпывающий анализ данных обычно требует многократной их обработки с применением разных методов.

2.6 Выбор стратегии анализа данных

Выбор стратегии анализа собранных данных основывается на знании теоретических и практических аспектов исследуемой предметной области, специфики и известных характеристик информации, свойств конкретных статистических методов, а также на опыте и взглядах исследователя.

Необходимо помнить, что анализ данных - это вовсе не конечная цель исследования. Его цель - получить информацию, которая поможет решить определенную проблему и принять адекватные управленческие решения. Выбор стратегии анализа должен начинаться с исследования итогов предыдущих этапов процесса: определение проблемы и разработка плана исследования. В качестве "черновика" используется предварительный план анализа данных, разработанный как один из элементов плана исследования. Затем, в ходе поступления на последующих стадиях процесса исследования дополнительной информации, может понадобиться внесение определенных изменений.

Статистические методы делятся на одно- и многомерные. Одномерные методы(univariatetechniques) используются тогда, когда все элементы выборки оцениваются одним показателем, либо если этих показателей несколько для каждого элемента, но каждая переменная анализируется при этом отдельно ото всех остальных.

Многомерные методы (multivariate techniques) прекрасно подходят для анализа данных, если для оценки каждого элемента выборки используется два или больше показателей и эти переменные анализируются одновременно. Такие методы применяются для определения зависимостей между явлениями.

Многомерные методы отличаются от одномерных прежде всего тем, что при их использовании центр внимания смещается с уровней (средних показателей) и распределений (дисперсий) явлений и сосредотачивается на степени взаимосвязи (корреляции или ковариации) между этими явлениями.

Одномерные методы можно классифицировать на основе того, какие данные анализируются: метрические или неметрические (рис. 3). Метрические данные (metric data) измеряются по интервальной шкале или относительной шкале. Неметрические данные (nonmetric data) оцениваются по номинальной или порядковой шкале

Кроме того, эти методы делят на классы на основе того, сколько выборок - одна, две или более - анализируется в ходе исследований.

Классификация одномерных статистических методов представлена на рис.2.4.

Рис. 2.4 Классификация одномерных статистических методов в зависимости от анализируемых данных

Число выборок определяется тем, как ведется работа с данными для конкретного анализа, а не тем, каким способом собирались данные. Например, данные по лицам мужского и женского пола можно получить в пределах одной выборки, но если их анализ нацелен на выявление разницы в восприятии, основанной на разнице полов, исследователю придется оперировать двумя разными выборками. Выборки считаются независимыми, если они экспериментально не связаны между собой. Измерения, проведенные в одной выборке, не оказывают влияния на значения переменных в другой. Для анализа данные, относящиеся к разным группам респондентов, например собранные от лиц женского и мужского пола, обычно обрабатываются как независимые выборки.

С другой стороны, если данные по двум выборкам относятся к одной и той же группе респондентов, выборки считаются объединенными в пары - зависимыми.

Если существует только одна выборка метрических данных, может использоваться z- и t-критерий. Если же независимых выборок две или больше, в первом случае можно воспользоваться z- и t-критерием для двух выборок, в во втором - методом однофакторного дисперсионного анализа. Для двух связанных выборок используется парный t-критерий. Если речь идет о неметрических данных по одной выборке, исследователь может воспользоваться критериями частотного распределения, хи-квадратом, критерием Колмогорова-Смирнова (K~S), критерием серий и биномиальным критерием. Для двух независимых выборок с неметрическими данными можно прибегнуть к следующим методам анализа: хи-квадрат, Манна-Уитни, медианы, К-С, однофакторным дисперсионным анализом Крускала-Уоллиса (ДА К-У). В отличие от этого, если существует две или больше взаимосвязанных выборок, следует воспользоваться критериями знаков, Мак-Немара и Уилкоксона.

Многомерные статистические методы нацелены на выявление существующих закономерностей: взаимозависимости переменных, взаимосвязи или последовательности событий, межобъектного сходства.

Достаточно условно можно выделить пять стандартных типов закономерностей, исследование которых представляет существенный интерес: ассоциация, последовательность, классификация, кластеризация и прогнозирование

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 65% купивших кукурузные чипсы берут также и "кока-колу", а при наличии скидки за такой комплект "колу" приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил.

Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации выделяют различные однородные группы данных.

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в виде временных рядов. Если удается построить найти закономерности, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем.

Многомерные статистические методы можно разделить на методы анализа взаимосвязи и классификационный анализ (рис. 2.5).

Рис.2.5 – Классификация многомерных статистических методов