Статистика дарбина уотсона dw 2 тогда. Тест дарбина-уотсона на наличие автокорреляции остатков

Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений от значений отклонений во всех других наблюдениях. Отсутствие зависимости гарантирует отсутствие коррелированности между любыми отклонениями, т.е. и, в частности, между соседними отклонениями .

Автокорреляция (последовательная корреляция ) остатков определяется как корреляция между соседними значениями случайных отклонений во времени (временные ряды) или в пространстве (перекрестные данные). Она обычно встречается во временных рядах и очень редко – в пространственных данных.

Возможны следующие случаи :

Эти случаи могут свидетельствовать о возможности улучшить уравнение путём оценивания новой нелинейной формулы или включения новой объясняющей переменной.

В экономических задачах значительно чаще встречается положительная автокорреляция, чем отрицательная автокорреляция.

Если же характер отклонений случаен , то можно предположить, что в половине случаев знаки соседних отклонений совпадают, а в половине – различны.

Автокорреляция в остатках может быть вызвана несколькими причинами, имеющими различную природу.

1. Она может быть связана с исходными данными и вызвана наличием ошибок измерения в значениях результативного признака.

2. В ряде случаев автокорреляция может быть следствием неправильной спецификации модели. Модель может не включать фактор, который оказывает существенное воздействие на результат и влияние которого отражается в остатках, вследствие чего последние могут оказаться автокоррелированными. Очень часто этим фактором является фактор времени .

От истинной автокорреляции остатков следует отличать ситуации, когда причина автокорреляции заключается в неправильной спецификации функциональной формы модели. В этом случае следует изменить форму модели, а не использовать специальные методы расчета параметров уравнения регрессии при наличии автокорреляции в остатках.

Для обнаружения автокорреляции используют либо графический метод. Либо статистические тесты.

Графический метод заключается в построении графика зависимости ошибок от времени (в случае временных рядов) или от объясняющих переменных и визуальном определении наличия или отсутствия автокорреляции.

Наиболее известный критерий обнаружения автокорреляции первого порядка – критерий Дарбина-Уотсона . Статистика DW Дарбина-Уотсона приводится во всех специальных компьютерных программах как одна из важнейших характеристик качества регрессионной модели.



Сначала по построенному эмпирическому уравнению регрессии определяются значения отклонений . А затем рассчитывается статистика Дарбина-Уотсона по формуле:

.

Статистика DW изменяется от 0 до 4. DW =0 соответствует положительной автокорреляции, при отрицательной автокорреляции DW =4 . Когда автокорреляция отсутствует , коэффициент автокорреляции равен нулю, и статистика DW = 2 .

Алгоритм выявления автокорреляции остатков на основе критерия Дарбина-Уотсона следующий.

Выдвигается гипотеза об отсутствии автокорреляции остатков . Альтернативные гипотезы и состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках. Далее по специальным таблицам определяются критические значения критерия Дарбина-Уотсона (- нижняя граница признания положительной автокорреляции) и (-верхняя граница признания отсутствия положительной автокорреляции) для заданного числа наблюдений , числа независимых переменных модели и уровня значимости . По этим значениям числовой промежуток разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью осуществляется следующим образом:

– положительная автокорреляция, принимается ;

– зона неопределенности;

– автокорреляция отсутствует;

– зона неопределенности;

– отрицательная автокорреляция, принимается .



Если фактическое значение критерия Дарбина-Уотсона попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу .

Можно показать, что статистика DW тесно связана с коэффициентом автокорреляции первого порядка:

Связь выражается формулой: .

Значения r изменяются от –1 (в случае отрицательной автокорреляции) до +1 (в случае положительной автокорреляции). Близость r к нулю свидетельствует об отсутствии автокорреляции.

При отсутствии таблиц критических значений DW можно использовать следующее «грубое» правило: при достаточном числе наблюдений (12-15), при 1-3 объясняющих переменных, если , то отклонения от линии регрессии можно считать взаимно независимыми.

Либо применить к данным уменьшающее автокорреляцию преобразование (например автокорреляционное преобразование или метод скользящих средних).

Существует несколько ограничений на применение критерия Дарбина-Уотсона.

1. Критерий DW применяется лишь для тех моделей, которые содержат свободный член.

2. Предполагается, что случайные отклонения определяются по итерационной схеме

,

3. Статистические данные должны иметь одинаковую периодичность (не должно быть пропусков в наблюдениях).

4. Критерий Дарбина – Уотсона не применим к авторегрессионным моделям, которые содержат в числе факторов также зависимую переменную с временным лагом (запаздыванием) в один период.

,

где – оценка коэффициента автокорреляции первого порядка, D(c) – выборочная дисперсия коэффициента при лаговой переменной y t -1 , n – число наблюдений.

Обычно значение рассчитывается по формуле , а D(c) равна квадрату стандартной ошибки S c оценки коэффициента с .

В случае наличия автокорреляции остатков полученная формула регрессии обычно считается неудовлетворительной. Автокорреляция ошибок первого порядка говорит о неверной спецификации модели. Поэтому следует попытаться скорректировать саму модель. Посмотрев на график ошибок, можно поискать другую (нелинейную) формулу зависимости, включить неучтённые до этого факторы, уточнить период проведения расчётов или разбить его на части.

Если все эти способы не помогают и автокорреляция вызвана какими–то внутренними свойствами ряда {e i }, можно воспользоваться преобразованием, которое называется авторегрессионной схемой первого порядка AR(1 ). (Авторегрессией это преобазование называется потому, что значение ошибки определяется значением той же самой величины, но с запаздыванием.Т.к. максимальное запаздывание равно 1, то это авторегрессияпервого порядка).

Формула AR(1 ) имеет вид: . .

Где -коэффициент автокорреляции первого порядка ошибок регрессии.

Рассмотрим AR(1) на примере парной регрессии:

.

Тогда соседним наблюдениям соответствует формула:

(1),

(2).

Умножим (2) на и вычтем из (1):

Сделаем замены переменных

получим с учетом :

(6) .

Поскольку случайные отклонения удовлетворяют предпосылкам МНК, оценки а * и b будут обладать свойствами наилучших линейных несмещенных оценок. По преобразованным значениям всех переменных с помощью обычного МНК вычисляются оценки параметров а* и b , которые затем можно использовать в регрессии.

Т.о. если остатки по исходному уравнению регрессии автокоррелированы, то для оценки параметров уравнения используют следующие преобразования:

1) Преобразовать исходные переменные у и х к виду (3), (4).

2) Обычным МНК для уравнения (6) определить оценки а * и b.

4) Записать исходное уравнение (1) с параметрами а и b (где а - из п.3, а b берётся непосредственно из уравнения (6)).

Для преобразования AR(1) важно оценить коэффициент автокорреляции ρ . Это делается несколькими способами. Самое простое – оценить ρ на основе статистики DW :

,

где r берется в качестве оценки ρ . Этот метод хорошо работает при большом числе наблюдений.

В случае, когда есть основания считать, что положительная автокорреляция отклонений очень велика (), можно использовать метод первых разностей (метод исключения тенденции) , уравнение принимает вид

.

Из уравнения по МНК оценивается коэффициент b . Параметр а здесь не определяется непосредственно, однако из МНК известно, что .

В случае полной отрицательной автокорреляции отклонений ()

Получаем уравнение регрессии:

или .

Вычисляются средние за 2 периода, а затем по ним рассчитывают а и b . Данная модель называется моделью регрессии по скользящим средним .

Критерий Дарбина - Уотсона (или DW-критерий) - статистический критерий, используемый для нахождения автокорреляции первого порядка элементов исследуемой последовательности. Наиболее часто применяется при анализе временных рядов и остатков регрессионных моделей. Критерий назван в честь Джеймса Дарбина и Джеффри Уотсона. Критерий Дарбина - Уотсона рассчитывается по следующей формуле

где ρ1 - коэффициент автокорреляции первого порядка.

В случае отсутствия автокорреляции d = 2, при положительной автокорреляции d стремится к нулю, а при отрицательной - к 4:

На практике применение критерия Дарбина - Уотсона основано на сравнении величины d с теоретическими значениями dL и dU для заданных числа наблюдений n, числа независимых переменных модели k и уровня значимости α.

Если d < dL, то гипотеза о независимости случайных отклонений отвергается (следовательно присутствует положительная автокорреляция);

Если d > dU, то гипотеза не отвергается;

Если dL < d < dU, то нет достаточных оснований для принятия решений.

Когда расчетное значение d превышает 2, то с dL и dU сравнивается не сам коэффициент d, а выражение (4 − d).

Также с помощью данного критерия выявляют наличие коинтеграции между двумя временными рядами. В этом случае проверяют гипотезу о том, что фактическое значение критерия равно нулю. С помощью метода Монте-Карло были получены критические значения для заданных уровней значимости. В случае, если фактическое значение критерия Дарбина - Уотсона превышает критическое, то нулевую гипотезу об отсутствии коинтеграции отвергают.

Недостатки :

Не способен выявлять автокорреляцию второго и более высоких порядков.

Даёт достоверные результаты только для больших выборок.

13. Соизмеримые показатели тесноты связи

К соизмеримым показателям тесноты связи относятся:

1) коэффициенты частной эластичности;

2) стандартизированные частные коэффициенты регрессии;

3) частный коэффициент детерминации.

Если факторные переменные имеют несопоставимые единицы измерения, то связь между ними измеряется с помощью соизмеримых показателей тесноты связи. С помощью соизмеримых показателей тесноты связи характеризуется степень зависимости между факторной и результативной переменными в модели множественной регрессии.

Коэффициент частной эластичности рассчитывается по формуле:

– среднее значение факторной переменной xi по выборочной совокупности,

– среднее значение результативной переменной у по выборочной совокупности;

– первая производная результативной переменной у по факторной переменной х.

Частный коэффициент эластичности измеряется в процентах и характеризует объём изменения результативной переменной у при изменении на 1 % от среднего уровня факторной переменной xiпри условии постоянства всех остальных факторных переменных, включённых в модель регрессии.

Для линейной модели регрессии частный коэффициент эластичности рассчитывается по формуле:

где βi– коэффициент модели множественной регрессии.

Для того чтобы рассчитать стандартизированные частные коэффициенты регрессии, необходимо построить модель множественной регрессии в стандартном (нормированном) масштабе. Это означает, что все переменные, включённые в модель регрессии, стандартизируются с помощью специальных формул. Посредством процесса стандартизации точкой отсчёта для каждой нормированной переменной устанавливается её среднее значение по выборочной совокупности. При этом в качестве единицы измерения стандартизированной переменной принимается её среднеквадратическое отклонение β.

Факторная переменная х переводится в стандартизированный масштаб по формуле:

где xij – значение переменной xj в i-том наблюдении;

G(xj) – среднеквадратическое отклонение факторной переменной xi;

Результативная переменная у переводится в стандартизированный масштаб по формуле:

где G(y) – среднеквадратическое отклонение результативной переменной у.

Стандартизированные частные коэффициенты регрессии характеризуют, на какую долю своего среднеквадратического отклонения G(y) изменится результативная переменная у при изменении факторной переменной х на величину своего среднеквадратического отклонения G(x), при условии постоянства всех остальных факторных переменных, включённых в модель регрессии.

Стандартизированный частный коэффициент регрессии характеризует степень непосредственной или прямой зависимости между результативной и факторной переменными. Но в связи с тем, что между факторными переменными, включёнными в модель множественной регрессии, существует зависимость, факторная переменная оказывает не только прямое, но и косвенное влияние на результативную переменную.

Частный коэффициент детерминации используется для характеристики степени косвенного влияния факторной переменной х на результативную переменную у:

где βi– стандартизированный частный коэффициент регрессии;

r(xixj) – коэффициент частной корреляции между факторными переменными xi и xj.

Частный коэффициент детерминации характеризует, на сколько процентов вариация результативной переменной вызвана вариацией i-ой факторной переменной, включённой в модель множественной регрессии, при условии постоянства всех остальных факторных переменных, включённых в модель регрессии.

Стандартизированные частные коэффициенты регрессии и частные коэффициенты эластичности могут давать различные результаты. Это несовпадение может быть объяснено, например, слишком большой величиной среднеквадратического отклонения одной из факторных переменных или эффектом неоднозначного воздействия одной из факторных переменных на результативную переменную.

Проверка адекватности трендовых моделей реальному процессу строится на основе анализа случайной компоненты. В расчетах случайная компонента заменяется остатками, представляющими собой разность фактических и расчетных значений

При правильном выборе тренда отклонения от него будут носить случайный характер. В случае если вид функции выбран неудачно, то последовательные значения остатков могут не обладать свойством независимости, т.е. они могут коррелировать между собой. В этом случае говорят, что имеет место автокорреляция ошибок.

Существует несколько приемов обнаружения автокорреляции. Наиболее распространенным является критерий Дарбина – Уотсона. Этот критерий связан с гипотезой о существовании автокорреляции первого порядка. Его значения определяются по формуле

. (2.29)

Для понимания смысла этой формулы преобразуем ее, сделав предварительное допущение, положив . Непосредственное преобразование формулы осуществляется следующим образом:

.

При достаточно большом сумма из слагаемых значительно превосходит сумму из двух слагаемых и поэтому отношением этих величин можно пренебречь. Кроме того, отношение в квадратных скобках в силу того, что , можно считать коэффициентном корреляции между и . Таким образом, критерий Дарбина – Уотсона записывается в виде

. (2.30)

Полученное представление критерия позволяет сделать вывод, что статистика Дарбина – Уотсона связывает с выборочным коэффициентом корреляции . Таким образом, и значение критерия может указывать на наличие или отсутствие автокорреляции в остатках. Причем, если , то . Если (положительная автокорреляция), то ; если (отрицательная автокорреляция), то .

Статистически значимая уверенность в наличии или отсутствии автокорреляции определяется с помощью таблицы критических точек распределения Дарбина – Уотсона. Таблица позволяет по заданному уровню значимости , числу наблюдений и количеству переменных в модели определить два значения: – нижняя граница и – верхняя граница.



Таким образом, алгоритм проверки автокоррелированности остатков по критерию Дарбина – Уотсона следующий:

1) Построение трендовой зависимости с помощью обычного МНК

2) Вычисление остатков

для каждого наблюдения ();

хорошо иллюстрируется графической схемой на рис. 3.1.

d

Рис. 2.1. Графическая схема проверки автокоррелированности остатков

Критерий Дарбина - Уотсона

Одним из самых простых, а потому широко применяемых на практике критериев проверки на наличие (отсутствие) автокорреляции является критерий Дарбина - Уотсона

и }