Автокорреляция остатков временного ряда.
Положительная и отрицательная автокорреляция
Рассмотрим в качестве примера временной ряд yt - ряд последовательных значений курса ценной бумаги А, наблюдаемых в моменты времени 1, ..., 100. Результаты наблюдений графически изображены на рисунке.
Очевидно, курс ценной бумаги А имеет тенденцию к росту, что можно проследить на графике.
Оценивая обычным методом наименьших квадратов зависимость курса от номера наблюдений получим следующие результаты:

Графически положительная автокорреляция выражается в чередовании зон, где наблюдаемые значения оказываются выше предсказанных, и зон, где наблюдаемые значения ниже.
На рисунке можно представить графики наблюдаемых значений yt и объясненных, сглаженных ŷt.
Отрицательная автокорреляция встречается в тех случаях, когда наблюдения действуют друг на друга по принципу "маятника" - завышенные значения в предыдущих наблюдениях приводят к занижению их в наблюдениях последующих. Графически это выражается в том, что результаты наблюдений yt "слишком часто" "перескакивают" через график объясненной части ŷt. Примерное поведение графика наблюдаемых значений временного ряда можно изобразить на рисунке.
Критерий Дарбина – Уотсона
Ситуация, когда на значение наблюдения уt, оказывает основное влияние не результат уt-1, а более ранние значения, является достаточно редкой. Чаще всего при этом влияние носит сезонный (циклический) характер, например, на значение уt оказывает наибольшее влияние уt-7, если наблюдения осуществляются ежедневно и имеют недельный цикл (например, сбор кинотеатра). В этом случае можно составить ряды наблюдений отдельно по субботам, воскресеньям и так далее, после чего наиболее сильная корреляция будет наблюдаться между соседними членами.
Таким образом, отсутствие корреляции между соседними членами служит хорошим основанием считать, что корреляция отсутствует в целом, и обычный метод наименьших квадратов дает адекватные и эффективные результаты.
Тест Дарбина – Уотсона определяет наличие автокорреляции между соседними членами. Тест Дарбина-Уотсона основан на простой идее: если корреляция ошибок регрессии не равна нулю, то она присутствует и в остатках регрессии е i , получающихся в результате применения обычного метода наименьших квадратов.
В тесте Дарбина – Уотсона для оценки корреляции используется статистика вида



значительно меньше
и в силу
.В случае отсутствия автокорреляции выборочный коэффициент r не сильно отличается от нуля, а значение статистики d будет близко к двум. Близость наблюдаемого значения к нулю должно означать наличие положительной автокорреляции, к четырем - отрицательной.
Тест Дарбина – Уотсона имеет недостаток – распределение статистики d зависит не только от числа наблюдений, но и от значений объясняющих величин Х j (j = 1, , р). Это означает, что тест Дарбина – Уотсона не представляет собой статистический критерий в том смысле, что нельзя указать критическую область, которая позволила бы отвергнуть гипотезу об отсутствии автокорреляции. Однако существуют два пороговых значения d в и dн, зависящие только от числа наблюдений, числа объясняющих величин, уровня значимости.

Недостатками критерия Дарбина-Уотсона являются наличие области неопределенности критерия, а также то, что критические значения d-статистики определены для объемов выборки не менее 15.
Выяснить на уровне значимости 0,05 наличие автокорреляции в остатках для временного ряда у t курса акций, приведённого в лекции 12, по критерию Дарбина – Уотсона.
| t | y | t·y | t2 | y 2 | ŷt | et | et-1 | et·et-1 | et2 | |
| 1 | 971 | 971 | 1 | 942841 | 885,2885 | 85,71146 | - | - | 7346,455 | |
| 2 | 1166 | 2332 | 4 | 1359556 | 905,4472 | 260,5528 | 85,71146 | 22332,36 | 67887,76 | |
| 3 | 1044 | 3132 | 9 | 1089936 | 925,6059 | 118,3941 | 260,5528 | 30847,92 | 14017,17 | |
| 4 | 907 | 3628 | 16 | 822649 | 945,7645 | -38,7645 | 118,3941 | -4589,49 | 1502,69 | |
| 5 | 957 | 4785 | 25 | 915849 | 965,9232 | -8,92321 | -38,7645 | 345,904 | 79,62363 | |
| 6 | 727 | 4362 | 36 | 528529 | 986,0819 | -259,082 | -8,92321 | 2311,841 | 67123,42 | |
| 7 | 752 | 5264 | 49 | 565504 | 1006,241 | -254,241 | -259,082 | 65869,12 | 64638,25 | |
| 8 | 1019 | 8152 | 64 | 1038361 | 1026,399 | -7,39921 | -254,241 | 1881,179 | 54,7483 | |
| 9 | 972 | 8748 | 81 | 944784 | 1046,558 | -74,5579 | -7,39921 | 551,6694 | 5558,877 | |
| 10 | 815 | 8150 | 100 | 664225 | 1066,717 | -251,717 | -74,5579 | 18767,45 | 63361,22 | |
| 11 | 823 | 9053 | 121 | 677329 | 1086,875 | -263,875 | -251,717 | 66421,76 | 69630,13 | |
| 12 | 1112 | 13344 | 144 | 1236544 | 1107,034 | 4,966121 | -263,875 | -1310,44 | 24,66236 | |
| 13 | 1386 | 18018 | 169 | 1920996 | 1127,193 | 258,8075 | 4,966121 | 1285,269 | 66981,3 | |
| 14 | 1428 | 19992 | 196 | 2039184 | 1147,351 | 280,6488 | 258,8075 | 72634 | 78763,74 | |
| 15 | 1364 | 20460 | 225 | 1860496 | 1167,51 | 196,4901 | 280,6488 | 55144,71 | 38608,37 | |
| 16 | 1241 | 19856 | 256 | 1540081 | 1187,669 | 53,33145 | 196,4901 | 10479,1 | 2844,244 | |
| 17 | 1145 | 19465 | 289 | 1311025 | 1207,827 | -62,8272 | 53,33145 | -3350,67 | 3947,259 | |
| 18 | 1351 | 24318 | 324 | 1825201 | 1227,986 | 123,0141 | -62,8272 | -7728,63 | 15132,47 | |
| 19 | 1325 | 25175 | 361 | 1755625 | 1248,145 | 76,85545 | 123,0141 | 9454,305 | 5906,76 | |
| 20 | 1226 | 24520 | 400 | 1503076 | 1268,303 | -42,3032 | 76,85545 | -3251,23 | 1789,562 | |
| 21 | 1189 | 24969 | 441 | 1413721 | 1288,462 | -99,4619 | -42,3032 | 4207,558 | 9892,667 | |
| 22 | 1213 | 26686 | 484 | 1471369 | 1308,621 | -95,6206 | -99,4619 | 9510,601 | 9143,29 | |
| сред | 11,5 | 1096,955 | 13426,36 | 172,5 | 1246676 | Сумма | 351814,3 | 594234,7 | ||
| cov | 811,3864 | |||||||||
| дисп | 40,25 | 43367,13 | ||||||||
| b | 20,15867 | d | 0,815908 | |||||||
| a | 865,1299 | |||||||||
| dн | dв | |||||||||
| 0 | 1,24 | 1,43 | 2,57 | 2,76 | 4 |
Фактическое d попадает в зону, которая свидетельствует о положительной автокорреляции.
Тест серий (Бреуша - Голфри)
Это приводит к необходимости использовать также другие тесты на наличие автокорреляции.
Тест серий (Бреуша-Годфри) основан на следующей идее: если имеется корреляция между соседними наблюдениями, то в уравнении
Заметим, что уравнение (1) является авторегрессионным уравнением первого порядка.
Практическое применение теста заключается в оценивании методом наименьших квадратов регрессии (1).
Преимущество теста Бреуша-Годфри по сравнению с тестом Дарбина-Уотсона заключается в том, что он проверяется с помощью статистического критерия. Другим преимуществом теста является возможность обобщения: в число регрессоров могут быть включены не только остатки с лагом 1, но и с лагом 2, 3 и т. д., что позволяет выявить корреляцию не только между соседними, но и между более отдаленными наблюдениями.
Вернемся к примеру зависимости курса ценной бумаги А от времени и применим тест серий Бреуша-Годфри.
Применяя метод наименьших квадратов, получим следующее уравнение:


Q-тест Льюинга-Бокса
Если ряд стационарный, то выборочный частный коэффициент корреляции rчастн(р) совпадает с оценкой обычного метода наименьших квадратов коэффициента βр в авторегрессионной модели:
График выборочной автокорреляционной функции называется коррелограммой. Коррелограмма является быстро убывающей функцией.
В случае отсутствия автокорреляции все значения автокорреляционной функции равны нулю. Ее выборочные значения r(τ) окажутся отличными от нуля, но в этом случае отличие не должно быть существенным. На этой идее основан еще один тест, проверяющий гипотезу об отсутствии автокорреляции, - Q-тест Льюинга-Бокса.
Статистика Льюинга-Бокса имеет вид:
. (3)Пример. Проверить гипотезу об отсутствии автокорреляции в модели зависимости курса ценной бумаги А от времени t.
Решение. Значение d-статистики Дарбина-Уотсона, примерно равное единице, дает оценку коэффициента корреляции между et иet-1, т. е. r(1) = 0,585. Отсюда по формуле (3)

Замечание. Критические значения χ²α;р статистики растут с увеличением р. Величины Qp также растут, но, возможно, медленнее. Таким образом, формальное применение теста Льюинга-Бокса может привести к парадоксальным выводам: например, отвергается гипотеза об отсутствии автокорреляции первого порядка, но не отвергается гипотеза об отсутствии автокорреляции всехостальных порядков! На самом деле противоречия здесь нет. Тот факт, что гипотеза не отвергается, не означает, что она на самом деле верна, можно лишь утверждать, что если она верна, то наблюдаемый результат возможен с вероятностью, большей, чем уровень значимости. Впрочем, подобного рода ситуации на практике встречаются достаточно редко.
Устранение автокорреляции. Идентификация временного ряда
Наиболее часто "скрытыми" регрессорами оказываются лаговые объясняемые переменные. В случае временного ряда можно предположить, что значения объясняемых переменных зависят не только от включенных уже регрессоров, но и от предыдущих значений объясняемой переменной. Рассмотренные тесты показывают, что это почти всегда имеет место в случае автокорреляции.
Другой механизм образования автокорреляции следующий. Случайные возмущения представляют собой белый шум ξt, но на результат наблюдения yt влияет не только величина ξt, но несколько предыдущих величин ξ t-1, , ξ t-p.
Например, рассматривая модель формирования курса ценной бумаги А, мы можем считать, что кроме временной тенденции на курс еще влияет конъюнктура рынка, которую в момент времени t можно считать случайной величиной ξt с нулевым средним и некоторой дисперсией. Будем предполагать, что величины ξt независимы. Естественно ожидать, что на формирование курса в момент времени t будет оказывать влияние конъюнктура ξt и конъюнктуры в дни предыдущих торгов ξ t-τ и т. д.
Наиболее распространенным приемом устранения автокорреляции во временных рядах является подбор соответствующей модели - авторегрессионной, скользящей средней или авторегрессионной модели скользящей средней для случайных возмущений регрессии.
В число регрессоров в моделях временных рядов могут быть включены и константа, и временной тренд, и какие-либо другие объясняющие переменные. Ошибки регрессии могут коррелировать между собой, однако, мы предполагаем, что остатки регрессии образуют стационарный временной ряд.
Идентификацией временного ряда называется построение для ряда остатков адекватной модели, в которой остатки представляют собой белый шум, а все регрессоры значимы. Такое представление не единственное, например, один и тот же ряд может быть идентифицирован и с помощью разных моделей. В этом случае выбирается наиболее простая модель.
Как подбирать для данного временного ряда подходящую модель? Безусловно, разумен метод элементарного подбора - пробуются различные модели; при этом начинается поиск с самых простых моделей, которые постепенно усложняются, пока не будет достигнута идентификация.
Полезную информацию можно получить с помощью выборочных автокорреляционной и частной автокорреляционной функций. Выборочная частная автокорреляционная функция rчаст(р) есть оценка параметра βp в авторегрессионной модели р-го порядка. Отсюда делаем вывод:
Если все значения выборочной частной автокорреляционной функции порядка выше р незначимо отличаются от нуля, временной ряд следует идентифицировать с помощью модели, порядок авторегрессии которой не выше р.
Теперь рассмотрим модель скользящей средней