ЛЕКЦИЯ 11

Метод скользящих средних

   Другим методом выравнивания (сглаживания) временного ряда, т. е. выделения неслучайной составляющей, является метод скользящих средних. Он основан на переходе от начальных значений членов ряда к их средним значениям на интервале времени, длина которого определена заранее. При этом сам выбранный интервал времени "скользит" вдоль ряда.
   Получаемый таким образом ряд скользящих средних ведет себя более гладко, чем исходный ряд, из-за усреднения отклонений ряда. Действительно, если индивидуальный разброс значений члена временного ряда yt около своего среднего (сглаженного) значения а характеризуется дисперсией σ2, то разброс средней из m членов временного ряда (у1 + у2 +... + уm)/m около того же значения а будет характеризоваться существенно меньшей величиной дисперсии, равной σ2/m. Для усреднения могут быть использованы средняя арифметическая (простая и с некоторыми весами), медиана и др.
   Пример 1. Провести сглаживание временного ряда
Год, t12345678
Спрос, y t213171291309317362351361
методом скользящих средних, используя простую среднюю арифметическую с интервалом сглаживания m = 3 года.
   Решение. Скользящие средние находим по формуле
,
когда m = (2p + 1) — нечётное число; при m = 3, р = 1.
   Например, при t = 2 получим
;
при t = 3 получим
и т.д. В результате получим сглаженный ряд:
Год, t12345678
Спрос, yt225257306329343258
На рисунке этот ряд представлен графически в виде пунктирной линии.

Прогнозирование на основе моделей временных рядов

   Одна из важнейших задач анализа временного ряда состоит в прогнозировании на его основе развития изучаемого процесса. При этом исходят из того, что тенденция развития, установленная в прошлом, может быть распространена на будущий период.
   Задача ставится так: имеется временной (динамический) ряд yt( t = 1, 2,...,n) и требуется дать прогноз уровня этого ряда на момент n + τ.
   Выше был рассматрен точечный и интервальный прогноз значений зависимой переменной Y полученных для парной и множественной регрессий для значений объясняющих переменных X, расположенных вне пределов обследованного диапазона значений X.
   Если рассматривать временной ряд как регрессионную модель изучаемого признака по переменной «время», то к нему могут быть применены рассмотренные выше методы анализа. Следует, однако, помнить, что одна из основных предпосылок регрессионного нализа состоит в том, что возмущения εt (t = 1, 2,..., n) представляют собой независимые случайные величины с математическим ожиданием (средним значением), равным нулю. При работе с временными рядами такое допущение оказывается во многих случаях неверным.
   Здесь мы полагаем, что возмущения εt (t = 1, 2,..., n) удовлетворяют предпосылкам регрессионного анализа, т. е. условиям нормальной классической регрессионной модели.
   Рассмотрим пример. По данным таблицы примера 1 дать точечную и с надёжностью 0,95 интервальную оценки прогноза среднего и индивидуального значений спроса на некоторый товар на момент t = 9.
   Решение. Выше получено уравнение регрессии
ŷt = 181,32 + 25,679 t,
то есть спрос ежегодно увеличивается на 25,7 единиц. Надо оценить условное математическое ожидание Mt=9(Y) = y(9). Оценкой y(9) является групповая средняя
ŷt=9 = 181,32 + 25,679·9 = 412,4 (ед).
Найдём оценку s2 дисперсии σ2
.
Вычислим среднюю
По формуле
вычислим оценку дисперсии групповой средней
По таблице t – распределений найдём t0,05; 6 = 2,447. Теперь по формуле
интервальная оценка прогноза среднего значения спроса имеет вид:
412,4 - 2,447·23,72 ≤ y(9) ≤ 412,4 + 2,447·23,72
или
347,0496116 ≤ y(9) ≤ 477,8075314.
Для нахождения интервальной оценки прогноза индивидуального значения у *(9) вычислим дисперсию его оценки по формуле
:
а затем по формуле
найдём интервальную оценку для у *(9)
412,4 - 2,447·43,4696 ≤ у * ≤ 412,4 + 2,447·43,4696
или
306,0584137 ≤ у *(9) ≤ 518,7987293 (ед)
Итак, с надёжностью 0,95 среднее значение спроса на товар на девятый год будет заключаться в интервале от 347 до 477,8 (ед.), а его индивидуальное значение от 306 до 518,8 (ед.).
   Прогноз развития изучаемого процесса на основе экстраполяции временных рядов может оказаться эффективным, как правило, в рамках краткосрочного, в крайнем случае, среднесрочного периода прогнозирования.

Понятие об авторегрессионных моделях и моделях скользящей средней

   Для данного временного ряда далеко не всегда удаётся подобрать адекватную модель, для которой ряд возмущений εt будет удовлетворять основным предпосылкам регрессионного анализа. Выше рассматривались задачи, в которых объясняющей переменной являлось «время». В экономике достаточно широкое распространение получили и другие регрессионные модели, в которых объясняющими переменными выступают лаговые переменные, т. е. переменные, влияние которых в эконометрической модели характеризуются некоторым запаздыванием. Еще одним отличием рассматриваемых в этом параграфе регрессионныx моделей является то, что представленные в них объясняющие переменные являются величинами случайными.
   Авторегрессионная модель р – го порядка имеет вид
yt = β0 + β1 yt - 1 + β2 yt-2 + … + βp yt - p + εt ( t = 1, 2, … , n),
где β0, β1, … , βр – некоторые константы.
   Она описывает изучаемый процесс в момент t в зависимости от его значений в предыдущие моменты t – 1, t – 2, …, t – p. Если исследуемый процесс в момент t определяется его значениями только значениями в предшествующий период t – 1, то рассматривают авторегрессионную модель 1 – го порядка (марковский случайный процесс):
yt = β0 + β1 yt - 1 + εt ( t = 1, 2, … , n).
В таблице представлены данные по динамике курса акций некоторой компании
t1234567891011
y971116610449079577277521019972815823
t1213141516171819202122
y11121386142813641241114513511325122611891213
Используя авторегрессионную модель 1 – го порядка, дать точечный и интервальный прогноз среднего и индивидуального значений курса акций в момент t = 23, т. е. на глубину один интервал.
   Решение. Попытка подобрать к данному временному ряду адекватную модель с линейным или полиномиальным трендом оказывается бесполезной. В соответствии с условием применим авторегрессионную модель. Получим
.
Квадрат длины вектора остатков равен Qe = 408208,8246. Определим коэффициент детерминации
Оценка значимости коэффициента корреляции r ≈ 0,75137 осуществляется по F – критерию. Определим фактическое значение FR
где m = 2 – число параметров уравнения регрессии. При уровне значимости α = 0,05 и степеням свободы k1 = 2 – 1 = 1 и k2 = 21 – 2 = 19 табличное значение FR = 4,35. Следовательно, при FR > Fk показатель тесноты связи r = 0,75137 признаётся существенным.
   Значение коэффициента детерминации свидетельствует, что 56,46 % последующей цены акций определяется предыдущей их ценой.
   Среднее квадратическоеотклонение результативного признака у i от выровненных значений у х равно
Далее вычислим фактические значения t – критерия:
Критическое значение по таблице Стьюдента с учётом принятого уровня значимости α = 0,05 и числом степеней свободы k = 21 – 2 = 19 равно t k = 2,093. Полученные параметры уравнения регрессии признаются значимыми, так как t фактическое больше t критического:
t a0 > t k < ta1
   Определим значимость уравнения регрессии:
.
Справедливость неравенства свидетельствует о значимости линии регрессии.
   Линия регрессии позволит сделать точечный прогноз о стоимости акции в момент t = 23:
ŷt=23 = 284 + 0,7503·1213 = 1194,1,
и интервальный на уровне значимости 0,05 для среднего и индивидуального значений. Найдём оценку s2 дисперсии σ2
По формуле
вычислим оценку дисперсии групповой средней
По таблице t – распределений найдём t0,05; 19 = 2,093. Теперь по формуле
интервальная оценка среднего курса акций в данный момент времени t = 23:
1120 ≤ y (23) ≤ 1269,
интервальная оценка индивидуального значения курса акций:
878,5 ≤ y* ≤ 1510.
   Использование соответствующих авторегрессионных моделей для прогнозирования экономических показателей, т. е. автопрогноз на базе рассмотренных моделей, может оказаться весьма эффективным (как правило, в краткосрочной перспективе).

Упражнения

  1. Имеются данные об урожайности озимой пшеницы yt (ц/га) за 10 лет:
    t12345678910
    yt16,320,217,17,715,316,319,914,418,720,7
    • 1)  Найти среднее значение, среднее квадратическое отклонение и коэффициенты автокорреляции (для лагов τ = 1; 2) временного ряда.
    • 2)  Найти уравнение тренда временного ряда уt полагая, что он линейный, и проверить его значимость на уровне 0,05.
    • 3)  Провести сглаживание временного ряда yt методом скользящих средних, используя простую среднюю арифметическую с интервалом сглаживания: а) m = 3; б) m = 5.
  2. В таблице представлены данные, отражающие динамику роста доходов на душу населения yt (ден. ед.) за восьмилетний период:
    t12345678
    yt11331222135413891342137714911684
    Полагая, что тренд линейный и условия классической модели выполнены:
    • найти уравнение тренда и оценить его значимость на уровне 0,05;
    • дать точечный и с надежностью 0,95 интервальный прогнозы среднего и индивидуального значений доходов на девятый год.
  3. Имеются данные об урожайности овощных культур в хозяйствах региона
    Год19891990199119921993199419951996
    Урожайность, т/га10,210,711,713,114,917,220,023,2
    Требуется:
    • 1) обосновать тип уравнения тренда.
    • 2) рассчитать параметры тренда.
    • 3) дать прогноз на 1997 г.
  4. Имеются данные за 15 дней по количеству пациентов клиники, прошедших через соответствующие отделения в течение дня
    ДеньЗадача 1Задача 2Задача 3Задача 4Задача 5
    Терапевтическое отделениеХирургическое отделениеСтоматологическое отделениеГлазное отделениеОтделение пластической хирургии
    12935413022
    24029522219
    33022301911
    45219472812
    54730282416
    62847221828
    71628513530
    85112402918
    94013574017
    103515333420
    115718433121
    122819512919
    133320363524
    144216192313
    153935422716
    Требуется:
    • 1) определить коэффициенты автокорреляции уровней ряда первого и второго порядка;
    • 2) обосновать выбор уравнения тренда и определить его параметры;
    • 3) сделать выводы.
  5. Имеются данные за 12 лет по странам о годовом объеме продаж автомобилей.
    Год
    Объем продаж 100 тыс.
    Задача 6Задача 7Задача 8Задача 9Задача 10
    Страна АСтрана ВСтрана ССтрана ДСтрана Е
    19863,84,15,22,84,2
    19874,75,26,33,65,4
    19883,94,34,52,74,0
    19892,73,23,92,03,1
    19902,93,03,81,82,9
    19912,32,83,01,42,4
    13923,04,24,82,13,7
    19933,64,65,02,54,1
    19942,93,74,62,11,4
    19953,74,86,13,02,2
    19964,55,66,73,72,9
    19974,25,06,93,12,6
    • 1) определить коэффициенты автокорреляции уровней ряда первого и второго порядка;
    • 2) обосновать выбор уравнения тренда и определить его параметры;
    • 3) сделать выводы.