ЛЕКЦИЯ 10

ВВЕРХ

Общие сведения о временных рядах и задачах их анализа.

Стационарные временные ряды.

Автокорреляционная функция.

Пример 1.

Аналитическое выравнивание временного ряда.

Пример 2.

Проверка значимости линии тренда.

Реализация вычислений в пакете MAPLE.

Главная страница раздела 1

Главная страница раздела 2

Задание 1

Задание 2

Литература

Для доступа к меню нажмите правую кнопку мыши.

ЛЕКЦИЯ 10

Общие сведения о временных рядах и задачах их анализа

   При рассмотрении классической модели регрессии характер экспериментальных данных, как правило, не имеет принципиального значения. Однако это оказывается не так, если условия классической модели нарушены.
   Методы исследования моделей, основанных на данных пространственных выборок и временных рядов, вообще говоря, существенно отличаются. Объясняется это тем, что в отличие от пространственных выборок наблюдения во временных рядах, как правило, нельзя считать независимыми.
   Ниже мы остановимся на некоторых общих понятиях и вопросах, связанных с временными рядами, использованием регрессионных моделей временных рядов для прогнозирования. При анализе точности этих моделей и определении интервальных ошибок прогноза на их основе, будем полагать, что рассматриваемые в главе регрессионные модели временных рядов удовлетворяют условиям классической модели. Модели временных рядов, в которых нарушены эти условия, будут рассмотрены далее.
   Под временным рядом в экономике подразумевается последовательность наблюдений некоторого признака (случайной величины) Y в последовательные моменты времени. Отдельные наблюдения называются уровнями ряда, которые будем обозначать y_t(t = 1, 2,..., n), где n - число уровней.
   Пусть указан спрос на некоторый товар (усл. ед) за восьмилетний период , т. е. временной ряд спроса у_t.

Год, t	1	2	3	4	5	6	7	8
Спрос, y_t	213	171	291	309	317	362	351	361

На рисунке указано регрессионное поле с линией регрессии на нём.
В общем виде при исследовании экономического временного ряда y_t выделяются несколько составляющих: y_t = u_t + v_t + c_t + ε_t (t = 1, 2, … n), (10.1) где

– u_t — тренд, плавно меняющаяся компонента, описывающая чистое влияние долговременных факторов, например, рост населения, изменение структуры потребления и т. п.
– v_t — сезонная компонента, отражающая повторяемость экономических процессов в течение не очень длительного периода, иногда месяца, недели. Например, объём реализуемых услуг в различные времена года.
– c_t — циклическая компонента, отражающая повторяемость экономических процессов в течение длительных периодов (влияние волн экономической активности, демографических «ям», циклов солнечной активности и т.п.);
– ε_t — случайная компонента, отражающая влияние не поддающихся учёту и регистрации случайных факторов. Эта компонента в отличие от первых трёх является случайной.

Важнейшей классической задачей при исследовании экономических временных рядов является выявление и статистическая оценка основной тенденции развития изучаемого процесса и отклонений от неё.
Основные этапы анализа временных рядов заключаются в следующем:

графическое представление и описание поведения временного ряда;
выявление и удаление закономерных (неслучайных) составляющих временного ряда (тренда, сезонных и циклических составляющих);
сглаживание и фильтрация (удаление низко – или высокочастотных составляющих временного ряда);
исследование случайной составляющей временного ряда, построение и проверка адекватности математической модели для её описания;
прогнозирование развития изучаемого процесса на основе имеющегося временного ряда;
исследование взаимосвязи между различными временными рядами.

Среди наиболее распространенных методов анализа временных рядов выделим корреляционный и спектральный анализ, модели авторегрессии и скользящей средней. О некоторых из них речь пойдет ниже.
Если выборка у₁, у₂, …, у_n рассматривается как одна из реализаций случайной величины Y, временной ряд у₁, у₂, …, у_n рассматривается как одна из реализаций (траекторий) случайного процесса Y(t). Случайным процессом (или случайной функцией) Y(t) неслучайного аргумента t называется функция, которая при любом значении t является случайной величиной. Вместе с тем следует иметь в виду принципиальные отличия временного ряда y_t ( t = 1,2,..., n) от последовательности наблюдений у₁, у₂, …, у_n, образующих случайную выборку. Во-первых, в отличие от элементов случайной выборки члены временного ряда, как правило, не являются статистически независимыми. Во-вторых, члены временного ряда не являются одинаково распределенными.

Стационарные временные ряды

Важное значение в анализе временных рядов имеют стационарные временные ряды, вероятностные свойства которых не изменяются во времени. Стационарные временные ряды применяются, в частности, при описании случайных составляющих анализируемых рядов.
Временной ряд у_t (t = 1, 2, …, n) называется строго стационарным, если совместное распределение вероятностей n наблюдений у₁, у₂, …, у_n такое же, как и n наблюдений у_1+τ, …, у_n+τ при любых n, t и τ. Свойства строго стационарных рядов y_t не зависят от момента t, то есть закон распределения и его числовые характеристики не зависят от t. Следовательно, математическое ожидание a_y = a, среднее квадратическое отклонение σ_y = σ могут быть оценены по наблюдениям у_t (t = 1, 2, …, n) по формулам:

, (10.2)

. (10.3) Простейшим примером стационарного временного ряда, у которого математическое ожидание равно нулю, а ошибки ε _t некоррелированы, является «белый шум». Следовательно, можно сказать, что возмущения (ошибки) ε_t, в классической линейной регрессионной модели образуют белый шум, а в случае их нормального распределения - нормальный (гауссовский) белый шум.
Степень тесноты связи между последовательностями наблюдений временного ряда у₁, у₂, … ,у_n и у _{1+ τ}, у _2+τ, … , у _n+τ (сдвинутых относительно друг друга на τ единиц, или, как говорят, с лагом τ) может быть определена с помощью коэффициента корреляции

, (10.4) поскольку M (y _t) = M (y _t+τ ) = a и σ _y(t) = σ _y(t+τ ) = σ.

Автокорреляционная функция

   Так как коэффициент ρ(τ) измеряет корреляцию между члеами одного и того же ряда, его называют коэффициентом автопрреляции, а зависимость ρ(τ) называют автокорреляционной функцией. Коэффициент ρ(τ) измеряет корреляцию между элементами одного и того же ряда.
   В силу стационарности временного ряда у _t (t = 1, 2, …, n) автокорреляционная функция ρ(τ) зависит только от лага τ, причём ρ(- τ) = ρ(τ) является чётной и при изучении ρ(τ) можно ограничиться только положительными значениями τ.
   Статистической оценкой ρ(τ) является выборочный коэффициент автокорреляции r(τ), определяемый по формуле коэффициента корреляции, в которой x_i = y_i, y_i = y_i+τ, а n заменяется на n - τ:

.     (10,5) Функцию ρ(τ) называют выборочной автокорреляционной функций, а её график — коррелограммой.
   При расчете ρ(τ) следует помнить, что с увеличением τ число n - τ пар наблюдений y_t, y_t+τ уменьшается, поэтому лаг τ должен быть таким, чтобы число n - τ было достаточным для определения ρ(τ). Обычно ориентируются на соотношение τ < n/4.
   Для стационарного временного ряда с увеличением лага τ взаимосвязь членов временного ряда y _t и y _t+τ ослабевает и автокорреляционная функция ρ(τ) должна по абсолютной величине убывать. В то же время для ее выборочного аналога r(τ), особенно при небольшом числе пар наблюдений n - τ, свойство монотонного убывания (по абсолютной величине) при возрастании τ может нарушаться.
   Наряду с автокорреляционной функцией при исследовании стационарных временных рядов рассматривается частная автокорреляционная функция ρ _част(τ), где ρ _част(τ) есть частный коэффициент корреляции между членами временного ряда y _t и y_t+τ при устранении влияния промежуточных ( между y_t и y_t+τ ) членов.
   Статистической оценкой ρ _част(τ) является выборочная частная автокорреляционная функция r_част(τ), где r_част(τ) — выборочный частный коэффициент корреляции. Например, выборочный частный коэффициент автокорреляции первого порядка между членами временного ряда y _t и y _t+2 при устранении влияния y_t+1 может быть вычислен по формуле

, где r(1), r(1,2), r(2) - выборочные коэффициенты автокорреляции между y_t и y_t+1, y_t+1 и y_t+2, y_t и y_t+2 t = l,..., n.

Пример 1

По данным

Год, t	1	2	3	4	5	6	7	8
Спрос, y_t	213	171	291	309	317	362	351	361

найти среднее значение, среднее квадратическое отклонение, коэффициенты автокорреляции (для лагов τ = 1; 2) и частный коэффициент автокорреляции первого порядка.
Решение.

Находим среднее значение временного ряда

, дисперсию и среднее квадратическое отклонение

Найдём коэффициент автокорреляции r(τ) временного ряда для лага τ = 1

y _t	213	171	291	309	317	362	351
y_y+τ	171	291	309	317	362	351	361

Находим необходимые суммы:

Теперь по формуле автокорреляции (5) находим

Коэффициент корреляции r(2) для лага τ = 2 между членами ряда

y_t	213	171	291	309	317	362
y_t+2	291	309	317	362	251	361

у_t и у_t+τ (t = 1, 2,…, 6) по шести парам наблюдения вычисляются аналогично r(2)= 0,8422425256.
Для определения частного коэффициента корреляции первого порядка r _част(2) = r _02,1 между членами у _t и у_t+2 при исключении влияния у _t+1 вначале находится коэффициент автокорреляции r(2,1) между членами ряда у_t+1 и у _t+2

у_t+1	171	291	309	317	362	351
у_t+2	291	309	317	362	351	361

r (1,2) = 0,8252874686.

Знание автокорреляционных функций r(τ) и r_част(τ) может оказать существенную помощь при подборе и идентификации модели анализируемого временного ряда и статистической оценке его параметров (см. об этом дальше).

Аналитическое выравнивание (сглаживание) временного ряда
(выделение неслучайной компоненты)

Одной из важнейших задач экономического временного ряда является выявление основной тенденции изучаемого процесса, выраженной неслучайной составляющей f (t) (тренда либо тренда с циклической или (и) сезонной компонентой). Для решения этой задачи необходимо выбрать функцию f(t). Наиболее часто используются следующие функции:

– линейная: f (t) = b₀ + b₁ t;
– полиномиальная: f (t) = b₀ + b₁ t + b₂ t² + … + b_n tⁿ;
– экспоненциальная: ;
– логистическая: ;
– Гомперца: log _c f (t) = a - b r ^t, где 0 < r < 1.

   Это весьма ответственный этап исследования. При выборе соответствующей функции f (t) используют содержательный анализ (который может установить характер динамики процесса), визуальные наблюдения (на основе графического изображения временного ряда). При выборе полиномиальной функции может быть применен метод последовательных разностей (состоящий в вычислении разностей первого порядка Δ_t = у_t - y_t-1, второго порядка Δ_t⁽²⁾ = Δ_t - Δ_t-1, и т. д.), и порядок разностей, при котором они будут примерно одинаковыми, принимается за степень полинома.
   Из двух функций предпочтение обычно отдаётся той, при которой меньше сумма квадратов отклонений фактических данных от расчётных на основе этих функций. Но этот принцип нельзя доводить до абсурда: так, для любого ряда из n точек можно подобрать полином (n - 1)-й степени, проходящий через все точки, и соответственно с минимальной - нулевой - суммой квадратов отклонений, но в этом случае, очевидно, не следует говорить о выделении основной тенденции, учитывая случайный характер этих точек. Поэтому при прочих равных условиях предпочтение следует отдавать более простым функциям.
   Для выявления основной тенденции чаще всего используется метод наименьших квадратов. Значения временного ряда у _t рассматриваются как зависимая переменная, а время t — как объясняющая: у _t = f (t) + ε_t, где ε_t — возмущения представляют собой независимые и одинаково распределённые случайные величины, распределение которых считается нормальным.
   Согласно методу наименьших квадратов параметры прямой линии ŷ_t = f ( t ) + ε_t находятся из системы уравнений

Учитывая, что значения переменной t = 1, 2,..., n образуют натуральный ряд чисел от 1 до n, суммы в системе уравнений можно выразить через число членов ряда т по известным в математике формулам:

Пример 2

По данным примера 1 найти уравнение неслучайной составляющей (тренда) для временного ряда y_t полагая тренд линейным.
Решение. По формулам находим

Система уравнений имеет вид

Решением системы этих уравнений будет b₀ = 181,32; b₁ = 25,679.
Уравнением линии тренда будет ŷ_t = 181,32 + 25,679 t , то есть спрос ежегодно увеличивается на 25,7 единиц.
При решении задачи можно было не выписывать систему уравнений, а представить уравнение регрессии в виде

, где

, а коэффициент регрессии b₁ найти по формуле

, где

Проверка значимости линии тренда

Проверим значимость полученного уравнения тренда по F – критерию на 5% уровне значимости. Вычислим суммы квадратов:

а) обусловленную регрессией —
б) общую — ;
в) остаточную — .

Найдём значение статистики

. Так как F > F_0,05;1;6= 5,99, то уравнение тренда значимо.

Реализация вычислений в пакете MAPLE

> restart: with(stats):n=8:t:=[1,2,3,4,5,6,7,8];y:=[213,171,291,309,317,362,351,361]; t := [1, 2, 3, 4, 5, 6, 7, 8]
y:=[213,171,291,309,317,362,351,361] > with(stats[statplots]):plots[display]({scatterplot(t,y)},view=[min(seq(t[i],i=1..8))-1..max(seq(t[i],i=1..8))+1,min(seq(y[i],i=1..8))-1..max(seq(y[i],i=1..8))],axes=FRAME,symbol=circle,symbolsize=15);

> sy:=describe[mean](y);evalf(%);

> disp_y:=describe[variance](y);evalf(%);

> sigma_y:=describe[standarddeviation](y);evalf(%);

> tau:=1:y1:=[seq(y[i],i=1..n-tau)];y2:=[seq(y[i],i=1+tau..n)];

> describe[linearcorrelation](y1,y2): r(1):=evalf(%);#Ковариация

> tau2:=2:y3:=[seq(y[i],i=1..n-tau2)];y4:=[seq(y[i],i=1+tau2..n)];

> describe[linearcorrelation](y3,y4): r(2):=evalf(%);#Коэффициент ковариации

> y5:=[seq(y[i],i=1+tau..n-tau)];y6:=[seq(y[i],i=1+tau2..n)];

> describe[linearcorrelation](y5,y6): r(1,2):=evalf(%);#Коэффициент ковариации

> rch(2):=((r(2)-r(1)*r(1,2))/(sqrt(1-r(1)^2)*sqrt(1-r(1,2)^2)));#частный коэффициент корреляции

> k1:=sum('t','t=1..8');k2:=sum('t^2','t=1..8');k3:=sum('y[t]','t=1..8');k4:=sum('y[t]^2','t=1..8');k5:=sum('y[t]*t','t=1..8');

> with(linalg):A:=matrix(2,2,[n,k1,k1,k2]);B:=matrix(2,1,[k3,k5]);

> b:=linsolve(A,B);

> b0:=evalf(b[1,1]);b1:=evalf(b[2,1]);

> lt:=plot(b0+b1*x,x=0..9,color=black,thickness=2): > n:=8:with(stats[statplots]):plots[display]({scatterplot(t,y),lt},view=[min(seq(t[i],i=1..n))-1..max(seq(t[i],i=1..n))+1,min(seq(y[i],i=1..n))-10..max(seq(y[i],i=1..n))+40],axes=FRAME,symbol=circle,symbolsize=15,thickness=2);

	Год	Спрос	y²	t²	t·y
	1	213	45369	1	213
	2	171	29241	4	342
	3	291	84681	9	873
	4	309	95481	16	1236
	5	317	100489	25	1585
	6	362	131044	36	2172
	7	351	123201	49	2457
	8	361	130321	64	2888
Сумма	36	2375	739827	204	11766
Средн		296,875	92478,38
		Дисперсия	4343,609
	СреднКвадратОткл	65,90606

	y _t	y _{t + τ}	y _t²	y_t+τ²	y _t·y _{t + τ}
	213	171	45369	29241	36423
	171	291	29241	84681	49761
	291	309	84681	95481	89919
	309	317	95481	100489	97953
	317	362	100489	131044	114754
	362	351	131044	123201	127062
	351	361	123201	130321	126711
Сумма	2014	2162	609506	694458	642583

ЛЕКЦИЯ 10

Общие сведения о временных рядах и задачах их анализа

Стационарные временные ряды

Автокорреляционная функция

Пример 1

Аналитическое выравнивание (сглаживание) временного ряда (выделение неслучайной компоненты)

Пример 2

Проверка значимости линии тренда

Реализация вычислений в пакете MAPLE

Аналитическое выравнивание (сглаживание) временного ряда
(выделение неслучайной компоненты)