Множественный регрессионный анализ

ВВЕРХ

Главная страница раздела 1

Главная страница раздела 2

Задание 1

Задание 2

Литература

Для доступа к меню нажмите правую кнопку мыши.

ЛЕКЦИЯ 6

Классическая линейная модель множественной регрессии.
Метод наименьших квадратов.
Дополнение предпосылок для регрессионного анализа.
Стандартизированные коэффициенты регрессии и коэффициенты эластичности.
Ковариационная матрица и её выборочная оценка.
Теорема Гаусса – Маркова.
Оценка дисперсии возмущения.
Вопросы для самопроверки.

Классическая линейная модель множественной регрессии

   Экономические явления определяются большим числом одновременно и совокупно действующих факторов. В связи с этим часто возникает задача исследования зависимости одной зависимой переменной Y от нескольких объясняющих переменных Х ₁, Х₂, …, Х_n.Эта задача решается с помощью множественного регрессионного анализа.
   Обозначим i – е наблюдение зависимой переменной y_i, а объясняющих переменных x_i₁, x_i₂, …, x_ip. Тогда модель множественной линейной регрессии можно представить в виде: y_i = β₀ + β₁·x_i1 + β₂·x_i2 + … + β_p·x_ip + ε_i,                  (1) где i = 1, 2, …, n.
   Модель (1), в которой зависимая переменная y_i, возмущения ε_i, и объясняющие переменные x_i₁, x_i₂, …, x_ip удовлетворяют приведенным выше предпосылкам 1-5 регрессионного анализа и, кроме того, предпосылке 6 о невырожденности матрицы (независимости столбцов) значений объясняющих переменных, называется классической нормальной линейной моделью множественной регрессии.
   Включение в регрессионную модель новых объясняющих переменных усложняет получаемые формулы и вычисления. Это приводит к целесообразности использования матричных обозначений. Матричное описание регрессии облегчает как теоретические концепции анализа, так и необходимые расчетные процедуры.
   Введём обозначение матрицы – столбца значений зависимой переменной

матрицы размерности n × (p +1) значений объясняющих переменных

. Следует обратить внимание, что первый столбец матрицы Х равен 1, то есть условно полагается, что в модели (1) свободный член β₀ умножается на фиктивную переменную х_i₀, принимающую значение 1 для всех значений индексов i: x_i₀ = 1 (i = 1, 2, …, n).
Матрица столбец размера (р + 1) параметров

. Матрица столбец размера n возмущений, или вектор возмущений (случайных ошибок, остатков) размера n

. В матричной форме модель (1) примет вид Y = X·β + ε. (2) Оценкой этой модели по выборке является уравнение Y = X·b + e, (3) где

Метод наименьших квадратов

Для оценки вектора неизвестных параметров β применим метод наименьших квадратов. Так как произведение транспонированной матрицы e^T на саму матрицу е

то условие минимизации остаточной суммы квадратов запишется в виде:

(4) Учитывая, что при транспонировании произведения матриц получается произведение транспонированных матриц, взятых в обратном порядке, т.е. (X b)^T = b^T X^T; после раскрытия скобок получим S = Y^T·Y - b^T·X^T·Y - Y^T·X·b + b^T·X^T·X·b. (5) Произведение Y^TXb есть матрица размера dim(Y^T·X·b) = 1×n×n×(p + 1)×(p + 1)×1 = 1×1, т.е. величина скалярная, следовательно, оно не меняется при транспонировании, то есть Y^T·X·b = (Y^T·X·b )^T = b^T·X^T·Y. Поэтому условие минимизации (4) примет вид: S = Y^T·Y - 2· b^T·X^T·Y + b^T·X^T·X·b→ min. На основании необходимого условия экстремума функции нескольких переменных S(b₀, b₁, …, b_p), необходимо приравнять нулю частные производные по этим переменным или в матричной форме - вектор частных производных

. Для вектора частных производных имеют место формулы

, где b и с – векторы-столбцы; А – симметрическая матрица. Воспользовавшись правилами дифференцирования матричных соотношений, получим

, откуда получаем систему уравнений в матричной форме для определения вектора b: X^T·X·b = X^T·Y. (6) Решением уравнения (6) является вектор b = (X^T·X)^-1·X^T·Y, (7) где (X^T·X)^-1 – матрица, обратная матрице X^T·X, X^T·Y - матрица-столбец.
Рассмотрим пример. Имеются следующие данные о деятельности предприятия — чистый доход (у), оборот капитала (х₁), используемый капитал (х₂) в млн. руб. Рассчитаем параметры линейного уравнения множественной регрессии.

y	3,0	3,3	3,6	5,5	3,0	2,7	2,4	1,8	1,6	0,9	6,5	3,6
х₁	18,0	16,7	16,2	53,1	35,3	93,6	31,5	13,8	30,4	31,3	107,9	16,2
х₂	6,5	15,4	13,3	27,1	16,4	25,4	12,5	6,5	15,8	18,9	50,4	13,3

Для рассматриваемой задачи матрицы Х и Y имеют вид

, Вычислим произведение матриц Х^T·X и Х^T·Y

Замечание. При вычислении произведения матриц в пакете Txcel используется функция MУМНОЖ, при вычислении обратной матрицы используется функция МОБР. При проследите, чтобы клавиши Ctrl+Shift были нажаты при нажимании клавиши Enter.
Вычислим обратную матрицу (Х^T·X)^-1

Умножая эту обратную матрицу на вектор Х^Т·Y, получим компоненты вектора b линейной регрессии:

Таким образом уравнение множественной регрессии имеет вид

. Оно показывает, что увеличение оборота капитала на 1 млн. руб. при неизменном использованном капитале ведёт к уменьшению прибыли на 0,0238707145 млн. руб. А увеличение использованного капитала на 1 млн. руб. при неизменном уровне оборотного капитала ведёт к увеличеню прибыли на 0,150525944 млн. руб.

Дополнение предпосылок для регрессионного анализа

   Для решения матричного уравнения (6) относительно вектора оценок параметров b необходимо ввести еще одну предпосылку 6 для множественного регрессионного анализа: матрица X^T·X является неособенной, т. е. ее определитель не равен нулю. Следовательно, ранг матрицы X^T·X равен ее порядку, т.е. rang(X^T·X) = р + 1. Из матричной алгебры известно, что rang(X^T·X) = rang(X), значит, rang(X) = р + 1, т. е. ранг матрицы плана X равен числу ее столбцов. Это позволяет сформулировать предпосылку 6 множественного регрессионного анализа в следующем виде:
   6. Векторы значений объясняющих переменных, или столбцы матрицы плана X, должны быть линейно независимыми, т. е. ранг матрицы X - максимальный (rang(X) = р + 1).
   Кроме того, полагают, что число имеющихся наблюдений (значений) каждой из объясняющих и зависимой переменных превосходит ранг матрицы X, т. е. n > rang(X) или n > p + 1, ибо в противном случае в принципе невозможно получение сколько-нибудь надежных статистических выводов.
Ниже рассматривается ковариационная матрица вектора возмущений Σ, являющаяся многомерным аналогом дисперсии одной переменной. Поэтому в новых терминах приведенные ранее и здесь предпосылки для множественного регрессионного анализа могут быть записаны следующим образом:

В модели (2) ε - случайный вектор, X - неслучайная (детерминированная) матрица.
М(ε) = 0.
Σ_i = M(ε·ε^T) = σ² E_n.
Σ_i = M(ε·ε^T) = σ² E_n.
ε – нормально распределенный случайный вектор, т.е. ε ~ N_n{0; σ² E_n).
rang (X) = p + 1 < n.

Как уже отмечено, модель (2), удовлетворяющая приведенным предпосылкам 1 - 6, называется классической нормальной линейной моделью множественной регрессии; если же среди приведенных не выполняется лишь предпосылка 5 о нормальном законе распределения вектора возмущений ε, то модель (2) называется просто классической линейной моделью множественной регрессии.

Стандартизированные коэффициенты регрессии и коэффициенты эластичности

На практике часто бывает необходимым сравнение влияния на зависимую переменную различных объясняющих переменных, когда последние выражаются разными единицами измерения. В этом случае используют стандартизованные коэффициенты регрессии b'_j и коэффициенты эластичности E_j(j = 1,2,..., р)

, (8)

. (9) Стандартизированный коэффициент регрессии

показывает, на сколько величин s_y изменится в среднем зависимая переменная Y при увеличении только j–й объясняющей переменной на

, а коэффициент эластичности Е_j – на сколько процентов (от средней) изменится Y при увеличении только Х_j на 1 %.
К примеру для рассматриваемой задачи имеем s_x₁ = 29,92; s_x₂ = 11,32; s_y = 1,51 и стандартизированные коэффициенты регрессии будут равны

Вычислим коэффициенты эластичности

Таким образом увеличение оборота капитала на s_x₁ = 29,92 млн.руб. приведёт к изменению дохода компании на b'₁·s_y = − 0,48·1,51 = − 0,72 млн.руб., увеличение оборота капитала на s_x₂ = 11,32 млн.руб. приведёт к изменению дохода компании на b'₂·s_y = 1,13·1,51 = 1,70 млн.руб.
   Увеличение на 1% (от своего среднего значения) оборота капитала приводит к уменьшению чистого дохода на 0,29%. Увеличение на 1% (от своего среднего значения) использованного капитала приводит к увеличению чистого дохода на 0,88%.
   Докажем, что вектор b есть несмещённая оценка параметра β. Для этого преобразуем (7) с учётом (2): b = (X^T ·X)^-1·X^T·(X ·β + ε) = (X^T·X )^-1·(X^T ·X)·β + (X^T·X)^-1·X^T·ε = E ·β + (X^T·X)^-1·X^T·ε, или b = β + (X^T·X )^-1·X^T·ε.                                  (10) Оценки, найденные по формуле (10), будут содержать случайные ошибки.
Математическое ожидание M(b) = M(β) + (X^T·X )^-1·X^T·M(ε) = β,                (11) так как М(ε) = 0. Таким образом, доказано, что вектор b есть несмещённая оценка параметра β.

Ковариационная матрица и её выборочная оценка

Вариации оценок параметров будут в конечном счете определять точность уравнения множественной регрессии. Для их измерения в многомерном регрессионном анализе рассматривают так называемую ковариационную матрицу вектора оценок параметров Σ_b, являющуюся матричным аналогом дисперсии одной переменной:

, где элементы σ_ij — ковариации (или корреляционные моменты) оценок параметров β_i и β_i.
Ковариация двух переменных определяется как математическое ожидание произведения отклонений этих переменных от их математических ожиданий. Поэтому σ_ij = M[( b_i – M( b _i ))·( b_j – M( b _i ))]. (12) Ковариация характеризует как степень рассеяния значений двух переменных относительно их математических ожиданий, так и взаимосвязь этих переменных.
В силу того, что оценки b_j, полученные методом наименьших квадратов, являются несмещенными оценками параметров β_j, т. е. М(b_j) = β_j, выражение (12) примет вид: σ _ij = M [( b _i – β _i )·( b _j – β _j )]. Рассматривая ковариационную матрицу Σ_b, легко заметить, что на ее главной диагонали находятся дисперсии оценок параметров регресии, так как

. (13) В сокращенном виде ковариационная матрица вектора оценок параметров Σ_b, имеет вид: Σ _b = M[( b − β )·( b − β )^T]. (14) (в этом легко убедиться, перемножив векторы ( b − β )·( b − β )^T.
Учитывая соотношение (10), соотношение (14) преобразуется к виду

(15) поскольку элементы матрицы Х являются неслучайными величинами.
Матрица M(ε·ε ^T) является ковариационной матрицей вектора возмущений:

. Все элементы этой матрицы, не лежащие на главной диагонали, равны нулю в силу предпосылки 4 о некоррелированности возмущений ε_i и ε_j между собой, а все элементы, лежащие на главной диагонали, в силу предпосылок 2 и 3 регрессионного анализа, равны одной и той же дисперсии σ ²:

Поэтому матрица М(ε·ε^Т) = σ ²·Е_n, где Е _n — единичная матрица порядка n. Следовательно, в силу (15), ковариационная матрица вектора оценок параметров равна

(16) Итак, с помощью обратной матрицы (X^T·X)^-1 определяется не только сам вектор b оценок параметров (7), но и дисперсии и ковариации его компонент.

Теорема Гаусса – Маркова

При выполнении предпосылок множественного регрессионного анализа оценка метода наименьших квадратов b = (Х^T·X)^-1·X^T·Y является наиболее эффективной, т. е. обладает наименьшей дисперсией в классе линейных несмещённых оценок.
Доказательство. В лекции показано, что оценка метода наименьших квадратов b = (Х^T·X)^-1·X^T·Y есть несмещённая оценка для вектора параметров β, т. е. М(b) = β. Любую другую оценку b₁ вектора β можно представить в виде b₁ = [(Х^T·X)^-1·X^T + C]·Y где C – некоторая матрица размера (р + 1)×n. Так как рассматриваемые в теореме оценки относятся к классу несмещённых оценок, то М(b₁ ) = β или M(b₁) = M [(Х^T·X)^-1·X^T + C]·Y = β Учитывая, что матрица в квадратных скобках – неслучайная, а в силу второй предпосылки регрессионного анализа М(ε) = 0, получим

откуда следует С·Х = 0.
Далее

так как С·Х = 0, (Х^ТХ)^-1·Х^Т·Х·β = Е·β = β.
Теперь с помощью преобразований, аналогичных проведенным при получении формул (15), (16), найдем, что ковариационная матрица вектора оценок Σ_b₁ примет вид

Диагональные элементы матрицы С·С^Т неотрицательны, так как они равны суммам квадратов элементов соответствующих строк этой матрицы. Так как Σ_b1 и Σ_b есть дисперсии компонент векторов b_i1 и b_i, то дисперсия

. Это означает, что оценки коэффициентов регрессии, найденных методом наименьших квадратов, обладают наименьшей дисперсией, что и требовалось доказать.

Оценка дисперсии возмущения

Рассмотрим вектор остатков е, равный е = Y – X·b. В силу (2) и (7) имеем

(учли, что произведение (Х^TХ)^-1Х^TХ = Е, т. е. равно единичной матрице Е_р+1 (р + 1)-го порядка).
Найдем транспонированный вектор остатков е^T. Так как при транспонировании матрица (Х^T Х)^-1 не меняется, т. е. ((Х^T Х)^-1)^T = [(Х^T Х)^T]^-1 = (X^T X)^-1, то e^T = [ε − X (X^T X)^-1 X^T ε]^T = ε^T − ε^T X (X^T X)^-1 X^T. Теперь

Так как последние два слагаемых взаимно уничтожаются, то M(e^T·e) = M(ε^T·ε) − M (ε^T X (X^T X)^-1 X^T ε). (17) Первое слагаемое выражения (17)

. так как в силу предпосылок 2,3 регрессионного анализа

Матрица B = X ·(X^T·X)^-1·X^T симметрическая, так как B^T = ( X ·(X^T·X)^-1·X^T)^T = X·(X^T·X)^-1·X^T, т. е. В^T = В. Поэтому ε^T B ε представляет квадратическую форму и ее математическое ожидание

так как след матрицы не меняется при ее транспонировании.
Таким образом M (e^T·e) = (n − p − 1)·σ². Это означает, что несмещённая оценка s² параметра σ ² или выборочная остаточная дисперсия s² определяется по формуле

. (18) Полученная формула легко объяснима. В знаменателе выражения (18) стоит n − (р + 1), а не n − 2, как это было выше в парном регрессионном анализе. Это связано с тем, что теперь (р + 1) степеней свободы (а не две) теряются при определении неизвестных параметров, число которых вместе со свободным членом равно (р + 1).

Вопросы для самопроверки

Сформулируйте классическую модель множественной регрессии.
Приведите выкладки метода наименьших квадратов в классической модели множественной регрессии.
Какими соотношениями определяются коэффициенты эластичности и какой смысл они имеют?
Как определяется ковариационная матрица в классической модели множественной регрессии?
Что характеризует ковариация?
Какие величины находятся на главной диагонали ковариационной матрицы?
Как определяется ковариационная матрица вектора возмущений?
Что можно сказать об элементах ковариационной матрицы вектора возмущений?
Какой вид имеет ковариационная матрица вектора оценок параметров регрессии?
Дайте оценку дисперсии возмущений.