МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ

Имеются следующие данные о деятельности предприятия — чистый доход (у), оборот капитала (х1), используемый капитал (х2) в млн. руб.
  1. Рассчитайте параметры линейного уравнения множественной регрессии.
  2. Рассчитайте среднюю ошибку аппроксимации. Сделайте вывод.
  3. Дайте оценку силы связи факторов с результатом с помощью средних коэффициентов эластичности.
  4. Найдите коэффициент детерминации. Сделайте вывод.
  5. Оцените статистическую значимость параметров и уравнения регрессии в целом с помощью соответственно критерия Стьюдента и критерия Фишера ( α = 0,05).
  6. Составьте матрицы парных и частных коэффициентов корреляции и укажите информативные факторы.
  7. При наличии мультиколлинеарности упростить модель и провести парный регрессионный анализ.
  8. Оцените полученные результаты, выводы должны сопровождаться пояснительной записью.
Вариант 1Вариант 2 Вариант 3Вариант 4
ух1х2ух1х2ух1х2ух1х2
3,253,117,16,66,983,63,616,213,31,55,95,9
2,418,811,23186,51,55,95,95,553,127,1
335,316,46,5107,950,45,553,127,12,418,811,2
4,271,932,53,316,715,42,418,811,2335,316,4
3,893,625,44,176,629,6335,316,44,271,932,5
1,6106,43,616,213,34,271,932,52,793,625,4
2,431,512,52,418,811,22,793,625,41,6106,4
3,346,714,3335,316,41,6106,42,431,512,5
1,813,86,51,813,86,52,431,512,53,336,714,3
3,464,822,72,464,822,73,336,714,31,813,86,5
2,331,115,81,630,415,81,813,86,52,464,822,7
1,412,19,31,412,19,32,464,822,71,630,415,8
Вариант 5Вариант 6 Вариант 7Вариант 8
ух1х2ух1х2ух1х2ух1х2
3,118,16,613376,213,2466,92322,85
3,416,815,516,460,91015,954,18,526,827,75,2
3,716,313,417608,516,250,68,52834,56
5,553,227,215,252,17,415,443,87,823,426,45,1
3,135,416,514,240,1714,278,68,323,219,84,8
2,893,725,510,530,46,21160,28,520,817,94,5
2,531,612,620437,521,150,29,522,425,25,4
1,913,96,61232,16,413,454,78,521,820,44,9
1,730,515,915,635,1715,642,88,522,420,75
131,41912,5326,212,860,48,323,521,45,2
6,610850,513,233614,547,27,520,319,64,5
3,716,313,414,632,55,815,140,67,621,424,54,9
Вариант 9Вариант 10
ух1х2ух1х2
22,537,27,622,728,85,4
29,8589,425,829,26
19,2389,520,826,95,6
13,6308,115,232,46,4
25,444,67,425,449,77,5
17,831,26,319,438,16,7
1826,45,918,231,26,2
21,128,75,52132,66,4
16,522,45,716,427,55,5
2335,46,823,5396,9
16,228,46,518,827,55,4
17,222,7617,531,26,3

ПРИМЕР ВЫПОЛЕНИЯ ЗАДАНИЯ

    Имеются данные о деятельности за год компании. Известны — чистый доход (у), оборот капитала (х1), использованный капитал (х2) в миллионах рублей.
y3,03,33,65,53,02,72,41,81,60,96,53,6
х118,016,716,253,135,393,631,513,830,431,3107,916,2
х26,515,413,327,116,425,412,56,515,818,950,413,3
   Решение. Ведём матричные величины
,
Для нахождения параметров линейной регрессии проведём вычисления матриц на компьютере в пакете Excel (на панели инструментов "мастер функций")
Найдём обратную матрицу для матрицы ХТ·Х. Эта матрица имеет вид (ХТ·Х)-1:
Умножая эту обратную матрицу на вектор ХТ·Y, получим компоненты вектора b линейной регрессии:
Таким образом уравнение множественной регрессии имеет вид
.
Оно показывает, что увеличение оборота капитала на 1 млн. руб. при неизменном использованном капитале ведёт к уменьшению прибыли на 0,0238707145 млн. руб. А увеличение использованного капитала на 1 млн. руб. при неизменном уровне оборотного капитала ведёт к увеличеню прибыли на 0,150525944 млн. руб.
   Средняя погрешность аппроксимации равна
,
и из этого следует сделать вывод о большой погрешности аппроксимации.
   Вычислим коэффициенты эластичности
    Увеличение на 1% (от своего среднего значения) оборота капитала приводит к уменьшению чистого дохода на 0,29%. Увеличение на 1% (от своего среднего значения) использованного капитала приводит к увеличению чистого дохода на 0,88%.
   Оценим значимость уравнения регрессии. Для этого найдём коэффициент детерминации по формуле
,
где  — n – мерные векторы. Вектор остатков е равен
Проводя умножение матриц, получим eT·e = 12,3632926. Вектор у равен
Проводя умножение матриц, получим yT·y = 27,26916666 и можно вычислить коэффициент детерминации
.
Коэффициент детерминации R 2 = 0,5466206592 свидетельствует о том, что изменение исследуемой зависимой переменной Y (чистый доход компании) на 54,66% объясняется изменчивостью включённых в модель объясняющих переменных — оборота капитала Х1, использованного капитала Х2.
   Так как известен коэффициент детерминации, то критерий значимости уравнения регрессии записывается в виде:
,
где k1 = p, k2 = n – p – 1:
,
или F = 5,4255 > 4,26, откуда видно, что полученное уравнение регрессии значимо на уровне α = 0,05.
   Выборочная остаточная дисперсия s2 определяется по формуле
.
Теперь
и выборочное среднее квадратическое отклонение равно
.
Среднее квадратическое отклонение (стандартная ошибка) коэффициента регрессии bj имеет вид
,
где [( XT·X)-1] jj — диагональный элемент матрицы (XT·X)-1.
   Стандартная ошибка для b1 равна
.
Стандартная ошибка для b 2 равна
.
Коэффициент bj значим на уровне значимости α, если
,
где t α; n - p - 1 — табличное значение t – критерия Стьюдента, определённое на уровне значимости α при числе степеней свободы k = n – p – 1. Проверим значимость коэффициентов регрессии b1 = - 0,0238707145 и b2 = 0.150525944.
   Так как
,
то коэффициент b1 незначим на 5% уровне значимости. Так как
,
то коэффициент b2 значим на 5% уровне значимости.
   Вычислим парные коэффициенты корреляции по формуле

.
Матрица выборочных коэффициентов корреляции имеет вид
.
Определим значимость коэффициентов корреляции. Коэффициент корреляции r значим на уровне α, если
,
где t α; n - 2 — табличное значение t — критерия Стьюдента, определённое на уровне значимости α при числе степеней свободы n – 2. В данном случае tα; n - 2 = t0,05; 10 = 2,228.
    Вычислим значения статистики

Значимыми на 5% -ном уровне коэффициентами корреляции являются r x1x2 = 0,8923260726 и r yx2 = 0,7077324102. В корреляционной матрице значимые элементы указаны звёздочкой.
   Следует отметить значение коэффициента корреляции r x1x2: высокая степень зависимости между факторами х1 и х2 свидетельствовала бы о наличии мультиколлинеарности между этими факторами. Однако высокая степень зависимости между факторами y и х2, а так же достаточно сильная связь между y и х1 скорее всего не подтверждает мультиколлинеарность. Мультиколлинеарность между факторами х1 и х2 будет иметь место в том случае, когда между ними связь существенна или сильная, а связь между y и х1 или y и х2 слабая или отсутствует. В этом случае несущественный фактор исключается из модели и проводится регрессионный анализ упрощённой модели (см. задание 1).