ЛЕКЦИЯ 7
- Определение доверительных интервалов для коэффициентов и функции регрессии.
- Доверительный интервал для функции регрессии.
- Доверительный интервал для параметра σ ².
- Пример.
- Оценка значимости множественной регрессии.
- Коэффициенты детерминации R2 и
.
- Пример.
- Вопросы для самопроверки.
Определение доверительных интервалов для коэффициентов и функции регрессии
,
дисперсии
коэффициента
регрессии bj определяется по формуле
,
— диагональный элемент матрицы (X T·X)-1.
Среднее квадратическое отклонение (стандартная ошибка) коэффициента регрессии bj примет вид
.
В общей постановке гипотеза Н0 о равенстве параметра βj заданному числу βj0, то есть Н0: βj = βj0, отвергается. Если
,
.
Доверительный интервал для функции регрессии
Выше такой интервал получен для уравнения парной регрессии. Обобщая соответствующие выражения на случай множественной регрессии, можно получить доверительный интервал для МХ(Y):
,
,
Аналогичный доверительный интервал для индивидуальных значений зависимой переменной y0* примет вид:
,
,
Доверительный интервал для параметра σ ²
Пример
Решение. В примере уравнение регрессии получено в виде
.
.
. Для ее вычисления обратимся к таблице (точнее к ее двум последним столбцам, при составлении которых учтено, что групповые средние определяются по полученному уравнению регрессии).
| y | х1 | х2 | x1² | x2² | y ² | x1 x2 | x1 y | x2 y | ŷ | e | e ² | |
| 1 | 3 | 18 | 6,5 | 324 | 42,25 | 9 | 117 | 54 | 19,5 | 1,84825 | 1,15175 | 1,327 |
| 2 | 3,3 | 16,7 | 15,4 | 278,89 | 237,16 | 10,89 | 257,18 | 55,11 | 50,82 | 3,2189 | 0,0811 | 0,007 |
| 3 | 3,6 | 16,2 | 13,3 | 262,44 | 176,89 | 12,96 | 215,46 | 58,32 | 47,88 | 2,91485 | 0,68515 | 0,469 |
| 4 | 5,5 | 53,1 | 27,1 | 2819,61 | 734,41 | 30,25 | 1439,01 | 292,05 | 149,05 | 4,10615 | 1,39385 | 1,943 |
| 5 | 3 | 35,3 | 16,4 | 1246,09 | 268,96 | 9 | 578,92 | 105,9 | 49,2 | 2,923 | 0,077 | 0,006 |
| 6 | 2,7 | 93,6 | 25,4 | 8760,96 | 645,16 | 7,29 | 2377,44 | 252,72 | 68,58 | 2,8783 | − 0,1783 | 0,032 |
| 7 | 2,4 | 31,5 | 12,5 | 992,25 | 156,25 | 5,76 | 393,75 | 75,6 | 30 | 2,42725 | − 0,02725 | 0,001 |
| 8 | 1,8 | 13,8 | 6,5 | 190,44 | 42,25 | 3,24 | 89,7 | 24,84 | 11,7 | 1,94905 | − 0,14905 | 0,022 |
| 9 | 1,6 | 30,4 | 15,8 | 924,16 | 249,64 | 2,56 | 480,32 | 48,64 | 25,28 | 2,9503 | − 1,3503 | 1,823 |
| 10 | 0,9 | 31,3 | 18,9 | 979,69 | 357,21 | 0,81 | 591,57 | 28,17 | 17,01 | 3,39525 | − 2,49525 | 6,226 |
| 11 | 6,5 | 107,9 | 50,4 | 11642,41 | 2540,16 | 42,25 | 5438,16 | 701,35 | 327,6 | 6,2976 | 0,2024 | 0,041 |
| 12 | 3,6 | 16,2 | 13,3 | 262,44 | 176,89 | 12,96 | 215,46 | 58,32 | 47,88 | 2,91485 | 0,68515 | 0,469 |
| Σ | 37,9 | 464 | 221,5 | 28683,38 | 5627,23 | 146,97 | 12193,97 | 1755,02 | 844,5 | 12,366 | ||
| средн | 3,16 | 38,67 | 18,46 | 2390,28 | 468,94 | 12,25 | 1016,16 | 146,25 | 70,38 | |||
| b0 | 1,302 | |||||||||||
| b1 | − 0,024 | |||||||||||
| b2 | 0,1505 |
.

По таблице приложений при числе степеней свободы k = 12 − 2 − 1 = 9 находим t0,05; 9 = 2,262. Доверительный интервал для Мx(Y) равен
Найдем доверительный интервал для индивидуального значения у0* при ХT0 = (l; 40,3; 20,2):
Проверим значимость коэффициентов регрессии b1 и b2. В примере получены b1 = − 0,024 и b2 = 0,1505. Стандартная ошибка s b1 в равна
.
,
Аналогично вычисляем
,
Доверительный интервал имеет смысл построить только для значимого коэффициента регрессии b2:
Найдем 95% − ный доверительный интервал для параметра σ ². Учитывая, что α = 0,05, найдем по таблице χ ² приложений n − р − 1 = n − 2 − 1 = n − 3 = 9 степенях свободы
;
.
,
Формально переменные, имеющие незначимые коэффициенты регрессии, могут быть исключены из рассмотрения. В экономических исследованиях исключению переменных из регрессии должен предшествовать тщательный качественный анализ. Поэтому может оказаться целесообразным все же оставить в регрессионной модели одну или несколько объясняющих переменных, не оказывающих существенного (значимого) влияния на зависимую переменную.
Оценка значимости множественной регрессии
Получим более удобные формулы для сумм квадратов Q, QR и Qe, не требующие вычисления значений ŷi обусловленных регрессией, и остатков е.
Для Q имеем
.
,
Наконец,
.
, (1)
Коэффициенты детерминации R2 и 
Коэффициент детерминации R2 вычисляется соотношением
. (2)
,
,
Коэффициент детерминации R2 характеризует долю вариации зависимой переменной, обусловленной регрессией или изменчивостью объясняющих переменных; чем ближе R2 к единице, тем лучше регрессия описывает зависимость между объясняющими и зависимой переменными.
Вместе с тем использование только одного коэффициента детерминации R2 для выбора наилучшего уравнения регрессии может оказаться недостаточным. Плохо определённая модель регрессии может дать сравнительно высокий коэффициент R2.
Недостатком коэффициента детерминации R2 является то, что он увеличивается при добавлении новых объясняющих переменных, хотя это не обязательно означает улучшение качества регрессионной модели. В этом смысле предпочтительнее использовать скорректированный коэффициент детерминации
(3)
. (3')
по сравнению с R2. В отличие от R2 скорректированный коэффициент
может уменьшаться при введении в модель новых объясняющих переменных, не оказывающих существенного влияния на зависимую переменную. Однако даже увеличение скорректированного коэффициента детерминации
при введении в модель новой объясняющей переменной не всегда означает, что ее коэффициент регрессии значим (это происходит только в случае, если соответствующее значение t - статистики больше единицы (по абсолютной величине), т. е. | t | > 1. Другими словами, увеличение
еще не означает улучшения качества регрессионной модели.Если известен коэффициент детерминации, то критерий значимости (1) уравнения регрессии может быть записан в виде:
,
Пример
Решение. Вычислим произведения векторов:
(см. итоговую строку таблицы). Из таблицы находим
и по формуле (2) находим множественный коэффициент детерминации
.
Проделав аналогичные расчеты по данным примера для одной объясняющей переменной Х2, можно было получить R'2 =0,5 (заметим, что в случае одной объясняющей переменной коэффициент детерминации R'2 равен квадрату парного коэффициента корреляции r2). Сравнивая значения R2 и R'2, можно сказать, что добавление второй объясняющей переменной Х2 незначительно увеличило величину коэффициента детерминации, определяющего качество модели.
По формуле (3) вычислим скорректированный коэффициент детерминации:
;
.
Зная R2=0,54, проверим значимость уравнения регрессии. Фактическое значение критерия по (1):
Вопросы для самопроверки
- Сформулируйте теорему Гаусса – Маркова.
- Какой критерий используется для проверки значимости регрессии?
- Как находятся коэффициенты детерминации в множественном регрессионном анализе?
- Какой вид имеет критерий значимости уравнения регрессии, если известен коэффициент детерминации?
- Как находится стандартная ошибка коэффициентов регрессии?
- Как проверяется значимость коэффициентов уравнений регрессии?
- Что называется частной корреляцией?
- Имеются следующие данные о выработке литья на одного работающего Х1 (т), браке литья Х2 (%) и себестоимости 1 т литья Y (руб.) по 25 литейным цехам заводов:
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 x1i 14,6 13,5 21,5 17,4 44,8 111,9 20,1 28,1 22,3 25,3 56,0 40,2 40,6 75,8 27,6 88,4 16,6 33,4 17,0 33,1 30,1 65,2 22,6 33,4 19,7 x2i 4,2 6,7 5,5 7,7 1,2 2,2 8,4 1,4 4,2 0,9 1,3 1,8 3,3 3,4 1,1 0,1 4,1 2,3 9,3 3,3 3,5 1,0 5,2 2,3 2,7 yi 239 254 262 251 158 101 259 186 204 198 170 173 197 172 201 130 251 195 282 196 186 176 238 204 205
- а) найти множественный коэффициент детерминации и пояснить его смысл;
- б) найти уравнение множественной регрессии Y по Х1 и Х2, оценить значимость этого уравнения и его коэффициентов на уровне α = 0,05;
- в) сравнить раздельное влияние на зависимую переменную каждой из объясняющих переменных, используя стандартизованные коэффициенты регрессии и коэффициенты эластичности;
- г) найти 95%-ные доверительные интервалы для коэффициентов регрессии, а также для среднего и индивидуальных значений себестоимости 1 т литья в цехах, в которых выработка литья на одного работающего составляет 40 т, а брак литья - 5%.
| Акция | Доходы по месяцам, % | |||||
| А В С | 5,4 6,3 9,2 | 5,3 6,2 9,2 | 4,9 6,1 9,1 | 4,9 5,8 9,0 | 5,4 5,7 8,7 | 6,0 5,7 8,6 |
Есть основания предполагать, что доходы Y по акции С зависят от доходов Х1 и Х2 по акциям A и В. Необходимо:
- а) составить уравнение регрессии Y по Х1 и Х2;
- б) найти множественный коэффициент детерминации R2 и пояснить его смысл;
- в) проверить значимость полученного уравнения регрессии на уровне α = 0,05;
- г) оценить средний доход по акции С, если доходы по акциям А и В составили соответственно 5,5 и 6,0%.