Парный регрессионный анализ
- Рассчитайте параметры уравнений регрессии у = а + b·x
- Оцените тесноту связи с помощью коэффициента корреляции.
- Рассчитайте среднюю погрешность аппроксимации и оцените качество модели.
- С помощью F – критерия Фишера (на уровне α = 0,05) оцените значимость уравнения регрессии.
- С помощью критерия Стьюдента оцените значимость параметров уравнения регрессии.
- Определите значимость коэффициента корреляции и оцените связь между факторами.
- Оцените качество модели с помощью коэффициента детерминации.
- Рассчитайте средний коэффициент эластичности и дайте сравнительную оценку силы связи факторов с результатом.
- Рассчитайте прогнозную стоимость ŷпр обслуживания вагона, если длина пробега вагона увеличится на 5% от его среднего значения.
- Найдите доверительный интервал изменения стоимости обслуживания вагона со средним по выборке пробегом на уровне α = 0,05.
- Найдите доверительный интервал стандартного отклонения стоимости обслуживания вагона при увеличении пробега вагона на 1 тыс. км. на уровне α = 0,05.
- Найдите доверительный интервал стандартного отклонения стоимости обслуживания вагона на уровне α = 0,05.
- Парный регрессионный анализ в пакете MAPLE.
- Расчёты должны быть подробны и сопровождены пояснительной записью.
Таблица 1
| 1 | х | 1 | 0,55 | 0,1 | 0,35 | 0,8 | 1,25 | 1,7 | 2,15 | 2,6 | 3,05 |
| у | 4,3 | 3,56 | 2,14 | 3,31 | 3,68 | 4,8 | 4,7 | 5,1 | 5,2 | 6,2 | |
| 2 | х | 0,01 | 0,56 | 1,11 | 1,66 | 2,21 | 2,28 | 3,3 | 3,85 | 4,4 | 4,95 |
| у | 0,6 | 1,4 | 1,28 | 1,54 | 1,55 | 2,09 | 2,2 | 2,44 | 3,2 | 2,8 | |
| 3 | х | 2 | 1,6 | 1,2 | 1,8 | 2,4 | 2,6 | 3,4 | 3,8 | 4,2 | 4,6 |
| у | 2,3 | 1,24 | 1,76 | 2,8 | 2,53 | 2 | 3,2 | 2,6 | 4,76 | 5,24 | |
| 4 | х | 0,3 | 1,57 | 2,84 | 4,11 | 5,38 | 6,65 | 7,92 | 9,19 | 10,46 | 11,73 |
| у | 1,33 | 1,55 | 2,3 | 2,7 | 2,74 | 2,6 | 3,5 | 3,3 | 3,4 | 3,7 | |
| 5 | х | 0,5 | 1,65 | 1,8 | 1,95 | 2,1 | 2,75 | 2,9 | 3,45 | 3,8 | 4,15 |
| у | 0,1 | 0,3 | 0,45 | 0,3 | 0,39 | 0,5 | 0,69 | 0,58 | 0,75 | 0,83 | |
| 6 | х | 0,15 | 0,94 | 1,72 | 2,51 | 3,29 | 4,08 | 4,86 | 5,65 | 6,43 | 7,22 |
| у | 1,69 | 2,2 | 2,37 | 3,25 | 3,43 | 4,21 | 4,74 | 5,3 | 5,58 | 6,93 | |
| 7 | х | 0,35 | 0,82 | 1,28 | 1,75 | 2,21 | 2,675 | 3,14 | 3,605 | 4,07 | 4,535 |
| у | 3,6 | 3,7 | 4,2 | 4,35 | 4,45 | 4,37 | 4,35 | 4,41 | 4,52 | 4,68 | |
| 8 | х | 1 | 1,8 | 2,6 | 3,4 | 5,2 | 6,0 | 6,2 | 6,4 | 7,6 | 7,8 |
| у | 4,14 | 4,2 | 4,3 | 4,82 | 5,41 | 5,8 | 5,83 | 6,85 | 7,32 | 6,95 | |
| 9 | х | 2 | 2,3 | 2,6 | 2,9 | 3,2 | 3,5 | 3,8 | 4,1 | 4,4 | 4,7 |
| у | 2,67 | 3,06 | 3,16 | 4,13 | 4,92 | 5,29 | 6,29 | 6,97 | 7,39 | 7,6 | |
| 10 | х | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| у | 0,1 | 0,2 | 0,5 | 0,61 | 0,71 | 0,78 | 0,82 | 0,89 | 1,2 | 1,5 |
Дополнительное задание только для студентов очной формы обучения
| 11 | х | 0,95 | 1,21 | 1,47 | 1,74 | 2,0 | 2,26 | 2,52 | 2,78 | 3,05 | 3,31 |
| у | 3,16 | 3,39 | 4,19 | 4,34 | 4,88 | 5,61 | 6,54 | 7,33 | 8,28 | 9,19 | |
| 12 | х | 0,35 | 0,82 | 1,28 | 1,75 | 2,21 | 2,68 | 3,14 | 3,61 | 4,07 | 4,53 |
| у | 6,99 | 7,83 | 8,61 | 9,56 | 9,96 | 10,62 | 10,29 | 11,09 | 11,93 | 12,8 | |
| 13 | х | 0,7 | 1,43 | 2,16 | 2,89 | 3,62 | 4,35 | 5,08 | 5,19 | 6,46 | 6,73 |
| у | 2,96 | 4,46 | 5,17 | 5,92 | 6,45 | 6,98 | 7,35 | 8,31 | 8,6 | 9,77 | |
| 14 | х | 2 | 3,5 | 3,59 | 4,5 | 5,6 | 6,5 | 7,4 | 8,5 | 8,7 | 9,5 |
| у | 0,3 | 0,52 | 0,48 | 0,44 | 0,77 | 0,98 | 1,2 | 1,53 | 1,45 | 1,75 | |
| 15 | х | 2 | 3,4 | 3,8 | 4,2 | 4,4 | 5,0 | 5,6 | 6,2 | 6,8 | 7,4 |
| у | 3,6 | 3,7 | 4,2 | 4,35 | 4,45 | 4,37 | 4,38 | 4,41 | 4,52 | 4,68 |
ПРИМЕР ВЫПОЛНЕНИЯ ЗАДАНИЯ
| х | 22,8 | 27,5 | 34,5 | 26,4 | 19,8 | 17,9 | 25,2 | 20,1 | 20,7 | 21,4 | 19,8 | 24,5 |
| у | 23,0 | 26,8 | 28,0 | 23,4 | 22,5 | 20,8 | 22,4 | 21,8 | 18,5 | 23,5 | 18,7 | 20,4 |
РЕШЕНИЕ. Регрессионную зависимость будем искать в виде у = а + b·x. Значения
отличаются от значений уi на некоторые величины ei, которые назовём погрешностями. В этом случае уi = а + b·xi + ei.Система, из которой найдём параметры уравнения регрессии, имеет вид
(1)





,
,
,
,
.
Уравнение регрессии необходимо дополнить показателем тесноты связи, в качестве его выступает коэффициент корреляции rxy:
.
.Средняя погрешность аппроксимации находится по формуле
.Таблица расчёта значений параметров линейной регрессии
| N | x | x² | y | x·y | y² | ![]() | ![]() | ( )² | ( )² | ŷ | y - | (y - ŷ )² | A% |
| 1 | 22,8 | 519,84 | 23 | 524,4 | 529 | 0,517 | -0,583 | 0,267 | 0,340 | 22,200 | 0,800 | 0,640 | 0,035 |
| 2 | 27,5 | 756,25 | 26,8 | 737 | 718,24 | 4,317 | 4,117 | 18,634 | 16,947 | 24,482 | 2,318 | 5,373 | 0,086 |
| 3 | 34,5 | 1190,25 | 28 | 966 | 784 | 5,517 | 11,117 | 30,434 | 123,580 | 27,881 | 0,119 | 0,014 | 0,004 |
| 4 | 26,4 | 696,96 | 23,4 | 617,76 | 547,56 | 0,917 | 3,017 | 0,840 | 9,100 | 23,948 | -0,548 | 0,300 | 0,023 |
| 5 | 19,8 | 392,04 | 22,5 | 445,5 | 506,25 | 0,017 | -3,583 | 0,000 | 12,840 | 20,744 | 1,756 | 3,085 | 0,078 |
| 6 | 17,9 | 320,41 | 20,8 | 372,32 | 432,64 | -1,683 | -5,483 | 2,834 | 30,067 | 19,821 | 0,979 | 0,958 | 0,047 |
| 7 | 25,2 | 635,04 | 22,4 | 564,48 | 501,76 | -0,083 | 1,817 | 0,007 | 3,300 | 23,365 | -0,965 | 0,932 | 0,043 |
| 8 | 20,1 | 404,01 | 21,8 | 438,18 | 475,24 | -0,683 | -3,283 | 0,467 | 10,780 | 20,889 | 0,911 | 0,830 | 0,042 |
| 9 | 20,7 | 428,49 | 18,5 | 382,95 | 342,25 | -3,983 | -2,683 | 15,867 | 7,200 | 21,181 | -2,681 | 7,185 | 0,145 |
| 10 | 21,4 | 457,96 | 23,5 | 502,9 | 552,25 | 1,017 | -1,983 | 1,034 | 3,934 | 21,520 | 1,980 | 3,919 | 0,084 |
| 11 | 19,8 | 392,04 | 18,7 | 370,26 | 349,69 | -3,783 | -3,583 | 14,314 | 12,840 | 20,744 | -2,044 | 4,176 | 0,109 |
| 12 | 24,5 | 600,25 | 20,4 | 499,8 | 416,16 | -2,083 | 1,117 | 4,340 | 1,247 | 23,025 | -2,625 | 6,893 | 0,129 |
| Сумма | 280,6 | 6793,54 | 269,8 | 6421,55 | 6155,04 | 0,000 | Q = | 89,037 | 232,177 | Qe = | 34,305 | 0,826 | |
| среднее значение | 23,383 | 566,128 | 22,483 | 535,129 | 512,920 | 7,420 | 19,348 | 2,859 | 6,884 | ||||
| Дисп | 19,348 | 2,724 | 4,399 | s = | 1,852174 | доп | |||||||
| b | 0,486 | ||||||||||||
| a | 11,130 | F = | 15,95 | ||||||||||
| эластичность | 0,504956 | ||||||||||||
| ковариация | 9,393889 | QR = | 54,731 | ||||||||||
| сигма | 4,398642 |
,
— сумма квадратов отклонений зависимой переменной от средней,
-
— сумма квадратов, обусловленная регрессией,
— остаточная сумма квадратов . Эти значения получены из приведённой таблицы 1.
.Определим среднее квадратическое отклонение остаточной дисперсии
.
, 
Коэффициент корреляции значим на уровне α (гипотеза о равенстве нулю коэффициента корреляции нулю отвергается), если справедливо неравенство
,
.Характеристикой прогностической силы регрессионной модели, мерой качества подгонки регрессионной модели к наблюдаемым значениям yi, является коэффициент детерминации
,
,В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату коэффициента корреляции R 2 = r2xy.
Для анализа построенной и оценённой модели используется средний показатель эластичности
.
.Рассчитаем прогнозное значение ŷпр, если прогнозное значение фактора увеличится на 5% от его среднего значения:
Несмещённая оценка дисперсии находится по формуле
.
.
,
.
.
= 23,38 доверительным интервалом является [21,29; 23,68]. То есть стоимость обслуживания вагона со средним пробегом 23,38 тыс. км
с надёжностью 0,95 находится в пределах [21,29; 23,68] тыс. рублей.Интервальная оценка углового коэффициента линии регрессии на уровне значимости α имеет вид
.
,Учитывая, что α = 0,05, найдём по таблице распределений Пирсона
;
.
,Парный регрессионный анализ в пакете MAPLE
>n:=12:X:=[22.8,27.5,34.5,26.4,19.8,17.9,25.2,20.1,20.7,21.4,19.8,24.5]:
Y:=[23,26.8,28,23.4,22.5,20.8,22.4,21.8,18.5,23.5,18.7,20.4]:#Исходные данные задачи
>with(stats[statplots]):plots[display]({scatterplot(X,Y)},view=[min(seq(X[i],i=1..n))-1..max(seq(X[i],i=1..n))+1,min(seq(Y[i],i=1..n))-1..max(seq(Y[i],i=1..n))+1],axes=FRAME,symbol=circle,symbolsize=15);#Построение корреляционного поля
Warning, these names have been redefined: boxplot, histogram, scatterplot, xscale, xshift, xyexchange, xzexchange, yscale, yshift, yzexchange, zscale, zshift

sy := 22.48333333
>dispX:=describe[variance](X);#Нахождение дисперсии Х
sigmaY := 2.723916706
a := 11.13023201
>pXY:=[[X[i],Y[i]] $i=1..n]: XRange:=x=min(seq(X[i],i=1..n))-2..max(seq(X[i],i=1..n))+1:#Формирование корреляционного поля
>pic2:=pointplot(pXY,symbol=circle,symbolsize=15,color=blue):#Картинка корреляционного поля
>plots[display](pic1,pic2);

>s2:=(sum(y(X[i])-Y[i],i=1..n)/sqrt(n-2)):evalf(%);
>plots[display](pic1,pic2,pic3,pic4);# Совмещение картин(создание общей картины)
>plots[display](pic1,pic2,pic3,pic4,pic5,pic6);# Совмещение картин(создание общей картины)
>if F>f then `significant` else `insignificant`fi;#Определение значимости уравнения регрессии

