Линейная корреляция
Если обе линий регрессии Y на X и X на Y - прямые, то корреляцию называют линейной.
Выборочное уравнение прямой линии регрессии Y на X имеет вид
(*)
yx условная средняя; x и y - выборочные средние признаков X и Y; σx и σy выборочные средние квадратические отклонения; rв – выборочный коэффициент корреляции, причем
Выборочное уравнение прямой линии регрессии X на Y имеет вид
(**)
Если данные наблюдений над признаками X и Y заданны в виде корреляционной таблицы с равностоящими вариантами, то целесообразно перейти к условным вариантам:
где C1 «ложный нуль» вариант X (новое начало отсчета); в качестве ложного нуля выгодно принять варианту, которая расположена примерно в середине вариационного ряда (условимся принимать в качестве ложного нуля варианту, имеющую наибольшую частоту); h1 – шаг, т.е. разность между двумя соседними вариантами X; C2 – «ложный нуль» вариант Y; h2 – шаг вариант Y. В этом случае выборочный коэффициент корреляции
причем слагаемое Σ nuvuv удобно вычислять, используя расчётную табл. 7. Величины u, v, σu, σv могут быть найдены либо методом произведений (при большом числе данных), либо непосредственно по формулам:
Зная эти величины, можно определить входящие в уравнения регрессии (*) и (**) величины по формулам:
Для оценки силы линейной корреляционной связи служит выборочный коэффициент корреляции rв.
Для обоснованного суждения о наличии связи между количественными признаками следует проверить, значим ли выборочный коэффициент корреляции.
535. Найти выборочное уравнение прямой линии регрессии Y на Х по данным, приведённым в корреляционной табл. 5.
Таблица 5
|
Y |
Х |
ny |
| 20 | 25 | 30 | 35 | 40 |
| 16 | 4 | 6 | – | – | – | 10 |
| 26 | – | 8 | 10 | – | – | 18 |
| 36 | – | – | 32 | 3 | 9 | 44 |
| 46 | – | – | 4 | 12 | 6 | 22 |
| 56 | – | – | – | 1 | 5 | 6 |
| nx | 4 | 14 | 46 | 16 | 20 | n = 100 |
Р е ш е н и е. Составим корреляционную табл. 6 в условных вариантах, выбрав в качестве ложных нулей С1 = 30 и С2 = 36 (каждая из этих вариант расположена в середине соответствующего вариационного ряда).
|
v |
u |
nv |
| -2 | -1 | 0 | 1 | 2 |
| -2 | 4 | 6 | – | – | – | 10 |
| -1 | – | 8 | 10 | – | – | 18 |
| 0 | – | – | 32 | 3 | 9 | 44 |
| 1 | – | – | 4 | 12 | 6 | 22 |
| 2 | – | – | – | 1 | 5 | 6 |
| nu | 4 | 14 | 46 | 16 | 20 | n = 100 |
Найдём: u и v:
Найдём вспомогательные величины
и
:
Найдем σu и σv
Найдем ∑nuvuv, для чего составим расчетную табл. 7. Суммируя числа последнего столбца табл. 7, находим
Для контроля вычислений находим сумму чисел последней строки:
Совпадение сумм свидетельствует о правильности вычислений.
Таблица 7
Пояснения к составлению табл. 7.
- Произведение частоты nuv на варианту u, т. е. nuvu, записывают в правом верхнем углу клетки, содержащей значение частоты. Например, в правых верхних углах клеток первой строки записаны произведения: 4∙(− 2) = -8; 6∙(− 1) = − 6.
- Складывают все числа, помещенные в правых верхних углах клеток одной строки, и их сумму помещают в клетку этой же строки «столбца». Например, для первой строки u = − 8 + (− 6) = − 14.
- Наконец, умножают варианту v на U и полученное произведение записывают в соответствующую клетку «столбца
vU». Например, в первой строке таблицы v = − 2, U = − 14, следовательно, vU =(− 2)∙(− 14) = 28.
- Сложив все числа «столбца vU», получают сумму
, которая равна искомой сумме ∑nuvuv. Например, для табл. 7
= 0,82, следовательно, искомая сумма ∑nuvuv = 82.
Для контроля аналогичные вычисления производят по столбцам: произведения nuvv записывают в левый нижний угол клетки, содержащей значение частоты; все числа, помещенные в левых нижних углах клеток одного столбца, складывают и их сумму помещают в «строку V»; наконец умножают каждую варианту u на V и в результат записывают в клетках последней строки.
Сложив все числа последней строки, получают сумму
, которая также равна искомой сумме ∑nuvuv. Например, для табл. 7
, следовательно, ∑nuvuv = 82.
Найдем искомый выборочный коэффициент корреляции:
Найдем шаги h1 и h2 (разности между любыми двумя соседними вариантами):
h1 = 25 – 20 = 5; h2 = 26 – 16 = 10.
Найдем x и y, учитывая, что C1 = 30, C2 = 36:
x = u h1 + С1 = 0,34·5 + 30 = 31,70,
y = v h2 + С2 = (− 0,04)·10 + 36 = 35,60.
Найдем σx и σy:
σx = h1∙σu = 5∙1,07 = 5,35; σy = h2∙σv = 10∙1,02 = 10,2.
Подставив найденные величины в соотношение (*), получим искомое уравнение прямой лини регрессии Y на X:
или окончательно
yx = 1,45 x − 10,36..
536. Найти выборочные уравнения прямых линий регрессии Y на X и X на Y по данным, приведенным в следующих корреляционных таблицах:
а)
|
Y |
X |
| 5 | 10 | 15 | 20 | 25 | 30 | 35 | 40 | n
y |
| 100 | 2 | 1 | - | - | - | - | - | - | 3 |
| 120 | 3 | 4 | 3 | - | - | - | - | - | 10 |
| 140 | - | - | 5 | 10 | 8 | - | - | - | 23 |
| 160 | - | - | - | 1 | - | 6 | 1 | 1 | 9 |
| 180 | - | - | - | - | - | - | 4 | 1 | 5 |
| nx | 5 | 5 | 8 | 11 | 8 | 6 | 5 | 2 | n = 50 |
б)
|
Y |
X |
| 18 | 23 | 38 | 33 | 38 | 43 | 48 | ny |
| 125 | - | 1 | - | - | - | - | - | 1 |
| 150 | 1 | 2 | 5 | - | - | - | - | 8 |
| 175 | - | 3 | 2 | 12 | - | - | - | 17 |
| 200 | - | - | 1 | 8 | 7 | - | - | 16 |
| 225 | - | - | - | - | 3 | 3 | - | 6 |
| 250 | - | - | - | - | - | 1 | 1 | 2 |
| nx | 1 | 6 | 8 | 20 | 10 | 4 | 1 | n = 50 |
в)
|
Y |
X |
| 5 | 10 | 15 | 20 | 25 | 30 | 35 | ny |
| 100 | - | - | - | - | - | 6 | 1 | 7 |
| 120 | - | - | - | - | - | 4 | 2 | 6 |
| 140 | - | - | 8 | 10 | 5 | - | - | 23 |
| 160 | 3 | 4 | 3 | - | - | - | - | 10 |
| 180 | 2 | 1 | - | 1 | - | - | - | 4 |
| nx | 5 | 5 | 11 | 11 | 5 | 10 | 3 | n = 50 |