К содержанию второй части

Линейная корреляция

   Если обе линий регрессии Y на X и X на Y - прямые, то корреляцию называют линейной.
    Выборочное уравнение прямой линии регрессии Y на X имеет вид
                     (*)
yx условная средняя; x и y - выборочные средние признаков X и Y; σx и σy ­ выборочные средние квадратические отклонения; rв – выборочный коэффициент корреляции, причем
   Выборочное уравнение прямой линии регрессии X на Y имеет вид
                     (**)
Если данные наблюдений над признаками X и Y заданны в виде корреляционной таблицы с равностоящими вариантами, то целесообразно перейти к условным вариантам:
где C1 «ложный нуль» вариант X (новое начало отсчета); в качестве ложного нуля выгодно принять варианту, которая расположена примерно в середине вариационного ряда (условимся принимать в качестве ложного нуля варианту, имеющую наибольшую частоту); h1 – шаг, т.е. разность между двумя соседними вариантами X; C2 – «ложный нуль» вариант Y; h2 – шаг вариант Y. В этом случае выборочный коэффициент корреляции
причем слагаемое Σ nuvuv удобно вычислять, используя расчётную табл. 7. Величины u, v, σu, σv могут быть найдены либо методом произведений (при большом числе данных), либо непосредственно по формулам:
Зная эти величины, можно определить входящие в уравнения регрессии (*) и (**) величины по формулам:
Для оценки силы линейной корреляционной связи служит выборочный коэффициент корреляции rв.
   Для обоснованного суждения о наличии связи между количественными признаками следует проверить, значим ли выборочный коэффициент корреляции.

535. Найти выборочное уравнение прямой линии регрессии Y на Х по данным, приведённым в корреляционной табл. 5.

Таблица 5

Y Х ny
2025303540
164610
2681018
36323944
46412622
56156
nx414461620n = 100
   Р е ш е н и е. Составим корреляционную табл. 6 в условных вариантах, выбрав в качестве ложных нулей С1 = 30 и С2 = 36 (каждая из этих вариант расположена в середине соответствующего вариационного ряда).
v u nv
-2-1012
-24610
-181018
0323944
1412622
2156
nu414461620n = 100
   Найдём: u и v:
Найдём вспомогательные величины и :
Найдем σu и σv
Найдем ∑nuvuv, для чего составим расчетную табл. 7. Суммируя числа последнего столбца табл. 7, находим
Для контроля вычислений находим сумму чисел последней строки:
Совпадение сумм свидетельствует о правильности вычислений.

Таблица 7

Пояснения к составлению табл. 7.
  1. Произведение частоты nuv на варианту u, т. е. nuvu, записывают в правом верхнем углу клетки, содержащей значение частоты. Например, в правых верхних углах клеток первой строки записаны произведения: 4∙(− 2) = -8; 6∙(− 1) = − 6.
  2. Складывают все числа, помещенные в правых верхних углах клеток одной строки, и их сумму помещают в клетку этой же строки «столбца». Например, для первой строки u = − 8 + (− 6) = − 14.
  3. Наконец, умножают варианту v на U и полученное произведение записывают в соответствующую клетку «столбца vU». Например, в первой строке таблицы v = − 2, U = − 14, следовательно, vU =(− 2)∙(− 14) = 28.
  4. Сложив все числа «столбца vU», получают сумму , которая равна искомой сумме ∑nuvuv. Например, для табл. 7 = 0,82, следовательно, искомая сумма ∑nuvuv = 82.
   Для контроля аналогичные вычисления производят по столбцам: произведения nuvv записывают в левый нижний угол клетки, содержащей значение частоты; все числа, помещенные в левых нижних углах клеток одного столбца, складывают и их сумму помещают в «строку V»; наконец умножают каждую варианту u на V и в результат записывают в клетках последней строки.
   Сложив все числа последней строки, получают сумму , которая также равна искомой сумме ∑nuvuv. Например, для табл. 7 , следовательно, ∑nuvuv = 82.
   Найдем искомый выборочный коэффициент корреляции:
   Найдем шаги h1 и h2 (разности между любыми двумя соседними вариантами):
h1 = 25 – 20 = 5; h2 = 26 – 16 = 10.
Найдем x и y, учитывая, что C1 = 30, C2 = 36:
x = u h1 + С1 = 0,34·5 + 30 = 31,70,
y = v h2 + С2 = (− 0,04)·10 + 36 = 35,60.
Найдем σx и σy:
σx = h1∙σu = 5∙1,07 = 5,35; σy = h2∙σv = 10∙1,02 = 10,2.
Подставив найденные величины в соотношение (*), получим искомое уравнение прямой лини регрессии Y на X:
или окончательно
yx = 1,45 x − 10,36..
536. Найти выборочные уравнения прямых линий регрессии Y на X и X на Y по данным, приведенным в следующих корреляционных таблицах:
а)
Y X
510152025303540n y
10021------3
120343-----10
140--5108---23
160---1-6119
180------415
nx558118652n = 50
б)
Y X
18233833384348ny
125-1-----1
150125----8
175-3212---17
200--187--16
225----33-6
250-----112
nx168201041 n = 50
в)
Y X
5101520253035ny
100-----617
120-----426
140--8105--23
160343----10
18021-1---4
nx 5511115103n = 50