| К содержанию второй части |
- Основные сведения
- Сравнение двух дисперсий нормальных генеральных совокупностей (554 – 559)
- Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона
СТАТИСТИЧЕСКАЯ ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Основные сведения
Нулевой (основной) называют выдвинутую гипотезу Hо.
Конкурирующей (альтернативной) называют гипотезу H1, которая противоречит нулевой.
Различают гипотезы, которые содержат одно и более одного предположений.
Простой называют гипотезу, содержащую только одно предположение.
Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
В итоге проверки гипотезы могут быть допущены ошибки двух родов.
Ошибка первого рода состоит в том, что будет отвергнута правильная нулевая гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через α.
Ошибка второго рода состоит в том, что будет принята неправильная нулевая гипотеза. Вероятность ошибки второго рода обозначают через β.
Статистическим критерием (или просто критерием) называют случайную величину К, которая служит для проверки гипотезы.
Наблюдаемым (эмпирическим) значением Kнабл называют то значение критерия, которое вычислено по выборкам.
Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.
Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых нулевую гипотезу принимают.
Основной принцип проверки статистических гипотез: если наблюдаемое значение критерия принадлежит критической области, то нулевую гипотезу отвергают; если наблюдаемое значение критерия принадлежит области принятия гипотезы, то гипотезу принимают.
Критическими точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы.
Правосторонней называют критическую область, определяемую неравенством К > kкр, где kкр – положительное число.
Левосторонней называют критическую область, определяемую неравенством К < kкр, где kкр – отрицательное число.
Двусторонней называют критическую область, определяемую неравенством К < k1, К > k2, где k2 > k1. В частности, если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенствами (в предположении, что kкр > 0)
а) для правосторонней критической области
Р (К < − kкр) = α/2.
Сравнение двух дисперсий нормальных генеральных совокупностей
Правило 1. Для того чтобы при заданном уровне значимости α проверить нулевую гипотезу H0: D(Х) = D(Y) о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе Н1: D(Х) > D(Y), надо вычислить наблюдаемое значение критерия (отношение большей исправленной дисперсии к меньшей)
Правило 2. При конкурирующей гипотезе Н1: D(Х) ≠ D(Y) критическую точку Fкр (α/2; k1; k2) ищут по уровню значимости α/2 (вдвое меньшему заданного) и числам степеней свободы k1 и k2 (k1 – число степеней свободы большей дисперсии). Если Fнабл < Fкр – нет оснований отвергнуть нулевую гипотезу. Если Fнабл > Fкр – нулевую гипотезу отвергают.
- По двум независимым выборкам, объемы которых n1 = 11 и n2 = 14, извлеченным из нормальных генеральных совокупностей X и Y, найдены исправленные выборочные дисперсии s2(X) = 0,76 и s2(Y) = 0,38. При уровне значимости α = 0,05, проверить нулевую гипотезу H0: D(Х) = D(Y) о равенстве генеральных дисперсий, при конкурирующей гипотезе Н1: D(Х) > D(Y).
Решение. Найдем отношение большей исправленной дисперсии к меньшей:Fнабл = 0,76/0,38 = 2. По условию конкурирующая гипотеза имеет вид D(Х) > D(Y) поэтому критическая область – правосторонняя. По таблице Фишера—Снедекора, по уровню значимости α = 0,05 числам степеней свободы k1 = n1 − 1 = 11 − 1 = 10, k2 = n2 − 1 = 14 − 1 = 13 находим критическую точкуFкр (0,05; 10; 13) =2,67. Так как Fнабл < Fкр – нет оснований отвергнуть гипотезу о равенстве генеральных дисперсий. Другими словами, выборочные исправленные дисперсии различаются незначимо. - По двум независимым выборкам, объемы которых n1 = 9 и n2 = 16, извлеченным из нормальных генеральных совокупностей X и Y, найдены исправленные выборочные дисперсии s2(X) = 34,02 и s2(Y) = 12,15. При уровне значимости 0,01, проверить нулевую гипотезу H0: D(Х) = D(Y) о равенстве генеральных дисперсий при конкурирующей гипотезе Н1: D(Х) > D(Y).
- По двум независимым выборкам, объемы которых
n1 = 14 и n2 = 10, извлеченным из нормальных генеральных
совокупностей X и Y, найдены исправленные выборочные дисперсии s2(X) = 0,84 и s2(Y) =2,52. При уровне значимости α = 0,1, проверить нулевую гипотезу H0: D(Х) = D(Y) о равенстве генеральных дисперсий при конкурирующей гипотезе Н1: D(Х) ≠ D(Y).
Р е ш е н и е . Найдем отношение большей исправленной дисперсии к меньшей:Fнабл = 2,52/0,84 = 3. По условию конкурирующая гипотеза имеет вид D(Х) ≠ D(Y), поэтому критическая область – двусторонняя. В соответствии с правилом 2 при отыскании критической точки следует брать уровень значимости, вдвое меньший заданного. По таблице Фишера—Снедекора, по уровню значимости α /2 = 0,1/2 = 0,05 и числам степеней свободы k1 = 10 − 1 = 9 и k2 = 14 − 1= 13, находим критическую точкуFкр (0,05; 9; 13) =2,71. Так как Fнабл > Fкр – нулевую гипотезу о равенстве генеральных дисперсий отвергаем. - По двум независимым выборкам, объемы которых n1 = 9 и n2 = 6, извлеченным из нормальных генеральных совокупностей X и Y, найдены выборочные дисперсии Dв( Х ) = 14,4 И Dв( Y ) = 20,5. При уровне значимости 0,1 проверить нулевую гипотезу H0: D(Х) = D(Y) о равенстве генеральных дисперсий при конкурирующей гипотезе Н1: D(Х) ≠ D(Y).
Указание. Найти исправеленные дисперсии
.
- Двумя методами проведены измерения одной и той же физической величины. Получены следующие результаты:
а) в первом случае х1 = 9,6; х2 = 10,0; х3 = 9,8; х4 = 10,2; х5 = 10,6;
б) во втором случае y1 = 10,4; y2 = 9,7; y3 = 10,0; y410,3.
Можно ли считать, что оба метода обеспечивают одинаковую точность измерений, если принять уровень значимости α 0,1? Предполагается, что результаты измерений распределены нормально и выборки независимы.
Решение. Будем судить о точности методов по величинам дисперсий. Таким образом, нулевая гипотеза имеет вид H0: D(Х) = D(Y). В качестве конкурирующей примем гипотезу Н1: D(Х) ≠ D(Y).
Найдем выборочные дисперсии. Для упрощения вычислений перейдем к условным вариантам:ui = 10 хi − 100, vi = 10 yi − 100. В итоге получим условные варианты
Найдем исправленные выборочные дисперсии:ui − 4 0 − 2 2 6 vi 4 −3 0 3 Сравним дисперсии. Найдем отношение большей исправленной дисперсии к меньшей (каждая из дисперсий увеличилась в 102 раз, но их отношение не изменилось):
По условию конкурирующая гипотеза имеет вид Н1: D(Х) ≠ D(Y), поэтому критическая область двусторонняя и в соответствии с правилом 2 при отыскании критической точки следует брать уровень значимости, вдвое меньший заданного.
.
По таблице Фишера—Снедекора, по уровню значимости α/2=0,1/2 = 0,05 и числам степеней свободы k1 = n1 − 1 = 5 − 1 = 4 и k2 = n2 − 1 = 4 − 1 = 3 находим критическую точку Fкр (0,05; 4; 3) = 9,12.
Так как Fнабл < Fкр нет оснований отвергнуть нулевую гипотезу о равенстве генеральных дисперсий. Другими словами, исправленные дисперсии различаются незначимо и, следовательно, оба метода обеспечивают одинаковую точность измерений. - Для сравнения точности двух станков-автоматов взяты две пробы (выборки), объемы которых n1 = 10 и n2 = 8. В результате измерения контролируемого размера отобранных изделий получены следующие результаты
xi 1,08; 1,10; 1,12; 1,14; 1,15; 1,25; 1,36; 1,38; 1,40; 1,42;
yi 1,11; 1,12; 1,18; 1,22; 1,33; 1,35; 1,36; 1,38.
Можно ли считать, что станки обладают одинаковой точностью [H0: D(Х) = D(Y)], если принять уровень значимости α = 0,1 и в качестве конкурирующей гипотезы Н1: D(Х) ≠ D(Y).
Указание. Для упрощения вычислений перейти к условным вариантам ui = 100 хi − 124, vi = 100 yi − 126.
Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона
Пусть эмпирическое распределение задано в виде последовательности равноотстоящих вариант и соответствующих им частот:
| xi | x1 | x2 | … | xN |
| ni | n1 | n2 | … | nN |
Правило 1. Для того чтобы при заданном уровне значимости α проверить гипотезу о нормальном распределении генеральной совокупности, надо:
- Вычислить непосредственно выборочную среднюю xв и выборочное среднее квадратическое отклонение σв
- Вычислить теоретические частоты
где n – объем выборки (сумма всех частот), h – шаг (разность между двумя соседними вариантами),
,
.
- Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:
- а) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия
;
- б) по таблице критических точек распределения χ2, по веданному уровню значимости α и числу степеней свободы k = s − 3,(s – число групп выборки) находят критическую точку χкр2 (α; k) правосторонней критической области.
- а) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия
Если χнабл2 > χкр2 – гипотезу отвергают. Другими словами, эмпирические и теоретические частоты различаются значимо.
Замечание 1. М алочисленные частоты (ni < 5) следует объединить; в этом случае и соответствующие им теоретические частоты также надо сложить. Если производилось объединение частот, то при определении числа степеней свободы по формуле k = s − 3 следует в качестве s принять число групп выборки, оставшихся после объединения частот.
- Почему при проверке с помощью критерия Пирсона гипотезы о нормальном распределении генеральной совокупности число степеней свободы находят по формуле k = s − 3 ?
Решение. При использовании критерия Пирсона число степеней свободы k = s − 1 − r, где r – число параметров, оцениваемыз по выборке. Нормальное распределение определяется двумя параметрами: математическим ожиданием а и средним квадратический отклонением σ. Так как оба эти параметра оценивались по выборке (в качестве оценки а принимают выборочную среднюю, в качестве оценки σ – выборочное среднее квадратическое отклонение), то r = 2 следовательно, k = s − 1 − 2 = s − 3. - Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объема n = 200:
Решение. Найдем выборочную среднюю xв = 12,63 и выборочное среднее квадратическое отклонение σв = 4,695.xi 5 7 8 11 13 15 17 19 21 ni 15 26 25 30 26 21 24 20 13
2. Вычислим теоретические частоты, учитывая, что n = 200, h = 2, σв = 4,695, по формуле Составим расчетную таблицу (значения функции φ(ui) помещены в приложении).
.
3. Сравним эмпирические и теоретические частоты,i xi 
φ(ui) ni' = 85,2·φ(ui) 1 5 −1,62 0,1074 9,1 2 7 −1,20 0,1942 16,5 3 9 −0,77 0,2966 25,3 4 11 −0,35 0,3752 32,0 5 13 0,08 0,3977 33,9 6 15 0,51 0,3503 29,8 7 17 0,93 0,2589 22,0 8 19 1,36 0,1582 13,5 9 21 1,78 0.0818 7,0
а) Составим расчетную таблицу, из которой найдем наблюдаемое значение критерия
;
Находим χнабл2 =22,2.i ni ni' ni − ni' (ni − ni')2 (ni − ni')2/ni' 1 15 9,1 5,9 34,81 3,8 2 26 16,5 9,5 90,25 5,5 3 25 25,3 −0,3 0,09 0,0 4 30 32,0 −2,0 4,00 0,1 5 26 33,9 −7,9 62,41 1,8 6 21 29,8 −8,8 77,44 2,6 7 24 22,0 2,0 4,00 0,2 8 20 13,5 6,5 42,25 3,1 9 13 7,0 6,0 36,00 5,1 Σ 200 χнабл2 =22,2
б) По таблице критических точек распределения χ2 (см. приложение), по уровню значимости α = 0,05 и числу степеней свободы k = s − 3 = 9 − 3 = 6 находим критическую точку правосторонней критической областиχкр2 (0,05; 6) = 12,6. Так как χнабл2 > χкр2 – гипотезу о нормальном распределении генеральной совокупности отвергаем. Другими словами, эмпирические и теоретические частоты различаются значимо. - Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объема n = 200:
xi 0,3 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,1 2,3 ni 6 9 26 25 30 26 21 24 20 8 5 - Используя критерий Пирсона, при уровне значимости 0,01 установить, случайно или значимо расхождение между эмпирическими частотами ni и теоретическими частотами ni', которые вычислены, исходя из гипотезы о нормальном распределении генеральной совокупности X:
ni 8 16 40 72 36 18 10 ni' 6 18 36 76 39 18 7 - Используя критерий Пирсона, при уровне значимости 0,05 установить, случайно или значимо расхождение между эмпирическими частотами ni и теоретическими частотами ni', которые вычислены исходя из гипотезы о нормальном распределении генеральной совокупности Х:
- a)
ni 5 10 20 8 7 ni' 6 14 18 7 5 - б)
ni 6 8 13 15 20 16 10 7 5 ni' 5 9 14 16 18 16 9 6 7 - в)
ni 14 18 32 70 20 36 10 ni' 10 24 34 80 18 22 12 - г)
ni 5 7 15 14 21 16 9 7 6 ni' 6 6 14 15 22 15 8 8 6
- a)
Эмпирическое распределение задано в виде последовательности интервалов одинаковой длины и соответствующих им частот
| (x1, x2) | (x2, x3) | … | (хs, хs + 1) |
| n1 | n2 | … | ns |
Правило 2. Для того чтобы при уровне значимости α проверить пшпезу о нормальном распределении генеральной совокупности надо:
- Вычислить выборочную cреднюю x и выборочное среднее квадратическое отклонение σв причём в качестве вариант хв* принимают среднее арифметическое концов интервала:
xi* = (xi + xi +1)/2. - Пронормировать X, т. е. перейти к случайной величине Z = (X − x*)/σ* и вычислить концы интервалов: zi = (xi − x*)/σ*, zi+1 = ( xi+1− x*)/σ*причем наименьшее значение Z, т. е. z1, полагают равным −∞. а наибольшее, т. е. zs+1, полагают равным ∞.
- Вычислить теоретические частоты
ni’ = n·Pi, где n – объем выборки (сумма всех частот); Pi = Ф(zi+1) − Ф (zi) вероятности попадания X в интервалы (хi, хi + 1); Ф (Z) – функция Лапласа. - Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:
а) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия Пирсона б) по таблице критических точек распределения χ2, по заданному уровню значимости α и числу степеней свободы k = s − 3 (s – число интервалов выборки) находят критическую точку правосторонней критической области χкр2 (α; k).
;
Если χнабл2 < χкр2 – ytn оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Если χнабл2 > χкр2 – гипотезу отвергают.
Замечание 2. Интервалы, содержащие малочисленные эмпирические частоты (n < 5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формулеk = s − 3 следует в качестве s принять число интервалов, оставшихся после объединения интервалов.
- Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объема n = 100, приведенным в таблице
Номер интервала
iГраница интервала Частота
nixi xi +1 1 3 8 6 2 8 13 8 3 13 18 15 4 18 23 40 5 23 28 16 6 28 33 8 7 33 38 7 n = 100 Решение 1. Вычислим выборочную среднюю и выборочное среднее квадратическое отклонение. Для этого перейдем от заданного интервального распределения к распределению равноотстоящих вариант, приняв в качестве варианты xi* ( среднее арифметическое концов интервала xi* = (xi + xi +1)/2. В итоге получим распределение:
xi* 5,5 10,5 15,5 20,5 25,5 30,5 35,5 ni 6 8 15 40 16 8 7 Найдем выборочную среднюю и выборочное среднее квадратическое отклонение: x* = 20,7, σ* = 7,28.
Найдем интервалы (zi, zi+1), учитывая, что x* = 20,7, σ* = 7,28, 1/σ* = 0,137. Для этого составим расчетную таблицу (левым конец первого интервала примем равным − ∞, а правьш конец последнего интервала ∞).
i Границы интервала xi − x* xi +1 − x* Границы интервала xi xi +1 zi = (xi − x*)/σ* zi+1 = ( xi+1− x*)/σ* 1 3 8 − −12,7 − ∞ −1,74 2 8 13 −12,7 −7,7 −1,74 −1,06 3 13 18 −7,7 −2,7 −1,06 −0,37 4 18 23 −2,7 2,3 −0,37 0,32 5 23 28 2,3 7,3 1,32 1,00 6 28 33 7,3 12,3 1,00 1,69 7 33 38 12,3 − 1,69 ∞ Найдем теоретические вероятности Рi, и теоретические частоты ni’ = n·Pi = 100·Рi. Для этого составим расчетную таблицу
i Границы интервала Ф (zi) Ф (zi +1) Pi = Ф (zi +1) − Ф (zi) ni' = 100·Pi zi zi +1 1 − −1,74 −0,5 −0,4591 0,04 4,09 2 −1,74 −1,06 −0,4591 −0,3554 0,1037 10,37 3 −1,06 −0,37 −0,3554 −0,1443 0,2111 21,11 4 −0,37 0,32 −0,1443 0,1255 0,2698 26,98 5 0,32 1,00 0,1255 0,3413 0,2158 21,58 6 1,00 1,69 0,3413 0,4545 0,1132 11,32 7 1,69 0,4545 0,5 0,0455 7,55 Σ 1 100 4. Сравним эмпирические и теоретические частоты, используя критерий Пирсона:
а) вычислим наблюдаемое значение критерия Пирсона. Для этого составим расчетную таблицу. Столбцы 7 и 8 служат для контроля вычислений по формуле
;
Контроль:1 2 3 4 5 6 7 8 i ni ni' ni − ni' (ni − ni')2 (ni − ni')2/ni' ni2 ni2/ni' 1 6 4,09 1,91 3,6481 0,8920 36 8,8019 2 8 10,37 −2,37 5,6169 0,5416 64 6,1716 3 15 21,11 −6,11 37,3321 1,7684 225 10,6584 4 40 26,98 13,02 169,5204 6,2833 1600 50,3052 5 16 21,58 −5,58 31,1364 1,4428 256 11,8628 6 8 11,32 −3,32 11,0224 0,9737 64 5,6537 7 7 4,55 2,45 6,0025 1,3192 49 10,7692 Σ 100 100 χнабл2 = 13,22 113,22 χнабл2 = Σ (ni2/ni') − n = 113,22 − 100 = 13,22. Вычисления произведены правильно;
б) по таблице критических точек распределения χ2 (приложение 5), по уровню значимости α = 0,05 и числу степеней свободы k = s − 3 = 7 − 3 = 4 (s – число интервалов) находим критическую точку правосторонней критической области χкр2 (0,05; 4) = = 9,5.
Так как χнабл2 > χкр2 – – отвергаем гипотезу о нормальном распределении генеральной совокупности X; другими словами, эмпирические и теоретические частоты различаются значимо. Это означает, что данные наблюдений не согласуются с гинотезой о нормальном распределении генеральной совокупности. - Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с заданным эмпирическим распределением.
- а)
Номер интервала
iГраница интервала Частота
nixi xi +1 1 -20 -10 20 2 -10 0 47 3 0 10 80 4 10 20 89 5 20 30 40 6 30 40 16 7 40 50 8 n = 300 - б)
Номер интервала
iГраница интервала Частота
nixi xi +1 1 1 3 2 2 3 5 4 3 5 7 6 4 7 9 10 5 9 11 18 6 11 13 20 7 13 15 16 8 15 17 11 9 17 19 7 10 19 21 5 11 21 23 1 n = 100 - в)
Номер интервала
iГраница интервала Частота
nixi xi +1 1 6 16 8 2 16 26 7 3 26 36 16 4 36 46 35 5 46 56 15 6 56 66 8 7 66 76 6 8 76 86 5 n = 100 - г)
Номер интервала
iГраница интервала Частота
nixi xi +1 1 5 10 7 2 10 15 8 3 15 20 15 4 20 25 18 5 25 30 23 6 30 35 19 7 35 40 14 8 40 45 10 9 45 50 6 n = 120