К содержанию второй части
  1. Основные сведения
  2. Сравнение двух дисперсий нормальных генеральных совокупностей (554 – 559)
  3. Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона

СТАТИСТИЧЕСКАЯ ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Основные сведения

 Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.
 Нулевой (основной) называют выдвинутую гипотезу Hо.
 Конкурирующей (альтернативной) называют гипотезу H1, которая противоречит нулевой.
 Различают гипотезы, которые содержат одно и более одного предположений.
 Простой называют гипотезу, содержащую только одно предположение.
 Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
 В итоге проверки гипотезы могут быть допущены ошибки двух родов.
 Ошибка первого рода состоит в том, что будет отвергнута правильная нулевая гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через α.
 Ошибка второго рода состоит в том, что будет принята неправильная нулевая гипотеза. Вероятность ошибки второго рода обозначают через β.
 Статистическим критерием (или просто критерием) называют случайную величину К, которая служит для проверки гипотезы.
 Наблюдаемым (эмпирическим) значением Kнабл называют то значение критерия, которое вычислено по выборкам.
 Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.
 Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых нулевую гипотезу принимают.
 Основной принцип проверки статистических гипотез: если наблюдаемое значение критерия принадлежит критической области, то нулевую гипотезу отвергают; если наблюдаемое значение критерия принадлежит области принятия гипотезы, то гипотезу принимают.
 Критическими точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы.
 Правосторонней называют критическую область, определяемую неравенством К > kкр, где kкр – положительное число.
 Левосторонней называют критическую область, определяемую неравенством К < kкр, где kкр – отрицательное число.
 Двусторонней называют критическую область, определяемую неравенством К < k1, К > k2, где k2 > k1. В частности, если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенствами (в предположении, что kкр > 0)
К < − kкр, К > kкр,
или равносильным неравенством
|К| > kкр.
 Для отыскания критинеской области задаются уровнем значимости α и ищут критические точки, исходя из следующих соотношений:
а) для правосторонней критической области
Р (К > kкр) = α при kкр > 0
б) для левосторонней критической области
Р (К < kкр) = α при kкр < 0
в) для двусторонней симметричной области
Р (К > kкр) = α/2; при kкр > 0
Р (К < − kкр) = α/2.
 Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.

Сравнение двух дисперсий нормальных генеральных совокупностей

 По независимым выборкам, объемы которых n1, n2, извлеченным из нормальных генеральных совокупностей, найдены исправленные выборочные дисперсии s2(X) и s2(Y). Требуется сравнить эти дисперсии.
 Правило 1. Для того чтобы при заданном уровне значимости α проверить нулевую гипотезу H0: D(Х) = D(Y) о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе Н1: D(Х) > D(Y), надо вычислить наблюдаемое значение критерия (отношение большей исправленной дисперсии к меньшей)
Fнабл = s2большее/s2меньшее
и по таблице критических точек распределения Фишера—Снедекора, по заданному уровню значимости α и числам степеней свободы k1 = n1 − 1,k2 = n2 − 1 (k1 – число степеней свободы большей исправленной дисперсии) найти критическую точку Fкр (α; k1; k2). Если Fнабл < Fкр – нет оснований отвергнуть нулевую гипотезу. Если Fнабл > Fкр – нулевую гипотезу отвергают.
 Правило 2. При конкурирующей гипотезе Н1: D(Х) ≠ D(Y) критическую точку Fкр (α/2; k1; k2) ищут по уровню значимости α/2 (вдвое меньшему заданного) и числам степеней свободы k1 и k2 (k1 – число степеней свободы большей дисперсии). Если Fнабл < Fкр – нет оснований отвергнуть нулевую гипотезу. Если Fнабл > Fкр – нулевую гипотезу отвергают.
  1. По двум независимым выборкам, объемы которых n1 = 11 и n2 = 14, извлеченным из нормальных генеральных совокупностей X и Y, найдены исправленные выборочные дисперсии s2(X) = 0,76 и s2(Y) = 0,38. При уровне значимости α = 0,05, проверить нулевую гипотезу H0: D(Х) = D(Y) о равенстве генеральных дисперсий, при конкурирующей гипотезе Н1: D(Х) > D(Y).
    Решение. Найдем отношение большей исправленной дисперсии к меньшей:
    Fнабл = 0,76/0,38 = 2.
    По условию конкурирующая гипотеза имеет вид D(Х) > D(Y) поэтому критическая область – правосторонняя. По таблице Фишера—Снедекора, по уровню значимости α = 0,05 числам степеней свободы k1 = n1 − 1 = 11 − 1 = 10, k2 = n2 − 1 = 14 − 1 = 13 находим критическую точку
    Fкр (0,05; 10; 13) =2,67.
    Так как Fнабл < Fкр – нет оснований отвергнуть гипотезу о равенстве генеральных дисперсий. Другими словами, выборочные исправленные дисперсии различаются незначимо.
  2. По двум независимым выборкам, объемы которых n1 = 9 и n2 = 16, извлеченным из нормальных генеральных совокупностей X и Y, найдены исправленные выборочные дисперсии s2(X) = 34,02 и s2(Y) = 12,15. При уровне значимости 0,01, проверить нулевую гипотезу H0: D(Х) = D(Y) о равенстве генеральных дисперсий при конкурирующей гипотезе Н1: D(Х) > D(Y).
  3. По двум независимым выборкам, объемы которых n1 = 14 и n2 = 10, извлеченным из нормальных генеральных совокупностей X и Y, найдены исправленные выборочные дисперсии s2(X) = 0,84 и s2(Y) =2,52. При уровне значимости α = 0,1, проверить нулевую гипотезу H0: D(Х) = D(Y) о равенстве генеральных дисперсий при конкурирующей гипотезе Н1: D(Х) ≠ D(Y).
    Р е ш е н и е . Найдем отношение большей исправленной дисперсии к меньшей:
    Fнабл = 2,52/0,84 = 3.
    По условию конкурирующая гипотеза имеет вид D(Х) ≠ D(Y), поэтому критическая область – двусторонняя. В соответствии с правилом 2 при отыскании критической точки следует брать уровень значимости, вдвое меньший заданного. По таблице Фишера—Снедекора, по уровню значимости α /2 = 0,1/2 = 0,05 и числам степеней свободы k1 = 10 − 1 = 9 и k2 = 14 − 1= 13, находим критическую точку
    Fкр (0,05; 9; 13) =2,71.
    Так как Fнабл > Fкр – нулевую гипотезу о равенстве генеральных дисперсий отвергаем.
  4. По двум независимым выборкам, объемы которых n1 = 9 и n2 = 6, извлеченным из нормальных генеральных совокупностей X и Y, найдены выборочные дисперсии Dв( Х ) = 14,4 И Dв( Y ) = 20,5. При уровне значимости 0,1 проверить нулевую гипотезу H0: D(Х) = D(Y) о равенстве генеральных дисперсий при конкурирующей гипотезе Н1: D(Х) ≠ D(Y).
    Указание. Найти исправеленные дисперсии
    .
  5. Двумя методами проведены измерения одной и той же физической величины. Получены следующие результаты:
    а) в первом случае х1 = 9,6; х2 = 10,0; х3 = 9,8; х4 = 10,2; х5 = 10,6;
    б) во втором случае y1 = 10,4; y2 = 9,7; y3 = 10,0; y410,3.
    Можно ли считать, что оба метода обеспечивают одинаковую точность измерений, если принять уровень значимости α 0,1? Предполагается, что результаты измерений распределены нормально и выборки независимы.
     Решение. Будем судить о точности методов по величинам дисперсий. Таким образом, нулевая гипотеза имеет вид H0: D(Х) = D(Y). В качестве конкурирующей примем гипотезу Н1: D(Х) ≠ D(Y).
     Найдем выборочные дисперсии. Для упрощения вычислений перейдем к условным вариантам:
    ui = 10 хi − 100, vi = 10 yi − 100.
    В итоге получим условные варианты
    ui − 4 0 − 2 2 6
    vi 4 −3 0 3 
    Найдем исправленные выборочные дисперсии:
     Сравним дисперсии. Найдем отношение большей исправленной дисперсии к меньшей (каждая из дисперсий увеличилась в 102 раз, но их отношение не изменилось):
    .
    По условию конкурирующая гипотеза имеет вид Н1: D(Х) ≠ D(Y), поэтому критическая область двусторонняя и в соответствии с правилом 2 при отыскании критической точки следует брать уровень значимости, вдвое меньший заданного.
     По таблице Фишера—Снедекора, по уровню значимости α/2=0,1/2 = 0,05 и числам степеней свободы k1 = n1 − 1 = 5 − 1 = 4 и k2 = n2 − 1 = 4 − 1 = 3 находим критическую точку Fкр (0,05; 4; 3) = 9,12.
     Так как Fнабл < Fкр нет оснований отвергнуть нулевую гипотезу о равенстве генеральных дисперсий. Другими словами, исправленные дисперсии различаются незначимо и, следовательно, оба метода обеспечивают одинаковую точность измерений.
  6. Для сравнения точности двух станков-автоматов взяты две пробы (выборки), объемы которых n1 = 10 и n2 = 8. В результате измерения контролируемого размера отобранных изделий получены следующие результаты

    xi 1,08; 1,10; 1,12; 1,14; 1,15; 1,25; 1,36; 1,38; 1,40; 1,42;

    yi 1,11; 1,12; 1,18; 1,22; 1,33; 1,35; 1,36; 1,38.

    Можно ли считать, что станки обладают одинаковой точностью [H0: D(Х) = D(Y)], если принять уровень значимости α = 0,1 и в качестве конкурирующей гипотезы Н1: D(Х) ≠ D(Y).
     Указание. Для упрощения вычислений перейти к условным вариантам ui = 100 хi − 124, vi = 100 yi − 126.

Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона

 Эмпирическое распределение задано в виде последовательности равноотстоящих вариант и соответствующих им частот.
 Пусть эмпирическое распределение задано в виде последовательности равноотстоящих вариант и соответствующих им частот:
xi x1 x2 xN
ni n1 n2 nN
 Требуется, используя критерий Пирсона, проверить гипотезу о том, что генеральная совокупность X распределена нормально.
 Правило 1. Для того чтобы при заданном уровне значимости α проверить гипотезу о нормальном распределении генеральной совокупности, надо:
  1. Вычислить непосредственно выборочную среднюю xв и выборочное среднее квадратическое отклонение σв
  2. Вычислить теоретические частоты
    ,
    где n – объем выборки (сумма всех частот), h – шаг (разность между двумя соседними вариантами),
    .
  3. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:
    1. а) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия
      ;
    2. б) по таблице критических точек распределения χ2, по веданному уровню значимости α и числу степеней свободы k = s − 3,(s – число групп выборки) находят критическую точку χкр2 (α; k) правосторонней критической области.
 Если χнабл2 < χкр2 нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются незначимо (случайно).
 Если χнабл2 > χкр2 – гипотезу отвергают. Другими словами, эмпирические и теоретические частоты различаются значимо.
 Замечание 1. М алочисленные частоты (ni < 5) следует объединить; в этом случае и соответствующие им теоретические частоты также надо сложить. Если производилось объединение частот, то при определении числа степеней свободы по формуле k = s − 3 следует в качестве s принять число групп выборки, оставшихся после объединения частот.
  1. Почему при проверке с помощью критерия Пирсона гипотезы о нормальном распределении генеральной совокупности число степеней свободы находят по формуле k = s − 3 ?
     Решение. При использовании критерия Пирсона число степеней свободы k = s − 1 − r, где r – число параметров, оцениваемыз по выборке. Нормальное распределение определяется двумя параметрами: математическим ожиданием а и средним квадратический отклонением σ. Так как оба эти параметра оценивались по выборке (в качестве оценки а принимают выборочную среднюю, в качестве оценки σ – выборочное среднее квадратическое отклонение), то r = 2 следовательно, k = s − 1 − 2 = s − 3.
  2. Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объема n = 200:
    xi 5 7 8 11 13 15 17 19 21
    ni 15 26 25 30 26 21 24 20 13
     Решение. Найдем выборочную среднюю xв = 12,63 и выборочное среднее квадратическое отклонение σв = 4,695.
    2. Вычислим теоретические частоты, учитывая, что n = 200, h = 2, σв = 4,695, по формуле
    .
    Составим расчетную таблицу (значения функции φ(ui) помещены в приложении).
    i xi φ(ui) ni' = 85,2·φ(ui)
    1 5 −1,62 0,1074 9,1
    2 7 −1,20 0,1942 16,5
    3 9 −0,77 0,2966 25,3
    4 11 −0,35 0,3752 32,0
    5 13 0,08 0,3977 33,9
    6 15 0,51 0,3503 29,8
    7 17 0,93 0,2589 22,0
    8 19 1,36 0,1582 13,5
    9 21 1,78 0.0818 7,0
    3. Сравним эмпирические и теоретические частоты,
    а) Составим расчетную таблицу, из которой найдем наблюдаемое значение критерия
    ;
    i ni ni' nini' (nini')2 (nini')2/ni'
    1 15 9,1 5,9 34,81 3,8
    2 26 16,5 9,5 90,25 5,5
    3 25 25,3 −0,3 0,09 0,0
    4 30 32,0 −2,0 4,00 0,1
    5 26 33,9 −7,9 62,41 1,8
    6 21 29,8 −8,8 77,44 2,6
    7 24 22,0 2,0 4,00 0,2
    8 20 13,5 6,5 42,25 3,1
    9 13 7,0 6,0 36,00 5,1
    Σ 200       χнабл2 =22,2
    Находим χнабл2 =22,2.
    б) По таблице критических точек распределения χ2 (см. приложение), по уровню значимости α = 0,05 и числу степеней свободы k = s − 3 = 9 − 3 = 6 находим критическую точку правосторонней критической области
    χкр2 (0,05; 6) = 12,6.
    Так как χнабл2 > χкр2 – гипотезу о нормальном распределении генеральной совокупности отвергаем. Другими словами, эмпирические и теоретические частоты различаются значимо.
  3. Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объема n = 200:
    xi 0,3 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,1 2,3
    ni 6 9 26 25 30 26 21 24 20 8 5
  4. Используя критерий Пирсона, при уровне значимости 0,01 установить, случайно или значимо расхождение между эмпирическими частотами ni и теоретическими частотами ni', которые вычислены, исходя из гипотезы о нормальном распределении генеральной совокупности X:
    ni 8 16 40 72 36 18 10
    ni' 6 18 36 76 39 18 7
  5. Используя критерий Пирсона, при уровне значимости 0,05 установить, случайно или значимо расхождение между эмпирическими частотами ni и теоретическими частотами ni', которые вычислены исходя из гипотезы о нормальном распределении генеральной совокупности Х:
    1. a)
      ni 5 10 20 8 7
      ni' 6 14 18 7 5
    2. б)
      ni 6 8 13 15 20 16 10 7 5
      ni' 5 9 14 16 18 16 9 6 7
    3. в)
      ni 14 18 32 70 20 36 10
      ni' 10 24 34 80 18 22 12
    4. г)
      ni 5 7 15 14 21 16 9 7 6
      ni' 6 6 14 15 22 15 8 8 6

Эмпирическое распределение задано в виде последовательности интервалов одинаковой длины и соответствующих им частот

 Пусть эмпирическое распределение задано в виде последовательности интервалов (хi, хi + 1) и соответствующих им частот ni, (ni – сумма частот, которые попали в i-й интервал);
(x1, x2) (x2, x3) (хs, хs + 1)
n1 n2 ns
 Требуется, используя критерий Пирсона, проверить гипотезу о том, что генеральная совокупность X распределена нормально.
 Правило 2. Для того чтобы при уровне значимости α проверить пшпезу о нормальном распределении генеральной совокупности надо:
  1. Вычислить выборочную cреднюю x и выборочное среднее квадратическое отклонение σв причём в качестве вариант хв* принимают среднее арифметическое концов интервала:
    xi* = (xi + xi +1)/2.
  2. Пронормировать X, т. е. перейти к случайной величине Z = (Xx*)/σ* и вычислить концы интервалов: zi = (xix*)/σ*, zi+1 = ( xi+1x*)/σ*причем наименьшее значение Z, т. е. z1, полагают равным −∞. а наибольшее, т. е. zs+1, полагают равным ∞.
  3. Вычислить теоретические частоты
    ni’ = n·Pi,
    где n – объем выборки (сумма всех частот); Pi = Ф(zi+1) − Ф (zi) вероятности попадания X в интервалы (хi, хi + 1); Ф (Z) – функция Лапласа.
  4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:
    а) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия Пирсона
    ;
    б) по таблице критических точек распределения χ2, по заданному уровню значимости α и числу степеней свободы k = s − 3 (s – число интервалов выборки) находят критическую точку правосторонней критической области χкр2 (α; k).
     Если χнабл2 < χкр2 – ytn оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Если χнабл2 > χкр2 – гипотезу отвергают.
     Замечание 2. Интервалы, содержащие малочисленные эмпирические частоты (n < 5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формулеk = s − 3 следует в качестве s принять число интервалов, оставшихся после объединения интервалов.
  1. Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объема n = 100, приведенным в таблице
    Номер интервала
    i
    Граница интервала Частота
    ni
    xi xi +1
    1 3 8 6
    2 8 13 8
    3 13 18 15
    4 18 23 40
    5 23 28 16
    6 28 33 8
    7 33 38 7
          n = 100
     

    Решение 1. Вычислим выборочную среднюю и выборочное среднее квадратическое отклонение. Для этого перейдем от заданного интервального распределения к распределению равноотстоящих вариант, приняв в качестве варианты xi* ( среднее арифметическое концов интервала xi* = (xi + xi +1)/2. В итоге получим распределение:

    xi* 5,5 10,5 15,5 20,5 25,5 30,5 35,5
    ni 6 8 15 40 16 8 7

    Найдем выборочную среднюю и выборочное среднее квадратическое отклонение: x* = 20,7, σ* = 7,28.

    Найдем интервалы (zi, zi+1), учитывая, что x* = 20,7, σ* = 7,28, 1/σ* = 0,137. Для этого составим расчетную таблицу (левым конец первого интервала примем равным − ∞, а правьш конец последнего интервала ∞).

    i Границы интервала xix* xi +1x* Границы интервала
    xi xi +1 zi = (xix*)/σ* zi+1 = ( xi+1x*)/σ*
    1 3 8 −12,7 − ∞ −1,74
    2 8 13 −12,7 −7,7 −1,74 −1,06
    3 13 18 −7,7 −2,7 −1,06 −0,37
    4 18 23 −2,7 2,3 −0,37 0,32
    5 23 28 2,3 7,3 1,32 1,00
    6 28 33 7,3 12,3 1,00 1,69
    7 33 38 12,3 1,69

    Найдем теоретические вероятности Рi, и теоретические частоты ni’ = n·Pi = 100·Рi. Для этого составим расчетную таблицу

    i Границы интервала Ф (zi) Ф (zi +1) Pi = Ф (zi +1) − Ф (zi) ni' = 100·Pi
    zi zi +1
    1 −1,74 −0,5 −0,4591 0,04 4,09
    2 −1,74 −1,06 −0,4591 −0,3554 0,1037 10,37
    3 −1,06 −0,37 −0,3554 −0,1443 0,2111 21,11
    4 −0,37 0,32 −0,1443 0,1255 0,2698 26,98
    5 0,32 1,00 0,1255 0,3413 0,2158 21,58
    6 1,00 1,69 0,3413 0,4545 0,1132 11,32
    7 1,69   0,4545 0,5 0,0455 7,55
    Σ         1 100

     4. Сравним эмпирические и теоретические частоты, используя критерий Пирсона:
     а) вычислим наблюдаемое значение критерия Пирсона. Для этого составим расчетную таблицу. Столбцы 7 и 8 служат для контроля вычислений по формуле

    ;
    1 2 3 4 5 6 7 8
    i ni ni' nini' (nini')2 (nini')2/ni' ni2 ni2/ni'
    1 6 4,09 1,91 3,6481 0,8920 36 8,8019
    2 8 10,37 −2,37 5,6169 0,5416 64 6,1716
    3 15 21,11 −6,11 37,3321 1,7684 225 10,6584
    4 40 26,98 13,02 169,5204 6,2833 1600 50,3052
    5 16 21,58 −5,58 31,1364 1,4428 256 11,8628
    6 8 11,32 −3,32 11,0224 0,9737 64 5,6537
    7 7 4,55 2,45 6,0025 1,3192 49 10,7692
    Σ 100 100     χнабл2 = 13,22   113,22
     Контроль:
    χнабл2 = Σ (ni2/ni') − n = 113,22 − 100 = 13,22.
     Вычисления произведены правильно;
     б) по таблице критических точек распределения χ2 (приложение 5), по уровню значимости α = 0,05 и числу степеней свободы k = s − 3 = 7 − 3 = 4 (s – число интервалов) находим критическую точку правосторонней критической области χкр2 (0,05; 4) = = 9,5.


     Так как χнабл2 > χкр2 – – отвергаем гипотезу о нормальном распределении генеральной совокупности X; другими словами, эмпирические и теоретические частоты различаются значимо. Это означает, что данные наблюдений не согласуются с гинотезой о нормальном распределении генеральной совокупности.
  2. Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с заданным эмпирическим распределением.
    1. а)
      Номер интервала
      i
      Граница интервала Частота
      ni
      xi xi +1
      1 -20 -10 20
      2 -10 0 47
      3 0 10 80
      4 10 20 89
      5 20 30 40
      6 30 40 16
      7 40 50 8
            n = 300
    2. б)
      Номер интервала
      i
      Граница интервала Частота
      ni
      xi xi +1
      1 1 3 2
      2 3 5 4
      3 5 7 6
      4 7 9 10
      5 9 11 18
      6 11 13 20
      7 13 15 16
      8 15 17 11
      9 17 19 7
      10 19 21 5
      11 21 23 1
            n = 100
    3. в)
      Номер интервала
      i
      Граница интервала Частота
      ni
      xi xi +1
      1 6 16 8
      2 16 26 7
      3 26 36 16
      4 36 46 35
      5 46 56 15
      6 56 66 8
      7 66 76 6
      8 76 86 5
            n = 100
    4. г)
      Номер интервала
      i
      Граница интервала Частота
      ni
      xi xi +1
      1 5 10 7
      2 10 15 8
      3 15 20 15
      4 20 25 18
      5 25 30 23
      6 30 35 19
      7 35 40 14
      8 40 45 10
      9 45 50 6
            n = 120
б) У к а з а н и е. Объединить малочисленные частоты первых двух и последних двух интервалов, а также сами интервалы.