К содержанию второй части

Проверка гипотезы о показательном распределении генеральной совокупности

   Задано эмпирическое распределение непрерывной случайной величины X в виде последовательности интервалов хiхi + 1 и соответствующих им частот ni, причем Σ n i = n (объем выборки). Требуется, используя критерий Пирсона, проверить гипотезу о том что случайная величина X имеет показательное распределение.
   П р а в и л о. Для того чтобы при уровне значимости α, проверить гипотезу о том, что непрерывная случайная величина распределена по показательному закону, надо:
  1. Найти по заданному эмпирическому распределению выборочную среднюю xв. Для этого, приняв в качестве «представителя» i-го интервала его середину x*i = (x i + xi + 1)/2, составляют последовательность равноотстоящих вариант и соответствующих им частот.
  2. Принять в качестве оценки параметра λ показательного распределения величину, обратную выборочной средней: λ* = 1/xв.
  3. Найти вероятности попадания X в частичные интервалы (х i, х i +1 ) по формуле
  4. Вычислить теоретические частоты:
    где Σ n i = n - объем выборки.
  5. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s − 2, где s - число первоначальных интервалов выборки: если же было произведено объединение .малочисленных частот, следовательно, и самих интервалов, то s - число интервалов, оставшихся после объединения.
647. Почему при проверке по критерию Пирсона гипотезы о показательном распределении генеральной совокупности число степеней свободы определяется равенством k = s − 2, где s - число интервалов выборки?
   Решение. При использовании критерия Пирсона число степеней свободы k = s − 1 − r, где r -число параметров, оцениваемых по выборке. Показательное распределение определяется одним параметром λ.Так как этот параметр оценивается по выборке, то r = 1 и, следовательно, число степеней свободы k = s − 1 − 1 = s − 2.

648. В результате испытания 200 элементов на длительность работы получено эмпирическое распределение, приведенное в табл. 31 (в первом столбце указаны интервалы времени в часах, во втором столбце - частоты, т. е. количество элементов, проработавших время в пределах соответствующего интервала).

Таблица 1

х i  хi +1 ni хi  хi + 1 ni
0 − 5 13315 – 204
5 − 10 45 20 − 25 2
10 – 15 15 25 – 30 1
    Требуется, при уровне значимости 0,05, проверить гипотезу о том, что время работы элементов распределено по показательному закону.
   Р е ш е н и е.
  1. Найдем среднее время работы всех элементов (в качестве среднего времени работы одного элемента примем середину интервала, которому принадлежит элемент):
    xв = (133·2,5 + 45·7,5 + 15·12,5 + 4·17,5 + 2·22,5 + 1·27,5)200 = 1000/200 = 5.
  2. Найдем оценку параметра предполагаемого показательного распределения:
    λ* = 1/xв = 1/5 = 0,2.
    Таким образом, дифференциальная функция предполагаемого показательного распределения имеет вид
    f (x) = 0,2·e-0,2·x (x > 0).
  3. Найдем вероятности попадания Xв каждый из интервалов по формуле
    Например, для первого интервала Р1 = Р (0 < X < 5) = е -0,2·0 – e -0,2·5 = 1 – е-1 = 1 - 0,3679 = 0,6321.
        Аналогично вычислим вероятности попадания X в остальные интервалы: Р 2 = 0,2326; Р3 = 0,0855; Р4 = 0,0315; Р5 = 0,0116; Р6 = 0,0042.
  4. Найдем теоретические частоты:
    = 200·P i,
    где Р i - вероятность попадания X в i-й интервал. Например, для первого интервала
    n´1 = 200·P1 = 200·0,6321 = 126,42.
    Аналогично вычислим остальные теоретические частоты:
    n´2 = 46,52; n´3 = 17,1; n´4 = 6,3; n´5 = 2,32; n´6 = 0,84.
  5. Сравним эмпирические и теоретические частоты с помощью критерии Пирсона. Для этого составим расчетную таблицу 2, причем объединим малочисленные частоты (4 + 2 + 1 = 7) и соответствующие им теоретические частоты (6,30 + 2,32 + 0,84 = 9,46).

Таблица 2

ininini - ni(nini
1133126,426,5843,29640,3425
24546,52−1,52 2,31040,0497
31517,10−2,10 4,41000,2579
479,46−2,46 6,05160,6397
Σn = 200    
    З а м е ч а н и е. Для упрощения вычислений в случае объединения малочисленных частот целесообразно (объединить и сами интервалы, которым принадлежат малочисленные частоты, в один интервал. Так, в рассматриваемой задаче, объединив последние три интервала получим один интервал (15, 30). В этом случае теоретическая частота
n4 = n·P(15 < X < 30) = 200·0,0473 = 9,46
совпадает с суммой теоретических частот (9,46), приведенной в табл. 2. Из табл. 2 находим: χ²набл = 1,29. По таблице критических точек распределения χ2 (см. приложение), по уровню значимости α = 0,05 и числу степеней свободы k = s − 2 = 4 – 2 = 2 находим критическую точку правосторонней критической области χ²кр (0,05; 2) = 6. Так как χ²набл < χ²кр - нет оснований отвергнуть гипотезу о распределении X по показательному закону. Другими словами, данные наблюдений согласуются с этой гипотезой.


649. В итоге испытания 450 ламп было получено эмпирическое распределение длительности их горения, приведенное в табл. 3 (в первом столбце указаны интервалы в часах, во втором столбце - частота ni, т. е. количество ламп, время горения которых заключёно в пределах соответствующего интервала). Требуется при уровне значимости 0,01 проверить гипотезу о том, что время горения ламп распределено по показательному закону.

Таблица 3

х i - х i +1niх i- хi +1ni
0 – 4001211600 – 200045
400 – 800952000 – 240036
800 – 1200762400 – 280021
1200 - 160056  
   n = 450
    650. В итоге испытаний 1000 элементов на время безотказной работы получено эмпирическое распределение, приведенное в табл. 4 (в первом столбце указаны интервалы времени в часах; во втором столбце - частота ni , т. е. количество отказавших элементов в i - м интервале).

Таблица 4

td>245
х i - хi + 1niхi - хi + 1ni
0 – 1036540 – 5070
10 – 2050 – 6045
20 – 3015060 – 7025
30 – 40100  
   n = 1000
    Требуется при уровне значимости 0,01 проверить гипотезу о том, что время безотказной работы элементов распределено по показательному закону.
   651. В итоге регистрации времени прихода 800 посетителей выставки (в качестве начала отсчета времени принят момент открытия работы выставки) получено эмпирическое распределение, приведенное в табл. 5 (в первом столбце указаны интервалы времени; во втором столбце - частоты ni , т. е. количество посетителей, пришедших в течение соответствующего интервала).

Таблица 5

х i - хi +1ni х iхi + 1 ni
0 – 12594 – 570
1 – 21675 – 647
2 – 31096 – 740
3 – 4747 – 834
      800
Требуется при уровне значимости 0,01 проверить гипотезу о том, что время прихода посетителей выставки распределено по показательному закону.