К содержанию второй части

Графическая проверка гипотезы о нормальном распределении генеральной совокупности. Метод спрямленных диаграмм

   А. Сгруппированные данные. Пусть эмпирическое распределение выборки из генеральной совокупности X задано в виде последовательности интервалов (х0, х1), (х1, х2), …, (хk - 1, хk), и соответствующих им частот ni(ni — число вариант, попавших в i - й интервал). Требуется графически проверить гипотезу о нормальном распределении X.
   Предварительно введем определение р - квантили случайной величины X. Если задана вероятность р, то р-квантилью (квантилем) X называют такое значение аргумента ир функции распределения F(х), для которого вероятность события X < uр равна заданному значению р. Например, если величина X распределена нормально и p =0,975, то uр = и0,975 = 1,96. Это означает, что Р (X < 1,96) =0,975.
   Заметим, что поскольку функция распределения общего и нормированного нормальных распределений связаны равенством
и, следовательно, up = (xpa)/σ.
   Правило 1. Для того чтобы графически проверить гипотезу о нормальном распределении генеральной совокупности X по эмпирическому распределению, заданному в виде последовательности интервалов и соответствующих им частот, надо:
  1. Составить расчетную табл.1. Квантили находят по таблице (см. приложение).

    Таблица 1

    1 2 3 4 5 6 7
    Номер интервала Правый конец интервала Частота Накопленная частота Относительная накопленная частота Относительная накопленная частота, % Квантили
    ix in iPi·100%up i
    В столбце 6 табл. 1 относительные накопленные частоты умножены на 100, так как в таблице приложения эти частоты указаны в процентах.

    Рис.1
  2. Построить в прямоугольной системе координат (х; u) точки (х1; u1), (х2; u2),... (значок р при квантилях опушен для простоты записи ). Если эти точки лежат вблизи некоторой прямой, то нет оснований отвергнуть гипотезу о нормальном распределении X; если же построенные точки удалены от прямой, то гипотезу отвергают.
   З а м е ч а н и е 1. Следует иметь в виду, что «начальные» и «конечные» точки (хi; ui), могут заметно отклоняться от прямой u = (xa)/σ.
   Замечание 2. Если построенные точки оказались вблизи прямой, то легко графически оценить параметры а и σ нормального распределения. В качестве оценки математического ожидания а можно принять абсциссу точки L (хL; 0) пересечения построенной прямой с осью Ох. В качестве оценки среднего квадратического отклонения σ можно принять разность абсцисс точки L (хL; 0) и точки N( хN; − 1) пересечения построенной линии с прямой u = − 1: σ* = хLх N (рис. 1).
   Замечание 3. При наличии вероятностной бумаги надобность в отыскании квантилей отпадает: на соответствующей оси откладывают накопленные относительные частоты.

641. Пусть метод спрямленных диаграмм подтверждает гипотезу о нормальном распределении генеральной совокупности X, т.е. точки (хi; ui) оказались вблизи прямой

u = (x a)/σ.                        (*)
  1. Почему в качестве оценки математического ожидания а нормального распределения можно принять абсциссу хL точки L пересечения прямой (*) с осью Ох(рис.1, а)?
  2. Почему в качестве оценки среднего квадратического отклонения нормального распределения можно принять разность абсцисс х LхN (рис. 1, б)?
            Р е ш е н и е. а) В точке L пересечения прямой (*) с осью Охордината u = 0, абсцисса х = xL(рис. 1, а). Положив в уравнении (*) u = 0, х = xL , получим
0 = (x La)/σ.
Отсюда а = хL.
   б) Обозначим через N такую точку прямой (*), ордината которой u = − 1; абсциссу этой точки обозначим через х N. Подставим координаты точки N в уравнение (*):
- 1 = (xN - a)/σ.
Отсюда σ = а - хN. Учитывая, что а = хL, окончательно получим σ = х L− хN.

642. Из генеральной совокупности X извлечена выборка объема n = 100, которая задана в виде последовательности интервалов одинаковой длины и соответствующих им частот ni (ni - число вариант, попавших в i - й интервал). Эмпирическое распределение приведено в табл. 2.

Таблица 2

Номер интервала i Границы интервала Частота ni Номер интервала i Границы интервала Частота ni
хi - 1 х i хi - 1 х i
1 1 3 2 7 13 15 16
2 3 5 4 8 15 17 11
3 5 7 6 9 17 19 7
4 7 9 10 10 19 21 5
5 9 11 18 11 21 23 1
6 11 13 20       n = 100
Требуется: а) методом спрямленных диаграмм проверить гипотезу о нормальном распределении генеральной совокупности X ; б)оценить графически математическое ожидание и среднее квадратическое отклонение Х. Решение. а) 1. Составим расчетную табл. 3. Квантили для столбца 7 взяты из таблицы приложения.

Таблица 3

Номер интервала i Правый конец интервала xi Частота niНакопленная частота Относительная накопленная частота Относительная накопленная частота, % Pi·100 Квантили upi
1 3 2 2 0,02 2 -2,054
2 5 4 6 0,06 6 -1,55510
3 7 6 12 0,1212 -1 ,17510
4 9 10 22 0,22 22 -0,77210
5 11 18 40 0,40 40 -0,25310
6 13 20 60 0,60 60 0,253
7 15 16 76 0,76 76 0,706
8 17 11 87 0,87 87 1,126
9 19 7 94 0,94 94 1,555
10 21 5 99 0,99 99 2,326
11 23 1 100 1,00 100 3,09
2. Построим в прямоугольной системе координат точки (xi; uр i )(рис. 2).

Рис. 2
Построенные точки лежат вблизи прямой, поэтому нет оснований отвергнуть гипотезу о нормальном распределении X. Другими словами, данные выборки согласуются с этой гипотезой.
   б) Найдем графически оценки математического ожидания и средквадратического отклонения предполагаемого нормального, распределения.
    В качестве оценки математического ожидания а примем абсциссу xL = 12,1 точки L, пересечения построенной прямой с осью Ох.
   Оценим σ, для чего проведем через точку М(0; - 1) вертикальной оси прямую u = -1 до пересечения с построенной прямой в точке N; опустим из точки Nперпендикуляр на ось Ох; абсцисса основания этого перпендикуляра xN = 8. В качестве оценки среднего квадратического отклонения примем разность абсцисс:
σ* = xLxN = 12,1 − 8 = 4,1.
   Разумеется, полученные оценки грубые. В действительности а = 12,04; σ = 4,261.

643. Из генеральной совокупности X извлечена выборка объема n = 120, которая задана в виде последовательности интервалов одинаковой длины и соответствующих им частот (табл. 4).

Таблица 4

Номер интервала i Границы интервала Частота ni Номер интервала i Границы интервала Частота ni
х i-1 х i х i-1 х i
151076303519
2101587354014
3 15 20 15 8 40 45 10
4 20 25 18 9 45 50 6
5 30 35 23        
              n = 120
   Требуется: а) методом спрямленных диаграмм проверить гипотезу о нормальном распределении X; б) оценить графически математическое ожидание и среднее квадратическое отклонение X.
644. Из генеральной совокупности Xизвлечена выборка объема n = 100, заданная табл. 5.

Таблица 5

Номер интервала i Границы интервала Частота ni Номер интервала i Границы интервала Частота ni
х i-1х iх i-1х i
16 16 8 5 46 56 35
2 16 26 16 6 56 66 6
3 26 36 7 7 66 76 5
4 36 46 15 8 76 86 8
n = 100
    Требуется методом спрямленных диаграмм проверить гипотезу о нормальном распределении X.

Б. Несгруппированные по интервалам данные

   Пусть эмпирическое распределение выборки задано в виде последовательности вариант х i, расположенных в возрастающем порядке, т. е. в виде вариационного ряда, и соответствующих им частот ni. Требуется графически проверить гипотезу о нормальном распределении X.
   П р а в и л о 2. Для того чтобы по несгруппированной по интервалам выборке объема n проверить гипотезу о нормальном распределении генеральной совокупности X, из которой извлечена выборка, надо:
  1. Составить расчетную табл. 6. Сразу укажем, что при заполнении столбца 4 принято из суммы частот вычитать 1/2; значения квантилей для заполнения столбца 7 находят по таблице (см. приложение).
  2. Построить в прямоугольной системе координат точки (х1; u1),(х2; u2), …, (хk; uk ) (значок р при u опущен для простоты записи). Если эти точки лежат вблизи некоторой прямой (в случае справедливости гипотезы о нормальном распределении X уравнение этой прямой) u = (x - x)/σв), то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности X; в противном случае гипотезу отвергают.
       З а м е ч а н и е 4. Замечания 1 - 3, приведенные выше для сгруппированной по интервалам выборки, остаются в силе.
645. Из генеральной совокупности X извлечена выборка объема n = 50, несгруппированная по интервалам (в первой строке указаны варианты, а во второй - соответствующие частоты):
х i 1,40 1,52 1,63 1,69 1,73 1,78 1,89 1,92 1,95
ni 1 1 1 1 2 1 1 1 1

х i1,98 1,99 2,03 2,072,12 2,16 2,20 2,23 2,26 2,31
ni 1 1 2 1 3 2 1 1 1 3

х i 2,36 2,40 2,44 2,47 2,50 2,52 2,55 2,60 2,64
ni 3 3 1 1 1 1 1 1 3

х i 2,71 2,74 2,78 2,86 2,93 3,02 3,30
ni 1 1 2 1 2 1 1
   Требуется: а) методом спрямленных диаграмм проверить гипотезу о нормальном распределении X; б) оценить графически математическое ожидание и среднее квадратическое отклонение X.
   Решение. 1. Составим расчетную табл. 7.
   2. Построим в прямоугольной системе координат точки (х i , ui) (рис. 3).

(рис. 3)
Построенные точки лежат вблизи прямой, поэтому нет оснований отвергнуть гипотезу о нормальном распределении X, данные выборки согласуются с этой гипотезой.
б) Найдем графически, используя рис. 2, оценки математического ожидания и среднего квадратического отклонения предполагаемого нормального распределения.
   В качестве оценки математического ожидания а примем абсциссу х L = 2,30 точки L пересечения построенной прямой с осью Ох.

Таблица 7

Номер варианта i ВариантахiЧастота niНакопленная частота минус 1/2
Ni = − 1/2
Относительная накопленная частота
Относительная накопленная частота, % Pi = F*×100Квантили uPi
11,4010,50,011− 2,326
21,5211,50,033− 1,881
31,6312,50,055− 1,645
41,6913,50,077− 1,476
5 – 61,7325,50,1111− 1,227
71,7816,50,1313− 1,126
81,8917,50,1515− 1,036
9 1,92 1 8,5 0,17 17 − 0,954
10 1,95 1 9,5 0,19 19 − 0,878
11 1,98 1 10,5 0,21 21 − 0,806
12 1,99 1 11,5 0,23 23 − 0,739
13 – 14 2,03 2 13,5 0,27 27 − 0,613
15 2,07 1 14,5 0,29 29 − 0,553
16 – 18 2,12 3 17,5 0,35 35 − 0,385
19 – 20 2,16 2 19,5 0,39 39 − 0,279
21 2,20 1 20,5 0,41 41 − 0,228
22 2,23 1 21,5 0,43 43 − 0,176
23 2,26 1 22,5 0,45 45 − 0,126
24 - 26 2,31 3 25,5 0,51 51 0,025
27 - 29 2,36 3 28,5 0,57 57 0,176
30 - 32 2,40 3 31,5 0,63 63 0,332
33 2,44 1 21,5 0,65 65 0,385
34 2,47 1 33,5 0,67 67 0,440
35 2,50 1 34,5 0,69 69 0,496
362,52 135,50,71710,553
372,55 1 36,5 0,73 73 0,613
38 2,60 1 37,5 0,75 75 0,674
39 - 41 2,64 3 40,5 0,81 81 0,878
42 2,71 1 41,5 0,83 83 0,954
43 2,74 1 42,5 0,85 85 1,036
44 - 45 2,78 2 44,5 0,89 89 1,227
46 2,86 1 45,5 0,91 91 1,341
47 - 48 2,93 2 47,5 0,95 95 1,645
49 1,02 1 48,5 0,97 97 1,881
50 1,30 1 49,5 0,99 99 2,326
   Оценим σ, для чего проведем через точку М (0; -1) вертикальной оси прямую u = − 1 до пересечения с построенной прямой линией в точке N ; опустим из точки N перпендикуляр на ось Ох; абсцисса основания этого перпендикуляра х N = 1,90. В качестве оценки среднего квадратического отклонения σ примем разность абсцисс:
σ = х L - х N = 2 , 30 − 1,90 = 0,40.
646. Из генеральной совокупности X извлечена выборка объема n = 50. Составлены следующие таблицы (в первой строке указаны варианты, а во второй - соответствующие частоты):
х i − 20,0 − 17,0 − 14,1 − 11,5 − 10,5
ni 1 1 1 1 1

х i− 9,0 − 8,0 − 6,5 − 5,5
ni 1 1 1 1

х i − 4,0 − 3,0 − 1,5 − 1,0 − 0,0 − 0,5
ni 1 1 1 1 1 2

х i 1,0 1,5 2,0 2,5 3,5 4,0 4,5
ni 1 1 2 1 1 2 1

х i 5,0 6,0 6,5 7,0 8,0 8,5 9,5 10,0 10,5 11,0 12,0 12,5
ni 2 1 1 2 2 2 1 1 1 1 1 1

х i 13,0 14,0 14,5 17,0 18,0 19,0 19,5 21,0 23,5
ni 1 1 1 1 1 1 1 1 1
   Требуется: а) методом спрямленных диаграмм проверить гипотезу о нормальном распределении генеральной совокупности X ; б) оценить графически математическое ожидание и среднее квадратическое отклонение X. Указание. Использовать таблицу квантилей (см. приложение).