СОДЕРЖАНИЕ РАЗДЕЛА "СТАТИСТИКА"
  1. Понятие статистической гипотезы.
  2. Общая постановка задачи проверки гипотез.
  3. Критерий согласия.
  4. Критическая область. Область принятия гипотезы. Критические точки.
  5. Отыскание правосторонней критической области.
  6. Отыскание левосторонней и двусторонней критических областей.
  7. Сравнение выборочной средней с гипотетической генеральной средней нормальной совокупности.
  8. Примеры.
  9. Основные формулы, используемые при проверке гипотез о значении параметров распределений.
  10. Вопросы для самопроверки.

Понятие статистической гипотезы

   Статистической называют такие гипотезы, которые относятся или к виду, или к отдельным параметрам распределения случайной величины.
   Примеры статистических гипотез: В первой гипотезе сделано предположение о виде неизвестного распределения, во второй – о параметрах двух неизвестных распределений.

Общая постановка задачи проверки гипотез

Пусть f(x, θ)  - закон распределения случайной величины Х, зависящей от одного параметра θ. Предположим, что необходимо проверить гипотезу о том, что θ = θ0. Назовём эту гипотезу нулевой и обозначим её через Н0.
   Гипотезу о том, что θ ≠ θ0, назовём конкурирующей и обозначим через Н1. Иногда гипотезу Н1, которая противоречит основной, называют альтернативной гипотезой.
   Простой называют гипотезу, содержащую только одно предложение.
   Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
   Ставится задача проверки гипотезы Н0 на основании выборки, состоящей из n независимых наблюдений x1, x2,… xn над случайной величиной Х. Всё возможное множество выборок объёма n можно разделить на два непересекающихся подмножества (условно обозначим их через "О" и " W") таких, что проверяемая гипотеза Н0 должна быть отвергнута, если наблюдаемая выборка попадёт в подмножество "W", и принята, если выборка принадлежит подмножеству "О". Подмножество " W" называют критической областью; "О"- областью допустимых значений.
   При выборе критической области следует иметь в виду, что принимая или отклоняя гипотезу Н0 можно допустить ошибки двух видов:    Вероятности ошибок первого и второго рода однозначно определяются выбором критической области W. Для любой заданной критической области W условимся обозначать через α вероятность ошибки первого рода, через β - вероятность ошибки второго рода. То есть доля ложных заключений равна α, если верна гипотеза Н0, и β если верна гипотеза Н1.
   Вероятность совершить ошибку первого рода принято называть уровнем значимости.

Критерий согласия

   Статистическим критерием называют случайную величину К, которая служит для проверки нулевой гипотезы.
   Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают наблюдаемое значение критерия. Наблюдаемым значением Кнабл называют значение критерия, вычисленное по выборкам.

Критическая область. Область принятия гипотезы. Критические точки

   После выбора определённого критерия множество возможных значений разбивается на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая – при которых она принимается.
   Критической областью называется совокупность значений критерия, при которых нулевую гипотезу отвергают. Областью принятия гипотезы называют совокупность значений критерия, при которых гипотезу принимают.
   Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают.
   Критическими точками (границами) kкр называют точки, называют точки, отделяющие критическую область от области принятия гипотезы.
   Правосторонней называют критическую область, определяемую неравенством К > kкр, где kкр – положительное число.
   Левосторонней называют критическую область, определяемую неравенством К < kкр, где kкр – отрицательное число.
   Левостороннюю и правостороннюю критические области называются односторонними.
   Двусторонней называют критическую область, определяемую неравенствами К < k1, K > k2, где k2 > k1.

Отыскание правосторонней критической области

   Для отыскания критической точки задаются достаточно малым уровнем значимости α. Затем ищут критическую точку kкр, исходя из требования, чтобы из условия справедливости нулевой гипотезы вероятность того, что критерий К примет значение, большее kкр > 0, была равна принятому уровню значимости: P(K > kкр) = α.
   Поскольку вероятность события K > k кр мала (α – малая величина), то такое событие при справедливости нулевой гипотезы, в силу принципа практической невозможности маловероятных событий, в единичном испытании не должно наступить. Если же оно произошло, т. е. Кнабл > kкр, то это можно объяснить, что нулевая гипотеза ложна, и, следовательно, должна быть отвергнута.
   Для каждого критерия имеются соответствующие таблицы, по которым находят критическую точку, удовлетворяющую этому требованию.
   Когда критическая точка уже найдена, вычисляют по данным выборок наблюдаемое значение критерия и, если окажется, что Кнабл > k кр, то нулевую гипотезу отвергают; если же Кнабл < k кр, то нет оснований, чтобы отвергнуть нулевую гипотезу. Данные наблюдений согласуются с нулевой гипотезой и, следовательно, не дают оснований её отвергнуть.

Отыскание левосторонней и двусторонней критических областей

   Отыскание левосторонней и двусторонней критических областей сводится к нахождению соответствующих критических точек.
   Левосторонняя критическая область определяется неравенством К < kкр, (kкр < 0). Критическую точку находят исходя из требования, чтобы при справедливости нулевой гипотезы вероятность того, что критерий примет значение, меньшее kкр, была равна принятому уровню значимости:
P( K < kкр ) = α.
   Двусторонняя критическая область определяется неравенствами К < k1, К > k2. Критические точки находят исходя из требования, чтобы при справедливости нулевой гипотезы сумма вероятностей того, что критерий примет значение, меньшее k1 или большее k2, была равна принятому уровню значимости:
P( K < k1) + P(K > k2) = α.
   Критические точки в этом случае могут быть выбраны бесчисленным множеством способов. Если же распределение критерия симметрично относительно нуля и имеются основания выбрать симметричные относительно нуля точки – k кр и k кр (k кр > 0), то
P(K < - k кр) = P(K > k кр),
и в этом случае получим
P( K > k кр) = α/2.
Это соотношение и служит для отыскания критических точек двусторонней критической области.

Сравнение выборочной средней с гипотетической генеральной средней нормальной совокупности

   Правило 1. Для того, чтобы при заданном уровне значимости α проверить нулевую гипотезу Н0 : m = μ0 о равенстве генеральной средней m нормальной совокупности с известной дисперсией σ ² гипотетическому значению μ0 при конкурирующей гипотезе, надо Если |k набл| > k кр, – нулевую гипотезу отвергают.
   Правило 2. При конкурирующей гипотезе Н1: m > m0 критическую точку правосторонней области находят из равенства
Если k набл < k кр – нет оснований отвергнуть нулевую гипотезу. Если k набл > k кр, – нулевую гипотезу отвергают.
   Правило 3. При конкурирующей гипотезе Н1: m < m0 сначала находят критическую точку k кр по правилу 2, а затем полагают границу левосторонней критической области k’кр = - kкр.
   Если k набл > - k кр – нет оснований отвергнуть нулевую гипотезу. Если k набл < - k кр – нулевую гипотезу отвергают.

Примеры

   Пример 1. По результатам восьми замеров установлено, что среднее время изготовления детали равно x = 48 c. Предполагая, что время изготовления есть нормально распределённая случайная величина с σ = 3 с, необходимо:
А. Проверить на уровне значимости α = 0,01 нулевую гипотезу Н0: m = m0 = 50с при конкурирующей гипотезе Н1: mm0.
   Решение. Найдём наблюдаемое значение критерия
   По условию конкурирующая гипотеза имеет вид mm0, поэтому критическая область двусторонняя. Найдём критическую точку:
kкр = Ф-1((1 - α)/2) = Ф-1((1 - 0,01)/2) = Ф-1(0,495) = 1,96.
Так как |kнабл | < kкр, то нулевую гипотезу скорее всего принимаем, чем отвергаем.
B) Проверить на уровне значимости α = 0,05 гипотезу Н0: m = 50 с при конкурирующей гипотезе Н1: m > 50с.
   Решение: Так как конкурирующая гипотеза имеем вид m > 50с, то критическая область правосторонняя. Найдём критическую точку из равенства
Ф(kкр) = (1 - 2·α)/2 = (1 - 2·0,05)/2 = 0,45.
По таблице функции Лапласа находим kкр = 1,65. Так как kнабл < kкр, то нулевую гипотезу скорее всего принимаем.
   Пример 2. На основании n = 9 измерений найдено, что средняя высота сальниковой камеры равна x = 51мм, а S = 0,8 мм. В предположении о нормальном распределении проверить на уровне значимости α = 0,01 нулевую гипотезу Н0: m0 = 50мм.    A. При конкурирующей гипотезе Н1: m = 52мм.
   Решение: Для проверки гипотезы Н0: m0 = 50мм при Н1: m = 52мм, если S = 0,8 мм рассчитаем наблюдаемое значение статистики критерия:
Граница критической области в случае правосторонней критических областей ищется по таблице Стьюдента
t кр = t табл = St-1 (2α; ν = n - 1) = St-1 (0.02; 8) = 2.896.
Поскольку |tнабл | > tкр, гипотеза Н0 отвергается, то есть противоречит наблюдениям.
   B. При конкурирующей гипотезе Н1: m ≠ 50мм; В случае двусторонней критической области
t кр = t табл =St-1 (α; ν = n - 1) = St-1 (0,01; 8) = 3,355.
Так как tнабл < tкр, то нулевая гипотеза Н0 не отвергается.

Основные формулы, используемые при проверке гипотез о значении параметров распределений

nН0Условия проверкиИспользуемое распределениеФормулы для вычисления наблюдаемого значения параметровН1Порядок определения критического значения параметровПравила проверки
1m0σ²
известна
Ф(t)m1<m0 = μ0;
m1>m0 = μ0
(1 - 2α) → tкр|tH|>tкр→H0
отвергается с вероятностью ошибки α
|tH|<tкр→H0
не отвергается
m1≠m0(1 - α) → tкр
σ² не известнаStm1<m0;
m1>m0
m1≠ m0
2mх = mуσ²1 и σ²2 известныФ(t)mx<my;
mx>my
(1 - 2α) → tкр
mx≠ my(1 - α) → tкр
σ²1 и σ²2 неизвестны,
но σ²1 = σ²2
Stmx<my;
mx>my
mx≠ my
3σ1² = σ0² χ ²σ1² < σ0²UH²≥χ ²кр→H0
не отвергается
σ1² ≠ σ0²χ²кр.лев≤U²H≤χ²кр.прав не отвергается
H≤χ²кр.лев или UH>χ²кр.левгипотеза Н0 отвергается
σ1² > σ0²H≤χ²кр→H0
не отвергается
4σ1² = σ0²1>s²2Fσ1² > σ2²FH≤Fкр → H0 не отвергается
5σ1² = σ2²=…=σn²n1≠n2≠…≠nl l > 4χ² UH²≤χкр²→H0 не отвергается
n1=n2= …=nlGGH≤Gкр→H0 не отвергается
6p1 = p2=…=pln →∞χ²UH²≤χкр²→H0 не отвергается

Вопросы для самопроверки

  1. Что означает понятие статистической гипотезы?
  2. Какую гипотезу называют основной?
  3. Какую гипотезу называют альтернативной?
  4. Какую гипотезу называют простой?
  5. Какую гипотезу называют сложной?
  6. Какую область называют критической?
  7. Какую область называют допутимой?
  8. Какие ошибки можно допустить при принятии или отклонении нулевой гипотезы?
  9. Что называют уровнем значимости?
  10. Что называют критерием согласия?
  11. Как формулируется основной принцип проверки статистических гипотез?
  12. Что называют критическими точками?
  13. Какую область называют правосторонней?
  14. Какую область называют левосторонней?
  15. Какую область называют двусторонней?
  16. Как найти критические области принятия гипотезы?