СОДЕРЖАНИЕ РАЗДЕЛА
  1. Несмещенные, эффективные и состоятельные оценки.
  2. Средняя арифметическая и её свойства.
  3. Групповая и общая средние.
  4. Примеры вычисления средней.
  5. Генеральная дисперсия.
  6. Выборочная дисперсия и её свойства.
  7. Групповая, внутригрупповая, межгрупповая и общая дисперсия.
  8. Сложение дисперсий.
  9. Примеры.
  10. Вопросы для самопроверки.

Несмещенные, эффективные и состоятельные оценки

 Пусть θ* есть статистическая оценка неизвестного параметра θ теоретического распределения. Допустим, что по выборке объема n найдена оценка θ*1. Повторим опыт, т. е. извлечем из генеральной совокупности другую выборку того же объема и по ее данным найдем оценку θ*2. Повторяя опыт многократно, получим числа θ*1, θ*2, …, θ*k, которые, вообще говоря, будут различны между собой. Таким образом, оценку θ* можно рассматривать как случайную величину, а числа θ*1, θ*2, …, θ*k, - как ее возможные значения.
 Представим себе, что оценка θ* дает приближенное значение θ с избытком; тогда каждое, найденное по данным выборок, число θ*i (i = 1, 2, …, k) будет больше истинного значения θ. Ясно, что в этом случае и математическое ожидание (среднее значение) случайной величины θ* будет больше, чем θ, т. е. M (θ*) > θ. Очевидно, что если θ* дает оценку с недостатком, то M (θ*) < θ.
 Таким образом, использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, привело бы к систематическим (одного знака) ошибкам. По этой причине естественно потребовать, чтобы математическое ожидание оценки θ* было равно оцениваемому параметру. Хотя соблюдение этого требования не устранит ошибок (одни значения θ* больше, а другие меньше θ), однако ошибки разных знаков будут встречаться одинаково часто. Соблюдение требований M (θ*) = θ гарантирует от получения систематических ошибок.
 Несмещенной называют статистическую ошибку θ*, математическое ожидание которой равно оцениваемому параметру θ при любом объеме выборки, т. е.
M (θ*) = θ.
 Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.
 Несмещенная оценка не всегда дает хорошее приближение оцениваемого параметра. Возможные значения θ* могут быть сильно рассеяны вокруг своего среднего значения, т. е. дисперсия D (θ*) может быть значительной. В этом случае, найденная по данным одной выборки оценка, например θ*1, может оказаться весьма удаленной от среднего значения θ*, а значит, и от самого оцениваемого параметра θ; приняв θ*1 в качестве приближенного значения θ, мы допустили бы большую ошибку. Если же потребовать, чтобы дисперсия θ* была малой, то возможность допустить большую ошибку будет исключена. По этой причине к статистической оценке предъявляется требование эффективности.
 Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию.
 При рассмотрении выборок большого объема (n велико!) к статистическим оценкам предъявляется требование состоятельности.
 Состоятельной называют статистическую оценку, которая при n → ∞ стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при n → ∞ стремится к нулю, то такая оценка оказывается и состоятельной.

Средняя арифметическая и её свойства

 Средней арифметической вариационного ряда называется сумма произведений всех вариантов на соответствующие им частоты, делённая на сумму частот:
.

Свойства средней арифметической

  1. Если все варианты увеличить (уменьшить) в одно и то же число раз, то средняя арифметическая увеличится (уменьшится) во столько же раз:
    .
    Указанное свойство позволяет вычислять среднюю арифметическую не по данным варианты, а по уменьшенным (или увеличенным) в k раз.
  2. Если все варианты уменьшить (увеличить) на одно и то же число, то средняя арифметическая уменьшится (увеличится) на то же число.
    .
    Это свойство позволяет вычислять среднюю арифметическую не по данным варианты, а по уменьшенным (или увеличенным) на произвольное число.
  3. Сумма произведений отклонений вариантов от средней арифметической на соответствующие им веса равна нулю.
  4. При уменьшении или увеличении весов в одно и то же число раз средняя арифметическая не изменяется.
 Пусть из генеральной совокупности (в результате независимых наблюдений над количественным признаком X) извлечена повторная выборка объема n со значениями признака x1, x2, …, хn. Не уменьшая общности рассуждений, будем считать эти значения признака различными. Пусть генеральная средняя хг неизвестна и требуется оценить ее по данным выборки. В качестве оценки генеральной средней принимают выборочную среднюю
Убедимся, что хв есть несмещенная оценка, т.е. покажем, что математическое ожидание этой оценки равно xг. Будем рассматривать хв как случайную величину и х1, х2, …, хn, как значения независимых, одинаково распределенных случайных величин Х1, Х2, …, Хn. Поскольку эти величины одинаково распределены, то они имеют одинаковые числовые характеристики, в частности, одинаковое математическое ожидание, которое обозначим через a. Так как математическое ожидание среднего арифметического одинаково распределенных случайных величин равно математическому ожиданию каждой из величин, то
                     (*)
Приняв во внимание, что каждая из величин Х1, Х2, …, Хn имеет то же распределение, что и генеральная совокупность (которую мы также рассматриваем как случайную величину), заключаем, что и числовые характеристики этих величин и генеральной совокупности одинаковы. В частности, математическое ожидание a каждой из величин равно математическому ожиданию признака X генеральной совокупности, т.е.
М (Xв ) = хг = а.
Заменив в формуле (*) математическое ожидание а через xг, окончательно получим М (Xв ) = хг. Тем самым доказано, что выборочная средняя есть несмещенная оценка генеральной средней.
 Легко показать, что выборочная средняя является и состоятельной оценкой генеральной средней. Действительно, допустим, что случайные величины Х1, Х2, …, Хn имеют ограниченные дисперсии, мы вправе применить к этим величинам теорему Чебышева (частный случай), в силу которой при увеличении n среднее арифметическое рассматриваемых величин, т.е. Хв стремится по вероятности к математическому ожиданию а каждой из величин или, что то же, к генеральной средней хг (так как хг =а). Итак, при увеличении объема выборки n выборочная средняя стремится по вероятности к генеральной средней а это и означает, что выборочная средняя есть состоятельная оценка генеральной средней. Из сказанного следует также, что если по нескольким выборкам достаточно большого объема из одной и той же генеральной совокупности будут найдены выборочные средние, то они будут приближенно равны между собой. В этом и состоит свойство устойчивости выборочных средних.
 Заметим, что если дисперсии двух совокупностей одинаковы, то близость выборочных средних к генеральным не зависит от отношения объема выборки к объему генеральной совокупности. Она зависит от объема выборки: чем объем выборки больше, тем меньше выборочная средняя отличается от генеральной. Например, если из одной совокупности отобран 1 % объектов, а из другой совокупности отобрано 4% объектов, причем объем первой выборки оказался большим, чем второй, то первая выборочная средняя будет меньше отличаться от соответствующей генеральной средней, чем вторая.
 Замечание. Мы предполагали выборку повторной. Однако полученные выводы применимы и для бесповторной выборки, если ее объем значительно меньше объема генеральной совокупности. Это положение часто используется на практике.

Групповая и общая средние

 Допустим, что все значения количественного признака X совокупности, безразлично генеральной или выборочной, разбиты на несколько групп. Рассматривая каждую группу как самостоятельную совокупность, можно найти ее среднюю арифметическую.
 Групповой средней называют среднее арифметическое значений признака, принадлежащих группе.
 Теперь целесообразно ввести специальный термин для средней всей совокупности. Общей средней называют среднее арифметическое значений признака, принадлежащих всей совокупности.
 Зная групповые средние и объемы групп, можно найти общую среднюю: общая средняя равна средней арифметической групповых средних, взвешенной по объемам групп. Опуская доказательство, приведем иллюстрирующий пример.

Примеры вычисления средней

 Пример 1. Найти общую среднюю совокупности, состоящей из следующих двух групп:
Группа первая вторая
Значение признака 1 6 1 5
Частота 10 15 20 30
Объем 10 + 15 = 25 20 + 30 = 50
Найдем общую среднюю по групповым средним
.
 Замечание. Для упрощения расчета общей средней совокупности большого объема целесообразно разбить ее на несколько групп, найти групповые средние и по ним общую среднюю.
 Пример 2. Из трех партий продукции, изготовленной на одном станке в разные смены, взяты выборки объемом n1 = 10, n2 = 20, и n3 = 15 и найдены соответствующие средние μ1 = 25,8; μ2 = 26,2 и μ 3 = 25,4. Требуется определить общую среднюю по трем средним.
.
 Замечание. Выборочная средняя, найденная по данным одной выборки, есть, очевидно, определенное число. Если же извлекать другие выборки того же объема из той же генеральной совокупности, то выборочная средняя будет изменяться от выборки к выборке. Таким образом, выборочную среднюю можно рассматривать как случайную величину, а следовательно, можно говорить о распределениях (теоретическом и эмпирическом) выборочной средней и о числовых характеристиках этого распределения (его называют выборочным), в частности, о математическом ожидании и дисперсии выборочного распределения.

Генеральная дисперсия

 Для того чтобы охарактеризовать рассеяние значений количественного признака X генеральной совокупности вокруг своего среднего значения, вводят сводную характеристику - генеральную дисперсию.
 Генеральной дисперсией Dг называют среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения хг.
 Если все значения x1, х2, …, хN признака генеральной совокупности объема N имеют соответственно частоты N1, N2, …, Nk, причем N1 + N2 + … + Nk = N, то
т.е. генеральная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответствующим частотам.
 Пример 3. Генеральная совокупность задана таблицей распределения:
x i 2 4 5 6
n i 8 9 10 3
Найти генеральную дисперсию.
 Решение. Найдем генеральную среднюю
Найдем генеральную дисперсию:
 Кроме дисперсии, для характеристики рассеяния значений признака генеральной совокупности вокруг своего среднего значения пользуются сводной характеристикой - средним квадратическим отклонением.
 Генеральным средним квадратическим отклонением (стандартом) называют квадратный корень из генеральной дисперсии:

Выборочная дисперсия

 Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения вводят сводную характеристику - выборочную дисперсию.
Если все значения x1, х2, …, хn признака выборки объема n имеют соответственно частоты n1, n2, …, nn, причем n1 + n2 + … + nn = n, то
,
т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответствующим частотам.
 Определение. Арифметическое значение корня квадратного из дисперсии называется средним квадратическим отклонением.

Свойства выборочной дисперсии

  1. Если все варианты увеличить (уменьшить) в k раз, то дисперсия увеличится (уменьшится) в k 2 раз.
     Следствие. Если все варианты увеличить (уменьшить) в k раз, то среднее квадратическое отклонение увеличится (уменьшится) в kраз.
  2. Увеличение или уменьшение вариантов на одну и ту же постоянную величину не изменяет дисперсии.
  3. Если частоты увеличить или уменьшить в одно и то же число раз, то дисперсия не изменится.
  4. Дисперсия относительно средней арифметической равна дисперсии относительно произвольной постоянной без квадрата разности между средней арифметической и этой постоянной:
    .
  5. Дисперсия равна средней арифметической квадратов без квадратов средней арифметической:
    .
    Доказательство вытекает из теоремы 4 при с= 0.

Групповая, внутригрупповая, межгрупповая и общая дисперсия

 Пусть выборочная совокупность разбита на k групп. Каждую группу можно рассматривать как самостоятельную выборочную совокупность и найти для неё выборочную среднюю и выборочную дисперсию. Групповой дисперсией называется дисперсия признака в группе
где ni - частота значения хi; j - номер группы; - групповая средняя группы j; N j = Σ n j - объём группы j.
 Внутригрупповой дисперсией называют среднюю арифметическую дисперсий, взвешенную по объёмам групп:
Nj - объём группы j, n = Σ Nj - объём всей совокупности.
 Межгрупповой дисперсией называют дисперсию групповых средних относительно общей средней:
где - групповая средняя группы j; Nj - объём группы j; - общая средняя; n - объём всей совокупности.

Сложение дисперсий

 Теорема. Если совокупность состоит из нескольких групп, то общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсии:
Dобщ = Dвн гр + Dмеж гр.
 Доказательство. Для упрощения доказательства будем считать, что вся совокупность Х разбита на две группы:
Группа первая вторая
Значение признака х1, х2 х1, х2
Частота m1, m2 n1, n2
Объём группы N1 = m1 + m2 N2 = n1 + n2
Групповая средняя 1 2
Групповая дисперсия D1гр D2гр
Объём всей совокупности n = N1 + N2
Общую дисперсию разложим по группам
Преобразуем первое слагаемое числителя прибавив и отняв 1 :
Аналогично преобразуется второе слагаемое числителя
.
С учётом этого общая дисперсия примет вид
Что и требовалось доказать.

Примеры

 Пример 1. Выборочная совокупность задана таблицей распределения
x i 1 2 3 4
n i 20 15 10 5
Найти выборочную дисперсию.
 Решение. Найдём выборочную среднюю
Найдём выборочную дисперсию
 Пример 2. Найти групповые дисперсии совокупности, состоящей из следующих двух групп:
Первая группа Вторая группа
x i n i x i n i
2 1 3 2
4 7 8 3
5 2    
N1 = Σ n j = 10 N2 = Σ n j = 5
Решение. Найдём групповые средние
Найдём групповые дисперсии:
Найдём внутригрупповую дисперсию
Найдём общую среднюю:
Найдём межгрупповую дисперсию:

Вопросы для самоконтроля

  1. Дайте определение средней арифметической.
  2. Дайте определение дисперсии.
  3. Перечислите свойства средней арифметической.
  4. Дайте определение групповой дисперсии.
  5. Перечислите свойства выборочной дисперсии.
  6. Дайте определение внутригрупповой дисперсии.
  7. Дайте определение межгрупповой дисперсии.
  8. Сформулируйте теорему сложения дисперсий.