СОДЕРЖАНИЕ РАЗДЕЛА


  1. Основная задача статистики. Понятие о выборочном методе.
  2. Основные определения.
  3. Виды выборок.
  4. Собственно случайная выборка.
  5. Механическая выборка.
  6. Типичная выборка.
  7. Серийная выборка.
  8. Понятие о вариационных рядах
  9. Эмпирическая функция распределения
  10. Графическое изображение вариационных рядов.
  11. Вопросы для самопроверки.

Основная задача статистики. Понятие о выборочном методе

 Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении статистических данных - результатов наблюдений. Первая задача математической статистики - указать способы сбора и группировки (если данных очень много) статистических сведений.
 Вторая задача математической статистики - разработать методы анализа статистических данных, в зависимости от целей исследования.
  Изучение тех или иных явлений методами математической статистики служит средством решения многих вопросов, выдвигаемых наукой и практикой (правильная организация технологического процесса, наиболее целесообразное планирование и др.). Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.
 Сплошное наблюдение нецелесообразно в случаях, когда оно приводит к уничтожению всех подлежащих рассмотрению объектов, когда экономически невыгодно производить обследование всей совокупности.
 По результатам изучения сравнительно небольшой ее части можно получить с достаточной для практики достоверностью необходимую информацию обо всей совокупности.

Основные определения

 Определение. Генеральной совокупностью называется вся подлежащая изучению совокупность объектов. Выборкой называется часть объектов, которая попала на проверку.
 Определение 2. Число элементов в генеральной совокупности и в выборке называется их объемами.
 При составлении выборки можно поступать двояко: после того, как объект отобран и над ним произведено наблюдение, он может быть возвращен в генеральную совокупность. В соответствии со сказанным, выборки подразделяют на повторные и бесповторные.
 Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.
 Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.
 Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной).
 В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку.
 Если объем генеральной совокупности достаточно велик, а выборка составляет лишь незначительную часть этой совокупности, то различие между повторной и бесповторной выборками стирается; в предельном случае, когда рассматривается бесконечная генеральная совокупность, а выборка имеет конечный объем, это различие исчезает.
 Определение 3. Различные значения признака, наблюдающиеся у членов совокупности, называются вариантами, а числа, показывающие, сколько раз встречается каждый вариант, – их частотами.
 Определение 4. Ошибками репрезентативности называются расхождения характеристик признака в выборочной совокупности от соответствующих характеристик его в генеральной совокупности, возникающие в результате того, что исследуется не вся совокупность, а лишь часть её.
 Ошибки репрезентативности бывают систематические и случайные. Систематическая ошибка репрезентативности возникает при нарушении случайности при отборе членов в выборочную совокупность.
 Математическая теория выборочного метода состоит в определении средней величины случайных ошибок репрезентативности и возможных границ их при различных способах образования выборочной совокупности.
 Определение 5. Ошибкой регистрации называется расхождение между истинным значением изучаемого признака у члена совокупности и значением, зарегистрированным при наблюдении.
 Определение 6. Отношение соответствующей частоты к её объёму называются частностями или весами.
 Определение 7. Вариационным рядом называется ранжированный в порядке возрастания или убывания ряд вариантов с соответствующими весами.
 Определение 8. Вариационный ряд называется дискретным, если значения признака отличаются друг от друга не менее чем на некоторую постоянную величину, и непрерывным, если значения признака отличаются один от другого на как угодно малую величину.
 Определение 9. Частота, приходящаяся на единицу длины интервала варьирования признака, называется плотностью распределения на этом интервале, а частость, приходящаяся на единицу длины этого интервала, – относительной плотностью распределения на этом интервале.
 Применение выборочного метода обычно приводит к уменьшению ошибок регистрации. Ошибки регистрации могут появиться как при выборочном, так и при сплошном обследовании. Ошибки репрезентативности арактерны лишь для выборочного метода.

Виды выборок

  1. Собственно-случайная.
  2. Механическая.
  3. Типическая.
  4. Серийная.

Собственно-случайные выборки

 Собственно-случайные выборки (с повторным или бесповторным отбором членов). Члены генеральной совокупности предварительно нумеруются, каждый номер записывается на отдельной карточке. Число их совпадает с объемом генеральной совокупности. После тщательного перемешивания из пачки карточек берут по одной. Номер на ней укажет, какой член генеральной совокупности считается попавшим в выборку. При этом возможны два принципиально различных способа отбора карточек. Первый способ: вынутая карточка после записи ее номера возвращается обратно, а затем карточки снова тщательно перемешиваются. Второй способ: вынутая карточка обратно не возвращается. Собственно-случайная выборка с бесповторным отбором членов образуется и в том случае, когда из тщательно перемешанной пачки сразу будет взято нужное число карточек.
 Собственно-случайную выборку с повторным отбором членов в нее для краткости называют повторной выборкой, а с бесповторным отбором членов – бесповторной выборкой.

Механическая выборка

 Механическая выборка образуется из генеральной совокупности при выборе элементов через определенный интервал. При этом необходимо убедиться, что в следующих один за другим членах генеральной совокупности значения признака не изменяются с той же периодичностью, как и периодичность отбора элементов в выборку.

Типическая выборка

 Если генеральную совокупность разбить предварительно на непересекающиеся группы, а затем образовать собственно-случайные выборки (с повторным или бесповторным отбором членов) из каждой группы, и все отобранные элементы считать попавшими в выборку, то получим выборочную совокупность, которая называется типической.

Серийная выборка

 Если генеральную совокупность предварительно разбить на непересекающиеся группы, а затем, рассматривая группы как элементы, образовать из них собственно-случайную выборку (с повторным или бесповторным отбором серий), и все члены отобранных серий считать попавшими в выборку, то получим выборочную совокупность, которая называется серийной.

Понятие о вариационных рядах

 Определение. Статистическим распределением выборки (вариационным рядом) называют перечень вариант и соответствующих им частот или относительных частот.
x ix 1x 2x k
n in 1n 2n k
Определение. Отношения соответствующих частот к её объёму называются относительными частотами или весами:
Определение. Вариационный ряд называется прерывным, если значения признака отличаются друг от друга не менее чем на некоторую постоянную величину, и непрерывным, если значения признака отличаются один от другого на как угодно малую величину.
 Определение. Частота, приходящаяся на единицу длины интервала варьирования признака, называется плотностью распределения на этом интервале, а частость, приходящаяся на единицу длины этого интервала, - относительной плотностью распределения на этом интервале.
 Пример. Задано распределение частот выборки объема = 20:
x i2612
n i3107
 Написать распределение относительных частот.
 Решение. Найдем относительные частоты, для чего разделим частоты на объем выборки:
Напишем распределение относительных частот:
x i2612
Wi0,150,50,35
Контроль: 0,15 + 0,5 + 0,35 = 1.

Эмпирическая функция распределения

 Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(x), определяющую для каждого значения х относительную частоту события Х < x:
где nx - число вариант, меньших х; n - объём выборки.
 Функцию F(x) распределения генеральной совокупности называют теоретической функцией распределения. Теоретическая функция распределения F(x) определяет вероятность события Х < x, эмпирическая функция распределения F*(x) определяет относительную частоту события Х < x. Из теоремы Бернулли следует, что
Отсюда следует целесообразность использования эмпирической функции распределения выборки для приближённого представления (интегральной) функции распределения генеральной совокупности.
 Эмпирическая функция распределения выборки обладает свойствами:
1) значения эмпирической функции распределения выборки принадлежат отрезку [0, 1];
2) F*(x) - неубывающая функция;
3) Если х1 - наименьшая варианта, то F*(x) = 0 при хх1; если хk - наибольшая варианта, то F*(x) = 1 при х > xk.

Пример

 Построить эмпирическую функцию по распределению выборки
x i2610
n i121830
Решение. Найдём объём выборки n = 12 + 18 + 30 = 60. Если х ≤ 2, то F*(x) = 0. Если 2 < x ≤ 6, то F*(x) = 12/60 = 0,2. Если 6 < x ≤ 10, то F*(x) = 30/60 = 0,5. Если x > 10 , то F*(x) = 1.
 Итак, искомая эмпирическая функция определяется так (рис. 1.1)

Графическое изображение вариационных рядов

 Полигоном частот называют ломаную, отрезки которой соединяют точки (x1; n1), (x2; n2), …, (xk; nk). Для рассмотренного выше примера полигон указан на рис. 1.2.
Полигоном относительных частот называют ломаную, отрезка которой соединяют точки (x1, W1), (x2, W2), …, (xk, Wk). Для рассмотренного выше примера распределение относительных частот имеет вид
x i2610
W i0,20,30,5
Для построения гистограммы интервал, в котором заключены наблюдаемые значения признака разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала ni - сумму частот вариант, попавших в i - й интервал. Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат интервалы длиной h, а высоты равны отношению ni/h (плотность частоты). Рассмотрим данные
Частичный интервал
длиной h = 5
Сумма частот вариант
частичного интервала
Плотность
частоты ni/h
5 — 1040,8
10 — 1561,2
15 — 20163,2
20 — 25367,2
25 — 30244,8
30 —35102,0
35 — 4040,8
Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят прямоугольники высотой ni/h. Площадь прямоугольника равна сумме частот вариант i - го интервала.
 Аналогично строят гистограмму относительных частот (рис.1.4).

Вопросы для самоконтроля

  1. Какой метод называется выборочным?
  2. Что называется генеральной совокупностью?
  3. Какие виды выборок бывают?
  4. Что называется выборочной долей?
  5. Что называется ошибкой репрезентативности?
  6. Как изображаются графически вариационные ряды?
  7. Что может являться характеристиками генеральной и выборочной совокупностей?
  8. Что называется вариационным рядом?
  9. Что называется относительной частотой?
  10. Что называется эмпирической функцией распределения?
  11. Что называется теоретической функцией распределения?
  12. Как связаны теоретическая и эмпирическая функция распределения?
  13. Как строится полигон частот и относительных частот?
  14. Как строится гистограмма частот и относительных частот?
  15. 14. Построить график эмпирической функции распределения
    x i571015
    n i2387
  16. Построить полигоны частот и относительных частот распределения
    x i13579
    n i1015303312
  17. Построить гистограммы частот и относительных частот распределения
    Частичный интервал
    влиной h = 5
    Сумма частот вариант
    частичного интервала
    2 – 59
    5 – 510
    8 – 1125
    11 – 146