| СОДЕРЖАНИЕ РАЗДЕЛА |
- Основная задача статистики. Понятие о выборочном методе.
- Основные определения.
- Виды выборок.
- Собственно случайная выборка.
- Механическая выборка.
- Типичная выборка.
- Серийная выборка.
- Понятие о вариационных рядах
- Эмпирическая функция распределения
- Графическое изображение вариационных рядов.
- Вопросы для самопроверки.
Основная задача статистики. Понятие о выборочном методе
Вторая задача математической статистики - разработать методы анализа статистических данных, в зависимости от целей исследования.
Изучение тех или иных явлений методами математической статистики служит средством решения многих вопросов, выдвигаемых наукой и практикой (правильная организация технологического процесса, наиболее целесообразное планирование и др.). Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.
Сплошное наблюдение нецелесообразно в случаях, когда оно приводит к уничтожению всех подлежащих рассмотрению объектов, когда экономически невыгодно производить обследование всей совокупности.
По результатам изучения сравнительно небольшой ее части можно получить с достаточной для практики достоверностью необходимую информацию обо всей совокупности.
Основные определения
Определение 2. Число элементов в генеральной совокупности и в выборке называется их объемами.
При составлении выборки можно поступать двояко: после того, как объект отобран и над ним произведено наблюдение, он может быть возвращен в генеральную совокупность. В соответствии со сказанным, выборки подразделяют на повторные и бесповторные.
Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.
Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.
Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной).
В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку.
Если объем генеральной совокупности достаточно велик, а выборка составляет лишь незначительную часть этой совокупности, то различие между повторной и бесповторной выборками стирается; в предельном случае, когда рассматривается бесконечная генеральная совокупность, а выборка имеет конечный объем, это различие исчезает.
Определение 3. Различные значения признака, наблюдающиеся у членов совокупности, называются вариантами, а числа, показывающие, сколько раз встречается каждый вариант, – их частотами.
Определение 4. Ошибками репрезентативности называются расхождения характеристик признака в выборочной совокупности от соответствующих характеристик его в генеральной совокупности, возникающие в результате того, что исследуется не вся совокупность, а лишь часть её.
Ошибки репрезентативности бывают систематические и случайные. Систематическая ошибка репрезентативности возникает при нарушении случайности при отборе членов в выборочную совокупность.
Математическая теория выборочного метода состоит в определении средней величины случайных ошибок репрезентативности и возможных границ их при различных способах образования выборочной совокупности.
Определение 5. Ошибкой регистрации называется расхождение между истинным значением изучаемого признака у члена совокупности и значением, зарегистрированным при наблюдении.
Определение 6. Отношение соответствующей частоты к её объёму называются частностями или весами.
Определение 7. Вариационным рядом называется ранжированный в порядке возрастания или убывания ряд вариантов с соответствующими весами.
Определение 8. Вариационный ряд называется дискретным, если значения признака отличаются друг от друга не менее чем на некоторую постоянную величину, и непрерывным, если значения признака отличаются один от другого на как угодно малую величину.
Определение 9. Частота, приходящаяся на единицу длины интервала варьирования признака, называется плотностью распределения на этом интервале, а частость, приходящаяся на единицу длины этого интервала, – относительной плотностью распределения на этом интервале.
Применение выборочного метода обычно приводит к уменьшению ошибок регистрации. Ошибки регистрации могут появиться как при выборочном, так и при сплошном обследовании. Ошибки репрезентативности арактерны лишь для выборочного метода.
Виды выборок
- Собственно-случайная.
- Механическая.
- Типическая.
- Серийная.
Собственно-случайные выборки
Собственно-случайную выборку с повторным отбором членов в нее для краткости называют повторной выборкой, а с бесповторным отбором членов – бесповторной выборкой.
Механическая выборка
Типическая выборка
Серийная выборка
Понятие о вариационных рядах
| x i | x 1 | x 2 | x k | |
| n i | n 1 | n 2 | n k |

Определение. Частота, приходящаяся на единицу длины интервала варьирования признака, называется плотностью распределения на этом интервале, а частость, приходящаяся на единицу длины этого интервала, - относительной плотностью распределения на этом интервале.
Пример. Задано распределение частот выборки объема = 20:
| x i | 2 | 6 | 12 |
| n i | 3 | 10 | 7 |
Решение. Найдем относительные частоты, для чего разделим частоты на объем выборки:

| x i | 2 | 6 | 12 |
| Wi | 0,15 | 0,5 | 0,35 |
Эмпирическая функция распределения

Функцию F(x) распределения генеральной совокупности называют теоретической функцией распределения. Теоретическая функция распределения F(x) определяет вероятность события Х < x, эмпирическая функция распределения F*(x) определяет относительную частоту события Х < x. Из теоремы Бернулли следует, что

Эмпирическая функция распределения выборки обладает свойствами:
1) значения эмпирической функции распределения выборки принадлежат отрезку [0, 1];
2) F*(x) - неубывающая функция;
3) Если х1 - наименьшая варианта, то F*(x) = 0 при х ≤ х1; если хk - наибольшая варианта, то F*(x) = 1 при х > xk.
Пример
| x i | 2 | 6 | 10 |
| n i | 12 | 18 | 30 |
Итак, искомая эмпирическая функция определяется так (рис. 1.1)
![]() |
![]() |
Графическое изображение вариационных рядов

| ![]() |
| Частичный интервал длиной h = 5 | Сумма частот вариант частичного интервала | Плотность частоты ni/h |
| 5 — 10 | 4 | 0,8 |
| 10 — 15 | 6 | 1,2 |
| 15 — 20 | 16 | 3,2 |
| 20 — 25 | 36 | 7,2 |
| 25 — 30 | 24 | 4,8 |
| 30 —35 | 10 | 2,0 |
| 35 — 40 | 4 | 0,8 |
Аналогично строят гистограмму относительных частот (рис.1.4).

Вопросы для самоконтроля
- Какой метод называется выборочным?
- Что называется генеральной совокупностью?
- Какие виды выборок бывают?
- Что называется выборочной долей?
- Что называется ошибкой репрезентативности?
- Как изображаются графически вариационные ряды?
- Что может являться характеристиками генеральной и выборочной совокупностей?
- Что называется вариационным рядом?
- Что называется относительной частотой?
- Что называется эмпирической функцией распределения?
- Что называется теоретической функцией распределения?
- Как связаны теоретическая и эмпирическая функция распределения?
- Как строится полигон частот и относительных частот?
- Как строится гистограмма частот и относительных частот?
- 14. Построить график эмпирической функции распределения
x i 5 7 10 15 n i 2 3 8 7 - Построить полигоны частот и относительных частот распределения
x i 1 3 5 7 9 n i 10 15 30 33 12 - Построить гистограммы частот и относительных частот распределения
Частичный интервал
влиной h = 5Сумма частот вариант
частичного интервала2 – 5 9 5 – 5 10 8 – 11 25 11 – 14 6


