Меню

Как создать интервальную таблицу частот

Вероятность и статистика в школьном курсе математики (стр. 15 )

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Интервальная таблица частот

Когда какую таблицу использовать? На сколько интервалов разбивать?

Пример 2. Интервальная таблица частот в MS Excel

Пример 3. Использование надстройки «Пакет анализа» в MS Excel

Пример 4. Интервальная таблица частот в ВЛ «Анализ случайной выборки»

Пример 5. Гистограмма частот в MS Excel

Пример 6. Гистограмма частот в ВЛ «Анализ случайной выборки»

Пример 7. Деньги на «мобильнике»

НЕОБХОДИМЫЕ СВЕДЕНИЯ

Итак, таблица частот делает представление статистических данных намного компактнее и информативнее. Из нее сразу видно, какие различные значения присутствовали в выборке, какие из них повторялись чаще, а какие реже. Но всегда ли дело обстоит так хорошо?

Сколько весит портфель первоклассника?

На школьниках 1-го «А» класса было проведено исследование для выяснения того, сколько весит портфель первоклассника. В результате взвешиваний был получен следующий статистический ряд (масса каждого портфеля в кг):

2,1; 2,45; 1,9; 2,6; 3,1; 1,95; 3,4; 4,3; 1,15; 2,7; 2,2; 3,2; 2,4; 2,2; 1,8; 1,5; 2,4; 2,25; 2,6; 1,75

На этот раз мы имеем дело с величиной, которая меняется непрерывно и может принимать любые значения из некоторого интервала. Правда, портфели взвешивались приближенно, с точностью до 50 г, но даже в этом случае почти все значения ряда оказались различными. Вот как будет выглядеть соответствующая таблица частот:

Как видите, абсолютная частота каждого значения оказалась равной 1 или 2. Ясно, что никакой наглядности такая таблица не прибавляет.

Интервальная таблица частот

В такой ситуации для наглядного представления результатов выборки приходится группировать данные в интервалы и представлять их в виде интервальной таблицы частот. Весь диапазон значений выборки разбивают на промежутки (чаще всего равные) и подсчитывают частоту попадания в каждый из них.

Вот как будет выглядеть интервальная таблица частот в примере 1, если разбить диапазон от 1 кг до 5 кг на четыре равных промежутка:

При попадании значения на границу промежутков его относят к какому-то одному из них (например, левому), чтобы не считать дважды. Так, если бы у кого-то из первоклассников портфель весил ровно 3 кг, мы включили бы это значение в промежуток от 2 до 3 кг.

Когда какую таблицу использовать?

Обычная таблица частот используется в том случае, если в выборке исследуется поведение дискретной величины, множество различных значений которой невелико. Интервальная таблица частот удобна для изучения непрерывных величин, которые могут принимать любые значения из некоторого промежутка.

На сколько интервалов разбивать?

При группировке данных интервалов должно быть не очень мало и не очень много – обычно 5-10. Если интервалов будет мало, то от нас ускользнут детали распределения, если много – то мы придем к такой же картине, которая была и без группировки.

Количество интервалов во многом зависит от объема выборки и обычно выбирается так, чтобы почти в каждом интервале, кроме быть может крайних, оказалось хотя бы по пять значений выборки.

Интервальная таблица частот в MS Excel

При построении интервальной таблицы частот в MS Excel возникают определенные трудности. Для автоматического подсчета абсолютных частот теперь нельзя использовать функцию СЧЕТЕСЛИ() так, как мы делали это в обычной, не интервальной таблице: эта функция в качестве возможных условий подсчета допускает лишь =, >, =, а нам нужно проверять попадание каждого значения в интервал (т. е. использовать двойное неравенство).

Источник



3. Интервальный вариационный ряд.
Гистограмма относительных частот

На предыдущем уроке по математической статистике (Занятие 1) мы разобрали дискретный вариационный ряд (Занятие 2), и сейчас на очереди интервальный. Его понятие, графическое представление (гистограмма и эмпирическая функция распределения), а также рациональные методы вычислений, как ручные, так и программные. В том числе будут рассмотрены задачи с достаточно большим количеством (100-200) вариант – что делать в таких случаях, как обработать большой массив данных.

Предпосылкой построения интервального вариационного ряда (ИВР) является тот факт, что исследуемая величина принимает слишком много различных значений. Зачастую ИВР появляется в результате измерения непрерывной характеристики изучаемых объектов. Типично – это время, масса, размеры и другие физические характеристики. Подходящие примеры встретились в первой же статье по матстату, вспоминаем Константина, который замерял время на лабораторной работе и Фёдора, который взвешивал помидоры.

Для изучения интервального вариационного ряда затруднительно либо невозможно применить тот же подход, что и для дискретного ряда. Это связано с тем, что ВСЕ варианты многих ИВР различны. И даже если встречаются совпадающие значения, например, 50 грамм и 50 грамм, то связано это с округлением, ибо полученные значения всё равно отличаются хоть какими-то микрограммами.

Поэтому для исследования ИВР используется другой подход, а именно, определяется интервал, в пределах которого варьируются значения, затем данный интервал делится на частичные интервалы, и по каждому интервалу подсчитываются частоты – количество вариант, которые в него попали.

Разберём всю кухню на конкретной задаче, и чтобы как-то разнообразить физику, я приведу пример с экономическим содержанием, кои десятками предлагают студентам экономических отделений. Деньги, строго говоря, дискретны, но если надо, непрерывны :), и по причине слишком большого разброса цен, для них целесообразно строить интервальный ряд:

По результатам исследования цены некоторого товара в различных торговых точках города, получены следующие данные (в некоторых денежных единицах):

Требуется составить вариационный ряд распределения, построить гистограмму и полигон относительных частот + бонус – эмпирическую функцию распределения.

Такое обывательское исследование проводит каждый из нас, начиная с анализа цены на пакет молока вот это дожил в нескольких магазинах, и заканчивая ценами на недвижимость по гораздо бОльшей выборке. Что называется, не какие-то там унылые сантиметры.

Поэтому представьте свой любимый товар / услугу и наслаждайтесь решением🙂

Очевидно, что перед нами выборочная совокупность объемом наблюдений (таблица 10*3), и вопрос номер один: какой ряд составлять – дискретный или интервальный? Смотрим на таблицу: среди предложенных цен есть одинаковые, но их разброс довольно велик, и поэтому здесь целесообразно провести интервальное разбиение. К тому же цены могут быть округлёнными.

Начнём с экстремальной ситуации, когда у вас под рукой нет Экселя или другого подходящего программного обеспечения. Только ручка, карандаш, тетрадь и калькулятор.

Тактика действий похожа на исследование дискретного вариационного ряда. Сначала окидываем взглядом предложенные числа и определяем примерный интервал, в который вписываются эти значения. «Навскидку» все значения заключены в пределах от 5 до 11. Далее делим этот интервал на удобные подынтервалы, в данном случае напрашиваются промежутки единичной длины. Записываем их на черновик:

Теперь начинаем вычёркивать числа из исходного списка и записывать их в соответствующие колонки нашей импровизированной таблицы:

После этого находим самое маленькое число в левой колонке и самое большое значение – в правой. Тут даже ничего искать не пришлось, честное слово, не нарочно получилось:)
ден. ед. – хорошим тоном считается указывать размерность.

Вычислим размах вариации:
ден. ед. – длина общего интервала, в пределах которого варьируется цена.

Читайте также:  Таблица ppfd для растений

Теперь его нужно разбить на частичные интервалы. Сколько интервалов рассмотреть? По умолчанию на этот счёт существует формула Стерджеса:

, где – десятичный логарифм* от объёма выборки и – оптимальное количество интервалов, при этом результат округляют до ближайшего левого целого значения.

* есть на любом более или менее приличном калькуляторе

В нашем случае получаем:
интервалов.

Следует отметить, что правило Стерджеса носит рекомендательный, но не обязательный характер. Нередко в условии задачи прямо сказано, на какое количество интервалов нужно проводить разбиение (на 4, 5, 6, 10 и т.д.), и тогда следует придерживаться именно этого указания.

Длины частичных интервалов могут быть различны, но в большинстве случаев использует равноинтервальную группировку:
– длина частичного интервала. В принципе, здесь можно было не округлять и использовать длину 0,96, но удобнее, ясен день, 1.

И коль скоро мы прибавили 0,04, то по 5 частичным интервалам у нас получается «перебор»: . Посему от самой малой варианты отмеряем влево 0,1 влево (половину «перебора») и к значению 5,7 начинаем прибавлять по , получая тем самым частичные интервалы. При этом сразу рассчитываем их середины (например, ) – они требуются почти во всех тематических задачах:

– убеждаемся в том, что самая большая варианта вписалась в последний частичный интервал и отстоит от его правого конца на 0,1.

Далее подсчитываем частоты по каждому интервалу. Для этого в черновой «таблице» обводим значения, попавшие в тот или иной интервал, подсчитываем их количество и вычёркиваем:

Так, значения из 1-го интервала я обвёл овалами (7 штук) и вычеркнул, значения из 2-го интервала – прямоугольниками (11 штук) и вычеркнул и так далее.

Правило: если варианта попадает на «стык» интервалов, то её следует относить в правый интервал. У нас такая варианта встретилась одна: – и её нужно причислить к интервалу .

В результате получаем интервальный вариационный ряд, при этом обязательно убеждаемся в том, что ничего не потеряно: , и, кроме того, рассчитываем относительные частоты по каждому интервалу, которые уместно округлить до двух знаков после запятой:

Дело за чертежами. Для ИВР чаще всего требуется построить гистограмму.

Гистограмма относительных частот – это фигура, состоящая из прямоугольников, ширина которых равна длинам частичных интервалов, а высота – соответствующим относительным частотам:

При этом вполне допустимо использовать нестандартную шкалу по оси абсцисс, в данном случае я начал нумерацию с четырёх.

Площадь гистограммы равна единице, и это статистический аналог функции плотности распределения непрерывной случайной величины. Построенный чертёж даёт наглядное и весьма точное представление о распределении цен на ботинки по всей генеральной совокупности. Но это при условии, что выборка представительна.

Вместе с гистограммой нередко требуют построить полигон. Без проблем, полигон относительных частот – это ломаная, соединяющая соседние точки , где – середины интервалов:

Большим достоинством приведённого решения является тот факт, что многие вычисления здесь устные, а если вы помните, как делить «столбиком», то можно обойтись даже без калькулятора. Вот она где притаилась, смерть Терминатора 🙂 😉

Автоматизируем решение в Экселе:

Как составить ИВР и представить его графически? (Ютуб)

И бонус – эмпирическая функция распределения. Она определяется точно так же, как в дискретном случае:

, где – количество вариант СТРОГО МЕНЬШИХ, чем «икс», который «пробегает» все значения от «минус» до «плюс» бесконечности.

Но вот построить её для интервального ряда намного проще. Находим накопленные относительные частоты:

И строим кусочно-ломаную линию, с промежуточными точками , где – правые концы интервалов, а – относительная частота, которая успела накопиться на всех «пройденных» интервалах:

При этом если и если .

Напоминаю, что данная функция не убывает, принимает значения из промежутка и, кроме того, для ИВР она ещё и непрерывна.

Эмпирическая функция распределения является аналогом функции распределения НСВ и приближает теоретическую функцию , которую теоретически, а иногда и практически можно построить по всей генеральной совокупности.

Помимо перечисленных графиков, вариационные ряды также можно представить с помощью кумуляты и огивы частот либо относительных частот, но в классическом учебном курсе эта дичь редкая, и поэтому о ней буквально пару абзацев:

Кумулята – это ломаная, соединяющая точки:

* либо – для дискретного вариационного ряда;
либо – для интервального вариационного ряда.

* – накопленные «обычные» частоты

В последнем случае кумулята относительных частот представляет собой «главный кусок» недавно построенной эмпирической функции распределения.

Огива – это обратная функция по отношению к кумуляте – здесь варианты откладываются по оси ординат, а накопленные частоты либо относительные частоты – по оси абсцисс.

С построением данных линий, думаю, проблем быть не должно, чего не скажешь о другой проблеме. Хорошо, если в вашей задаче всего лишь 20-30-50 вариант, но что делать, если их 100-200 и больше? В моей практике встречались десятки таких задач, и ручной подсчёт здесь уже не торт. Считаю нужным снять небольшое видео:

Как быстро составить ИВР при большом объёме выборки? (Ютуб)

Ну, теперь вы монстры 8-го уровня 🙂

Но не всё так сурово. В большинстве задач вам предложат готовый вариационный ряд, и на счёт молока, то, конечно, была шутка:

Выборочная проверка партии чая, поступившего в торговую сеть, дала следующие результаты:

Требуется построить гистограмму и полигон относительных частот, эмпирическую функцию распределения

Проверяем свои навыки работы в Экселе! (исходные числа и краткая инструкция прилагается) И на всякий случай краткое решение для сверки в конце урока.

Что ещё важного по теме? Время от времени встречаются ИВР с открытыми крайними интервалами, например:

В таких случаях, что убийственно логично, интервалы «закрывают». Обычно поступают так: сначала смотрим на средние интервалы и выясняем длину частичного интервала: км. И для дальнейшего решения можно считать, что крайние интервалы имеют такую же длину: от 140 до 160 и от 200 до 220 км. Тоже логично. Но уже не убийственно:)

Ну вот, пожалуй, и вся практически важная информация по ИВР.

На очереди числовые характеристики вариационных рядов и начнём мы с их центральных характеристик, а именно – Моды, медианы и средней.

До скорых встреч!

Решения и ответы:

Пример 7. Решение: заполним расчётную таблицу

Построим гистограмму и полигон относительных частот:

Построим эмпирическую функцию распределения:

Автор: Емелин Александр

(Переход на главную страницу)

«Всё сдал!» — онлайн-сервис помощи студентам

Источник

Как создать интервальную таблицу частот

В математической статистике исследуются утверждения, которые могут быть сделаны на основе измерения некоторой величины, на простейшем примере поясним постановку (одной из многих) задач математической статистики.

Пусть требуется измерить некоторую величину . Результаты измерений

естественно рассматривать как значения случайных величин , полученных в данном эксперименте. Если измерительный инструмент не имеет систематической ошибки, то можно положить . Следовательно, возникает задача оценить параметр . Для решения задачи рассмотрим случайную величину

Это обстоятельство приводит к мысли построить статистические характеристики:

Первая представляет среднее арифметическое наблюденных значений случайной величины и статистическую дисперсию — во втором случае. В соответствии с законом больших чисел эти среднеарифметические сходятся по вероятности соответственно к математическому ожиданию величины и к дисперсии

Читайте также:  Магний физические свойства таблица

При ограниченности наблюдений эксперимента заменой и на и совершаем погрешность, а при небольшом числе наблюдений величины , являются случайными величинами. Возникает задача об оценке неизвестных параметров , случайной величины на основе экспериментальных данных, т.е. задача — найти подходящие значения этих параметров.

Множество результатов измерений величины называется выборкой объема . Для того, чтобы иметь возможность воспользоваться аппаратом теории вероятностей, целесообразно наблюдаемую величину рассматривать как случайную величину, функцию распределения которой

Полученный статистический материал , , . наблюдений представляет собой первичные данные о величине, подлежащей статистической обработке. Обычно такие статистические данные оформляются в виде таблицы, графика, гистограммы и т.д.

Если выборка объема содержит различных элементов , причем встречается раз, то число называется частотой элемента , а отношение называется относительной частотой элемента . Очевидно, что

Вариационным (статистическим) рядом называется таблица, первая строка которой содержит в порядке возрастания элементы ‘, а вторая — их частоты (относительные частоты .

Полигоном частот (относительных частот) выборки называется ломаная с вершинами в точках ( , ( ( , ).

Функция , где — объем выборки, а — число значений в выборке, меньших , называется эмпирической функцией распределения. Функция служит оценкой неизвестной функции распределения , т.е. .

Пусть теперь — непрерывная случайная величина с неизвестной плотностью вероятности . Для оценки по выборке разобьем область значений на интервалы длины . Обозначим через середины интервалов, а через число элементов выборки, попавших в указанный интервал. Тогда — оценка плотности вероятности в точке . В прямоугольной системе координат построим прямоугольники с основаниями и высотами , т.е. площади прямоугольника, равной относительной частоте данного разряда. Полученная таким образом фигура называется гистограммой выборки.

Пример 156. Имеются данные о количестве студентов в 30 группах физико-математического факультета:

26 25 25 26 25 23
23 24 19 23 20 19
22 24 24 23 20 23
24 19 21 18 21 18
20 18 18 21 15 15

Найти вариационный ряд количества студентов в группах и размах варьирования. Построить полигон частот.

Решение. Записывая исходные данные в порядке возрастания, составим вариационный ряд:

15 18 19 20 21 22 23 24 25 26
2 4 2 4 3 1 5 4 3 2

Для построения полигона частот обозначим на оси абсцисс возможные значения признака, а на оси ординат соответствующие частоты и полученные точки соединим отрезками.

Пример 157. Школьникам предлагалось разгадать несколько числовых закономерностей и вписать в пропуски недостающие числа. Оценка осуществлялась по количеству правильно решенных задач и дала следующие результаты:

Кол-во баллов 13 14 15 16 17 18 19 20
Кол-во школьников 2 3 2 4 12 10 8 9

Составить статистическое распределение количества школьников по количеству набранных баллов и построить полигон относительных частот.

Решение. Пусть = <количество набранных баллов>, a = <относительные частоты>. Тогда статистическое распределение выборки можно представить в виде следующей таблицы:

X 13 14 15 16 17 18 19 20
0,04 0,06 0,04 0,08 0,24 0,2 0,16 0,18

Чтобы построить полигон относительных частот, отложим на оси абсцисс значения , а на оси ординат — относительные частоты . После этого последовательно соединим полученные точки отрезками.

Пример 158. В 2002 году количество служб, представляющих гражданам жилищные субсидии, по сельским районам области распределено следующим образом:

Построить эмпирическую функцию распределения.

Решение. Найдем сначала статистический ряд распределения числа служб в районах области.

1 4 5 10

Эмпирическую функцию распределения находим аналогично интегральной функции (см. §13 ) [перейти].

Пример 159. Построить гистограмму следующей выборки объема 50

интервала Границы

1 3 — 7 5 2 7 — 12 10 3 12 — 17 20 4 17 — 21 8 5 21 — 28 7

Решение. Найдем плотность относительной частоты для каждого интервала и заполним последний столбец таблицы:

Построим на оси абсцисс заданные интервалы и проведем над этими интервалами отрезки, параллельные оси абсцисс и находящиеся на расстояниях, равных соответствующим плотностям относительной частоты .

Из способа построения гистограммы следует, что полная ее площадь равна единице.

Пример 160. Число школ Ярославской области в 2002 — 2003 учебном году по малым городам и районам составило:

Построить гистограмму распределения числа школ по районам области.

Решение. Выберем границы интервалов и составим по данной выборке следующую таблицу

интервала Границы

1 13 — 17 6 2 17 — 20 3 3 20 — 25 4 4 25 — 31 4

Аналогично предыдущему примеру строим гистограмму числа школ, распределенных по малым городам и районам области.

«Сглаживая» полученную гистограмму, получаем «похожесть» данного дискретного закона распределения на классический показательный (непрерывный) закон. В этом и заключается основное предназначение гистограмм выборок.

Вопросы для самоконтроля

На каких методах основано изучение статистических данных?

Основные задачи математической статистики.

Какие способы отбора из генеральной совокупности вы знаете?

Какая выборка называется представительной?

В чем отличие вариационного от статистического ряда?

Для чего используется полигон частот?

Свойства эмпирической функции распределения.

В каком случае и для чего строятся гистограммы?

I. 311. Записать выборку 2, 7, 3, 5, 4, 10, 5, 5, 2, 8, 10, 2, 7, 7, 7, 5, 4, 2, 4, 7, 8 в виде: а) вариационного ряда; б) статистического ряда.

312. Найдите эмпирическую функцию распределения для выборки, представленной вариационным рядом:

1 2 4 7
10 20 30 40

313. Имеются данные о количестве сельских населенных пунктов районов Ярославской области с численностью населения более 500 человек:

Большесельский — 4, Борисоглебский — 2, Брейтовский — 1, Гаврилов-Ямский — 2, Даниловский — 2, Любимский — 1, Мышкинский — 0, Некоузский — 6, Некрасовский — 5, Первомайский — 2, Переславский — 11, Пошехонский — 0, Ростовский — 11, Рыбинский — 12, Тутаевский — 3, Угличский — 4, Ярославский — 27.

Найдите вариационный ряд количества населенных пунктов Ярославской области с численностью населения более 500 человек. Постройте полигон частот.

314. В 2002 году количество крупных и средних промышленных предприятий по районам ( в том же порядке, что и в предыдущей задаче) области распределено следующим образом:

Постройте полигон частот и эмпирическую функцию распределения.

315. Количество учащихся, получивших аттестат с медалью, в 2001 году по городам и районам Ярославской области:

г. Ярославль — 280, г. Рыбинск — 66, г. Ростов — 61, г. Переславль — 27, г. Углич — 32, г. Тутаев — 36;

Большесельский — 8, Борисоглебский — 3, Брейтовский — 11, Гаврилов-Ямский — 7, Даниловский — 19, Любимский — 11, Мышкинский — 3, Некоузский — 15, Некрасовский — 7, Первомайский — 6, Переславский — 1, Пошехонский — 8, Ярославский — 30.

Найдите вариационный ряд распределения медалистов, размах варьирования и среднее число медалистов по городам и районам области.

316. Посевные площади картофеля (тыс. гектаров) в сельских хозяйствах Ярославской области по районам:

1,5; 1,5; 0,6; 1,3; 0,9; 0,9; 0,6; 1,3; 1,1; 0,6; 1,1; 0,9; 1,6; 1,3; 0,8; 0,4; 1,1.

Найдите статистический ряд распределения посевных площадей и постройте полигон относительных частот.

II. 317. Построить гистограмму выборки, представленной в виде таблицы частот. Объем выборки .

Номер интервала

Сумма частот вариант интервала

13 — 15

24

318. Построить гистограмму выборки объема , представленной в виде таблицы частот:

Источник

Пользуясь формулой, вычисляем накопленные частоты интервалов. В частности,

Объем выборки n 30 — 50 50 — 90 100 — 200 300 — 400
Число интервалов k 5 -6

Процедура получения интервального вариационного ряда состоит из следующих шагов.

1. Пользуясь табл. 1, находят число интервалов .

2. Определяют длину интервала:

3. Находят границы интервалов.

4. Находят частоты интервалов.

5. Полученные результаты заносят в таблицу.

Интервальный статистический ряд наглядно может быть представлен в виде гистограммы частот – столбиковой диаграммы, состоящей из прямоугольников, основаниями которых служат подынтервалы, а высота равна (плотность частоты).Площадь i-го прямоугольника равна ,а площадь всей гистограммы частот равна сумме всех частот, т.е. объёму выборки .

Для построения гистограммы относительных частот основание прямоугольника также равно h, а высота . Площадь каждого столбика равна . Площадь всей гистограммы относительных частот равна .

На основании гистограммы обычно выдвигается предположение о виде закона распределения исследуемой величины.

Пример 2. Анализируется доход населения. Извлечена выборка объёма 300 единиц. По уровню дохода население подразделяется на 6 групп. Данные сгруппированы в интервальный статистический ряд:

Построить гистограмму относительных частот.

Решение. Шаг h = 20. Разделив относительные частоты на шаг разбиения, получим высоту столбиков.

Форма гистограммы в наибольшей степени соответствует нормальному распределению.

Пример 3. Мальчиками 12 — 13 лет были показаны следующие результаты в подтягивании на перекладине:

9, 5, 7, 10, 11, 10, 14, 7, 10, 11, 8, 10, 8, 9, 12, 13, 8, 11, 9, 9, 10, 6, 9, 13, 9, 17, 11, 15, 8, 14, 11, 16, 8, 10, 10, 11, 8, 9, 10, 10, 8, 11, 14, 12, 11, 13, 15, 13, 10, 5.

Требуется представить данную неупорядоченную выборку в виде интервального вариационного ряда.

Решение.Непосредственным подсчетом находим объем выборки: .

1. Пользуясь табл. 1, определяем число интервалов. Полагаем .

2. Просматривая заданный ряд, замечаем, что максимальное число подтягиваний равно 17 , а минимальное — 5 . Пользуясь формулой, находим длину интервала .

3. Находим границы интервалов.

К границам предыдущего интервала прибавляем длину интервала . В частности,

Замечаем при этом, что правая граница первого интервала является левой границей второго интервала. И так далее до тех пор, пока не найдем: .

4. Считаем частоты каждого интервала, отыскивая в заданном ряду значения, удовлетворяющие неравенству:

В частности, для первого интервала таких значений три, для второго — девять и т. д., то есть

Полученные данные заносим в таблицу (см. табл. 2, первые три столбца); им же соответствует рис.

6. Вычисляем частости интервалов. Например,

7. Вычисляем накопленные частости интервалов.

8. Данные вычислений заносим в табл. 2

№ интервала Границы интервала Частота Накопленная частота Частость Накопленная частость
5 — 7 0,06 0,06
7 — 9 0,18 0,24
9 — 11 0,34 0,58
11 — 13 0,20 0,78
13 — 15 0,14 0,92
15 — 17 0,08

Распределение типа сведенного в табл. 2 представляет собой интервальный вариационный ряд.

Анализ вариационных рядов упрощается при их графическом представлении. Наряду с гистограммой и полигоном частот можно построить полигон накопленных частостей (кумулята)

График получается при соединении точек прямыми отрезками. Координаты точек соответствуют верхним границам интервалови накопленным частотам. Если по оси ординат откладывать накопленные частости, то полученный график называется полигоном накопленных частостей. Если ряд не интервальный, то по оси откладывают значения измеряемого признака, а по оси — соответствующие накопленные частоты или частости. На рис.2 изображен полигон накопленных частостей для примера 3.

На практике соседние точки чаще всего соединяют кривыми линиями (рис. 3).

1.3. Статистические характеристики вариационного ряда

Для полноты картины анализа выборки рассматривают статистические характеристики вариационного ряда. С этой целью оценивают следующие качества ряда:

ü центральную тенденцию выборки;

Центральную тенденцию выборки оценивают такими статистическими характеристиками, как

ü среднее арифметическое значение.

К характеристикам вариации относят:

ü среднее квадратическое отклонение;

ü коэффициент вариации;

ü ошибку выборочного среднего.

Модой называется значение признака, наиболее часто встречающееся в выборке. Мода обозначается . Если значения выборки сгруппированы в интервальный вариационный ряд, то выбирается модальный интервалс наибольшей частотой.

Медиана— это такое значение признака, при котором одна половина значений признака меньше ее, а другая половина — больше (медиана делит вариационный ряд пополам). Медиана обозначается . Для отыскания медианы выборку ранжируют, то есть значения признака располагают в порядке возрастания или убывания. В ранжированной выборке ранг (порядковый номер в выборке) медианы определяют по формуле: , где — объем выборки.

При нечетном ранг — целое число, и медианой считают следующее значение: . При четном ранг — число не целое, представимое в виде , где — целое. В таком случае медианой считают значение .

Среднее арифметическоенеупорядоченной выборки вычисляют по формуле:

В случае интервального вариационного ряда формула приобретает вид: , где — частота -го интервала, — среднее арифметическое значение этого интервала.

Размах вариации– это разность между максимальным и минимальным значениями выборки:

Дисперсиейназывается средний квадрат отклонений значений признака от среднего арифметического и вычисляется по формуле:

Средним квадратическим отклонениемназывается положительный квадратный корень из дисперсии:

Среднее квадратическое отклонение имеет ту же единицу измерения, что и варьирующий признак. Оно характеризует степень отклонения значений признака от его среднего арифметического значения в абсолютных единицах.

Для сравнения варьируемости двух или нескольких выборок, имеющих разные единицы измерения, используют коэффициент вариации. Коэффициент вариации— это относительный показатель, равный отношению среднего квадратического отклонения к среднему арифметическому значению:

Принято считать, что если , то варьируемость малая, — средняя, — большая.

Отклонения выборочных коэффициентов от параметров в генеральной совокупности называются ошибками параметров. Эти ошибки возникают в силу того, что выборочная совокупность представляет генеральную совокупность только приближенно. Если взять несколько вариантов выборок объемом из одной и той же генеральной совокупности и вычислить для каждой из них среднее арифметическое, то окажется, что средние арифметические выборок варьируют вокруг среднего арифметического для генеральной совокупности в раз меньше, чем отдельные варианты. На этом основании в качестве стандартной ошибки выборочного среднего принимают величину

Чтобы подчеркнуть точность оценки среднего выборочного, его чаще всего записывают в виде: .

Пример 4. В качестве оценки силовой подготовки учащихся 5 класса произведен тест на количество подтягиваний на перекладине.

Данные теста следующие: 9, 9, 10, 11, 8, 7, 10, 7, 9, 11, 7, 8, 9, 8, 9.

Требуется вычислить моду, медиану, среднее арифметическое значение, размах вариации, дисперсию, среднее квадратическое отклонение, коэффициент вариации и ошибку выборочного среднего данной выборки.

Решение. Непосредственным подсчетом убеждаемся, что значение встречается в выборке чаще других (5 раз), следовательно, .

Для вычисления медианы производим ранжировку заданной выборки:

7, 7, 7, 8, 8, 8, 9, 9, 9, 9, 9, 10, 10, 11, 11

Объем выборки — число нечетное, поэтому ранг медианы вычисляем по формуле:

то есть медианой является 8-е значение выборки), .

Среднее арифметическое значение выборки находим, пользуясь формулой:

Крайние значения ряда) определяют минимальное и максимальное значения выборки , . Согласно определению, размах вариации равен:

Источник

Таблицы © 2021
Внимание! Информация, опубликованная на сайте, носит исключительно ознакомительный характер.

Adblock
detector