Меню

Как построить интервальную таблицу алгоритм

Как построить интервальную таблицу алгоритм

Как построить интервальный вариационный ряд

Интервальный вариационный ряд представляет собой таблицу, состоящую из двух столбцов или строк. В первом указывается интервал признака, вариация которого рассматривается, во втором – число единиц совокупности, попадающих в данный интервал (частот). Статьи по теме:

  • Как построить интервальный вариационный ряд
  • Как построить кумуляту
  • Как построить доверительный интервал

Вопрос «Как определить объем трубы?Если ее длина 200м а диаметр 65мм.» — 4 ответа Инструкция
1 Для того чтобы построить интервальный вариационный ряд, в первую очередь необходимо выбрать оптимальное число интервалов и установить длину каждого из них. При этом учтите, что длина интервала должна быть постоянной, поскольку при анализе вариационного ряда сравнивают частоты из разных групп. Оптимальное количество групп необходимо выбирать так, чтобы отразить разнообразие признаков совокупности и вместе с тем их закономерное распределение, а также исключить искажение совокупности случайными колебаниями частот. Учтите, что если групп будет слишком мало, не будет видна закономерность распределения, а если, наоборот, слишком много – случайные скачки единиц совокупности исказят ряд распределения.
2 Для определения числа групп в вариационном ряду воспользуйтесь формулой Стерждеса:
h = 1 + 3,322 х ln(n), где
h – число групп в вариационном ряду;
n – численность совокупности.
Если полученное значение окажется дробным, то за значение величины шага интервала, возьмите любое ближайшее целое число.
3 Затем определите величину интервала:
i = (Хmax – Xmin)/h, где
Хmax – максимальное значение признака в совокупности;
Xmin – минимальное значение признака в совокупности.
4 Далее заполните границы интервала. Они могут указываться разными способами: верхняя граница предыдущего интервала может повторять нижнюю границу следующего (5-10, 10-15, 15-20) или не повторять (5-10, 10,1-15, 15,1-20). За начало первого интервала А0 принимается следующее значение:
А0 = Хmin – i/2, где
i – длина интервала.
За конец j-го интервала принимается значение Аj, представляющее собой верхнюю границу j-го интервала и начало (j+1)-го интервала:
Aj = A(j-1) + i.
Построение шкалы интервалов продолжается до тех пор, пока величина Аj удовлетворяет соотношению Aj Статьи по теме:

Источник



Интервальный вариационный ряд и его характеристики

п.1. Построение интервального вариационного ряда по данным эксперимента

Интервалы, \(\left.\left[a_,a_i\right.\right)\) \(\left.\left[a_<0>,a_1\right.\right)\) \(\left.\left[a_<1>,a_2\right.\right)\) . \(\left.\left[a_,a_k\right.\right)\)
Частоты, \(f_i\) \(f_1\) \(f_2\) . \(f_k\)

Здесь k — число интервалов, на которые разбивается ряд.

Скобка \(\lfloor\ \rfloor\) означает целую часть (округление вниз до целого числа).

Скобка \(\lceil\ \rceil\) означает округление вверх, в данном случае не обязательно до целого числа.

Алгоритм построения интервального ряда
На входе: все значения признака \(\left\,\ j=\overline<1,N>\)
Шаг 1. Найти размах вариации \(R=x_-x_\)
Шаг 2. Найти оптимальное количество интервалов \(k=1+\lfloor\log_2 N\rfloor\)
Шаг 3. Найти шаг интервального ряда \(h=\left\lceil\frac\right\rceil\)
Шаг 4. Найти узлы ряда: $$ a_0=x_,\ \ a_i=1_0+ih,\ \ i=\overline <1,k>$$ Шаг 5. Найти частоты \(f_i\) – число попаданий значений признака в каждый из интервалов \(\left.\left[a_,a_i\right.\right)\).
На выходе: интервальный ряд с интервалами \(\left.\left[a_,a_i\right.\right)\) и частотами \(f_i,\ i=\overline<1,k>\)

Заметим, что поскольку шаг h находится с округлением вверх, последний узел \(a_k\geq x_\).

Например:
Проведено 100 измерений роста учеников старших классов.
Минимальный рост составляет 142 см, максимальный – 197 см.
Найдем узлы для построения соответствующего интервального ряда.
По условию: \(N=100,\ x_=142\ см,\ x_=197\ см\).
Размах вариации: \(R=197-142=55\) (см)
Оптимальное число интервалов: \(k=1+\lfloor 3,322\cdot\lg ⁡100\rfloor=1+\lfloor 6,644\rfloor=1+6=7\)
Шаг интервального ряда: \(h=\lceil\frac<55><5>\rceil=\lceil 7,85\rceil=8\) (см)
Получаем узлы ряда: $$ a_0=x_=142,\ a_i=142+i\cdot 8,\ i=\overline <1,7>$$

\(\left.\left[a_,a_i\right.\right)\) cм \(\left.\left[142;150\right.\right)\) \(\left.\left[150;158\right.\right)\) \(\left.\left[158;166\right.\right)\) \(\left.\left[166;174\right.\right)\) \(\left.\left[174;182\right.\right)\) \(\left.\left[182;190\right.\right)\) \(\left[190;198\right]\)

п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения

Например:
Продолжим анализ распределения учеников по росту.
Выше мы уже нашли узлы интервалов. Пусть, после распределения всех 100 измерений по этим интервалам, мы получили следующий интервальный ряд:

i 1 2 3 4 5 6 7
\(\left.\left[a_,a_i\right.\right)\) cм \(\left.\left[142;150\right.\right)\) \(\left.\left[150;158\right.\right)\) \(\left.\left[158;166\right.\right)\) \(\left.\left[166;174\right.\right)\) \(\left.\left[174;182\right.\right)\) \(\left.\left[182;190\right.\right)\) \(\left[190;198\right]\)
\(f_i\) 4 7 11 34 33 8 3

Найдем середины интервалов, относительные частоты и накопленные относительные частоты:

\(x_i\) 146 154 162 170 178 186 194
\(w_i\) 0,04 0,07 0,11 0,34 0,33 0,08 0,03
\(S_i\) 0,04 0,11 0,22 0,56 0,89 0,97 1

Построим гистограмму и полигон:
Гистограмма
Полигон
Построим кумуляту и эмпирическую функцию распределения:
Кумулята
Эмпирическая функция распределения
Эмпирическая функция распределения (относительно середин интервалов): $$ F(x)= \begin 0,\ x\leq 146\\ 0,04,\ 146\lt x\leq 154\\ 0,11,\ 154\lt x\leq 162\\ 0,22,\ 162\lt x\leq 170\\ 0,56,\ 170\lt x\leq 178\\ 0,89,\ 178\lt x\leq 186\\ 0,97,\ 186\lt x\leq 194\\ 1,\ x\gt 194 \end $$

п.3. Выборочная средняя, мода и медиана. Симметрия ряда

Расположение выборочной средней, моды и медианы в зависимости от симметрии ряда аналогично их расположению в дискретном ряду (см. §65 данного справочника).

Например:
Для распределения учеников по росту получаем:

\(x_i\) 146 154 162 170 178 186 194
\(w_i\) 0,04 0,07 0,11 0,34 0,33 0,08 0,03 1
\(x_iw_i\) 5,84 10,78 17,82 57,80 58,74 14,88 5,82 171,68

$$ X_=\sum_^k x_iw_i=171,68\approx 171,7\ \text <(см)>$$ На гистограмме (или полигоне) относительных частот максимальная частота приходится на 4й интервал [166;174). Это модальный интервал.
Данные для расчета моды: \begin x_o=166,\ f_m=34,\ f_=11,\ f_=33,\ h=8\\ M_o=x_o+\frac><(f_m-f_)+(f_m+f_)>h=\\ =166+\frac<34-11><(34-11)+(34-33)>\cdot 8\approx 173,7\ \text <(см)>\end На кумуляте значение 0,5 пересекается на 4м интервале. Это – медианный интервал.
Данные для расчета медианы: \begin x_o=166,\ w_m=0,34,\ S_=0,22,\ h=8\\ \\ M_e=x_o+\frac<0,5-S_>h=166+\frac<0,5-0,22><0,34>\cdot 8\approx 172,6\ \text <(см)>\end \begin \\ X_=171,7;\ M_o=173,7;\ M_e=172,6\\ X_\lt M_e\lt M_o \end Ряд асимметричный с левосторонней асимметрией.
При этом \(\frac<|M_o-X_|><|M_e-X_|>=\frac<2,0><0,9>\approx 2,2\lt 3\), т.е. распределение умеренно асимметрично.

п.4. Выборочная дисперсия и СКО

Например:
Для распределения учеников по росту получаем:

$x_i$ 146 154 162 170 178 186 194
\(w_i\) 0,04 0,07 0,11 0,34 0,33 0,08 0,03 1
\(x_iw_i\) 5,84 10,78 17,82 57,80 58,74 14,88 5,82 171,68
\(x_i^2w_i\) — результат 852,64 1660,12 2886,84 9826 10455,72 2767,68 1129,08 29578,08

$$ D=\sum_^k x_i^2 w_i-X_^2=29578,08-171,7^2\approx 104,1 $$ $$ \sigma=\sqrt\approx 10,2 $$

п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации

Подробней о том, почему и когда нужно «исправлять» дисперсию, и для чего использовать коэффициент вариации – см. §65 данного справочника.

Например:
Для распределения учеников по росту получаем: \begin S^2=\frac<100><99>\cdot 104,1\approx 105,1\\ s\approx 10,3 \end Коэффициент вариации: $$ V=\frac<10,3><171,7>\cdot 100\text<%>\approx 6,0\text<%>\lt 33\text <%>$$ Выборка однородна. Найденное значение среднего роста \(X_\)=171,7 см можно распространить на всю генеральную совокупность (старшеклассников из других школ).

п.6. Алгоритм исследования интервального вариационного ряда

На входе: все значения признака \(\left\,\ j=\overline<1,N>\)
Шаг 1. Построить интервальный ряд с интервалами \(\left.\right[a_,\ a_i\left.\right)\) и частотами \(f_i,\ i=\overline<1,k>\) (см. алгоритм выше).
Шаг 2. Составить расчетную таблицу. Найти \(x_i,w_i,S_i,x_iw_i,x_i^2w_i\)
Шаг 3. Построить гистограмму (и/или полигон) относительных частот, эмпирическую функцию распределения (и/или кумуляту). Записать эмпирическую функцию распределения.
Шаг 4. Найти выборочную среднюю, моду и медиану. Проанализировать симметрию распределения.
Шаг 5. Найти выборочную дисперсию и СКО.
Шаг 6. Найти исправленную выборочную дисперсию, стандартное отклонение и коэффициент вариации. Сделать вывод об однородности выборки.

п.7. Примеры

Пример 1. При изучении возраста пользователей коворкинга выбрали 30 человек.
Получили следующий набор данных:
18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29
Постройте интервальный ряд и исследуйте его.

1) Построим интервальный ряд. В наборе данных: $$ x_=18,\ \ x_=38,\ \ N=30 $$ Размах вариации: \(R=38-18=20\)
Оптимальное число интервалов: \(k=1+\lfloor\log_2⁡ 30\rfloor=1+4=5\)
Шаг интервального ряда: \(h=\lceil\frac<20><5>\rceil=4\)
Получаем узлы ряда: $$ a_0=x_=18,\ \ a_i=18+i\cdot 4,\ \ i=\overline <1,5>$$

\(\left.\left[a_,a_i\right.\right)\) лет \(\left.\left[18;22\right.\right)\) \(\left.\left[22;26\right.\right)\) \(\left.\left[26;30\right.\right)\) \(\left.\left[30;34\right.\right)\) \(\left.\left[34;38\right.\right)\)

Считаем частоты для каждого интервала. Получаем интервальный ряд:

\(\left.\left[a_,a_i\right.\right)\) лет \(\left.\left[18;22\right.\right)\) \(\left.\left[22;26\right.\right)\) \(\left.\left[26;30\right.\right)\) \(\left.\left[30;34\right.\right)\) \(\left.\left[34;38\right.\right)\)
\(f_i\) 1 7 12 6 4

2) Составляем расчетную таблицу:

\(x_i\) 20 24 28 32 36
\(f_i\) 1 7 12 6 4 30
\(w_i\) 0,033 0,233 0,4 0,2 0,133 1
\(S_i\) 0,033 0,267 0,667 0,867 1
\(x_iw_i\) 0,667 5,6 11,2 6,4 4,8 28,67
\(x_i^2w_i\) 13,333 134,4 313,6 204,8 172,8 838,93

3) Строим полигон и кумуляту
Пример 1
Пример 1
Эмпирическая функция распределения: $$ F(x)= \begin 0,\ x\leq 20\\ 0,033,\ 20\lt x\leq 24\\ 0,267,\ 24\lt x\leq 28\\ 0,667,\ 28\lt x\leq 32\\ 0,867,\ 32\lt x\leq 36\\ 1,\ x\gt 36 \end $$ 4) Находим выборочную среднюю, моду и медиану $$ X_=\sum_^k x_iw_i\approx 28,7\ \text <(лет)>$$ На полигоне модальным является 3й интервал (самая высокая точка).
Данные для расчета моды: \begin x_0=26,\ f_m=12,\ f_=7,\ f_=6,\ h=4\\ M_o=x_o+\frac><(f_m-f_)+(f_m+f_)>h=\\ =26+\frac<12-7><(12-7)+(12-6)>\cdot 4\approx 27,8\ \text <(лет)>\end
На кумуляте медианным является 3й интервал (преодолевает уровень 0,5).
Данные для расчета медианы: \begin x_0=26,\ w_m=0,4,\ S_=0,267,\ h=4\\ M_e=x_o+\frac<0,5-S_>>h=26+\frac<0,5-0,4><0,267>\cdot 4\approx 28,3\ \text <(лет)>\end Получаем: \begin X_=28,7;\ M_o=27,8;\ M_e=28,6\\ X_\gt M_e\gt M_0 \end Ряд асимметричный с правосторонней асимметрией.
При этом \(\frac<|M_o-X_|><|M_e-X_|> =\frac<0,9><0,1>=9\gt 3\), т.е. распределение сильно асимметрично.

5) Находим выборочную дисперсию и СКО: \begin D=\sum_^k x_i^2w_i-X_^2=838,93-28,7^2\approx 17,2\\ \sigma=\sqrt\approx 4,1 \end
6) Исправленная выборочная дисперсия: $$ S^2=\fracD=\frac<30><29>\cdot 17,2\approx 17,7 $$ Стандартное отклонение \(s=\sqrt\approx 4,2\)
Коэффициент вариации: \(V=\frac<4,2><28,7>\cdot 100\text<%>\approx 14,7\text<%>\lt 33\text<%>\)
Выборка однородна. Найденное значение среднего возраста \(X_=28,7\) лет можно распространить на всю генеральную совокупность (пользователей коворкинга).

Источник

Построение интервального вариационного ряда

date image2015-05-30
views image6928

facebook icon vkontakte icon twitter icon odnoklasniki icon

Кроме дискретного вариационного ряда часто встречается такой способ группировки данных, как интервальный вариационный ряд.

Интервальный ряд строится если:

а) признак имеет непрерывный характер изменения;

б) дискретных значений получилось очень много (больше 10)

в) частоты дискретных значений очень малы (не превышают 1-3 при относительно большем количестве единиц наблюдения);

г) много дискретных значений признака с одинаковыми частотами.

Интервальный вариационный ряд – это способ группировки данных в виде таблицы, которая имеет две графы (значения признака в виде интервала значений и частота каждого интервала).

В отличие от дискретного ряда значения признака интервального ряда представлены не отдельными значениями, а интервалом значений («от — до»).

Число, которое показывает, сколько единиц наблюдения попало в каждый выделенный интервал, называется частота значения признака и обозначают fi. Сумма всех частот ряда равна количеству элементов (единиц наблюдения) в изучаемой совокупности.

Если единица обладает значением признака, равным величине верхней границы интервала, то ее следует относить к следующему интервалу.

Например, ребёнок с ростом 100 см попадёт во 2-ой интервал, а не в первый; а ребёнок с ростом 130 см попадёт в последний интервал, а не в третий.

На основании этих данных можно построить интервальный вариационный ряд.

xi (рост ребенка) fi (кол-во детей с таким ростом)
90-100
100-110
110-130
больше 130
Всего

У каждого интервала есть нижняя граница (хн), верхняя граница (хв) и ширина интервала (i).

Граница интервала – это значение признака, которое лежит на границе двух интервалов.

рост детей (см) рост детей (см) количество детей
хн хв
90-100
100-110
110-130
больше 130
Всего

Если у интервала есть верхняя и нижняя граница, то он называется закрытый интервал. Если у интервала есть только нижняя или только верхняя граница, то это – открытый интервал. Открытым может быть только самый первый или самый последний интервал. В приведённом примере последний интервал – открытый.

Ширина интервала (i) – разница между верхней и нижней границей.

Ширина открытого интервала принимается такой же, как ширина соседнего закрытого интервала.

рост детей (см) количество детей Ширина интервала (i)
хн хв
100-90=10
110-100=10
130-110=20
для расчётов 130+20=150 20 (потому что ширина соседнего закрытого интервала – 20)
всего

Все интервальные ряды делятся на интервальные ряды с равными интервалами и интервальные ряды с неравными интервалами. В интервальных рядах с равными интервалами ширина всех интервалов одинаковая. В интервальных рядах с неравными интервалами ширина интервалов разная.

В рассматриваемом примере — интервальный ряд с неравными интервалами.

Алгоритм построения интервального вариационного
ряда с равными интервалами

Источник

Как построить вариационный ряд в Excel

Вариационный ряд может быть:

дискретным, когда изучаемый признак характеризуется определенным числом (как правило целым).

интервальным, когда определены границы «от» и «до» для непрерывно варьируемого признака. Интервальный ряд также строят если множество значений дискретно варьируемого признака велико.

Рассмотрим пример построения дискретного вариационного ряда.

Пример 1. Имеются данные о количественном составе 60 семей.

Построить вариационный ряд и полигон распределения

Решение .

Алгоритм построения вариационного ряда:

1) Откроем таблицы Excel.

2) Введем массив данных в диапазон А1:L5. Если вы изучаете документ в электронной форме (в формате Word, например), для этого достаточно выделить таблицу с данными и скопировать ее в буфер, затем выделить ячейку А1 и вставить данные – они автоматически займут подходящий диапазон.

3) Подсчитаем объем выборки n – число выборочных данных, для этого в ячейку В7 введем формулу =СЧЁТ(А1:L5). Заметим, что для того, чтобы в формулу ввести нужный диапазон, необязательно вводить его обозначение с клавиатуры, достаточно его выделить.

4) Определим минимальное и максимальное значение в выборке, введя в ячейку В8 формулу =МИН(А1:L5), и в ячейку В9: =МАКС(А1:L5).

Рис.1.1 Пример 1. Первичная обработка статистических данных в таблицах Excel

5) Далее, подготовим таблицу для построения вариационного ряда, введя названия для столбца интервалов (значений варианты) и столбца частот. В столбец интервалов введем значения признака от минимального (1) до максимального (6), заняв диапазон В12:В17.

6) Выделим столбец частот, введем формулу =ЧАСТОТА(А1:L5;В12:В17) и нажмем сочетание клавиш CTRL+SHIFT+ENTER

Рис.1.2 Пример 1. Построение вариационного ряда

7) Для контроля вычислим сумму частот при помощи функции СУММ (значок функции S в группе «Редактирование» на вкладке «Главная»), вычисленная сумма должна совпасть с ранее вычисленным объемом выборки в ячейке В7.

Построим полигон:

1) выделив полученный диапазон частот, выберем команду «График» на вкладке «Вставка». По умолчанию значениями на горизонтальной оси будут порядковые числа — в нашем случае от 1 до 6, что совпадает со значениями варианты (номерами тарифных разрядов).

2) Название ряда диаграммы «ряд 1» можно либо изменить, воспользовавшись той же опцией «выбрать данные» вкладки «Конструктор», либо просто удалить.

Рис.1.3. Пример 1. Построение полигона частот

Источник

Читайте также:  Таблица слогов и слов для скорочтения
Adblock
detector