Меню

Построить функцию распределения случайной величины заданной таблицей



2.2.7. Функция распределения случайной величины

И для дискретной, и для непрерывной случайной величины она определяется одинаково:

, где – вероятность того, что случайная величина примет значение, МЕНЬШЕЕ, чем переменная , которая«пробегает» все действительные значения от «минус» до «плюс» бесконечности.

Построим функцию распределения для нашей подопытной игры:

Начинаем разбираться. Чему, например, равно значение ? Это вероятность того, что выигрыш будет меньше, чем –20. И это невозможное событие: . Совершенно понятно, что и для всех «икс» из интервала , а также для . Почему? По определению функции распределения:
– вы согласны? Функция возвращает вероятность того, что в точке выигрыш будет СТРОГО МЕНЬШЕ «минус» пяти.

Таким образом: , если .
На интервале функция , поскольку левее любой точки этого интервала есть только одно значение случайной величины, которое появляется с вероятностью 0,5. Кроме того, сюда же следует отнести точку , так как:
– очень хорошо осознайте этот момент!

Таким образом, если , то

Далее рассматриваем промежуток . СТРОГО ЛЕВЕЕ любой точки этого промежутка находятся два выигрыша , поэтому:

И, наконец, если , то , ибо все значения случайной величины лежат СТРОГО левее любой точки интервала

Заметим, кстати, важную особенность: коль скоро функция характеризует вероятность, то она может принимать значения лишь из промежутка – и никакие другие!

Итак, функция распределения вероятностей ДСВ является кусочной и, как многие знают, в таких случаях принято использовать фигурные скобки:

График данной функции имеет разрывный «ступенчатый» вид:

Причём, функция или её график однозначно определяют сам закон распределения: в точке высота «ступеньки» (разрыв) составляет (следим по графику), в точке «скачок» разрыва равен и, наконец, в точке он равен в точности .
Таким образом, функция распределения вероятностей – это ещё один способ ЗАДАТЬ случайную величину. И этот способ особо важен для непрерывной случайной величины – по той причине, что её невозможно описать таблицей (ввиду бесконечного и несчётного количества принимаемых значений). Однако, всему своё время, и НСВ – тоже.

Освоим технические моменты решения типовой задачи:

Задача 93
Построить функцию распределения случайной величины

Найти вероятности того, что случайная величина примет значение из следующих промежутков:

…, пожалуй, достаточно.

Решение: На практике удобно использовать формальный алгоритм построения функции распределения:

Сначала берём первое значение и составляем нестрогое неравенство . На этом промежутке .

На промежутке (между и ):

На промежутке (между и ):

На промежутке (между и ):

И, наконец, если строго больше самого последнего значения , то:

Легко заметить, что с увеличением «икс» идёт накопление (суммирование) вероятностей, и поэтому функцию иногда называют интегральной функцией распределения. В практических задачах проведённые выше действия обычно выполняют устно, а результат сразу записывают под единую скобку:

Выполним чертёж:

и проконтролируем правильность решения с помощью «скачков» графика: в точке «скачок» равен , в точке составляет , в точке равен , и, наконец, в точке – .

При выполнении чертежа от руки оптимален следующий масштаб:
горизонтальная ось: 1 ед. = 2 или 1 тетрадная клетка;
вертикальная ось: 0,1 = 1 тетрадная клетка.

На левых концах ступенек (кроме нижнего луча) можно ставить выколотые точки – дело вкуса. Левый нижний луч следует прочертить жирно (чтобы он не сливался с координатной осью) и до конца оси! Правая верхняя линия не должна заканчиваться раньше острия оси! Такие оплошности могут говорить о непонимании функции распределения, а это, как вы понимаете, скверно. То было ручное построение. Ну а о том, как строить такие красивые графики в Экселе можно узнать в этом ролике на Ютубе, к слову, полигон (многоугольник) распределения строится ещё проще.

Переходим ко второй части задания, её коротко можно сформулировать так:

Полную и свежую версию этой книги в pdf-формате ,
а также курсы по другим темам можно найти здесь.

Также вы можете изучить эту тему подробнее – просто, доступно, весело и бесплатно!

С наилучшими пожеланиями, Александр Емелин

Источник

Дискретные распределения вероятностей и их параметры

п.1. Общие свойства дискретного распределения

Согласно данному определению дискретная величина может быть определена либо на бесконечном счетном множестве, либо на конечном множестве (которое всегда счетное).
Напомним, что счетным называется множество, которое эквивалентно множеству натуральных чисел, т.е. элементы которого можно пронумеровать (см. §11 справочника для 8 класса).

Например:
1) При подбрасывании игрального кубика мы получаем всего 6 исходов. Случайная величина X – выпавшее число очков – принимает конечное число значений \(\Omega=\left\<1;2;3;4;5;6\right\>\), т.е. является дискретной конечной случайной величиной.
2) Случайная величина X – количество поступивших вызовов на сервер за сутки – не ограничена сверху и может принимать значения \(\Omega=\left\<1;2;3;. \right\>\)

Случайная величина полностью описывается своим законом распределения.
Закон распределения может быть задан аналитически (формулой), таблично или графически.

Например:
В результате измерения температуры учеников школы получен следующий ряд распределения:

t, °C 36,3 36,4 36,5 36,6 36,7 36,8 36,9 37,0 37,1
p(t) 0,05 0,07 0,15 0,33 0,31 0,11 0,04 0,01 0,01

Чтобы вспомнить о несовместных событиях и полной группе событий – см. §39 справочника для 9 класса.

Например:
Пусть в урне находится 2 белых и 3 черных шара. Мы достаем шар, смотрим на его цвет, возвращаем его обратно и все шары перемешиваем. Таким образом, событие A=«достали белый шар» каждый раз является независимым от предыдущих и имеет вероятность \(p=\frac25\).
Пусть мы провели n=3 испытания. В 3 испытаниях можно получить от 0 до 3 белых шаров. Вероятность событий \(k\in\left\<0;1;2;3\right\>\) описывается биномиальным законом распределения (см. §40 справочника для 9 класса): $$ P_3(k)=C_3^k p^k q^<3-q>,\ \ k=\overline <0;3>$$ Получаем закон распределения: \begin P_3(0)=C_3^0 p^0 q^<3-0>=q^3=\left(\frac35\right)^3=\frac<27><125>\\ P_3(1)=C_3^1 p^1 q^<3-1>=3pq^2=3\cdot \frac25\cdot \left(\frac35\right)^2=\frac<54><125>\\ P_3(2)=C_3^2 p^2 q^<3-2>=3p^2q=3\cdot \left(\frac25\right)^2\cdot \frac35=\frac<36><125>\\ P_3(3)=C_3^3 p^3 q^<3-3>=p^3=\left(\frac25\right)^3=\frac<8> <125>\end

k 1 2 3
\(P_3(k)\) \(\frac<27><125>\) \(\frac<54><125>\) \(\frac<36><125>\) \(\frac<8><125>\)

п.2. Функция распределения дискретной случайной величины

Для дискретной случайной величины функция распределения будет ступенчатой кусочно-непрерывной функцией, область значений которой: \(F(x)\in[0;1]\).
Слева на графике функции распределения будет нулевая «ступенька», а справа – единичная «ступенька».

Например:
Найдем из закона распределения случайной величины k, полученного в предыдущем примере для урны с шарами, функцию распределения.

k 1 2 3
\(P_3(k)\) \(\frac<27><125>\) \(\frac<54><125>\) \(\frac<36><125>\) \(\frac<8><125>\)
\(F(k)\) \(\frac<27><125>\) \(\frac<27+54><125>=\frac<81><125>\) \(\frac<81+36><125>=\frac<117><125>\) \(\frac<117+8><125>=1\)

Изобразим графически закон распределения в виде гистограммы:
Функция распределения дискретной случайной величины
Построим график для функции распределения: \begin F(k)= \begin 0,\ k\leq 0\\ \frac<27><125>,\ 0\lt k\leq 1\\ \frac<81><125>,\ 1\lt k\lt 2\\ \frac<117><125>,\ 2\lt k\leq 3\\ 1,\ k\gt 3 \end \end Функция распределения дискретной случайной величины

п.3. Числовые характеристики дискретного распределения

Числовыми характеристиками дискретного распределения являются математическое ожидание, дисперсия и среднее квадратичное отклонение (СКО).
Подробно о свойствах этих характеристик – см. §41 справочника для 9 класса.

Здесь мы приведем только основные определения.

Например:
Рассчитаем числовые характеристики для урны с шарами из предыдущего примера.
Составим расчетную таблицу:

\(x_i\) 1 2 3
\(p_i\) \(\frac<27><125>\) \(\frac<54><125>\) \(\frac<36><125>\) \(\frac<8><125>\) \(1\)
\(x_i p_i\) \(0\) \(\frac<54><125>\) \(\frac<72><125>\) \(\frac<24><125>\) \(1,2\)
\(x_i^2\) 1 4 9
\(x_i^2 p_i\) \(0\) \(\frac<54><125>\) \(\frac<144><125>\) \(\frac<72><125>\) \(2,16\)

Получаем \begin M(X)=\sum_^3 x_i p_i=1,2=\frac65\\ D(X)=\sum_^3 x_i^2 p_i-M^2(X)=2,16-1,2^2=0,72=\frac<18><25>\\ \sigma(X)=\sqrt=\sqrt<\frac<18><25>>=\frac<3\sqrt<2>> <5>\end В научных статьях и технической документации принято записывать случайные величины в виде \(x=M(X)\pm\sigma (X)\).
В данном случае для числа вынутых белых шаров в 3 испытаниях можем записать: $$ k=\frac<6\pm 3\sqrt<2>> <5>$$

п.4. Таблица дискретных распределений и их параметров

Название Принятое
обозначение
Плотность
распределения
Мат.
ожидание
Дисперсия
Дискретное равномерное \(U(N)\) \begin P(\left\)=\frac1N\\ N\in\mathbb,\ k\in\left\ <1. N\right\>\end

\(\frac<2>\) \(\frac<12>\)
Бернулли \(B(1,p)\) \begin P(0)=1-p=q\\ P(1)=p\\ k\in\left\ <0;1\right\>\end

\(p\) \(pq\)
Биномиальное \(B(n,p)\) \begin P(\left\)=C_n^k p^k q^\\ n\in\mathbb,\ k=\in\left\ <0,1. n\right\>\end

\(np\) \(npq\)
Пуассона \(Pois(\lambda)\) \begin P(\left\)=\frac<\lambda^k>e^<-\lambda>\\ \lambda\gt 0,\ k=\in\left\ <0,1. n\right\>\end

\(\lambda\) \(\lambda\)
Геометрическое \(Geopm(p)\) \begin P(\left\)=pq^\\ k=\in\left\ <0,1,2. \right\>\end

\(\frac1p\) \(\frac\)
Гипер-геометрическое \(HG(D,N,n)\) \begin P(\left\)=\frac^> \end

\(\frac\) $$\frac<\frac\left(1-\frac DN\right)(N-n)>$$

п.5. Примеры

Пример 1. Выведите формулы для мат.ожидания и дисперсии дискретного равномерного распределения

Предварительно заметим, что по формуле суммы арифметической прогрессии: $$ \sum_^N k_i=1+2+. +N=\frac <2>$$ А сумму квадратов можно найти по формуле Архимеда (доказательство – см. пример 2 в §25 справочника для 9 класса): $$ \sum_^N k_i^2=1^2+2^2+. +N^2=\frac <6>$$ Найдем математическое ожидание: $$ M(X)=\sum_^N k_ip_i=\sum_^N k_i\cdot \frac1N=\frac1N(1+2+. +N)=\frac1N\cdot\frac<2>=\frac <2>$$ Найдем дисперсию: \begin D(X)=\sum_^N k_i^2 p_i-M^2(X)=\sum_^N k_i^2\cdot\frac1N-M^2(X)=\\ =\frac1N\cdot\frac<6>-\left(\frac<2>\right)^2=\frac<(N+1)(2N+1)><6>-\frac<(N+1)^2><4>=\\ =\frac<2>\left(\frac<2N+1><3>-\frac<2>\right)=\frac<2>\cdot\frac<4N+2-3N-3><6>=\frac<2>\cdot\frac<6>=\frac <12>\end В частности, для игрального кубика: $$ N=6;\ p_i=\frac16;\ M(X)=\frac<6+1><2>=3,5;\ D(X)=\frac<6^2-1><12>=2\frac<11> <12>$$
Ответ: \(M(X)=\frac<2>;\ D(X)=\frac<12>\)

Пример 2. Выведите формулы для мат.ожидания и дисперсии распределения Бернулли.

Найдем математическое ожидание: $$ M(X)=0\cdot (1-p)+1\cdot p=p $$ Найдем дисперсию: \begin D(X)=(0^2\cdot(1-p)+1^2\cdot p)-M^2(X)=p-p^2=p(1-p)=pq \end
Типичным примером является бросание монеты, где \(M(X)=p=0,5\) и \(D(X)=0,5\cdot 0,5=0,25\). Дисперсия максимальна для нефальшивой монеты.

Рассмотрим другой пример – бросание фальшивой монеты, для которой вероятность выпадения орла (k=1) равна p=0,7. Тогда \(M(k)=p=0,7\), дисперсия \(D(k)=0,7\cdot 0,3=0,21\). Как и ожидалось, для фальшивой монеты средняя величина возрастает (70% бросков заканчивается выпадением орла). При этом дисперсия уменьшается.

Пример 3. Выведите формулы для мат.ожидания и дисперсии биномиального распределения.

Математическое ожидание и дисперсию для одного опыта Бернулли мы получили в примере 2: \(M(X)=p,\ D(X)=pq\).

Общее число успехов при n опытах складывается из числа успехов при каждом опыте, т.е. \(X=X_1+X_2+. +X_n\). Все опыты между собой независимы.
По свойству мат.ожидания суммы независимых событий (см. §41 справочника для 9 класса): \begin M(X)=M(X_1+X_2+. +X_n)=M(X_1)+M(X_2)+. +M(X_n)=\\ =\underbrace_=np \end По свойству дисперсии суммы независимых событий (см. §41 справочника для 9 класса): \begin D(X)=D(X_1+X_2+. +X_n)=D(X_1)+D(X_2)+. +D(X_n)=\\ =\underbrace_=npq \end Например, пусть событие A=«уронить молоток на ногу» имеет вероятность p=0,1.
Тогда для n=100 забиваний гвоздей вы в среднем уроните молоток на ногу
\(M(X)=np=100\cdot 0,1=10\) раз
Дисперсия этого события \(D(X)=npq=100\cdot 0,1\cdot 0,9=9\)
СКО \(\sigma(X)=\sqrt=3\)
По правилу «трех сигм» интервал оценки: \begin 10-3\cdot 3\lt X\lt 10+3\cdot 3\\ -17\lt X\lt 37\\ 0\leq X\leq 36 \end Скорее всего (вероятность 99,72%), вы уроните молоток от 0 до 36 раз.

Ответ: \(M(X)=np,\ D(X)=npq\)

Пример 4. Выведите формулы для мат.ожидания и дисперсии распределения Пуассона.

Распределение Пуассона получается из биномиального распределения предельным переходом \(n\rightarrow\infty,\ p\rightarrow 0,\ np\rightarrow\lambda\).
Найдем математическое ожидание как предел мат. ожидания биномиального распределения: $$ M(X)=\lim_M_B(X)=\lim_(np)=\lambda $$ Т.е. параметр \(\lambda\) является средним числом удачных исходов.
Дисперсия, если учесть что \(p\rightarrow 0\), а значит \(q=1-p\rightarrow 1\) $$ D(X)=\underset<\lim_> D_B(X)=\underset<\lim_>(npq)=\lambda\cdot 1=\lambda $$
Например, в городе размерами 10х10 км болеет гриппом 1000 человек.
С какой вероятностью в комнате размерами 10х10 м:
а) не окажется больных;
б) окажется 1 больной?
Площадь города в метрах \(S=(10^4)^2=10^8\) м 2
Площадь комнаты в метрах \(s_0=10^2\) м 2
Среднее количество больных в комнате: \(\lambda=N\frac=10^3\cdot\frac<10^2><10^3>=10^<-3>=0,001\)
а) вероятность того, что в комнате не окажется больных: $$ p_0=\frac<0,001^0><0!>e^<-0,001>=e^<-0,001>\approx 1-0,001=0,999 $$ Здесь мы использовали формулу приближенных вычислений \(e^x\approx 1+x,\ x\rightarrow 0\) (см. §52 данного справочника).
б) вероятность того, что в комнате окажется один больной: $$ p_1=\frac<0,001^1><1!>e^<-0,001>=0,000999\approx 0,001 $$ Вероятность всех остальных случаев пренебрежимо мала.
Таким образом, при малых \(\lambda\) вероятности \(p_0\approx 1-\lambda,\ p_1\approx\lambda\), т.е. фактически мы получаем распределение Бернулли.
Ответ: \(M(X)=\lambda ,\ D(X)=\lambda\)

Источник

Многоугольник и функция распределения
дискретной случайной величины

Приветствую вас в 3-й части урока, посвящённого дискретной случайной величине. Тому, кто зашёл с поисковика, рекомендую сначала прочитать о понятии, математическом ожидании и дисперсии ДСВ, после чего вернуться к этой статье, где мы узнаем о других способах задания случайной величины и научимся строить соответствующие графики.

Итак, пусть дискретная случайная величина задана своим законом распределения:

Многоугольником распределения вероятностей данной величины называют ломаную, звенья которой соединяют соседние точки . Термин, на мой взгляд, не слишком удачен, но так сошлись звёзды.

Всё очень просто:

Построить многоугольник распределения вероятностей случайной величины

Решение: чертим прямоугольную систему координат, в которой по оси абсцисс отсчитываются – значения случайной величины, а по оси ординат – их вероятности. Отмечаем на чертеже точки , в данном случае их пять, и соединяем «соседей» отрезками:

При выполнении чертежа от руки по возможности придерживайтесь следующего масштаба:

горизонтальная ось: 1 ед. = 2 тетрадные клетки (1 см);
вертикальная ось: 0,1 = 2 тетрадные клетки.

Если значения достаточно велики, то ось абсцисс можно «разорвать» (не чертить её кусочек после единицы), и справа продолжить нумерацию, например, с 20.

Теперь обратите внимание на следующую важную вещь: помимо того, что дискретную случайную величину можно изобразить с помощью многоугольника – её ведь можно ещё и ЗАДАТЬ этим способом. До сих пор мы делали это с помощью таблички, но никто же не мешает использовать и чертёж:

Дискретная случайная величина задана своим многоугольником

Записать закон распределения данной случайной величины.

Это задание для самостоятельного решения.

Иногда вместо «многоугольника» говорят о полигоне распределения вероятностей, но этот вариант больше применим в математической статистике.

На практике разобранные задачи встречаются не так уж редко, и поэтому я счёл нужным включить их в данную статью. Однако гораздо бОльшее распространение получила функция распределения случайной величины.

Стандартное обозначение:

И для дискретной, и для непрерывной случайной величины она определяется одинаково:

, где – вероятность того, что случайная величина примет значение, МЕНЬШЕЕ, чем переменная , которая «пробегает» все действительные значения (от «минус» до «плюс» бесконечности).

Смысл функции распределения хорошо иллюстрирует наша любимая игра:

Чему, например, равно значение ? Это вероятность того, что выигрыш будет меньше, чем –20. И это невозможное событие: . Совершенно понятно, что и для всех «икс» из интервала , а также для . Почему? По определению функции распределения:

– вы согласны? Функция возвращает вероятность того, что в точке выигрыш будет СТРОГО МЕНЬШЕ «минус» пяти.

Таким образом: , если .

На интервале функция , поскольку левее любой точки этого интервала есть только одно значение случайной величины, которое появляется с вероятностью 0,5. Кроме того, сюда же следует отнести точку , так как:

– очень хорошо осознайте этот момент!

Таким образом, если , то

Далее рассматриваем промежуток . СТРОГО ЛЕВЕЕ любой точки этого промежутка находятся два выигрыша , поэтому:

И, наконец, если , то , ибо все значения случайной величины лежат строго левее любой точки

Заметим, кстати, важную вещь: коль скоро, функция характеризуем вероятность, то она может принимать значения лишь из промежутка – и никакие другие!

Итак, функция распределения вероятностей ДСВ является кусочной и, как многие знают, в таких случаях принято использовать фигурные скобки:

График данной функции имеет разрывный «ступенчатый» вид:

– о том, как построить такой чертёж в Экселе, смотрИте ролик по ссылке.

Причём, функция или её график однозначно определяют сам закон распределения:

– в точке «скачок» разрыва равен 0,5 (следим по чертежу) – и это в точности вероятность этого значения;

– в точке «скачок» составляет ;

– и для выигрыша «высота ступеньки» равна .

Таким образом, функция распределения вероятностей – это ещё один способ ЗАДАТЬ случайную величину. И этот способ особо важен для непрерывной случайной величины – по той причине, что её невозможно описать таблицей (ввиду бесконечного и несчётного количества принимаемых значений). Однако, всему своё время.

Сейчас мы освоим технические моменты решения типовой задачи:

Построить функцию распределения случайной величины

Найти вероятности того, что случайная величина примет значение из следующих промежутков:

Решение: рассмотрим формальный алгоритм построения функции распределения.

Сначала берём первое значение и составляем нестрогое неравенство . На этом промежутке .

На промежутке (между и ):

На промежутке (между и ):

На промежутке (между и ):

И, наконец, если строго больше самого последнего значения , то:

Легко заметить, что с увеличением «икс» идёт накопление (суммирование) вероятностей, и поэтому функцию также называют интегральной функцией распределения. В практических задачах проведённые выше действия обычно выполняют в уме, а результат сразу записывают под единую скобку:

Выполним чертёж:

и проконтролируем правильность решения с помощью «скачков» графика: в точке «скачок» равен , в точках:

При выполнении чертежа от руки оптимален следующий масштаб:

горизонтальная ось: 1 ед. = 2 или 1 тетрадная клетка;
вертикальная ось: 0,1 = 1 тетрадная клетка.

На левых концах ступенек (кроме нижнего луча) можно ставить выколотые точки – дело вкуса. И ещё хочу остановиться на двух технических ошибках, которые часто допускают на практике. При выполнении чертежа простым карандашом левый нижний луч следует прочерчивать жирно (чтобы он не сливался с координатной осью) и до конца оси! Второй момент: правая верхняя линия не должна заканчиваться раньше острия оси! Такие оплошности могут говорить о непонимании функции распределения, а это, как вы понимаете, скверно.

Переходим ко второй части задания.

Найдём – вероятность того, что случайная величина примет значение из интервала .

И здесь я сформулирую практическое правило: если оба конца и промежутка не «попадают» в точки разрыва функции , то следующие вероятности: , можно найти по единой формуле:

В данном случае концы интервала (–1 и 5) находятся в области непрерывности функции распределения поэтому:

И действительно, на данном интервале находятся значения , вероятности появления которых: .

Вычислим вероятность . Оба конца этого промежутка не «попадают» в точки разрыва, поэтому:
– вероятность того, что случайная величина примет значение из данного промежутка. И в самом деле – на нём находится единственное значение , которое может появиться с вероятностью 0,2.

Та же самая история с – единственное, тут левый конец промежутка равен «минус» бесконечности:
– самостоятельно проанализируйте, какие значения , и с какими вероятностями располагаются на полуинтервале

Теперь более занятная ситуация, где нужно особо включать голову: если хотя бы один из концов , промежутка «попадает» в точку разрыва функции , то указанную выше формулу можно использовать лишь в одном случае из четырёх:

! Примечание: если , то левое неравенство становится строгим, но формула тоже применима.

Это равенство строго доказывается в курсе теории вероятностей – перепишите в свой справочник!

Найдём . Тут сразу оба конца «попали». Как быть? – под правило не подходит! Вспоминаем теоремы тервера. По теореме сложения вероятностей несовместных событий:

– вероятность того, что случайная величина примет значение из отрезка . И действительно, этот отрезок включает в себя два значения , которые появляются с вероятностями .

Тут же рассмотрим три других варианта:
, т.к. на интервале нет значений случайной величины. Да-да, так и пишем.

– это «штатный» теоретический случай (см. выше).

И для 2-го полуинтервала используем теорему сложения вероятностей несовместных событий:

Едем дальше:
, поскольку там нет значений случайной величины. Кстати, случай с нестрогим неравенством – есть «штатный» случай:

который можно записать и так: – ведь на функции распределения «свет клином не сошёлся»!

И, наконец, типовая вероятность – того, что значение случайной величины отклонится от своего математического ожидания не более чем на одно среднее квадратическое отклонение. Как вы догадываетесь, их нужно предварительно вычислить, но эти числовые характеристики уже найдены в Примере 6 статьи о дисперсии: . Раскрываем модуль и пользуемся тем фактом, что концы интервала не «попадают» в точки разрыва функции распределения:

Напоминаю, что в типичном случае на интервале и / или вблизи него «сконцентрированы» наиболее вероятные значения случайной величины. Так сказать, «центр событий».

Ответ:

Напоминаю, что для любителей комфорта есть соответствующая программа (см. после Примера 6), которая строит графики автоматически; причём результаты её работы элементарно копируются в Вёрд.

И аналогичное задание для самопроверки:

Составить функцию распределения случайной величины

Выполнить чертёж. Найти вероятности следующих событий:

Подумайте над рациональным масштабом графика. Если возникают сомнению с нахождением вероятностей, помните – их всегда можно пересчитать вручную.

Решение и ответ совсем рядом. Кроме того, несколько дополнительных задач есть в библиотеке.

И не успела появиться эта статья, как от читателей сайта стали поступать просьбы включить в неё контрольный пример. Я даже прослезился (прямо как тот профессор), и, конечно же, не мог вам отказать:

В билете три задачи. Вероятность того, что студент правильно решит первую задачу, равна 0,9, вторую – 0,8, третью – 0,7. Составить закон распределения числа правильно решенных задач в билете, вычислить математическое ожидание и дисперсию этой случайной величины. Построить график функции распределения. Найти вероятность того, что студент сдаст зачёт, если для этого нужно правильно решить не менее двух задач.

Проверьте, насколько хорошо вы усвоили материал. Тут нужно использовать теоремы сложения и умножения, и могут возникнуть накладки с обозначениями. В образце решения я обозначил , а вероятности значений случайной величины – через .

На самом деле таких задач довольно много, и сейчас нас ожидают наиболее распространённые виды дискретных распределений:

После чего мы перейдём к изучению непрерывной случайной величины.

Да, наш урок, посвященный дискретной случайной величине, подошел к концу – но это не значит, что тема закрыта!

Вперёд – за новыми открытиями!

Решения и ответы:

Пример 12. Решение: запишем закон распределения случайной величины :

Контроль:

Пример 14. Решение: составим функцию распределения вероятностей:

Выполним чертёж:

Примечание: сплошная нумерация по оси абсцисс представлена исключительно ради удобства восприятия.

Вычислим вероятности того, что случайная величина примет значение из предложенных интервалов:

более простой способ:

(«штатный» случай)
(частный случай «штатной» формулы)

Числовые характеристики найдены в Примере 8, вычислим вероятность того, что случайная величина отклонится от математического ожидания не более чем на среднее квадратическое отклонение:

Пример 15. Решение: найдём вероятности того, что соответствующие задачи будут решены неверно:

Используя теоремы умножения независимых и сложения несовместных событий, составим закон распределения случайной величины – числа правильно решенных задач в билете:

0) (все задачи решены неверно)

3) (все задачи решены правильно)

Таким образом, искомый закон распределения:

Контроль: 0,006 + 0,092 + 0,398 + 0,504 = 1

Вычислим и . Заполним расчетную таблицу:

Математическое ожидание:
Дисперсия: .

Составим функцию распределения:

Выполним чертеж:

Найдём вероятность – того, что студент сдаст зачёт:

Автор: Емелин Александр

(Переход на главную страницу)

«Всё сдал!» — онлайн-сервис помощи студентам

Источник

Функция распределения и плотность вероятности в MS EXCEL

13 октября 2016 г.

Даны определения Функции распределения случайной величины и Плотности вероятности непрерывной случайной величины. Эти понятия активно используются в статьях о статистике сайта ]]> www.excel2.ru ]]> . Рассмотрены примеры вычисления Функции распределения и Плотности вероятности с помощью функций MS EXCEL .

Введем базовые понятия статистики, без которых невозможно объяснить более сложные понятия.

Генеральная совокупность и случайная величина

Пусть у нас имеется генеральная совокупность (population) из N объектов, каждому из которых присуще определенное значение некоторой числовой характеристики Х.

Примером генеральной совокупности (ГС) может служить совокупность весов однотипных деталей, которые производятся станком.

Поскольку в математической статистике, любой вывод делается только на основании характеристики Х (абстрагируясь от самих объектов), то с этой точки зрения генеральная совокупность представляет собой N чисел, среди которых, в общем случае, могут быть и одинаковые.

В нашем примере, ГС — это просто числовой массив значений весов деталей. Х – вес одной из деталей.

Если из заданной ГС мы выбираем случайным образом один объект, имеющей характеристику Х, то величина Х является случайной величиной . По определению, любая случайная величина имеет функцию распределения , которая обычно обозначается F(x).

Функция распределения

Функцией распределения вероятностей случайной величины Х называют функцию F(x), значение которой в точке х равно вероятности события X Поясним на примере нашего станка. Хотя предполагается, что наш станок производит только один тип деталей, но, очевидно, что вес изготовленных деталей будет слегка отличаться друг от друга. Это возможно из-за того, что при изготовлении мог быть использован разный материал, а условия обработки также могли слегка различаться и пр. Пусть самая тяжелая деталь, произведенная станком, весит 200 г, а самая легкая — 190 г. Вероятность того, что случайно выбранная деталь Х будет весить меньше 200 г равна 1. Вероятность того, что будет весить меньше 190 г равна 0. Промежуточные значения определяются формой Функции распределения. Например, если процесс настроен на изготовление деталей весом 195 г, то разумно предположить, что вероятность выбрать деталь легче 195 г равна 0,5.

Типичный график Функции распределения для непрерывной случайной величины приведен на картинке ниже (фиолетовая кривая, см. файл примера ):

В справке MS EXCEL Функцию распределения называют Интегральной функцией распределения ( Cumulative Distribution Function , CDF ).

Приведем некоторые свойства Функции распределения:

  • Функция распределения F(x) изменяется в интервале [0;1], т.к. ее значения равны вероятностям соответствующих событий (по определению вероятность может быть в пределах от 0 до 1);
  • Функция распределения – неубывающая функция;
  • Вероятность того, что случайная величина приняла значение из некоторого диапазона [x1;x2): P(x 1 2 )=F(x 2 )-F(x 1 ).

Существует 2 типа распределений: непрерывные распределения и дискретные распределения .

Дискретные распределения

Если случайная величина может принимать только определенные значения и количество таких значений конечно, то соответствующее распределение называется дискретным . Например, при бросании монеты, имеется только 2 элементарных исхода, и, соответственно, случайная величина может принимать только 2 значения. Например, 0 (выпала решка) и 1 (не выпала решка) (см. схему Бернулли ). Если монета симметричная, то вероятность каждого исхода равна 1/2. При бросании кубика случайная величина принимает значения от 1 до 6. Вероятность каждого исхода равна 1/6. Сумма вероятностей всех возможных значений случайной величины равна 1.

Примечание : В MS EXCEL имеется несколько функций, позволяющих вычислить вероятности дискретных случайных величин. Перечень этих функций приведен в статье Распределения случайной величины в MS EXCEL .

Непрерывные распределения и плотность вероятности

В случае непрерывного распределения случайная величина может принимать любые значения из интервала, в котором она определена. Т.к. количество таких значений бесконечно велико, то мы не можем, как в случае дискретной величины, сопоставить каждому значению случайной величины ненулевую вероятность (т.е. вероятность попадания в любую точку (заданную до опыта) для непрерывной случайной величины равна нулю). Т.к. в противном случае сумма вероятностей всех возможных значений случайной величины будет равна бесконечности, а не 1. Выходом из этой ситуации является введение так называемой функции плотности распределения p(x) . Чтобы найти вероятность того, что непрерывная случайная величина Х примет значение, заключенное в интервале (а; b), необходимо найти приращение функции распределения на этом интервале:

Как видно из формулы выше плотность распределения р(х) представляет собой производную функции распределения F(x), т.е. р(х) = F’(x).

Типичный график функции плотности распределения для непрерывной случайно величины приведен на картинке ниже (зеленая кривая):

Примечание : В MS EXCEL имеется несколько функций, позволяющих вычислить вероятности непрерывных случайных величин. Перечень этих функций приведен в статье Распределения случайной величины в MS EXCEL .

В литературе Функция плотности распределения непрерывной случайной величины может называться: Плотность вероятности, Плотность распределения, англ. Probability Density Function (PDF) .

Чтобы все усложнить, термин Распределение (в литературе на английском языке — Probability Distribution Function или просто Distribution ) в зависимости от контекста может относиться как Интегральной функции распределения, так и кее Плотности распределения.

Из определения функции плотности распределения следует, что p(х)>=0. Следовательно, плотность вероятности для непрерывной величины может быть, в отличие от Функции распределения, больше 1. Например, для непрерывной равномерной величины , распределенной на интервале [0; 0,5] плотность вероятности равна 1/(0,5-0)=2. А для экспоненциального распределения с параметром лямбда =5, значение плотности вероятности в точке х=0,05 равно 3,894. Но, при этом можно убедиться, что вероятность на любом интервале будет, как обычно, от 0 до 1.

Напомним, что плотность распределения является производной от функции распределения , т.е. «скоростью» ее изменения: p(x)=(F(x2)-F(x1))/Dx при Dx стремящемся к 0, где Dx=x2-x1. Т.е. тот факт, что плотность распределения >1 означает лишь, что функция распределения растет достаточно быстро (это очевидно на примере экспоненциального распределения ).

Примечание : Площадь, целиком заключенная под всей кривой, изображающей плотность распределения , равна 1.

Примечание : Напомним, что функцию распределения F(x) называют в функциях MS EXCEL интегральной функцией распределения . Этот термин присутствует в параметрах функций, например в НОРМ.РАСП (x; среднее; стандартное_откл; интегральная ). Если функция MS EXCEL должна вернуть Функцию распределения, то параметр интегральная , д.б. установлен ИСТИНА. Если требуется вычислить плотность вероятности , то параметр интегральная , д.б. ЛОЖЬ.

Примечание : Для дискретного распределения вероятность случайной величине принять некое значение также часто называется плотностью вероятности (англ. probability mass function (pmf)). В справке MS EXCEL плотность вероятности может называть даже «функция вероятностной меры» (см. функцию БИНОМ.РАСП() ).

Вычисление плотности вероятности с использованием функций MS EXCEL

Понятно, что чтобы вычислить плотность вероятности для определенного значения случайной величины, нужно знать ее распределение.

Найдем плотность вероятности для стандартного нормального распределения N(0;1) при x=2. Для этого необходимо записать формулу =НОРМ.СТ.РАСП(2;ЛОЖЬ) =0,054 или =НОРМ.РАСП(2;0;1;ЛОЖЬ) .

Напомним, что вероятность того, что непрерывная случайная величина примет конкретное значение x равна 0. Для непрерывной случайной величины Х можно вычислить только вероятность события, что Х примет значение, заключенное в интервале (а; b).

Вычисление вероятностей с использованием функций MS EXCEL

1) Найдем вероятность, что случайная величина, распределенная по стандартному нормальному распределению (см. картинку выше), приняла положительное значение. Согласно свойству Функции распределения вероятность равна F(+∞)-F(0)=1-0,5=0,5.

В MS EXCEL для нахождения этой вероятности используйте формулу =НОРМ.СТ.РАСП(9,999E+307;ИСТИНА) -НОРМ.СТ.РАСП(0;ИСТИНА) =1-0,5. Вместо +∞ в формулу введено значение 9,999E+307= 9,999*10^307, которое является максимальным числом, которое можно ввести в ячейку MS EXCEL (так сказать, наиболее близкое к +∞).

2) Найдем вероятность, что случайная величина, распределенная по стандартному нормальному распределению , приняла отрицательное значение. Согласно определения Функции распределения, вероятность равна F(0)=0,5.

В MS EXCEL для нахождения этой вероятности используйте формулу =НОРМ.СТ.РАСП(0;ИСТИНА) =0,5.

3) Найдем вероятность того, что случайная величина, распределенная по стандартному нормальному распределению , примет значение, заключенное в интервале (0; 1). Вероятность равна F(1)-F(0), т.е. из вероятности выбрать Х из интервала (-∞;1) нужно вычесть вероятность выбрать Х из интервала (-∞;0). В MS EXCEL используйте формулу =НОРМ.СТ.РАСП(1;ИСТИНА) — НОРМ.СТ.РАСП(0;ИСТИНА) .

Все расчеты, приведенные выше, относятся к случайной величине, распределенной по стандартному нормальному закону N(0;1). Понятно, что значения вероятностей зависят от конкретного распределения. В статье Распределения случайной величины в MS EXCEL приведены распределения, для которых в MS EXCEL имеются соответствующие функции, позволяющие вычислить вероятности.

Обратная функция распределения (Inverse Distribution Function)

Вспомним задачу из предыдущего раздела: Найдем вероятность, что случайная величина, распределенная по стандартному нормальному распределению, приняла отрицательное значение.

Вероятность этого события равна 0,5.

Однозначно вычислить значение случайной величины позволяет свойство монотонности функции распределения.

Обратите внимание, что для вычисления обратной функции мы использовали именно функцию распределения , а не плотность распределения . Поэтому, в аргументах функции НОРМ.СТ.ОБР() отсутствует параметр интегральная , который подразумевается. Подробнее про функцию НОРМ.СТ.ОБР() см. статью про нормальное распределение .

Обратная функция распределения вычисляет квантили распределения , которые используются, например, при построении доверительных интервалов . Т.е. в нашем случае число 0 является 0,5-квантилем нормального распределения . В файле примера можно вычислить и другой квантиль этого распределения. Например, 0,8-квантиль равен 0,84.

В англоязычной литературе обратная функция распределения часто называется как Percent Point Function (PPF).

Примечание : При вычислении квантилей в MS EXCEL используются функции: НОРМ.СТ.ОБР() , ЛОГНОРМ.ОБР() , ХИ2.ОБР(), ГАММА.ОБР() и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье Распределения случайной величины в MS EXCEL .

Источник

Читайте также:  Учение дарвина об естественном отборе таблица
Adblock
detector