Меню

Интервальные оценки таблицы значений



Интервальная оценка

Материал из MachineLearning.

Интервальное оценивание — один из видов статистического оценивания, предполагающий построение интервала, в котором с некоторой вероятностью находится истинное значение оцениваемого параметра.

Содержание

Определение

Пусть — неизвестный параметр генеральной совокупности. По сделанной выборке по определенным правилам находятся числа и такие чтобы выполнялось неравенство:

Интервал является доверительным интервалом для параметра , а число — доверительной вероятностью или надежностью сделанной оценки. Обычно надежность задается заранее, причем выбираются числа близкие к 1 (0.95, 0.99 или 0.999).

Примеры интервальных оценок

Пример 1. Доверительное оценивание по вариационному ряду.

Пусть задана выборка некоторой случайной величины Построим вариационный ряд выборки

Очевидно, что вероятность попасть в любой из — го интервалов значений случайной ведичины одинакова и равна Тогда вероятность того, что случайная величина приняла значение из интервала где k» alt= «l>k»/> будет равна:

Вопрос: чему должен быть равен размер выборки чтобы вероятность попасть в интервал составила 95%.

Подставляя значение для доверительной вероятности в формулу выше, получим: откуда

Таким образом, при достаточном для заданной доверительной вероятности числе измерений случайной величины по набору ее порядковых статистик может быть оценен диапазон принимаемых ею значений.

Пример 2. Доверительный интервал для медианы.

Таблица 1

Пусть задана выборка некоторой случайной величины

  • При 50″ alt= «n>50»/>доверительный интервал для медианы определяется порядковыми статистиками

где при при при

  • Для значений номера порядковых статистик, заключающих в себе медиану, при и приведены в таблице 1, взятой из [3].

Пример 3. Доверительный интервал для математического ожидания.

Пусть задана выборка некоторой случайной величины , арактеристики которой (дисперсия D и математическое ожидание M) неизвестны. Эти параметры оценим так:

— несмещенная оценка дисперсии.

Величину называют оценкой среднего квадратического отклонения. Воспользуемся тем, что величина представляет собой сумму независимых случайных величин, и, согласно центральной предельной теореме, при достаточно большом ее закон близок к нормальному. Поэтому будем считать, что величина распределена по нормальному закону. Характеристики этого закона — математическое ожидание и дисперсия — равны соответственно M (настоящее МО случайной величины ) и .

Найдем такую величину , для которой . Перепишем это в эквивалентном виде и скажем, что случайная величина перед знаком неравенства есть модуль от стандартной нормальной. Получаем, что , и . В случае неизвестной дисперсии ее можно заменить на оценку .

Квантили стандартного нормального распределения:

Квантиль порядка Квантиль порядка
0.01 -2.326348 0.60 0.253347
0.025 -1.959964 0.70 0.524401
0.05 -1.644854 0.80 0.841621
0.10 -1.281552 0.90 1.281552
0.30 -0.524401 0.95 1.644854
0.40 -0.253347 0.975 1.959964
0.50 0.99 2.326348

Например, выбирая , получаем коэффициент

Окончательно: с вероятностью можно сказать, что

Источник

3.4. Интервальные — оценки

В статистике имеются два подхода к оцениванию неизвестных параметров распределений: точечный и интервальный. В соответствии с точечным оцениванием, которое рассмотрено в предыдущем разделе, указывается лишь точка, около которой находится оцениваемый параметр. Желательно, однако, знать, как далеко может отстоять в действительности этот параметр от возможных реализаций оценок в разных сериях наблюдений.

Ответ на этот вопрос – тоже приближенный – дает другой способ оценивания параметров – интервальный. В соответствии с этим способом оценивания находят интервал, который с вероятностью, близкой к единице, накрывает неизвестное числовое значение параметра.

Понятие интервальной оценки

Точечная оценка является случайной величиной и для возможных реализаций выборки принимает значения лишь приближенно равные истинному значению параметра . Чем меньше разность , тем точнее оценка. Таким образом, положительное число , для которого , характеризует точность оценки и называется Ошибкой оценки (или предельной ошибкой).

Доверительной вероятностью (или надежностью) называется вероятность β, с которой осуществляется неравенство , т. е.

. (3.20)

Заменив неравенство равносильным ему двойным неравенством , или , получим

. (3.21)

Интервал , накрывающий с вероятностью β, , неизвестный параметр , называется Доверительным интервалом (или интервальной оценкой), соответствующим доверительной вероятности β.

Случайной величиной является не только оценка , но и ошибка : ее значение зависит от вероятности β и, как правило, от выборки. Поэтому доверительный интервал случаен и выражение (3.21) следует читать так: “Интервал накроет параметр с вероятностью β ”, а не так: “Параметр попадет в интервал с вероятностью β ”.

Смысл доверительного интервала состоит в том, что при многократном повторении выборки объема в относительной доле случаев, равной β, доверительный интервал, соответствующий доверительной вероятности β, накрывает истинное значение оцениваемого параметра. Таким образом, доверительная вероятность β характеризует Надежность доверительного оценивания: чем больше β, тем вероятнее, что реализация доверительного интервала содержит неизвестный параметр.

Следует, однако, иметь в виду, что с ростом доверительной вероятности β в среднем растет длина доверительного интервала, то есть уменьшается точность доверительного оценивания. Выбор доверительной вероятности определяется конкретными условиями; обычно используются значения β, равные 0,90; 0,95; 0,99.

Вероятность (3.22)

называется Уровнем значимости и характеризует относительное число ошибочных заключений в общем числе заключений.

Читайте также:  Таблица сложения распечатать крупно

В формуле (3.21) границы доверительного интервала симметричны относительно точечной оценки. Однако не всегда удается построить интервал, обладающий таким свойством. Более общим является следующее определение.

Источник

Интервальные оценки таблицы значений

Параметры нормального распределения – математическое ожидание М и генеральное среднеквадратическое отклонение (СКО) σ (или генеральная дисперсия σ 2 ). Математическое ожидание – это центр группировки результатов испытаний. При отсутствии систематических погрешностей соответствует количественной характеристике объекта испытаний. Дисперсия (или СКО) – мера рассеяния результатов.

Найти значения параметров абсолютно точно невозможно. Но при объёме выборки n 25…30 и более обычно считают, что с достаточной точностью точечные оценки параметров равны параметрам. Кроме того, можно достаточно точно рассчитать генеральную дисперсию при проведении серий испытаний, в которых генеральная дисперсия не меняется (такой расчёт называется вычислением дисперсии по текущим измерениям), например, такой расчёт бывает возможен при приёмо-сдаточных испытаниях.

Применяется также мера рассеяния, называемая коэффициентом вариации. Генеральный коэффициент вариации

&nbsp &nbsp &nbspγ=&#963/M; &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp (1.1)

Выборочный коэффициент вариации

&nbsp &nbsp &nbsp &nbsp &nbsp &nbsp (1.2)

Точечная оценка математического ожидания — среднее значение выборки (В Excel рассчитывается по функции СРЗНАЧ):

Точечная оценка генеральной дисперсии — выборочная дисперсия (В Excel находят по функции ДИСП):

По текущим измерениям дисперсию находят так:

Здесь ni – объем испытаний (иначе говоря, объём выборки) в каждой серии, si 2 – дисперсии в соответствующих сериях, m – количество серий.

Оценка генерального СКО — выборочное СКО (В MS Excel рассчитывается по функции СТАНДОТКЛОН):

Точечные оценки малоинформативны, поскольку это случайные величины, и они могут заметно отличаться от оцениваемого параметра. Для повышения информативности используют интервальные оценки (рассчитывают доверительные интервалы).

Если генеральная дисперсия σ 2 известна достаточно точно, доверительный интервал для математического ожидания находят так:

&nbsp &nbsp &nbsp &nbsp &nbsp &nbsp (1.3)

Здесь уровень значимости α=1-Р (Р -доверительная вероятность), z1-α/2 – квантиль стандартного нормального распределения (рассчитывается по функции НОРМСТОБР), n – объём испытаний.

Если генеральная дисперсия неизвестна, доверительный интервал для математического ожидания находят так:

Здесь tα;k – коэффициент Стьюдента (рассчитывается с использованием функции СТЬЮДРАСПОБР), k=n-1 – число степеней свободы. Для дисперсии доверительный интервал определяют из соотношения:

Здесь χ 2 — критерий распределения хи-квадрат (В Excel функция ХИ2ОБР), k=n-1 – число степеней свободы.

Извлекая квадратный корень из всех частей неравенства, получаем интервальную оценку СКО.

Пример 1.1. Проведены испытания образцов дюралюминиевого профиля на разрыв. Полученные значения предела прочности образцов (МПа) приведены в табл. 1.1.

Таблица 1.1.

477 443 462 444 445 453 458 472 452 473
448 471 459 436 460 466 465 434 466 468
456 462 458 478 446 452 451 446 447 462

Найти точечные и интервальные оценки параметров распределения предела прочности при доверительной вероятности 0,95.

Фрагмент выполнения примера 1.1 показан на рис.1.1.

Рис. 1.1. Фрагмент расчёта для примера 1.1.

В ячейки В4:В33 вводим значения предела прочности, в ячейки А4:А33 номера соответствующих данных. В ячейке Е3 рассчитываем объём испытаний (объём выборки) функцией СЧЁТ. При этом в диалоговом окне функции СЧЁТ в строке Значение 1 вводим интервал от В4 примерно до В1000 (не до В33). Это необходимо для того, чтобы электронная таблица была пересчитываема, т.е. при последующем введении других данных в другом количестве (большем или меньшем) все расчётные значения автоматически пересчитывались бы для этих новых данных. Так следует поступать и при использовании других функций.

В ячейку Е4 вводим значение доверительной вероятности. В ячейке Е5 рассчитываем уровень значимости (но не вводим в виде числа, чтобы при другой доверительной вероятности таблица автоматически пересчитывалась).

В ячейках Е7, Е8 и Е9 соответственно рассчитываем среднее значение предела прочности, его СКО и дисперсию по соответствующим статистическим формулам (поставьте размерности). В ячейках D11:D13 и F11:F13 рассчитываем соответственно нижние и верхние границы доверительных интервалов для математического ожидания, дисперсии и СКО. При этом, учитывая, что объём испытаний достаточно велик, т.е. σ примерно равно s, доверительный интервал для математического ожидания рассчитываем по формуле (1.3). При получении значений z и χ 2 в диалоговых окнах функций НОРМСТОБР и ХИ2ОБР значения вероятностей следует получать расчётом со ссылками на ячейку, в которой указано значение α, а не вводить в виде чисел, чтобы таблица была пересчитываемой. (Внимание! Адреса ячеек вводить в формулы и строки диалоговых окон надо кликом на эти ячейки, а не с клавиатуры, поскольку ввод с клавиатуры замедляет работу и повышает вероятность ошибок).

Примечания:
1. Доверительный интервал можно вычислить также по статистической функции ДОВЕРИТ.
2. Чтобы ввести в ячейке часть текста в виде верхнего или нижнего индекса, следует в строке формул выделить необходимую часть текста, затем задать для неё верхний индекс командой Формат – Ячейки и отметкой в диалоговом окне Верхний индекс.

Читайте также:  Русско шведская война 1654 1667 таблица

Задание.
1. Выполнить расчёты по примеру 1.1. Как изменяются доверительные интервалы (увеличиваются или уменьшаются) при уменьшении доверительной вероятности?
2. Найти точечные и интервальные оценки математического ожидания, дисперсии и СКО некоторой характеристики (табл. 1.2), выборка из которой получена по результатам испытаний.
3. По испытаням выборок из четырёх партий бумаги получены значения разрывной длины образцов бумаги, представленные в табл. 1.3. Определить дисперсию по результатам испытаний всех партий (по текущим измерениям), учитывая, что генеральная дисперсия в разных партиях не меняется. Для партии 4 найти доверительный интервал для математического ожидания, используя рассчитанную дисперсию как генеральную, при доверительной вероятности 0,9.

Таблица 1.2.

Вариант Р Значения характеристики
1 0,95 15,9 18,3 16,5 17,9 16,3 18,2 16,9 17,6 16,0 16,5
2 0,90 7,41 7,50 7,25 7,63 7,55 7,66 7,43 7,38
3 0,99 79 64 63 74 60 71 68 76 65
4 0,98 53,8 53,1 54,3 54,6 56,4 54,6 56,0 55,3 55,0 54,4
5 0,97 831 832 815 823 843 825 818 841 837
6 0,95 5,6 5,7 5,8 5,4 5,9 5,6 5,5 5,7 5,5 5,7
7 0,90 0,55 0,58 0,57 0,56 0,54 0,59 0,56 0,56
8 0,99 8,5 8,7 8,3 8,7 8,7 8,9 8,4 8,9 9,0 8,6
9 0,98 7,33 7,31 7,35 7,28 7,45 7,25 7,19 7,42
10 0,97 7,51 6,43 6,34 7,38 6,96 7,10 6,88 7,52 6,56 6,77

Таблица 1.3.

Партия Номер образца
1 2 3 4 5 6 7 8 9 10
Разрывная длина, м
1 3750 3720 3800 3790 3950 3820 3870 3870 3850 3810
2 3830 3810 3880 3890 4030 3860 4000 3950 3930 3890
3 3860 3840 3910 3930 4080 3900 4010 3980
4 3690 3680 3720 3720 3850 3740 3790 3790 3770

&nbsp &nbsp &nbsp &nbsp Далее &nbsp &nbsp Содержание
© В.В. Заляжных

Источник

ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ

date image2018-02-13
views image13027

facebook icon vkontakte icon twitter icon odnoklasniki icon

Оценки неизвестных параметров бывают двух видов — ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ.
ТОЧЕЧНАЯ ОЦЕНКА — оценка имеющая конкретное числовое значение. Например, среднее арифметическое:

где: X — среднее арифметическое (точечная оценка МО);
x1,x2. xn — выборочные значения; n — объем выборки.
ИНТЕРВАЛЬНАЯ ОЦЕНКА — оценка представляемая интервалом значений, внутри которого с задаваемой исследователем вероятностью находится истинное значение оцениваемого параметра. Интервал в интервальной оценке называется ДОВЕРИТЕЛЬНЫМ ИНТЕРВАЛОМ, задаваемая исследователем вероятность называется ДОВЕРИТЕЛЬНОЙ ВЕРОЯТНОСТЬЮ. В практике статистических вычислений применяются стандартные значения доверительной вероятности: 0,95, 0,98 и 0,99 (95%, 98% и 99% соответственно). Например, интервальная оценка МО (3,8) при доверительной вероятности 0,95. Это означает, что МО лежит в пределах от 3 до 8 с вероятностью 0,95, следовательно вероятность того, что МО меньше 3 или больше 8 не превышает 0,05.
Очевидно, что чем выше доверительная вероятность, тем выше точность оценки, но шире доверительный интервал.Отсюда следует — ДЛЯ НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН ВЕРОЯТНОСТЬ ТОГО, ЧТО ТОЧЕЧНАЯ ОЦЕНКА (ширина доверительного интервала равна 0) СОВПАДЕТ С ЛЮБЫМ ЗАДАННЫМ ЗНАЧЕНИЕМ ИЛИ ОЦЕНИВАЕМЫМ ПАРАМЕТРОМ РАВНА 0.
Таким образом, точечная оценка имеет смысл лишь тогда, когда приведена характеристика рассеяния этой оценки (дисперсия).В противном случае она может служить лишь в качестве исходных данных для построения интервальной оценки.

Вычисление интервальной оценки рассмотрим на примере интервальной оценки МО для случайной величины подчиняющейся нормальному закону распределения. Границы доверительного интервала определятся по формулам:

Xmin = X — T(ν,P)*S/(n) 1/2

Xmax = X + T(ν,P)*S/(n) 1/2

где: Xmin, Xmax — нижняя и верхняя границы интервала;
X — среднее арифметическое (точечная оценка МО);
n — объем выборки;
T(ν,P) — поправочный коэффициент, называемый T-статистика, величина которого определяется значением задаваемой доверительной вероятности pи числом степеней свободы ν (ν=n-1);

S = [(x1 — X) 2 + (x2 — X) 2 + . + (xn — X) 2 ] 1/2 — корень квадратный из оценки дисперсии случайной величины X

ЧИСЛО СТЕПЕНЕЙ СВОБОДЫ СТАТИСТИКИ — число независимых случайных величин, по которым вычисляется данная статистика. Например, при вычислении среднего арифметического все случайные величины в выборке x1,x2. xn независят друг от друга. В оценке S из nотклонений вида (xi — X) 2 независимы только n-1 (т.к. в формуле присутствует X, то по любому набору n-1 отклонений вычисляется n-ое).

Погрешности средств измерений и измерительных каналов средств автоматизации могут быть выражены двумя различными способами: с помощью точечных оценок и с помощью интервальных. К точечным оценкамотносится математическое ожидание погрешности и среднеквадратическое отклонение.В качестве интервальной оценкииспользуют интервал погрешности, который охватывает все возможные значения погрешности измерений с вероятностью .Эта вероятность называется доверительной или надежностью оценки погрешности.

Предел допускаемой погрешности можно рассматривать как точечную оценку или как интервальную для доверительной вероятности, равной единице.

Интервальная оценка является более гибкой, поскольку она позволяет указать погрешность измерений в зависимости от того, какая требуется вероятность реализации этой погрешности для конкретных условий эксплуатации средства измерений.

Читайте также:  Этика и этикет таблица

Смысл интервальной оценки погрешности иллюстрируется рис. 4.3. Здесь использованы следующие обозначения: — погрешность измерения; — плотность распределения погрешностей ; — функция распределения погрешностей, .Для нормального закона распределения погрешностей (закона Гаусса) плотность распределения центрированной случайной величины описывается функцией , где — среднеквадратическая погрешность.

Если погрешность измерения находится внутри интервала , то вероятность этого события вычисляется как

. (4.35)

В наиболее типичном случае симметричных границ ( ) получим

. (4.36)

Здесь использовано свойство симметрии функции распределения для закона Гаусса.

Таким образом, если задан интервал , который содержит в себе погрешность измеряемого параметра , то вероятность того, что погрешность не выходит за границы интервала, можно найти по формуле (4.36) для нормального закона распределения. Вероятность называют также надежностью оценки погрешности и обозначают символом :

. (4.37)

Для вычисления функции распределения удобно использовать пакеты MathCAD, Matlab.С их помощью из формулы (4.37) несложно найти величину доверительного интервала , если задана величина надежности .

Для доверительная вероятность =68,3%; для =95,3%; для =99,7% и для = 99,994%.

Для увеличения надежности оценки погрешности измерений или для сужения доверительного интервала при заданной надежности можно использовать усреднение результатов многократных измерений. Поскольку оценка среднеквадратической погрешности результата усреднения равна (см. (3.2)), где — среднеквадратическая погрешность средства измерений, — количество однократных измерений, то, подставив в (4.37) вместо величину , получим

. (4.38)

Эта формула позволяет найти количество однократных измерений , которое необходимо усреднить для получения требуемого доверительного интервала при заданной надежности или требуемой надежности при заданном доверительном интервале .Поскольку формула (4.38) задана в неявном виде, для нахождения требуемых неизвестных следует воспользоваться математическими пакетами для компьютерных вычислений.

Следует иметь в виду, что повышение точности путем усреднения результатов многократных измерений имеет множество ограничений.

Проблемой использования интервального метода оценки погрешности является необходимость знания закона распределения погрешностей.

Отметим, что доверительные интервалы, полученные из рассеяния множества измерений, никак не учитывают систематическую погрешность измерений.Систематическую погрешность или наличие ошибки в постановке эксперимента, в учете факторов, о существовании которых мы не знаем, оценить невозможно, не имея более точного измерительного прибора.

Результат испытаний может быть дискретной или непрерывной случайной величиной.Так, количество дефектных изделий в выборке — дискретная случайная величина, поскольку это может быть только целое число.

Непрерывная случайная величина может принимать любое значение в некотором конечном или бесконечном интервале (например, разрывная длина бумаги).При испытаниях часто получают выборку значений непрерывной случайной величины с некоторым распределением вероятности получения того или иного значения.Наиболее часто встречается нормальное распределение.Точнее, реальные распределения в большинстве случаев достаточно близки к нормальному.

Основные параметры нормального распределения – математическое ожидание М случайной величины и её генеральное среднеквадратическое отклонение (СКО) σ (или генеральная дисперсия σ 2 ).Математическое ожидание – это центр группировки результатов испытаний, при отсутствии систематических погрешностей соответствует количественной характеристике объекта испытаний.Дисперсия (или СКО) – мера рассеяния результатов испытаний.Найти их значения абсолютно точно невозможно. Однако при объёме выборки n не менее 25…30 обычно считают, что точечные оценки параметров нормального распределения с приемлемой точностью равны параметрам. Кроме того, можно достаточно точно рассчитать генеральную дисперсию при проведении серий испытаний, в которых генеральная дисперсия не меняется (вычисление дисперсии по текущим измерениям), например, при приёмо-сдаточных испытаниях.

Применяется также мера рассеяния, называемая коэффициентом вариации. Генеральный коэффициент вариации

Выборочный коэффициент вариации

(1.2)

Точечной оценкой математического ожидания М является среднее значение выборки :

Точечной оценкой генеральной дисперсии является выборочная несмещенная дисперсия:

По текущим измерениям дисперсия может быть вычислена по формуле

Здесь ni – объем испытаний (объём выборки) в каждой серии, si 2 – дисперсии в соответствующих сериях, m – количество серий.

Оценка генерального СКО — выборочное СКО:

Точечные оценки малоинформативны, поскольку являются случайными величинами и могут значительно отличаться от оцениваемо-го параметра.Для повышения информативности используют интер-вальные оценки (рассчитывают доверительные интервалы).

При достаточно точно известной генеральной дисперсии σ 2 ) доверительный интервал для математического ожидания определяют из соотношения

(1.3)

Здесь уровень значимости α=1-Р (Р -доверительная вероятность), z1-α/2 – квантиль стандартного нормального распределения, n – объём испытаний (объём выборки).

Если генеральная дисперсия неизвестна, доверительный интервал для математического ожидания определяют из соотношения

Здесь tα;k – коэффициент Стьюдента, k=n-1 – число степеней свободы. Доверительный интервал для дисперсии определяют из соотношения:

Здесь χ 2 — критерий распределения хи-квадрат, k=n-1 – число степеней свободы.

Извлекая из всех частей неравенства квадратный корень, можно получить интервальную оценку СКО.

LU-метод

LU-разложение — это представление матрицы A в виде A=L•U, где L — нижнетреугольная матрица с еденичной диагональю, а U — верхнетреугольная матрица. LU-разложение является модификациеё метода Гаусса.Основные применения данного алгоритма — решение систем алгебраических уравнений, вычисление определителя, вычисление обратной матрицы и др.

Рассмотрим алгоритм на примере матрицы

Алгоритм

1. Создаем матрицы


и

2. Для каждого столбца j = 1… 3 матрицы будем вычислять как

Для каждой строки вычислим

Источник

Adblock
detector