Меню

Корреляционный анализ таблицы значимости

Корреляционный анализ таблицы значимости

Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic

Критерии и методы

КРИТЕРИЙ КОРРЕЛЯЦИИ ПИРСОНА

Карл Пирсон

Карл Пирсон

​ – это метод параметрической статистики, позволяющий определить наличие или отсутствие линейной связи между двумя количественными показателями, а также оценить ее тесноту и статистическую значимость. Другими словами, критерий корреляции Пирсона позволяет определить, изменяется ли (возрастает или уменьшается) один показатель в ответ на изменения другого? В статистических расчетах и выводах коэффициент корреляции обычно обозначается как rxy или Rxy.

1. История разработки критерия корреляции

Критерий корреляции Пирсона был разработан командой британских ученых во главе с Карлом Пирсоном (1857-1936) в 90-х годах 19-го века, для упрощения анализа ковариации двух случайных величин. Помимо Карла Пирсона над критерием корреляции Пирсона работали также Фрэнсис Эджуорт и Рафаэль Уэлдон.

2. Для чего используется критерий корреляции Пирсона?

Критерий корреляции Пирсона позволяет определить, какова теснота (или сила) корреляционной связи между двумя показателями, измеренными в количественной шкале. При помощи дополнительных расчетов можно также определить, насколько статистически значима выявленная связь.

Например, при помощи критерия корреляции Пирсона можно ответить на вопрос о наличии связи между температурой тела и содержанием лейкоцитов в крови при острых респираторных инфекциях, между ростом и весом пациента, между содержанием в питьевой воде фтора и заболеваемостью населения кариесом.

3. Условия и ограничения применения критерия хи-квадрат Пирсона

  1. Сопоставляемые показатели должны быть измерены в количественной шкале (например, частота сердечных сокращений, температура тела, содержание лейкоцитов в 1 мл крови, систолическое артериальное давление).
  2. Посредством критерия корреляции Пирсона можно определить лишь наличие и силу линейной взаимосвязи между величинами. Прочие характеристики связи, в том числе направление (прямая или обратная), характер изменений (прямолинейный или криволинейный), а также наличие зависимости одной переменной от другой — определяются при помощи регрессионного анализа.
  3. Количество сопоставляемых величин должно быть равно двум. В случае анализ взаимосвязи трех и более параметров следует воспользоваться методом факторного анализа.
  4. Критерий корреляции Пирсона является параметрическим, в связи с чем условием его применения служит нормальное распределение каждой из сопоставляемых переменных. В случае необходимости корреляционного анализа показателей, распределение которых отличается от нормального, в том числе измеренных в порядковой шкале, следует использовать коэффициент ранговой корреляции Спирмена.
  5. Следует четко различать понятия зависимости и корреляции. Зависимость величин обуславливает наличие корреляционной связи между ними, но не наоборот.

Например, рост ребенка зависит от его возраста, то есть чем старше ребенок, тем он выше. Если мы возьмем двух детей разного возраста, то с высокой долей вероятности рост старшего ребенка будет больше, чем у младшего. Данное явление и называется зависимостью, подразумевающей причинно-следственную связь между показателями. Разумеется, между ними имеется и корреляционная связь, означающая, что изменения одного показателя сопровождаются изменениями другого показателя.

В другой ситуации рассмотрим связь роста ребенка и частоты сердечных сокращений (ЧСС). Как известно, обе эти величины напрямую зависят от возраста, поэтому в большинстве случаев дети большего роста (а значит и более старшего возраста) будут иметь меньшие значения ЧСС. То есть, корреляционная связь будет наблюдаться и может иметь достаточно высокую тесноту. Однако, если мы возьмем детей одного возраста, но разного роста, то, скорее всего, ЧСС у них будет различаться несущественно, в связи с чем можно сделать вывод о независимости ЧСС от роста.

Приведенный пример показывает, как важно различать фундаментальные в статистике понятия связи и зависимости показателей для построения верных выводов.

4. Как рассчитать коэффициента корреляции Пирсона?

Расчет коэффициента корреляции Пирсона производится по следующей формуле:

5. Как интерпретировать значение коэффициента корреляции Пирсона?

Значения коэффициента корреляции Пирсона интерпретируются исходя из его абсолютных значений. Возможные значения коэффициента корреляции варьируют от 0 до ±1. Чем больше абсолютное значение rxy – тем выше теснота связи между двумя величинами. rxy = 0 говорит о полном отсутствии связи. rxy = 1 – свидетельствует о наличии абсолютной (функциональной) связи. Если значение критерия корреляции Пирсона оказалось больше 1 или меньше -1 – в расчетах допущена ошибка.

Для оценки тесноты, или силы, корреляционной связи обычно используют общепринятые критерии, согласно которым абсолютные значения rxy 0.7 — о сильной связи.

Более точную оценку силы корреляционной связи можно получить, если воспользоваться таблицей Чеддока:

Абсолютное значение rxy Теснота (сила) корреляционной связи
менее 0.3 слабая
от 0.3 до 0.5 умеренная
от 0.5 до 0.7 заметная
от 0.7 до 0.9 высокая
более 0.9 весьма высокая

Оценка статистической значимости коэффициента корреляции rxy осуществляется при помощи t-критерия, рассчитываемого по следующей формуле:

Полученное значение tr сравнивается с критическим значением при определенном уровне значимости и числе степеней свободы n-2. Если tr превышает tкрит, то делается вывод о статистической значимости выявленной корреляционной связи.

6. Пример расчета коэффициента корреляции Пирсона

Целью исследования явилось выявление, определение тесноты и статистической значимости корреляционной связи между двумя количественными показателями: уровнем тестостерона в крови (X) и процентом мышечной массы в теле (Y). Исходные данные для выборки, состоящей из 5 исследуемых (n = 5), сведены в таблице:

N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y)
1. 951 83
2. 874 76
3. 957 84
4. 1084 89
5. 903 79
    Вычислим суммы анализируемых значений X и Y:

Σ(X) = 951 + 874 + 957 + 1084 + 903 = 4769

Σ(Y) = 83 + 76 + 84 + 89 + 79 = 441

Найдем средние арифметические для X и Y:

Mx = Σ(X) / n = 4769 / 5 = 953.8

My = Σ(Y) / n = 441 / 5 = 82.2

  • Рассчитаем для каждого значения сопоставляемых показателей величину отклонения от среднего арифметического dx = X — Mx и dy = Y — My:
    N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y) Отклонение содержания тестостерона от среднего значения (dx) Отклонение % мышечной массы от среднего значения (dy)
    1. 951 83 -2.8 0.8
    2. 874 76 -79.8 -6.2
    3. 957 84 3.2 1.8
    4. 1084 89 130.2 6.8
    5. 903 79 -50.8 -3.2
  • Возведем в квадрат каждое значение отклонения dx и dy:
    N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y) Отклонение содержания тестостерона от среднего значения (dx) Отклонение % мышечной массы от среднего значения (dy) dx 2 dy 2
    1. 951 83 -2.8 0.8 7.84 0.64
    2. 874 76 -79.8 -6.2 6368.04 38.44
    3. 957 84 3.2 1.8 10.24 3.24
    4. 1084 89 130.2 6.8 16952,04 46.24
    5. 903 79 -50.8 -3.2 2580,64 10.24
  • Рассчитаем для каждой пары анализируемых значений произведение отклонений dx x dy:
    N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y) Отклонение содержания тестостерона от среднего значения (dx) Отклонение % мышечной массы от среднего значения (dy) dx 2 dy 2 dx x dy
    1. 951 83 -2.8 0.8 7.84 0.64 -2.24
    2. 874 76 -79.8 -6.2 6368.04 38.44 494.76
    3. 957 84 3.2 1.8 10.24 3.24 5.76
    4. 1084 89 130.2 6.8 16952,04 46.24 885.36
    5. 903 79 -50.8 -3.2 2580,64 10.24 162.56
  • Определим значения суммы квадратов отклонений Σ(dx 2 ) и Σ(dy 2 ):

    Найдем значение суммы произведений отклонений Σ(dx x dy):

    Рассчитаем значение коэффициента корреляции Пирсона rxy по приведенной выше формуле:

    Найдем значение t-критерия для оценки статистической значимости корреляционной связи:

    Критическое значение t-критерия найдем по таблице, где при числе степеней свободы f = n-2 = 3 и уровне значимости p = 0.01 значение tкрит = 5.84. Рассчитанное значение tr (7.0) больше tкрит (5.84), следовательно связь является статистически значимой.

    Сделаем статистический вывод:

    Источник

    

    Корреляционный анализ

    Корреляционный анализ

    Корреляционный анализ – раздел математической статистики, исследующий зависимости между двумя или более случайными величинами. Термин «Correlation» означает взаимосвязь, взаимоотношение.

    Функциональная зависимость и корреляция

    Еще Гиппократ обратил внимание на то, что между телосложением и темпераментом людей, между строением их тела и предрасположенностью к заболеваниям существует определенная взаимосвязь.

    В области физической культуры и спорта можно привести много примеров такой взаимосвязи. Например, от уровня силы во многом зависит результат, показанный спортсменом в таких видах спорта, как тяжелая атлетика, пауэрлифтинг, гиревой спорт, метание диска и толкание ядра и т.д. Результат в беге на 100 м во многом зависит от процента содержания в мышцах спортсменов быстрых мышечных волокон (II типа). Доказано, что у выдающихся спринтеров этот показатель превышает 80%. Чтобы определить, насколько сильна взаимосвязь между переменными (признаками) используется корреляционный анализ.

    Две случайные величины X и Y могут быть:

    • связаны функциональной зависимостью (жестко, как зависимость переменных в математическом анализе);
    • независимыми;
    • связаны стохастической (вероятностной зависимостью) при которой изменение одной величины влечет изменение распределения другой.

    В качестве меры связи между случайными величинами используется коэффициент корреляции. Коэффициент корреляции для генеральной совокупности обозначается ρ. Однако, как правило, он неизвестен. Поэтому он оценивается по экспериментальным данным, представляющим выборку объема n, полученную при совместном измерении двух переменных (признаков) X и Y. Коэффициент корреляции, определяемый по выборочным данным называется выборочным коэффициентом корреляции (или просто коэффициентом корреляции). Его принято обозначать символом r. Наиболее часто в качестве оценок генерального коэффициента корреляции используется коэффициент корреляции Пирсона (r) и коэффициент корреляции Спирмена (rs).

    Коэффициент корреляции Пирсона ( r )

    Чтобы правильно применять корреляционный анализ в научных исследованиях, нужно учитывать условия применения этого метода.

    Условия, при которых возможен расчет коэффициента корреляции Пирсона:

    1. Экспериментальные данные должны быть представлены в только в интервальной шкале или шкале отношений.
    2. Распределение экспериментальных данных подчиняется нормальному закону.
    3. Предполагается линейная зависимость между случайными величинами X и Y.

    Коэффициент корреляции Спирмена ( r S)

    При расчете коэффициента корреляции Спирмена требования к исходным данным менее строгие, а именно:

    1. Данные могут быть представлены в порядковой, интервальной шкале или шкале отношений.
    2. Допускается любой закон распределения случайных величин X и Y.
    3. Между случайными величинами X и Y должна существовать монотонно-возрастающая или монотонно-убывающая зависимость.

    Свойства оценок коэффициентов корреляции

    Рассчитанные коэффициенты корреляции могут принимать значения от -1 до +1.

    1. Если коэффициент корреляции равен: r =+1 и r = -1, это означает, что случайные величины X и Y связаны жесткой линейной зависимостью.
    2. Если r ≠ 0, то чем ближе |r| к единице, тем сильнее линейная зависимость случайных величин X и Y.
    3. Если коэффициент корреляции положительный (r > 0) – это означает, что между случайными величинами X и Y существует положительная корреляция (или другими словами положительная корреляционная зависимость). Примером положительной корреляционной зависимости является увеличение результата прыжка в длину с увеличением силы мышц ног (рис.1А).
    4. Eсли коэффициент корреляции отрицательный (r Таблица 1 — Критические значения коэффициента корреляции Пирсона

    n 0,05 0,01 0,001
    3 0,9969 0,999877 0,99999877
    4 0,950 0,9900 0,9990
    5 0,878 0,9597 0,99114
    6 0,811 0,9172 0,9741
    7 0,754 0,875 0,9509
    8 0,707 0,834 0,9244
    9 0,666 0,798 0,898
    10 0,632 0,765 0,872
    20 0,444 0,561 0,679
    30 0,361 0,463 0,570
    40 0,312 0,402 0,501
    50 0,279 0,361 0,451

    В итоговой таблице необходимо указать объем выборки, чтобы читающий мог оценить значимость (достоверность) вычисленных коэффициентов корреляции. Иногда в публикациях приводятся только значимые коэффициенты корреляции, а вместо незначимых ставится прочерк. В таблице 2 авторы указали, что объем выборки равен n = 32. Критическое значение коэффициента корреляции при n = 32 и a = 0,05 составляет r0,05 = 0,349 (В.С.Иванов, 1990). Следовательно, все коэффициенты корреляции достоверны.

    Таблица 2 — Значения коэффициентов корреляции между результатами в скоростно-силовых тестах и результатом в толкании ядра с разгоном n=32, спортивный результат группы варьировал от 12,00 м до 20,50. Критическое значение коэффициента корреляции при n = 32 и a = 0,05 составляет r0,05 = 0,349 (по: Я.Е.Ланка, Ан.А.Шалманов, 1982).

    Источник

    СПИСОК ЛИТЕРАТУРЫ ОНЛАЙН

    Корреляционный анализ по методу Спирмена (ранги Спирмена)

    Студента-психолога (социолога, менеджера, управленца и др.) нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых группах.

    В математике для описания связей между переменными величинами используют понятие функции F, которая ставит в соответствие каждому определенному значению независимой переменной X определенное значение зависимой переменной Y. Полученная зависимость обозначается как Y=F(X).

    При этом виды корреляционных связей между измеренными признаками могут быть различны: так, корреляция бывает линейной и нелинейной, положительной и отрицательной. Она линейна — если с увеличением или уменьшением одной переменной X,вторая переменная Y в среднем либо также растет, либо убывает. Она нелинейна, если при увеличении одной величины характер изменения второй не линеен, а описывается другими законами.

    Корреляция будет положительной, если с увеличением переменной X переменная Y в среднем также увеличивается, а если с увеличением X переменная Y имеет в среднем тенденцию к уменьшению, то говорят о наличии отрицательной корреляции. Возможна ситуация, когда между переменными невозможно установить какую-либо зависимость. В этом случае говорят об отсутствии корреляционной связи.

    Задача корреляционного анализа сводится к установлению направления (положительное или отрицательное) и формы (линейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.

    Коэффициент корреляции рангов, предложенный К. Спирменом, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин.

    Ранговый коэффициент линейной корреляции Спирмена подсчитывается по формуле:

    Ранговый коэффициент Спирмена

    где n — количество ранжируемых признаков (показателей, испытуемых);
    D — разность между рангами по двум переменным для каждого испытуемого;
    D2 — сумма квадратов разностей рангов.

    Критические значения коэффициента корреляции рангов Спирмена представлены ниже:

    Критические значения рангов корреляции Спирмена

    Величина коэффициента линейной корреляции Спирмена лежит в интервале +1 и -1. Коэффициент линейной корреляции Спирмена может быть положительным и отрицательным, характеризуя направленность связи между двумя признаками, измеренными в ранговой шкале.

    Если коэффициент корреляции по модулю оказывается близким к 1, то это соответствует высокому уровню связи между переменными. Так, в частности, при корреляции переменной величины с самой собой величина коэффициента корреляции будет равна +1. Подобная связь характеризует прямо пропорциональную зависимость. Если же значения переменной X будут распложены в порядке возрастания, а те же значения (обозначенные теперь уже как переменная Y) будут располагаться в порядке убывания, то в этом случае корреляция между переменными Х и Y будет равна точно -1. Такая величина коэффициента корреляции характеризует обратно пропорциональную зависимость.

    Знак коэффициента корреляции очень важен для интерпретации полученной связи. Если знак коэффициента линейной корреляции — плюс, то связь между коррелирующими признаками такова, что большей величине одного признака (переменной) соответствует большая величина другого признака (другой переменной). Иными словами, если один показатель (переменная) увеличивается, то соответственно увеличивается и другой показатель (переменная). Такая зависимость носит название прямо пропорциональной зависимости.

    Если же получен знак минус, то большей величине одного признака соответствует меньшая величина другого. Иначе говоря, при наличии знака минус, увеличению одной переменной (признака, значения) соответствует уменьшение другой переменной. Такая зависимость носит название обратно пропорциональной зависимости. При этом выбор переменной, которой приписывается характер (тенденция) возрастания — произволен. Это может быть как переменная X, так и переменная Y. Однако если считается, что увеличивается переменная X, то переменная Y будет соответственно уменьшаться, и наоборот.

    Рассмотрим пример корреляции Спирмена

    Психолог выясняет, как связаны между собой индивидуальные показатели готовности к школе, полученные до начала обучения в школе у 11 первоклассников и их средняя успеваемость в конце учебного года.

    Для решения этой задачи были проранжированы, во-первых, значения показателей школьной готовности, полученные при поступлении в школу, и, во-вторых, итоговые показатели успеваемости в конце года у этих же учащихся в среднем. Результаты представим в таблице:

    таблица

    Подставляем полученные данные в вышеприведенную формулу, и производим расчет. Получаем:

    коэффициент рангов Спирмена

    Для нахождения уровня значимости обращаемся к таблице «Критические значения коэффициента корреляции рангов Спирмена,» в которой приведены критические значения для коэффициентов ранговой корреляции.

    Строим соответствующую «ось значимости»:

    Ось значимости

    Полученный коэффициент корреляции совпал с критическим значением для уровня значимости в 1%. Следовательно, можно утверждать, что показатели школьной готовности и итоговые оценки первоклассников связаны положительной корреляционной зависимостью — иначе говоря, чем выше показатель школьной готовности, тем лучше учится первоклассник. В терминах статистических гипотез психолог должен отклонить нулевую (Н0) гипотезу о сходстве и принять альтернативную (Н1) о наличии различий, которая говорит о том, что связь между показателями школьной готовности и средней успеваемостью отлична от нуля.

    Источник

    Библиотека постов MEDSTATISTIC об анализе медицинских данных

    Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic

    Критерии и методы

    КРИТЕРИЙ КОРРЕЛЯЦИИ ПИРСОНА

    Карл Пирсон

    Карл Пирсон

    ​ – это метод параметрической статистики, позволяющий определить наличие или отсутствие линейной связи между двумя количественными показателями, а также оценить ее тесноту и статистическую значимость. Другими словами, критерий корреляции Пирсона позволяет определить, изменяется ли (возрастает или уменьшается) один показатель в ответ на изменения другого? В статистических расчетах и выводах коэффициент корреляции обычно обозначается как rxy или Rxy.

    1. История разработки критерия корреляции

    Критерий корреляции Пирсона был разработан командой британских ученых во главе с Карлом Пирсоном (1857-1936) в 90-х годах 19-го века, для упрощения анализа ковариации двух случайных величин. Помимо Карла Пирсона над критерием корреляции Пирсона работали также Фрэнсис Эджуорт и Рафаэль Уэлдон.

    2. Для чего используется критерий корреляции Пирсона?

    Критерий корреляции Пирсона позволяет определить, какова теснота (или сила) корреляционной связи между двумя показателями, измеренными в количественной шкале. При помощи дополнительных расчетов можно также определить, насколько статистически значима выявленная связь.

    Например, при помощи критерия корреляции Пирсона можно ответить на вопрос о наличии связи между температурой тела и содержанием лейкоцитов в крови при острых респираторных инфекциях, между ростом и весом пациента, между содержанием в питьевой воде фтора и заболеваемостью населения кариесом.

    3. Условия и ограничения применения критерия хи-квадрат Пирсона

    1. Сопоставляемые показатели должны быть измерены в количественной шкале (например, частота сердечных сокращений, температура тела, содержание лейкоцитов в 1 мл крови, систолическое артериальное давление).
    2. Посредством критерия корреляции Пирсона можно определить лишь наличие и силу линейной взаимосвязи между величинами. Прочие характеристики связи, в том числе направление (прямая или обратная), характер изменений (прямолинейный или криволинейный), а также наличие зависимости одной переменной от другой — определяются при помощи регрессионного анализа.
    3. Количество сопоставляемых величин должно быть равно двум. В случае анализ взаимосвязи трех и более параметров следует воспользоваться методом факторного анализа.
    4. Критерий корреляции Пирсона является параметрическим, в связи с чем условием его применения служит нормальное распределение каждой из сопоставляемых переменных. В случае необходимости корреляционного анализа показателей, распределение которых отличается от нормального, в том числе измеренных в порядковой шкале, следует использовать коэффициент ранговой корреляции Спирмена.
    5. Следует четко различать понятия зависимости и корреляции. Зависимость величин обуславливает наличие корреляционной связи между ними, но не наоборот.

    Например, рост ребенка зависит от его возраста, то есть чем старше ребенок, тем он выше. Если мы возьмем двух детей разного возраста, то с высокой долей вероятности рост старшего ребенка будет больше, чем у младшего. Данное явление и называется зависимостью, подразумевающей причинно-следственную связь между показателями. Разумеется, между ними имеется и корреляционная связь, означающая, что изменения одного показателя сопровождаются изменениями другого показателя.

    В другой ситуации рассмотрим связь роста ребенка и частоты сердечных сокращений (ЧСС). Как известно, обе эти величины напрямую зависят от возраста, поэтому в большинстве случаев дети большего роста (а значит и более старшего возраста) будут иметь меньшие значения ЧСС. То есть, корреляционная связь будет наблюдаться и может иметь достаточно высокую тесноту. Однако, если мы возьмем детей одного возраста, но разного роста, то, скорее всего, ЧСС у них будет различаться несущественно, в связи с чем можно сделать вывод о независимости ЧСС от роста.

    Приведенный пример показывает, как важно различать фундаментальные в статистике понятия связи и зависимости показателей для построения верных выводов.

    4. Как рассчитать коэффициента корреляции Пирсона?

    Расчет коэффициента корреляции Пирсона производится по следующей формуле:

    5. Как интерпретировать значение коэффициента корреляции Пирсона?

    Значения коэффициента корреляции Пирсона интерпретируются исходя из его абсолютных значений. Возможные значения коэффициента корреляции варьируют от 0 до ±1. Чем больше абсолютное значение rxy – тем выше теснота связи между двумя величинами. rxy = 0 говорит о полном отсутствии связи. rxy = 1 – свидетельствует о наличии абсолютной (функциональной) связи. Если значение критерия корреляции Пирсона оказалось больше 1 или меньше -1 – в расчетах допущена ошибка.

    Для оценки тесноты, или силы, корреляционной связи обычно используют общепринятые критерии, согласно которым абсолютные значения rxy 0.7 — о сильной связи.

    Более точную оценку силы корреляционной связи можно получить, если воспользоваться таблицей Чеддока:

    Абсолютное значение rxy Теснота (сила) корреляционной связи
    менее 0.3 слабая
    от 0.3 до 0.5 умеренная
    от 0.5 до 0.7 заметная
    от 0.7 до 0.9 высокая
    более 0.9 весьма высокая

    Оценка статистической значимости коэффициента корреляции rxy осуществляется при помощи t-критерия, рассчитываемого по следующей формуле:

    Полученное значение tr сравнивается с критическим значением при определенном уровне значимости и числе степеней свободы n-2. Если tr превышает tкрит, то делается вывод о статистической значимости выявленной корреляционной связи.

    6. Пример расчета коэффициента корреляции Пирсона

    Целью исследования явилось выявление, определение тесноты и статистической значимости корреляционной связи между двумя количественными показателями: уровнем тестостерона в крови (X) и процентом мышечной массы в теле (Y). Исходные данные для выборки, состоящей из 5 исследуемых (n = 5), сведены в таблице:

    N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y)
    1. 951 83
    2. 874 76
    3. 957 84
    4. 1084 89
    5. 903 79
      Вычислим суммы анализируемых значений X и Y:

    Σ(X) = 951 + 874 + 957 + 1084 + 903 = 4769

    Σ(Y) = 83 + 76 + 84 + 89 + 79 = 441

    Найдем средние арифметические для X и Y:

    Mx = Σ(X) / n = 4769 / 5 = 953.8

    My = Σ(Y) / n = 441 / 5 = 82.2

  • Рассчитаем для каждого значения сопоставляемых показателей величину отклонения от среднего арифметического dx = X — Mx и dy = Y — My:
    N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y) Отклонение содержания тестостерона от среднего значения (dx) Отклонение % мышечной массы от среднего значения (dy)
    1. 951 83 -2.8 0.8
    2. 874 76 -79.8 -6.2
    3. 957 84 3.2 1.8
    4. 1084 89 130.2 6.8
    5. 903 79 -50.8 -3.2
  • Возведем в квадрат каждое значение отклонения dx и dy:
    N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y) Отклонение содержания тестостерона от среднего значения (dx) Отклонение % мышечной массы от среднего значения (dy) dx 2 dy 2
    1. 951 83 -2.8 0.8 7.84 0.64
    2. 874 76 -79.8 -6.2 6368.04 38.44
    3. 957 84 3.2 1.8 10.24 3.24
    4. 1084 89 130.2 6.8 16952,04 46.24
    5. 903 79 -50.8 -3.2 2580,64 10.24
  • Рассчитаем для каждой пары анализируемых значений произведение отклонений dx x dy:
    N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y) Отклонение содержания тестостерона от среднего значения (dx) Отклонение % мышечной массы от среднего значения (dy) dx 2 dy 2 dx x dy
    1. 951 83 -2.8 0.8 7.84 0.64 -2.24
    2. 874 76 -79.8 -6.2 6368.04 38.44 494.76
    3. 957 84 3.2 1.8 10.24 3.24 5.76
    4. 1084 89 130.2 6.8 16952,04 46.24 885.36
    5. 903 79 -50.8 -3.2 2580,64 10.24 162.56
  • Определим значения суммы квадратов отклонений Σ(dx 2 ) и Σ(dy 2 ):

    Найдем значение суммы произведений отклонений Σ(dx x dy):

    Рассчитаем значение коэффициента корреляции Пирсона rxy по приведенной выше формуле:

    Найдем значение t-критерия для оценки статистической значимости корреляционной связи:

    Критическое значение t-критерия найдем по таблице, где при числе степеней свободы f = n-2 = 3 и уровне значимости p = 0.01 значение tкрит = 5.84. Рассчитанное значение tr (7.0) больше tкрит (5.84), следовательно связь является статистически значимой.

    Сделаем статистический вывод:

    Источник

  • Читайте также:  1с событие выбор таблица значений
    Adblock
    detector