Коэффициент корреляции Пирсона
Введение
Коэффициент корреляции Пирсона — это мера линейной зависимости между двумя количественными переменными. Полученное значение лежит в интервале от -1 до 1, где 1 указывает на идеальную положительную линейную зависимость, -1 на идеальную отрицательную, а 0 на отсутствие линейной зависимости. Этот коэффициент широко используется в статистических и аналитических исследованиях для понимания взаимосвязей между переменными.
Операция
Коэффициент корреляции Пирсона, обозначаемый как , вычисляется по формуле:
где и — значения данных, и — их средние значения. Значение -value позволяет оценить статистическую значимость вычисленного коэффициента корреляции.
Свойства
- Диапазон значений: .
- Знак корреляции: Положительное значение указывает на прямую связь, отрицательное на обратную.
- Масштаб независимость: Корреляция не изменяется при линейном преобразовании данных.
- Чувствительность: Влияет только линейная зависимость, не реагирует на другие виды зависимости.
Примеры использования
Пример 1
Рассчитайте коэффициент корреляции Пирсона и -value для двух наборов данных: , .
Вычислим :
-value для представляет идеальную линейную зависимость, что обычно говорит о статистической значимости в случае случайных данных, но в данном случае данных недостаточно для адекватной оценки.
Пример 2
Для более случайных данных , рассчитаем и -value:
Вычислим :
-value вычисляется через -статистику, используя распределение Стьюдента, показывая достаточно высокую корреляцию между данными.
Часто задаваемые вопросы (FAQ)
-
Что показывает коэффициент корреляции Пирсона?
- Он показывает степень линейной зависимости между двумя переменными.
-
Какие значения считаются высокими для коэффициента?
- Значения ближе к -1 или 1 указывают на сильную линейную зависимость.
-
Как связаны и -value?
- -value оценивает вероятность возникновения такой или более сильной корреляции, исходя из предположения о несвязанности переменных.
Примеры из жизни
- Климатология: Изучение связи между температурой и уровнем осадков для прогнозирования изменения климата.
- Медицина: Оценка зависимости между симптомами и заболеванием для улучшения диагностики.
- Экономика: Анализ влияния изменений в процентной ставке на экономический рост или инфляцию.
Ссылки на литературу и ресурсы
- Учебники и литература:
- Монсик В. Б., Скрынников А. А. «Вероятность и статистика: учебное пособие»
- Лагутин М. Б. «Наглядная математическая статистика»
- Онлайн курсы: