Коэффициент корреляции Спирмена
Введение
Коэффициент корреляции Спирмена — это не параметрическая мера статистической зависимости между двумя переменными. Он оценивает степень и направление монотонной зависимости между переменными и особенно полезен, когда данные не соответствуют нормальному распределению или содержат выбросы. Коэффициент варьируется от -1 до 1, где значения -1 и 1 указывают на идеальную отрицательную или положительную монотонную зависимость, соответственно.
Операция
Коэффициент корреляции Спирмена () определяется на основе рангов данных. Расчёт заключается в следующем:
- Присвоение рангов каждому элементу каждой из двух выборок.
- Вычисление разности рангов () для каждого сопряжённого наблюдения.
- Использование формулы Спирмена:
где — разность рангов, и — общее количество наблюдений.
Свойства
- Не параметрический метод: Подходит для данных, которые не соответствуют нормальному распределению.
- Монотонная зависимость: Выявляет зависимости, которые сохраняют порядок, но не обязаны быть линейными.
- Устойчивость к выбросам: Менее чувствителен к выбросам по сравнению с коэффициентом Пирсона.
Примеры использования
Пример 1
Предположим, у нас есть два набора данных: ,
-
Присвоим ранги:
- Ранги для X:
- Ранги для Y:
-
Найдём разности рангов:
-
Вычислим сумму квадратов разностей рангов:
-
Используем формулу Спирмена:
Пример 2
Для значимости корреляции Спирмена используется критерий на основе p-value.
Предположим, в другом наборе данных с наблюдениями . Для небольших выборок используется преобразование Спирмана для определения p-value, обычно через таблицы или программные реализации. Например, p-value для и может быть около 0.037.
Часто задаваемые вопросы (FAQ)
- В чем разница между коэффициентами Спирмена и Пирсона?
- Спирмен измеряет монотонную зависимость и не требует нормального распределения, тогда как Пирсон оценивает линейную зависимость и относительно чувствителен к выбросам.
- Может ли коэффициент Спирмена быть ненулевым, если данные независимы?
- Да, особенно на небольших выборках, значение Спирмена может отличаться от нуля из-за случайных вариаций.
Примеры из жизни
- Психология: Анализируем корреляции между оценками и поведением, где не требуется линейная зависимость.
- Экология: Изучаем взаимосвязь между показателями среды и биологическим разнообразием.
- Маркетинг: Исследуем зависимости между позиционированием товаров на полках и объемами продаж, где данные имеют ранговую природу.
Ссылки на литературу и ресурсы
- Учебники и литература:
- Монсик В. Б., Скрынников А. А. «Вероятность и статистика: учебное пособие»
- Лагутин М. Б. «Наглядная математическая статистика»
- Онлайн курсы: