Открыть сервис

Коэффициент ранговой корреляции Спирмена

Коэффициент ранговой корреляции Спирмена (или коэффициент корреляции рангов Спирмена, обозначается греческой буквой ρ (ро) или rₛ) — это непараметрический статистический показатель, используемый для измерения силы и направления монотонной связи между двумя переменными, представленными в порядковой (ранговой) шкале. В отличие от параметрического коэффициента корреляции Пирсона, который оценивает линейную зависимость, коэффициент Спирмена основан на рангах значений, а не на их абсолютных величинах, что делает его устойчивым к выбросам и пригодным для анализа данных, не подчиняющихся нормальному распределению.

История

Метод ранговой корреляции был предложен английским психологом и статистиком Чарльзом Спирменом в 1904 году. Спирмен разработал этот показатель в контексте исследований в области психометрии, где требовалось оценивать связи между переменными, измеренными в порядковых шкалах (например, результаты тестов способностей или ранги предпочтений). Первоначально Спирмен использовал коэффициент для анализа интеллектуальных способностей, что стало важным шагом в развитии непараметрической статистики. Позднее метод был формализован и включён в стандартный инструментарий статистического анализа.

Определение и формула

Коэффициент ранговой корреляции Спирмена вычисляется на основе рангов — порядковых номеров, присвоенных каждому значению переменной после сортировки данных по возрастанию. Для двух переменных X и Y, имеющих n наблюдений, расчёт производится следующим образом:

  1. Каждому значению X и Y присваивается ранг (от 1 до n). При наличии одинаковых значений (связей) используется средний ранг.
  2. Вычисляется разность рангов dᵢ для каждой пары наблюдений: dᵢ = R(Xᵢ) − R(Yᵢ).
  3. Коэффициент ρ рассчитывается по формуле:

ρ = 1 − (6 Σ dᵢ²) / (n (n² − 1))

где Σ dᵢ² — сумма квадратов разностей рангов, n — количество наблюдений.

В случае наличия большого числа связанных рангов (повторяющихся значений) применяется поправочная формула, использующая ковариацию рангов и их стандартные отклонения.

Свойства

Интерпретация

Интерпретация коэффициента Спирмена зависит от контекста исследования. Общепринятые эмпирические ориентиры (условные):

Знак коэффициента указывает на направление связи: положительный — прямая зависимость, отрицательный — обратная. Важно помнить, что даже сильная корреляция не означает причинно-следственной связи.

Применение

Коэффициент Спирмена широко используется в различных областях науки и практики:

Психология и социология

Медицина и биология

Экономика и финансы

Машинное обучение и анализ данных

Пример расчёта

Рассмотрим гипотетический пример: пять студентов (n=5) получили баллы по двум тестам (X и Y):

СтудентX (баллы)Y (баллы)Ранг XРанг Yd
A859045−11
B70652200
C95855411
D607013−24
E75603124

Σ d² = 1 + 0 + 1 + 4 + 4 = 10.

ρ = 1 − (6 10) / (5 (25 − 1)) = 1 − 60 / 120 = 1 − 0,5 = 0,5.

Таким образом, между баллами по тестам наблюдается умеренная прямая монотонная связь.

Ограничения и критика

Сравнение с другими коэффициентами

Программная реализация

Коэффициент Спирмена реализован во всех основных статистических пакетах и языках программирования:

Источники

BFOmetr — база данных и аналитика по компаниям России.

На главную BFOmetr →