Корреляционный анализ спирмена онлайн. Коэффициент ранговой корреляции спирмена

Корреляционный анализ является методом, позволяющим обнаруживать зависимости между определенным количеством случайных величин. Цель корреляционного анализа, сводится к выявлению оценки силы связей между такими случайными величинами либо признаками, характеризующими определенные реальные процессы.

Сегодня мы предлагаем рассмотреть, как применяется корреляционный анализ по Спирмену, для наглядного отображения форм связи в практическом трейдинге.

Корреляция по Спирмену или основа корреляционного анализа

Для того чтобы понять, что такое корреляционный анализ, изначально следует уяснить понятие корреляции.

При этом, если цена начнет двигаться в нужном Вам направлении необходимо вовремя произвести разлокирование позиций.


Для данной стратегии в основу которой положен корреляционный анализ, наилучшим образом подходят торговые инструменты имеющие высокую степень корреляции (EUR/USD и GBP/USD, EUR/AUD и EUR/NZD, AUD/USD и NZD/USD, контракты CFD и тому подобные).

Видео: Применение корреляции Спирмена на рынке Форекс

Студента-психолога (социолога, менеджера, управленца и др.) нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых группах.

В математике для описания связей между переменными величинами используют понятие функции F, которая ставит в соответствие каждому определенному значению независимой переменной X определенное значение зависимой переменной Y. Полученная зависимость обозначается как Y=F(X).

При этом виды корреляционных связей между измеренными признаками могут быть различны: так, корреляция бывает линейной и нелинейной, положительной и отрицательной. Она линейна - если с увеличением или уменьшением одной переменной X,вторая переменная Y в среднем либо также растет, либо убывает. Она нелинейна, если при увеличении одной величины характер изменения второй не линеен, а описывается другими законами.

Корреляция будет положительной, если с увеличением переменной X переменная Y в среднем также увеличивается, а если с увеличением X переменная Y имеет в среднем тенденцию к уменьшению, то говорят о наличии отрицательной корреляции. Возможна ситуация, когда между переменными невозможно установить какую-либо зависимость. В этом случае говорят об отсутствии корреляционной связи.

Задача корреляционного анализа сводится к установлению направления (положительное или отрицательное) и формы (линейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.

Коэффициент корреляции рангов, предложенный К. Спирменом, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин.

Ранговый коэффициент линейной корреляции Спирмена подсчитывается по формуле:

где n - количество ранжируемых признаков (показателей, испытуемых);
D - разность между рангами по двум переменным для каждого испытуемого;
D2 - сумма квадратов разностей рангов.

Критические значения коэффициента корреляции рангов Спирмена представлены ниже:

Величина коэффициента линейной корреляции Спирмена лежит в интервале +1 и -1. Коэффициент линейной корреляции Спирмена может быть положительным и отрицательным, характеризуя направленность связи между двумя признаками, измеренными в ранговой шкале.

Если коэффициент корреляции по модулю оказывается близким к 1, то это соответствует высокому уровню связи между переменными. Так, в частности, при корреляции переменной величины с самой собой величина коэффициента корреляции будет равна +1. Подобная связь характеризует прямо пропорциональную зависимость. Если же значения переменной X будут распложены в порядке возрастания, а те же значения (обозначенные теперь уже как переменная Y) будут располагаться в порядке убывания, то в этом случае корреляция между переменными Х и Y будет равна точно -1. Такая величина коэффициента корреляции характеризует обратно пропорциональную зависимость.

Знак коэффициента корреляции очень важен для интерпретации полученной связи. Если знак коэффициента линейной корреляции - плюс, то связь между коррелирующими признаками такова, что большей величине одного признака (переменной) соответствует большая величина другого признака (другой переменной). Иными словами, если один показатель (переменная) увеличивается, то соответственно увеличивается и другой показатель (переменная). Такая зависимость носит название прямо пропорциональной зависимости.

Если же получен знак минус, то большей величине одного признака соответствует меньшая величина другого. Иначе говоря, при наличии знака минус, увеличению одной переменной (признака, значения) соответствует уменьшение другой переменной. Такая зависимость носит название обратно пропорциональной зависимости. При этом выбор переменной, которой приписывается характер (тенденция) возрастания - произволен. Это может быть как переменная X, так и переменная Y. Однако если считается, что увеличивается переменная X, то переменная Y будет соответственно уменьшаться, и наоборот.

Рассмотрим пример корреляции Спирмена.

Психолог выясняет, как связаны между собой индивидуальные показатели готовности к школе, полученные до начала обучения в школе у 11 первоклассников и их средняя успеваемость в конце учебного года.

Для решения этой задачи были проранжированы, во-первых, значения показателей школьной готовности, полученные при поступлении в школу, и, во-вторых, итоговые показатели успеваемости в конце года у этих же учащихся в среднем. Результаты представим в таблице:

Подставляем полученные данные в вышеприведенную формулу, и производим расчет. Получаем:

Для нахождения уровня значимости обращаемся к таблице «Критические значения коэффициента корреляции рангов Спирмена,» в которой приведены критические значения для коэффициентов ранговой корреляции.

Строим соответствующую «ось значимости»:

Полученный коэффициент корреляции совпал с критическим значением для уровня значимости в 1%. Следовательно, можно утверждать, что показатели школьной готовности и итоговые оценки первоклассников связаны положительной корреляционной зависимостью - иначе говоря, чем выше показатель школьной готовности, тем лучше учится первоклассник. В терминах статистических гипотез психолог должен отклонить нулевую (Н0) гипотезу о сходстве и принять альтернативную (Н1) о наличии различий, которая говорит о том, что связь между показателями школьной готовности и средней успеваемостью отлична от нуля.

Корреляция спирмена. Корреляционный анализ по методу спирмена. Ранги спирмена. Коэффициент корреляции Спирмена. Ранговая корреляция Спирмена

На практике для определения тесноты связи двух признаков часто применяется коэффициент ранговой корреляции Спирмена (Р). Значения каждого признака ранжируются по степени возрастания (от 1 до n), затем определяется разница (d) между рангами, соответствующими одному наблюдению.

Пример №1 . Зависимость между объемом промышленной продукции и инвестициями в основной капитал по 10 областям одного из федеральных округов РФ в 2003 году характеризуется следующими данными.
Вычислите ранговые коэффициенты корреляции Спирмена и Кендэла . Проверить их значимость при α=0,05. Сформулируйте вывод о зависимости между объемом промышленной продукции и инвестициями в основной капитал по рассматриваемым областям РФ.

Присвоим ранги признаку Y и фактору X . Найдем сумму разности квадратов d 2 .
Используя калькулятор , вычислим коэффициент ранговой корреляции Спирмена:

X Y ранг X, d x ранг Y, d y (d x - d y) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

Связь между признаком Y фактором X сильная и прямая.

Оценка коэффициента ранговой корреляции Спирмена



По таблице Стьюдента находим Tтабл.
T табл = (18;0.05) = 1.734
Поскольку Tнабл > Tтабл, то отклоняем гипотезу о равенстве нулю коэффициента ранговой корреляции. Другими словами, коэффициента ранговой корреляции Спирмена статистически - значим.

Интервальная оценка для коэффициента ранговой корреляции (доверительный интервал)
Доверительный интервал для коэффициента ранговой корреляции Спирмена: p(0.5431;0.9095).

Пример №2 . Исходные данные.

5 4
3 4
1 3
3 1
6 6
2 2
Так как в матрице имеются связанные ранги (одинаковый ранговый номер) 1-го ряда, произведем их переформирование. Переформирование рангов производиться без изменения важности ранга, то есть между ранговыми номерами должны сохраниться соответствующие соотношения (больше, меньше или равно). Также не рекомендуется ставить ранг выше 1 и ниже значения равного количеству параметров (в данном случае n = 6). Переформирование рангов производится в табл.
Новые ранги
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
Так как в матрице имеются связанные ранги 2-го ряда, произведем их переформирование. Переформирование рангов производится в табл.
Номера мест в упорядоченном ряду Расположение факторов по оценке эксперта Новые ранги
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
Матрица рангов.
ранг X, d x ранг Y, d y (d x - d y) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
Поскольку среди значений признаков х и у встречается несколько одинаковых, т.е. образуются связанные ранги, то в таком случае коэффициент Спирмена вычисляется как:

где


j - номера связок по порядку для признака х;
А j - число одинаковых рангов в j-й связке по х;
k - номера связок по порядку для признака у;
В k - число одинаковых рангов в k-й связке по у.
A = [(2 3 -2)]/12 = 0.5
B = [(2 3 -2)]/12 = 0.5
D = A + B = 0.5 + 0.5 = 1

Связь между признаком Y и фактором X умеренная и прямая.

This calculator below calculates Spearman"s rank correlation coefficient between two random variables. The theoretical part is traditional below the calculator.

add import_export mode_edit delete

Changes of random variables

arrow_upward arrow_downward arrow_upward arrow_downward
Items per page: 5 10 20 50 100 chevron_left chevron_right

Changes of random variables

Import data Import error

"One of the following characters is used to separate data fields: tab, semicolon (;) or comma(,)" Sample: -50.5;-50.5

Import Back Cancel

Digits after the decimal point: 4

Calculate

Spearman"s correlation coefficient

Save share extension

The method of Spearman"s rank correlation coefficient calculation is actually pretty simple. It"s like the Pearson correlation coefficient , but designed not for measurements of random variables only but for their ranking values .

We have only to understand what is the rank value and why all this is necessary.

If the elements of a variational series arranged in ascending or descending order, that rank of the element will be his number in ordered series.

For example, we have a variational series {17,26,5,14,21}. Let"s sort it"s elements in a descending order {26,21,17,14,5}. 26 has a rank of 1, 21 - rank of 2 and so on, Variational series of ranking values will look like this {3,1,5,4,2}.

I.e. when calculating Spearman"s coefficient initial variation series are converted into variational series of ranking values and then Pearson"s formula is applied to them.
.
There is one subtlety - the rank of the repeating values is taken as the average of the ranks. That is, for a series {17, 15, 14, 15}ranking series will look like {1, 2.5, 4, 2.5}, as the first element is 15 has a rank of 2, and the second - rank of 3, and.

If you don"t have the repeating values, that is, all the values of ranking series - the numbers between 1 and n, the Pearson"s formula can be simplified to

By the way, this formula is often given as the formula for calculating the Spearman"s coefficient.

What is the essence of the transition from the values themselves to their rank value?
When investigating the correlation of ranking values you can find how well the dependence of the two variables is described by a monotonic function.

The sign of the coefficient indicates the direction of the relationship between variables. If the sign is positive the values of Y has a tendency to increase with the increasement of X. If the sign is negative the values of Y has a tendency to decrease with the increasement of X. If the coefficient is 0 there is no tendency then. If the coefficient equals 1 or -1, the relationship between X and Y has an appearance of monotonic function, i.e. with the increasement of X, Y also increases and vice versa.

That is, unlike the Pearson"s correlation coefficient, which can detect only the linear relationship of one variable from another, Spearman"s correlation coefficient can detect monotonic dependence, where the direct linear relationship cannot be revealed.

Here"s an example.
Поясню на примере. Let"s suppose,we examine the function y=10/x.
We have the following measurements of X and Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
For this data, Pearson correlation coefficient is equal to -0.4686, i.e. the relationship is weak or absent. And Spearman"s correlation coefficient is strictly equal to -1, as if it"s hints to the researcher that Y has strongly negative monotonic dependence from X.

Дисциплина "высшая математика" у некоторых вызывает неприятие, так как поистине не всем дано ее понять. Но те, кому посчастливилось изучать этот предмет и решать задачи, используя различные уравнения и коэффициенты, могут похвастаться практически полной в ней осведемленности. В психологической науке существует не только гуманитарная направленность, но и определенные формулы и способы для математической проверки выдвигаемой в ходе исследований гипотезы. Для этого применяются различные коэффициенты.

Коэффициент корреляции Спирмена

Это распространенное измерение по определению тесноты связи между какими-либо двумя признаками. Коэффициент еще называют непараметрическим методом. Он показывает статистику связи. То есть мы знаем, например, что у ребенка агрессия и раздражительность связаны между собой, а коэффициент корреляции рангов Спирмена показывает статистическую математическую связь этих двух признаков.

Как вычисляется ранговый коэффициент?

Естественно, что для всех математических определений или величин существуют свои формулы, по которым они вычисляются. Ею обладает и коэффициент корреляции Спирмена. Формула у него следующая:

С первого взгляда формула не совсем понятна, но если разобраться, все очень легко вычисляется:

  • n - это количество признаков или показателей, которые проранжированы.
  • d - разность определенных двух рангов, соответствующих конкретным двум переменным каждого испытуемого.
  • ∑d 2 - сумма всех квадратов разностей рангов признака, квадраты которых вычисляются отдельно для каждого ранга.

Область применения математической меры связи

Для применения рангового коэффициента необходимо, чтобы количественные данные признака были проранжированы, то есть им был присвоен определенный номер в зависимости от места, на котором расположен признак, и от его значения. Доказано, что два ряда признаков, выраженных в числовом виде, несколько параллельны между собой. Коэффициент ранговой корреляции Спирмена определяет степень этой параллельности, тесноты связи признаков.

Для математической операции по расчету и определению связи признаков с помощью указанного коэффициента нужно произвести некоторые действия:

  1. Каждому значению какого-либо испытуемого или явления присваивается номер по порядку - ранг. Он может соответствовать значению явления по возрастанию и по убыванию.
  2. Дальше сопоставляются ранги значения признаков двух количественных рядов для того, чтобы определить разность между ними.
  3. В отдельном столбце таблицы для каждой полученной разности прописывается ее квадрат, а внизу результаты суммируются.
  4. После этих действий применяется формула, по которой рассчитывается коэффициент корреляции Спирмена.

Свойства коэффициента корреляции

К основным свойствам коэффициента Спирмена относят следующие:

  • Измерение значений в пределах от -1 до 1.
  • Знак коэффициента интерпретаций не имеет.
  • Теснота связи определяется по принципу: чем выше величина, тем теснее связь.

Как проверить полученное значение?

Для проверки связи признаков между собой необходимо выполнить определенные действия:

  1. Выдвигается нулевая гипотеза (H0), она же основная, затем формулируется другая, альтернативная первой (H 1). Первая гипотеза будет заключаться в том, что коэффициент корреляции Спирмена равняется 0 - это значит, что связи не будет. Вторая, наоборот, гласит, что коэффициент не равен 0, тогда связь есть.
  2. Следующим действием будет нахождение наблюдаемого значения критерия. Оно находится по основной формуле коэффициента Спирмена.
  3. Далее находятся критические значения заданного критерия. Это можно сделать только с помощью специальной таблицы, где отображаются различные значения по заданным показателям: уровень значимости (l) и число, определяющее (n).
  4. Теперь нужно сравнить два полученных значения: установленного наблюдаемого, а также критического. Для этого необходимо построить критическую область. Нужно начертить прямую линию, на ней отметить точки критического значения коэффициента со знаком "-" и со знаком"+". Слева и справа от критических значений полукругами от точек откладываются критические области. Посередине, объединяя два значения, отмечается полукругом ОПГ.
  5. После этого делается вывод о тесноте связи между двумя признаками.

Где лучше использовать эту величину

Самой первой наукой, где активно использовался этот коэффициент, была психология. Ведь это наука, не основывающаяся на цифрах, однако для доказательства каких-либо важных гипотез, касающихся развития отношений, черт характера людей, знаний студентов, требуется статистическое подтверждение выводов. Также его используют в экономике, в частности, при валютных оборотах. Здесь оцениваются признаки без статистики. Очень удобен коэффициент ранговой корреляции Спирмена в этой области применения тем, что оценка производится независимо от распределения переменных, так как они заменяются ранговым числом. Активно применяется коэффициент Спирмена в банковском деле. Социология, политология, демография и другие науки также используют его в своих исследованиях. Результаты получаются быстро и максимально точно.

Удобно и быстро используется коэффициент корреляции Спирмена в Excel. Здесь существуют специальные функции, которые помогают быстро получить необходимые значения.

Какие еще коэффициенты корреляции существуют?

Кроме того, что мы узнали про коэффициент корреляции Спирмена, существуют еще различные корреляционные коэффициенты, позволяющие измерить, оценить качественные признаки, связь между количественными признаками, тесноту связи между ними, представленными в ранговой шкале. Это такие коэффициенты, как биссериальный, рангово-биссериальный, контенгенции, ассоциации, и так далее. Коэффициент Спирмена очень точно показывает тесноту связи, в отличие от всех остальных методов ее математического определения.