Korelacje
Korelacje
Korelacja jest to taka relacja między zmiennymi, w której wzrostowi lub spadkowi poziomu jednej zmiennej towarzyszy wzrost lub spadek poziomu innej zmiennej. Zależność ta nie mówi nic o związkach przyczynowo skutkowych między zmiennymi a jedynie o ich współwystępowaniu. Opisane w tym artykule współczynniki korelacji służą do badania relacji między dwiema zmiennymi, istnieją jednak również korelacje wielozmiennowe, np. korelacja kanonicza, czy współczynniki uwzględniające wpływ zmiennych towarzyszących, np. korelacja cząstkowa.
Kluczowe charakterystyki współczynników korelacji
Współczynnik korelacji r-Pearosna
Jest to miara parametryczna, służy do badania współzależności dla dwóch zmiennych ilościowych o rozkładach normalnych. Współczynnik r-Peraosna jest szczególnie wrażliwy na skośność rozkładów zmiennych, jeśli rozkład nie spełnia kryterium normalności to pomimo to można rozważyć zastosowanie tego współczynnika, o ile skośność mieści się w przedziale <-1;1>. W innym przypadku rekomenduje się użycie nieparametrycznego współczynnika korelacji Rho-Spermana.
Współczynnik korelacji Rho-Spearmana
Rho Spearmana jest współczynnikiem nieparametrycznym, opartym na metodzie rangowania. Jest przeznaczony dla zmiennych porządkowaych i w sytuacji gdy nie można zastosować współczynnika r-Pearsona ze względu na odchylenia rozkładu zmiennej od normalnego, w takiej sytuacji rekomenduje się sprowadzenie zmiennych ilościowych do skali porządkowej. Współczynnik Spearmana sprawdza się najlepiej gdy zmienna porządkowa ma wiele poziomów, czyli jest mierzona na skali co najmniej 10-stpniowej.
Współczynnik korelacji tau b-Kendalla
Współczynnik tau b-Kendalla także należy do grupy nieparametrycznych i bazuje na metodzie rangowania, stosuje się dla zmiennych porządkowych, w wypadku gdy obydwie zmienne mają tyle samo poziomów, najlepiej dla skal od 5 do 10-stopniowej.
Współczynnik korelacji tau c-Kendalla
Podobnie jak tau b-Kendalla jest przeznaczony dla zmiennych porządkowych, które mogą być mierzone na skalach o różnej liczbie poziomów.
Gamma
Współczynnik gamma również przeznaczony dla zmiennych porządkowych o niewielkiej liczbie poziomów, najlepiej do 5.
Współczynnik d Sommersa
Także przeznaczony dla zmiennych porządkowych, charakteryzuje się tym że jest asymetryczny, czyli daje inny wynik gdy zmienne ustawione jako zależna i niezależna zamieni się miejscami. Współczynnik d Sommersa wymaja więc zdefiniowania zmiennej zależnej i niezależnej. Może być stosowany zamiast regresji liniowej z jednym predyktorem wówczas gdy nie można przeprowadzić regresji metodą najmniejszych kwadratów z uwagi na słabą skalę pomiarową lub brak rozkładu normalnego zmiennych.
Współczynnik phi
Phi jest współczynnikiem korelacji dla zmiennych nominalnych mierzonych na dwóch poziomach. Obydwie zmienne muszą być mierzone na skali nominalnej dwukategorialnej. Oczywiście każdą skalę porządkową, czy wyższą można sprowadzić do tej postaci.
Współczynnik C kontyngencji
Podobnie jak współczynnik phi jest przeznaczony dla zmiennych nominalnych o równej liczbie kategorii, z tym że w przypadku współczynnika C kontyngencji liczba kategorii zmiennych może być większa, niż dwie.
Współczynnik V Kramera
Przeznaczony dla zmiennych nominalnych o dowolnej liczbie poziomów. W praktyce używany także dla nominalnych i porządkowych, z tym że wówczas kolejne poziomy czynnika są traktowane jak odrębne klasy, bez uwzględnienia porządku między nimi, czyli zmienna porządkowa traktowana jest jak nominalna.
Współczynnik eta
Przeznaczony dla zmiennej nominalnej i ilościowej (przedziałowej lub interwałowej). Zmienna nominalna może mieć dowolną liczbę kategorii. Normalność rozkładu dla zmiennej ilościowej nie jest wymagana.
Wyjątki
W psychologii, pedagogice, socjologii, zarządzaniu i innych naukach społecznych niektóre skale porządkowe traktuje się jak skale ilościowe (przedziałowe) i oblicza dla nich współczynnik korelacji r-Pearsona. Dwuwartościowa skala nominalna (0,1) jest szczególnym przypadkiem skali porządkowej, dlatego może się zdarzyć, iż współczynnik korelacji r-Pearsona zostanie obliczony dla zmiennej mierzonej na takiej skali, jest to jednak wyjątek – nie reguła – i należy unikać takiego postępowania. W naukach ścisłych i przyrodniczych powyższy zasada nie obowiązuje.
Współczynnik korelacji a normalność rozkładu.
Współczynnik r-Persona wymaga aby populacje, z których pobrano próby, miały rozkład normalny. Pozostałe współczynniki są wolne od tego założenia.
Jak interpretować wynik współczynnika korelacji?
Interpretując współczynnik korelacji dwuzmiennowej należy wziąć pod uwagę poziom istotności, wielkość współczynnika korelacji i liczebność próby.
Współczynnik korelacji wskazuje na kierunek zależności – dodatnia, czy ujemna – oraz na jej siłę.
- Do 0,2 – korelacja bardzo słaba
- 0,21 – 0,4 – korelacja słaba
- 0,41 – 0,7 – korelacja umiarkowana
- 0,71 – 0,9 – korelacja silna
- 0,91 – 0,99 – korelacja bardzo silna
- 1 – zależność funkcyjna
Podane powyżej wartości są wartościami bezwzględnymi, kierunek zależności odczytujemy ze współczynnika.
Wymienione w tym artykule współczynniki korelacji dwuzmiennowych należą do najczęściej stosowanych, nie wyczerpuje to jednak pełnego spektrum tego typu miar.
Bibliografia
Aczel, A., D., Sounderpandian, J. (2017). Statystyka w zarządzaniu. Warszawa: PWN
King, B., M., Minium, E., W. (2009). Statystyka dla psychologów i pedagogów. Warszawa: PWN