Analiza dyskryminacyjna

Analiza dyskryminacyjna

Analiza dyskryminacyjna to grupa metod służąca do klasyfikacji, predykcji i eksploracji danych. Funkcja dyskryminacyjna na podstawie wybranych predyktorów pozwala przewidzieć przynależność do grup.

Analiza dyskryminacyjna – podstawowe założenia

  • predyktory nie mogą być współosiowe
  • obserwacje muszą należeć do dwóch lub więcej wykluczających się wzajemnie grup
  • predyktory mierzone na skali ilościowej
  • w badanej populacji macierze kowariancji we wszystkich grupach są sobie równe
  • liczba obserwacji musi być większa od liczby zmiennych o co najmniej dwie
  • grupy zostały pobrane z populacji mającej rozkład normalny

Otrzymana w oparciu o model analizy dyskryminacyjnej liniowa kombinacja zmiennych niezależnych służy jako kryterium przyporządkowywania obserwacji do grup. Informacje, których nośnikami są zmienne niezależne (predyktory), zapisywane są w postaci syntetycznej jako wyniki funkcji dyskryminacyjnej. Równanie tej funkcji przypomina bliźniaczo analizę regresji wielokrotnej:

Dkm = B0 + B1X1 km + B1X1 km + … BpXp km

gdzie: D km – wartość kanonicznej funkcji dyskryminacyjnej dla obserwacji m w grupie k (tzw. wynik dyskryminacyjny); Xi km – wartość zmiennej dyskryminującej dla obserwacji m w grupie k; Bi – współczynnik dyskryminacyjny dla zmiennej Xi reprezentujący jej ważony efekt; B0 – wartości stałej.

Współczynniki dyskryminacyjne, nazywane niekiedy wagami, określają ilościowy udział poszczególnych predyktorów w funkcji. Wyniki dyskryminacyjne poszczególnych obserwacji należących do różnych grup powinny różnić się od siebie tak bardzo jak to tylko możliwe. Współczynniki funkcji dyskryminacyjnej maksymalizują stosunek wariancji międzygrupowej do wariancji wewnątrzgrupowej.

Celem analizy dyskryminacyjnej jest wskazanie takich zmiennych dyskryminujących, które w sposób możliwie najbardziej efektywny pozwolą wyjaśnić różnice między porównywanymi grupami i przewidzieć przynależność grupową.


Przykład

Zbadano cztery cechy osobowości - autorytaryzm, szczerość, zainteresowanie, bezstronność - w grupie 74 studentów uniwersytetu, studentów podzielono ze względu na sympatię do 3 partii politycznych.  Pytanie badawcze brzmi: czy na podstawie sympatii do jednej z 3 partii politycznych można przewidzieć układ cech osobowości u studentów. 

Test dobroci dopasowania

Tabela 1. Test Boxa równości kowariancji – kowariancje w grupach powinny być równe. Analizę przeprowadzono w programie R. 

Box’s M

27.964

Approx.

1.284

df1

20

df2

18037.929

p-value

.177

 

M=27,964; p=0,177. Kowariancje są równe, co wskazuje na dobre dopasowanie modelu.

Testy równości średnich

Tabela 2. Test równości średnich grupowych. Obliczenia przeprowadzono w programie R. 

 

Wilks' Lambda

F

df1

df2

p-value

Autorytaryzm

.941

2.215

2

71

.117

Szczerość

.905

3.724

2

71

.029

Zainteresowanie

.931

2.651

2

71

.078

Bezstronność

.895

4.161

2

71

.020

Test równości średnich grupowych jest odpowiednikiem jednoczynnikowej analizy wariancji

Lambda Wilksa jest miarą równości średnich grupowych, zawiera się w przedziale 0-1   Statystyka Lambda Wilksa powinna być możliwie najmniejsza. 1-Lambda Wilksa = eta-kwadrat. W analizowanym przykładzie 1-0,905= 0,095 czyli 9,5% wariancji zmiennej zależnej grupa jest wyjaśniany przez cechę szczerość  Wartość Lambda Wilksa można sprowadzić do wartości statystyki F, która pokazuje istotność statystyczną różnic między grupami. W przypadku drugiej istotnej zmiennej bezstronność wkład w wyjaśnianie zmiennej zależnej to 10,5%.

Istotą analizy dyskryminacyjnej jest testowanie jednoczesnego i łącznego wpływu wielu predyktorów uwzględniając ich powiązanie między sobą, w tym celu analizujemy współczynniki funkcji dyskryminacyjnej.

Wyniki funkcji dyskryminacyjnej

Utworzono dwie funkcje dyskryminacyjne, z których jedna jest istotna statystycznie

Tabela 3. Funkcja dyskryminacyjna. Obliczenia przeprowadzono w programie R. 

Test of Function(s)

Wilks' Lambda

Chi-square

df

p-value

1 through 2

.771

18.089

8

.021

2

.917

6.007

3

.111

Funkcja dyskryminacyjna na podstawie grupy zmiennych pozwala na trafną klasyfikację według grupy.

Lambda Wilksa jest to proporcja całkowitej wariancji wyników, której nie wyjaśniają różnic między grupami. Kiedy średnie wyniki dyskryminacyjne w grupach są sobie równe to wówczas Lambda Wilksa osiąga wartość 1.  Funkcje dyskryminacyjne, które mają dużą wariancję międzygrupową i małą wewnątrzgrupową  wykazują wartości zbliżone do zera, czyli im mniejszy współczynnik Wilk’s Lambda tym większa wartość funkcji dyskryminacyjnej.

W analizowanym przypadku Lambda Wilksa ma wartość 0,771, co oznacza że średnia wartość funkcji dyskryminacyjnej we wszystkich  grupach  różni się na poziomie umiarkowanym.  Statystyka chi-kwadrat jest istotna statystycznie, co oznacza że istnieje jednak  pewna różnica funkcji dyskryminacyjnej  między grupami.

Wartości własne

Tabela 4. Wartości własne funkcji dyskryminacyjnej. Obliczenia przeprowadzono w programie R. 

Function

Eigenvalue

% of Variance

Cumulative %

Canonical Correlation

1

.190

67.8

67.8

.399

2

.090

32.2

100.0

.288

 

Wartość własna przedstawia stosunek  wariancji wewnątrzgrupowej do międzygrupowej. Im większa wartość własna, tym większa moc dyskryminacyjna. Wartość 100% pojawia się zawsze wówczas gdy mamy do czynienia z dwiema grupami.Wartość własna na poziomie 0,190 wskazuje na umiarkowaną moc dyskryminacyjną modelu. Korelacja kanoniczna jest miarą wielkości związku pomiędzy wynikami dyskryminacyjnymi i zmienną grupującą, reprezentuje część wariancji która wyjaśnia różnice międzygrupowe. Wartość korelacji kanonicznej zawiera się w przedziale (0-1). W podanym przypadku korelacja kanoniczna na poziomie 0,399 wskazuje, że funkcja dyskryminacyjna jest umiarkowanie powiązana ze zmienną grupującą. Kwadrat korelacji kanonicznej wskazuje jaki procent wariancji funkcji jest wyjaśniany przez różnice międzygrupowe. W podanym przykładzie jest to 16,92%, zatem  16,92% wariancji funkcji jest wyjaśniany przez różnice międzygrupowe.

Niestandaryzowane współczynniki funkcji dyskryminacyjnych

Tabela 5. Niestandaryzowane współczynniki funkcji dyskryminacyjnej. Obliczenia przeprowadzono w programie R

 

Unstandarised Canonical Discriminant Function Coefficients

1

2

Autorytaryzm

-.464

-.437

Szczerość

.671

-.144

Zainteresowanie

-.055

.474

Bezstronność

.677

.313

(Constant)

-2.861

.858

Wielkość współczynników niestandaryzowanych mówi o tym o ile wzrośnie lub zmaleje wartość funkcji, jeśli wielkość predykatora zmieni się  o jednostkę.  Po podstawieniu współczynników równanie dyskryminacyjne przedstawia się następująco:

Dkm=-0,2,861 – 0,464 * X1 + 0,671 * X2 – 0,055 * X3 + 0,667*X4

 Dkm – GRUPA , X1 – autorytaryzm, X2 – szczerość, X3 – zainteresowanie, X4- bezstronność

 

Standaryzowane współczynniki funkcji dyskryminacyjnych

Tabela 6. Standaryzowane współczynniki funkcji dyskryminacyjnej. Obliczenia przeprowadzono w programie R

 

Standardized Canonical Discriminant Function Coefficients

1

2

Autorytaryzm

-.436

-.410

Szczerość

.734

-.158

Zainteresowanie

-.071

.608

Bezstronność

.740

.341

Współczynniki standaryzowane pokazują wkład danego predyktora w obliczenie wyniku dyskryminacyjnego, określając  ilościowy udział danego predyktora w funkcji. Jeśli predyktory są ze sobą skorelowane, tj. wnoszą podobny zasób informacji dyskryminujących dzielą między sobą wkład w wynik dyskryminacyjny, w konsekwencji ich współczynniki beta są mniejsze, niż gdyby potraktować je oddzielnie.  Przeciwne znaki współczynników beta sygnalizują, że ich wpływ równoważy się.

W tym przypadku funkcja dyskryminacyjna opiera się na wysokich wartościach  cech bezstronności  i szczerości. Predyktorem, który wnosi najmniejszy wkład jest zainteresowanie.

Macierz struktury

Tabela 7. Macierz struktury. Obliczenia przeprowadzono w programie R

 

Function

1

2

Autorytaryzm

.779

.152

Szczerość

.640

-.549

Zainteresowanie

-.180

.871

Bezstronność

.134

-.808

Współczynnik korelacji każdej zmiennej z wartością funkcji dyskryminacyjnej do kwadratu oznacza stopnień wyjaśniania zmienności danej zmiennej przez wartości utworzonej funkcji dyskryminacyjnej, bezstronność w 60,8% jest wyjaśniana przez funkcję dyskryminacyjną. Współczynnik korelacji każdej zmiennej z wartością funkcji dyskryminacyjnej wskazuje na zakres determinacji wartości funkcji dyskryminacyjnej przez poszczególne zmienne.

Ocena dopasowania funkcji dyskryminacyjnej, tj. ocena efektywności wyjaśniania różnic między grupami.

Ocena dopasowania funkcji dyskryminacyjnej, tj. ocena efektywności wyjaśniania różnic między grupami.

Tabela 8. Dopasowanie funkcji dyskryminacyjnej. Obliczenia przeprowadzono w programie R

 

group

Predicted Group Membership

Total

Partia 1

Partia 2

Partia 3

Original

Count

Partia 1

14

6

5

25

Partia 2

8

8

8

24

Partia 3

3

7

15

25

%

Partia 1

56.0%

24.0

20.0

100.0

Partia 2

33.3

33.3%

33.3

100.0

Partia 3

12.0

28.0

60.0%

100.0

Funkcja najlepiej przewiduje przynależność do grupy trzeciej 60% przypadków udało się poprawnie sklasyfikować.

Średnie wartości funkcji dyskryminacyjnej

Tabela 9. Średnie wartości funkcji dyskryminacyjnej - wyniki standaryzowane. Obliczenia przeprowadzono w programie R

group

Function

1

2

Partia 1

.447

-.273

Partia 2

.127

.416

Partia 3

-.569

-.126

Wykres 1. Wykresy funkcji dyskryminacyjnej w poszczególnych grupach. Wykresy wykonano w programie R. 

 Bibliografia

Gatnar, E., Walesiak, M. (2009). Statystyczna analiza danych z wykorzystaniem programu R. Warszawa: PWN

Radkiewicz, P. (2010). Analiza dyskryminacyjna. Podstawowe za założenia i zastosowania w badaniach społecznych. Psychologia Społeczna. T. 5 2-3(14) 142-161.