Analiza dyskryminacyjna
Analiza dyskryminacyjna
Analiza dyskryminacyjna to grupa metod służąca do klasyfikacji, predykcji i eksploracji danych. Funkcja dyskryminacyjna na podstawie wybranych predyktorów pozwala przewidzieć przynależność do grup.
Analiza dyskryminacyjna – podstawowe założenia
- predyktory nie mogą być współosiowe
- obserwacje muszą należeć do dwóch lub więcej wykluczających się wzajemnie grup
- predyktory mierzone na skali ilościowej
- w badanej populacji macierze kowariancji we wszystkich grupach są sobie równe
- liczba obserwacji musi być większa od liczby zmiennych o co najmniej dwie
- grupy zostały pobrane z populacji mającej rozkład normalny
Otrzymana w oparciu o model analizy dyskryminacyjnej liniowa kombinacja zmiennych niezależnych służy jako kryterium przyporządkowywania obserwacji do grup. Informacje, których nośnikami są zmienne niezależne (predyktory), zapisywane są w postaci syntetycznej jako wyniki funkcji dyskryminacyjnej. Równanie tej funkcji przypomina bliźniaczo analizę regresji wielokrotnej:
Dkm = B0 + B1X1 km + B1X1 km + … BpXp km
gdzie: D km – wartość kanonicznej funkcji dyskryminacyjnej dla obserwacji m w grupie k (tzw. wynik dyskryminacyjny); Xi km – wartość zmiennej dyskryminującej dla obserwacji m w grupie k; Bi – współczynnik dyskryminacyjny dla zmiennej Xi reprezentujący jej ważony efekt; B0 – wartości stałej.
Współczynniki dyskryminacyjne, nazywane niekiedy wagami, określają ilościowy udział poszczególnych predyktorów w funkcji. Wyniki dyskryminacyjne poszczególnych obserwacji należących do różnych grup powinny różnić się od siebie tak bardzo jak to tylko możliwe. Współczynniki funkcji dyskryminacyjnej maksymalizują stosunek wariancji międzygrupowej do wariancji wewnątrzgrupowej.
Celem analizy dyskryminacyjnej jest wskazanie takich zmiennych dyskryminujących, które w sposób możliwie najbardziej efektywny pozwolą wyjaśnić różnice między porównywanymi grupami i przewidzieć przynależność grupową.
Przykład
Zbadano cztery cechy osobowości - autorytaryzm, szczerość, zainteresowanie, bezstronność - w grupie 74 studentów uniwersytetu, studentów podzielono ze względu na sympatię do 3 partii politycznych. Pytanie badawcze brzmi: czy na podstawie sympatii do jednej z 3 partii politycznych można przewidzieć układ cech osobowości u studentów.
Test dobroci dopasowania
Tabela 1. Test Boxa równości kowariancji – kowariancje w grupach powinny być równe. Analizę przeprowadzono w programie R.
Box’s M |
27.964 |
Approx. |
1.284 |
df1 |
20 |
df2 |
18037.929 |
p-value |
.177 |
M=27,964; p=0,177. Kowariancje są równe, co wskazuje na dobre dopasowanie modelu.
Testy równości średnich
Tabela 2. Test równości średnich grupowych. Obliczenia przeprowadzono w programie R.
|
Wilks' Lambda |
F |
df1 |
df2 |
p-value |
Autorytaryzm |
.941 |
2.215 |
2 |
71 |
.117 |
Szczerość |
.905 |
3.724 |
2 |
71 |
.029 |
Zainteresowanie |
.931 |
2.651 |
2 |
71 |
.078 |
Bezstronność |
.895 |
4.161 |
2 |
71 |
.020 |
Test równości średnich grupowych jest odpowiednikiem jednoczynnikowej analizy wariancji
Lambda Wilksa jest miarą równości średnich grupowych, zawiera się w przedziale 0-1 Statystyka Lambda Wilksa powinna być możliwie najmniejsza. 1-Lambda Wilksa = eta-kwadrat. W analizowanym przykładzie 1-0,905= 0,095 czyli 9,5% wariancji zmiennej zależnej grupa jest wyjaśniany przez cechę szczerość Wartość Lambda Wilksa można sprowadzić do wartości statystyki F, która pokazuje istotność statystyczną różnic między grupami. W przypadku drugiej istotnej zmiennej bezstronność wkład w wyjaśnianie zmiennej zależnej to 10,5%.
Istotą analizy dyskryminacyjnej jest testowanie jednoczesnego i łącznego wpływu wielu predyktorów uwzględniając ich powiązanie między sobą, w tym celu analizujemy współczynniki funkcji dyskryminacyjnej.
Wyniki funkcji dyskryminacyjnej
Utworzono dwie funkcje dyskryminacyjne, z których jedna jest istotna statystycznie
Tabela 3. Funkcja dyskryminacyjna. Obliczenia przeprowadzono w programie R.
Test of Function(s) |
Wilks' Lambda |
Chi-square |
df |
p-value |
1 through 2 |
.771 |
18.089 |
8 |
.021 |
2 |
.917 |
6.007 |
3 |
.111 |
Funkcja dyskryminacyjna na podstawie grupy zmiennych pozwala na trafną klasyfikację według grupy.
Lambda Wilksa jest to proporcja całkowitej wariancji wyników, której nie wyjaśniają różnic między grupami. Kiedy średnie wyniki dyskryminacyjne w grupach są sobie równe to wówczas Lambda Wilksa osiąga wartość 1. Funkcje dyskryminacyjne, które mają dużą wariancję międzygrupową i małą wewnątrzgrupową wykazują wartości zbliżone do zera, czyli im mniejszy współczynnik Wilk’s Lambda tym większa wartość funkcji dyskryminacyjnej.
W analizowanym przypadku Lambda Wilksa ma wartość 0,771, co oznacza że średnia wartość funkcji dyskryminacyjnej we wszystkich grupach różni się na poziomie umiarkowanym. Statystyka chi-kwadrat jest istotna statystycznie, co oznacza że istnieje jednak pewna różnica funkcji dyskryminacyjnej między grupami.
Wartości własne
Tabela 4. Wartości własne funkcji dyskryminacyjnej. Obliczenia przeprowadzono w programie R.
Function |
Eigenvalue |
% of Variance |
Cumulative % |
Canonical Correlation |
1 |
.190 |
67.8 |
67.8 |
.399 |
2 |
.090 |
32.2 |
100.0 |
.288 |
Wartość własna przedstawia stosunek wariancji wewnątrzgrupowej do międzygrupowej. Im większa wartość własna, tym większa moc dyskryminacyjna. Wartość 100% pojawia się zawsze wówczas gdy mamy do czynienia z dwiema grupami.Wartość własna na poziomie 0,190 wskazuje na umiarkowaną moc dyskryminacyjną modelu. Korelacja kanoniczna jest miarą wielkości związku pomiędzy wynikami dyskryminacyjnymi i zmienną grupującą, reprezentuje część wariancji która wyjaśnia różnice międzygrupowe. Wartość korelacji kanonicznej zawiera się w przedziale (0-1). W podanym przypadku korelacja kanoniczna na poziomie 0,399 wskazuje, że funkcja dyskryminacyjna jest umiarkowanie powiązana ze zmienną grupującą. Kwadrat korelacji kanonicznej wskazuje jaki procent wariancji funkcji jest wyjaśniany przez różnice międzygrupowe. W podanym przykładzie jest to 16,92%, zatem 16,92% wariancji funkcji jest wyjaśniany przez różnice międzygrupowe.
Niestandaryzowane współczynniki funkcji dyskryminacyjnych
Tabela 5. Niestandaryzowane współczynniki funkcji dyskryminacyjnej. Obliczenia przeprowadzono w programie R
|
Unstandarised Canonical Discriminant Function Coefficients |
|
1 |
2 |
|
Autorytaryzm |
-.464 |
-.437 |
Szczerość |
.671 |
-.144 |
Zainteresowanie |
-.055 |
.474 |
Bezstronność |
.677 |
.313 |
(Constant) |
-2.861 |
.858 |
Wielkość współczynników niestandaryzowanych mówi o tym o ile wzrośnie lub zmaleje wartość funkcji, jeśli wielkość predykatora zmieni się o jednostkę. Po podstawieniu współczynników równanie dyskryminacyjne przedstawia się następująco:
Dkm=-0,2,861 – 0,464 * X1 + 0,671 * X2 – 0,055 * X3 + 0,667*X4
Dkm – GRUPA , X1 – autorytaryzm, X2 – szczerość, X3 – zainteresowanie, X4- bezstronność
Standaryzowane współczynniki funkcji dyskryminacyjnych
Tabela 6. Standaryzowane współczynniki funkcji dyskryminacyjnej. Obliczenia przeprowadzono w programie R
|
Standardized Canonical Discriminant Function Coefficients |
|
1 |
2 |
|
Autorytaryzm |
-.436 |
-.410 |
Szczerość |
.734 |
-.158 |
Zainteresowanie |
-.071 |
.608 |
Bezstronność |
.740 |
.341 |
Współczynniki standaryzowane pokazują wkład danego predyktora w obliczenie wyniku dyskryminacyjnego, określając ilościowy udział danego predyktora w funkcji. Jeśli predyktory są ze sobą skorelowane, tj. wnoszą podobny zasób informacji dyskryminujących dzielą między sobą wkład w wynik dyskryminacyjny, w konsekwencji ich współczynniki beta są mniejsze, niż gdyby potraktować je oddzielnie. Przeciwne znaki współczynników beta sygnalizują, że ich wpływ równoważy się.
W tym przypadku funkcja dyskryminacyjna opiera się na wysokich wartościach cech bezstronności i szczerości. Predyktorem, który wnosi najmniejszy wkład jest zainteresowanie.
Macierz struktury
Tabela 7. Macierz struktury. Obliczenia przeprowadzono w programie R
|
Function |
|
1 |
2 |
|
Autorytaryzm |
.779 |
.152 |
Szczerość |
.640 |
-.549 |
Zainteresowanie |
-.180 |
.871 |
Bezstronność |
.134 |
-.808 |
Współczynnik korelacji każdej zmiennej z wartością funkcji dyskryminacyjnej do kwadratu oznacza stopnień wyjaśniania zmienności danej zmiennej przez wartości utworzonej funkcji dyskryminacyjnej, bezstronność w 60,8% jest wyjaśniana przez funkcję dyskryminacyjną. Współczynnik korelacji każdej zmiennej z wartością funkcji dyskryminacyjnej wskazuje na zakres determinacji wartości funkcji dyskryminacyjnej przez poszczególne zmienne.
Ocena dopasowania funkcji dyskryminacyjnej, tj. ocena efektywności wyjaśniania różnic między grupami.
Ocena dopasowania funkcji dyskryminacyjnej, tj. ocena efektywności wyjaśniania różnic między grupami.
Tabela 8. Dopasowanie funkcji dyskryminacyjnej. Obliczenia przeprowadzono w programie R
|
group |
Predicted Group Membership |
Total |
|||
Partia 1 |
Partia 2 |
Partia 3 |
||||
Original |
Count |
Partia 1 |
14 |
6 |
5 |
25 |
Partia 2 |
8 |
8 |
8 |
24 |
||
Partia 3 |
3 |
7 |
15 |
25 |
||
% |
Partia 1 |
56.0% |
24.0 |
20.0 |
100.0 |
|
Partia 2 |
33.3 |
33.3% |
33.3 |
100.0 |
||
Partia 3 |
12.0 |
28.0 |
60.0% |
100.0 |
Funkcja najlepiej przewiduje przynależność do grupy trzeciej 60% przypadków udało się poprawnie sklasyfikować.
Średnie wartości funkcji dyskryminacyjnej
Tabela 9. Średnie wartości funkcji dyskryminacyjnej - wyniki standaryzowane. Obliczenia przeprowadzono w programie R
group |
Function |
|
1 |
2 |
|
Partia 1 |
.447 |
-.273 |
Partia 2 |
.127 |
.416 |
Partia 3 |
-.569 |
-.126 |
Wykres 1. Wykresy funkcji dyskryminacyjnej w poszczególnych grupach. Wykresy wykonano w programie R.
Bibliografia
Gatnar, E., Walesiak, M. (2009). Statystyczna analiza danych z wykorzystaniem programu R. Warszawa: PWN
Radkiewicz, P. (2010). Analiza dyskryminacyjna. Podstawowe za założenia i zastosowania w badaniach społecznych. Psychologia Społeczna. T. 5 2-3(14) 142-161.