Test niezależności chi kwadrat
Test niezalezności wykonuje się w celu zbadania związku pomiędzy dwoma zmiennymi nominalnymi i . Hipotezy zerową oraz alternatywną dla tego testu możemy zapisać następująco:
Zmienne i są niezależne.
Zmienne i nie są niezależne.
Test bazuje na porównaniu ze sobą wartości obserwowanych (otrzymanych w badaniu) a wartości teoretycznych (obliczonych przy założeniu, że pomiędzy zmiennymi nie ma żadnego związku). Duże różnice wskazują na istnienie zależności pomiędzy zmiennymi.
Jeśli założymy, że zmienna zmienia się na poziomach, a zmienna na poziomach, to statystykę testową obliczymy korzystając z wzoru:
gdzie:
- - liczności obserwowane,
- - liczności teoretyczne.
Statystyka testowa przy założeniu prawdziwości ma rozkład o stopni swobody.
Obszar krytyczny w tym teście jest obszarem prawostronnym , gdzie jest wartością odczytaną z tablic rozkładu dla ustalonego .
Przykład:
W ramach programu edukacyjnego dotyczącego antybiotykoterapii zadano pacjentom pytanie: „Czy antybiotyki działają na wirusy?”. Respondenci mieli możliwość wskazania jednej z trzech odpowiedzi: „Tak”, „Nie” lub „Nie wiem”.
Rozkład udzielanych odpowiedzi (liczności obserwowanych) wśród kobiet i mężczyzn przedstawia tabela:
Lp. pacjenta | Nie | Nie wiem | Tak | Suma |
---|---|---|---|---|
Kobieta | 2789 | 770 | 455 | 4014 |
Mężczyzna | 2243 | 744 | 389 | 3376 |
Suma | 5032 | 1514 | 844 | 7390 |
Czy istnieje zależność pomiędzy rodzajem udzielanych odpowiedzi, a płcią pacjenta? Innymi słowy, czy mężczyźni lub kobiety wykazali się większą wiedzą w poruszanej kwestii?
Aby udzielić odpowiedzi na to pytanie, wykonamy test niezalezności .
Liczebność teoretyczną kobiet, które udzieliły odpowiedzi „Nie” obliczamy w następujący sposób:
.
Dla pozostałych par wykonujemy analogiczne obliczenia. Zestawienie otrzymanych liczności teoretycznych przedstawia tabela.
Lp. pacjenta | Nie | Nie wiem | Tak |
---|---|---|---|
Kobieta | 2733 | 822 | 458 |
Mężczyzna | 2299 | 692 | 386 |
Statystyka testowa obliczona na podstawie tych danych przyjmie wartość:
,
co oznacza istotną zależność pomiędzy płcią pacjenta a rodzajem udzielanych przez niego odpowiedzi przy .
O teście można także powiedzieć, że bada istotność różnic w strukturach procentowych. W naszym przypkładzie byłaby to analiza różnic w strukturach procentowych udzielania poszczególnych odpowiedzi wśród kobiet i mężczyzn.
Procentowy udział każdej z odpowiedzi wśród kobiet i mężczyzn przedstawia wykres:
Interpretując dane zobrazowane na wykresie możemy stwierdzić, że prawidłowych odpowiedzi - "Nie" - częściej udzielały kobiety. Test potwierdził, że różnice te są istotne.