Kowariancja i korelacja r-Pearsona

Współczynnik kowariancji i korelacji r-Pearsona

Siłę zmienności dwóch analizowanych zmiennych można wyrazić za pomocą wielu mierników.

Jedną z miar jest współczynnik kowariancji:

Niech oraz , dla będą zmiennymi opisującymi dane pomiarów badania. Wtedy:

lub

,

gdzie:
to wartość oczekiwana zmiennej, której estymatorem w populacji jest średnia arytmetyczna.

Współczynnik ten wskazuje jedynie na powiązanie badanych cech. Jeżeli podzielimy wartości kowariancji przez iloczyn odchyleń standardowych porównywanych zmiennych uzyskamy parametr opisujący siłę zależności pomiędzy nimi – współczynnik korelacji Pearsona 

,

gdzie:
to współczynnik kowariancji zmiennych ,
to odchylenia standardowe zmiennych .

 

Test na istotność współczynnika korelacji

Aby sprawdzić czy obliczona wartość współczynnika korelacji jest istotna przeprowadza się test o następujących hipotezach: 

- zależność cech jest nieistotna
- zależność cech jest istotna

Do weryfikacji hipotezy stosujemy test t:

,

gdzie:
to współczynnik korelacji zmiennych ,
to liczebność populacji do której należą zmienne .

Dla danej wartości testu odczytujemy wartość istotności Zwykle w badaniach statystycznych przyjmujemy poziom istotności Jeżeli przyjmujemy Jeżeli odrzucamy na rzecz

 

Macierz kowariancji i korelacji

Elementami macierzy kowariancji są współczynniki kowariancji dla par zmiennych losowych opisanych przez parametry wiersza i kolumny macierzy. Macierz ta jest przeniesieniem pojęcia wariancji na przypadek wielowymiarowy (jest to macierz wartości oczekiwanych iloczynów wariancji analizowanych dwóch zmiennych).

Kryteria spełniane przez każdą macierz kowariancji:

  • jest to macierz kwadratowa oraz symetryczna względem głównej przekątnej,
  • wyznacznik macierzy kowariancji jest nieujemny.

Elementami macierzy korelacji są współczynniki korelacji dla par zmiennych losowych opisanych przez parametry wiersza i kolumny macierzy.

Kryteria spełniane przez każdą macierz korelacji:

  • jest to macierz kwadratowa oraz symetryczna względem głównej przekątnej (na której elementy przyjmują wartość ze względu na korelację zmiennej z nią samą),
  •  wartości wszystkich elementów macierzy pochodzą z przedziału a wyznacznik macierzy należy do przedziału

Wielkość wartości wyznacznika macierzy jest adekwatna do poziomu korelacji zmiennych tworzących macierz. Im wyższe wartości on przyjmuje tym bardziej skorelowane są ze sobą poszczególne parametry

a) Macierzą kowariancji nazywamy macierz kwadratową w postaci:

,

gdzie:

jest wariancją zmiennej jeżeli

b) Macierzą korelacji nazywamy macierz kwadratową  postaci:

,

    gdzie:
     to współczynniki korelacji zmiennych

 

PRZYKŁAD

Wylosowano zestaw 15 obserwacji charakteryzujący wiek i wskaźnik masy ciała (BMI) badanych, aby sprawdzić czy zamienne korelują ze sobą.

Obliczono:

  • wartość oczekiwaną dla iloczynu zmiennych:
  • wartości średnie:
   
  • odchylenia standardowe:
   

Dla analizowanych danych sporządzono:

  • kowariancję:
  • korelację Pearsona:
  • tablicę kowariancji:
  • tablicę korelacji:

Dla wartości współczynnika korelacji wyliczono istotność statystyczną:

Dla obliczonej wartości testu istotność wynosi:

Jako, że to nie ma podstaw do odrzucenia

Polecane serwisy: