Współczynnik korelacji tetrachorycznej

Współczynnik korelacji tetrachorycznej – jedna z miar zależności, współczynnik określający poziom zależności pomiędzy dwiema zmiennymi dychotomicznymi i porządkowymi. Zakładamy przy tym, że obydwie zmienne są faktycznie zmiennymi ciągłymi i o rozkładzie normalnym, natomiast zostały one sprowadzone do skali dychotomicznej w celu ich uproszczenia lub z innych powodów^[1].

Przykład zastosowania: korelacja pomiędzy wynikami uczniów pewnej klasy z egzaminu z matematyki i egzaminu z biologii, przy czym wyniki egzaminów zostały sprowadzone do postaci dychotomicznej (wartości: wynik powyżej mediany dla klasy lub wynik poniżej mediany dla klasy).

Obliczanie

Oznaczmy w następujący sposób liczebności w tablicy kontyngencji o wymiarach 2×2 pokazującej rozkład dwóch zmiennych dychotomicznych:

	y = 1	y = 0	total
x = 1	$a$	$b$	$a+b$
x = 0	$c$	$d$	$c+d$
total	$a+c$	$b+d$	$n$

Dokładne wyznaczenie wartości współczynnika korelacji tetrachorycznej na podstawie danych z próby wymaga dość złożonych numerycznie obliczeń^[2]. Należy znaleźć ${\hat {\rho }}$ , wykorzytując następującą równość:

{\frac {d}{n}}=\int _{\hat {h}}^{\infty }\int _{\hat {k}}^{\infty }{\frac {1}{2\pi \left(1-{\hat {\rho }}^{2}\right)^{1/2}}}{\text{exp}}\left[{\frac {-\left(x^{2}-2{\hat {\rho }}xy+y^{2}\right)}{2\left(1-{\hat {\rho }}^{2}\right)}}\right]dy{\text{ }}dx

,

gdzie ${\hat {h}}=\Phi ^{-1}\left({\frac {a+c}{n}}\right)$ i ${\hat {k}}=\Phi ^{-1}\left({\frac {a+b}{n}}\right)$ .

W 2005 Bonett i Price zaproponowali uproszczony wzór umożliwiający uzyskanie oszacowania o dobrych właściwościach^[1]:

{\hat {\rho }}^{*}=\cos \left({\frac {\pi }{1+{\hat {\omega }}^{\hat {c}}}}\right)

,

gdzie: $\pi$ to liczba pi, ${\hat {c}}$ wyznaczone jest za pomocą następującego wzoru:

{\hat {c}}={\frac {1}{2}}\left(1-{\frac {|b-c|}{5(n+2)}}-\left({\frac {1}{2}}-{\frac {min(a+b;a+c;b+d;c+d)+1}{n+2}}\right)^{2}\right)

zaś ${\hat {\omega }}$ to oszacowanie ilorazu szans z wykorzystaniem liczebności w komórkach tablicy kontyngencji powiększonych o 0,5:

{\hat {\omega }}={\frac {(a+0{,}5)(d+0{,}5)}{(b+0{,}5)(c+0{,}5)}}

.

Przypisy

1 2 Douglas G.D.G. Bonett Douglas G.D.G., Robert M.R.M. Price Robert M.R.M., Inferential Methods for the Tetrachoric Correlation Coefficient, „Journal of Educational and Behavioral Statistics”, 30 (2), 2005, s. 213–225, DOI: 10.3102/10769986030002213, ISSN 1076-9986 [dostęp 2025-02-08] (ang.).
↑ BernardB. Harris BernardB., Tetrachoric Correlation Coefficient, John Wiley & Sons, Ltd, 2014, DOI: 10.1002/9781118445112.stat00385, ISBN 978-1-118-44511-2 [dostęp 2025-02-08] (ang.).

Bibliografia

Why so many Correlation Coefficients
Bruce M. King, Edward W. Minium, Statystyka dla psychologów i pedagogów, Wydawnictwo Naukowe PWN, Warszawa 2009, s. 193.

[:0-1] 1 2 Douglas G.D.G. Bonett Douglas G.D.G., Robert M.R.M. Price Robert M.R.M., Inferential Methods for the Tetrachoric Correlation Coefficient, „Journal of Educational and Behavioral Statistics”, 30 (2), 2005, s. 213–225, DOI: 10.3102/10769986030002213, ISSN 1076-9986 [dostęp 2025-02-08] (ang.).

[2] BernardB. Harris BernardB., Tetrachoric Correlation Coefficient, John Wiley & Sons, Ltd, 2014, DOI: 10.1002/9781118445112.stat00385, ISBN 978-1-118-44511-2 [dostęp 2025-02-08] (ang.).

[1]

[2]