Współczynnik korelacji tetrachorycznej

Współczynnik korelacji tetrachorycznej – jedna z miar zależności, współczynnik określający poziom zależności pomiędzy dwiema zmiennymi dychotomicznymi i porządkowymi. Zakładamy przy tym, że obydwie zmienne są faktycznie zmiennymi ciągłymi i o rozkładzie normalnym, natomiast zostały one sprowadzone do skali dychotomicznej w celu ich uproszczenia lub z innych powodów[1].

Przykład zastosowania: korelacja pomiędzy wynikami uczniów pewnej klasy z egzaminu z matematyki i egzaminu z biologii, przy czym wyniki egzaminów zostały sprowadzone do postaci dychotomicznej (wartości: wynik powyżej mediany dla klasy lub wynik poniżej mediany dla klasy).

Obliczanie

Oznaczmy w następujący sposób liczebności w tablicy kontyngencji o wymiarach 2×2 pokazującej rozkład dwóch zmiennych dychotomicznych:

y = 1 y = 0 total
x = 1
x = 0
total

Dokładne wyznaczenie wartości współczynnika korelacji tetrachorycznej na podstawie danych z próby wymaga dość złożonych numerycznie obliczeń[2]. Należy znaleźć , wykorzytując następującą równość:

,

gdzie i .

W 2005 Bonett i Price zaproponowali uproszczony wzór umożliwiający uzyskanie oszacowania o dobrych właściwościach[1]:

,

gdzie: to liczba pi, wyznaczone jest za pomocą następującego wzoru:

zaś to oszacowanie ilorazu szans z wykorzystaniem liczebności w komórkach tablicy kontyngencji powiększonych o 0,5:

.

Przypisy

  1. 1 2 Douglas G. Bonett, Robert M. Price, Inferential Methods for the Tetrachoric Correlation Coefficient, „Journal of Educational and Behavioral Statistics”, 30 (2), 2005, s. 213–225, DOI: 10.3102/10769986030002213, ISSN 1076-9986 [dostęp 2025-02-08] (ang.).
  2. Bernard Harris, Tetrachoric Correlation Coefficient, John Wiley & Sons, Ltd, 2014, DOI: 10.1002/9781118445112.stat00385, ISBN 978-1-118-44511-2 [dostęp 2025-02-08] (ang.).

Bibliografia