Statystyka T² Hotellinga[1] – uogólnienie rozkładu Studenta, który jest używany do testowania hipotez wielowymiarowych. Nazwa pochodzi od Harolda Hotellinga.
Statystyka Hotellinga jest definiowana jako:

gdzie
jest liczbą obserwacji,
jest p-wymiarową kolumną wektorową, a
jest
macierzą kowariancji.
Jeśli
jest zmienną losową z wielowymiarowego rozkładu Gaussa i
(niezależne od
) ma rozkład Wisharta z taką samą macierzą wariancji
oraz z
wówczas rozkład
jest
rozkładem T² Hotellinga z parametrami
i 
Można pokazać, że:

gdzie
jest rozkładem F Snedecora.
Teraz załóżmy, że

jest
kolumną wektorową, której wartościami są liczby rzeczywiste. Załóżmy, że

są ich średnią. Niech
będzie macierzą dodatnie określoną

jest macierzą „przykładowych wariancji”. (Transpozycja jakiejkolwiek macierzy
jest oznaczona jako
). Niech
będzie znanym
wektorem. Wówczas statystyka Hotellinga przyjmuje postać:

Warto zauważyć, że
jest blisko powiązona z kwadratem odległością Mahalanobisa.
W szczególności może to być pokazane poprzez[2]:
Jeśli
są niezależne, i
i
są jak zdefiniowano powyżej, wówczas
ma rozkład Wisharta z
stopniami swobody

i jest niezależna od
oraz

To oznacza, że:

Statystyka T² Hotellinga dla dwóch prób
Jeśli
oraz
są próbkami niezależnymi wyciągniętymi z dwóch niezależnych wielowymiarowych rozkładów Gaussa o takiej samej średniej oraz kowariancji, i definiujemy

jako średnie próbek, oraz

jako estymator nieobciążonej macierzy kowariancji, wówczas statystyka T² Hotellinga dla dwóch prób wygląda tak:

i może być przedstawiona w postaci rozkładu F Snedecora:
[2].
Przypisy
- ↑ H. Hotelling (1931) The generalization of Student’s ratio, Ann. Math. Statist., Vol. 2, s. 360–378.
- 1 2 K.V. Mardia, J.T. Kent, J.M. Bibby (1979), Multivariate Analysis, Academic Press.