Základné štatistické metódy
5. Vzťahy medzi premennými
5.1. Analýza kontingencie
Tieto testy zisťujú vzťahy medzi dvoma nominálnymi premennými, t.j. používajú sa k analýze závislostí nominálnych premenných. Patrí sem skupina neparametrických testov, ktoré vychádzajú z kontingenčnej tabuľky (Tabuľka 24). Tieto testy overujú nulovú hypotézu, ktorá tvrdí, že premenné sú nezávislé. Jedna skupina testov je určená iba pre štvorpoľné kontingenčné tabuľky (2x2), v ktorých vystupujú dve dichotomické premenné.
Kontingenčná tabuľka pozorovaných početností RxS
Chí-kvadrát test nezávislosti môžeme použiť k analýze viacpoľných tabuliek. Chí-kvadrát test nezávislosti predstavuje rozšírenie chí-kvadrát testu dobrej zhody a vychádza z kontingenčnej tabuľky pozorovaných početností, kde pozorovaná početnosť aij je početnosť (frekvencia) kombinácie .
Očakávané početnosti eij sú také, ktoré zodpovedajú nulovej hypotéze o nezávislosti dvoch premenných. Očakávaná početnosť príslušnej bunky sa rovná podielu súčinu príslušnej pozorovanej početnosti riadku a stĺpca a celkovému počtu pozorovaní.
Chí-kvadrát test overuje, či môžu byť rozdiely skutočných a očakávaných početností iba náhodné (premenné sú nezávislé) alebo štatisticky významné (premenné sú závislé).
Chí-kvadrát test môžeme použiť iba v prípade, že očakávané početnosti sú dostatočne veľké.
Taktiež výsledky z kontingenčných tabuliek, ktoré obsahujú nulové početnosti, treba brať s rezervou.
V prípade, že očakávané početnosti nebudú dostatočne veľké, môžeme použiť Fisherov test, ktorý je však použiteľný iba pre štvorpoľné tabuľky.
Procedúra testovania - chí-kvadrát test nezávislosti/Fisherov test
Kontingenčné koeficienty (Pearsonov, Cramerov V) predstavujú mieru vzťahu medzi dvoma nominálnymi premennými. Nadobúdajú hodnoty z intervalu 0 (žiadny vzťah) až 1 (dokonalý vzťah). Chí-kvadrát testom nezávislosti môžeme testovať významnosť kontingenčných koeficientov.
Ďalej ako mieru vzťahu dvoch nominálnych premenných môžeme použiť symetrické korelačné koeficienty Spearmanov, Kendallov, koeficient gama a asymetrický koeficient Sommerovo D, ktorý je rozšírením gama koeficientu. Asymetrický koeficient rozlišuje závislú a nezávislú premennú na rozdiel od predchádzajúcich koeficientov. Štatistický softvér väčšinou ponúkne k výpočtu obidve možnosti: D(X|Y), D(Y|X).
Fí-kvadrát môžeme použiť ako mieru vzťahu iba v štvorpoľných kontingenčných tabuľkách (2x2), t.j. medzi dvoma dichotomickými premennými.
Všetky miery môžeme interpretovať rovnako ako korelačné koeficienty.