1. Testy o strednej hodnote a ich neparametrické alternatívy

4.4.1 Jedna vzorka

Jednovýberový z-test a t-test testujú hypotézu o rozdiele priemeru a konštanty (Tabuľka 21). Zisťujú, či sú namerané rozdiely medzi priemerom a konštantou iba náhodné, alebo štatisticky významné. Z-test sa používa, ak je rozptyl známy, t.j. pracujeme so skutočným parametrom .  

Na použitie testov je nutné splniť nasledujúci predpoklad:

-  Normálne rozdelenie premennej.

Ak je vzorka malá, menšia ako 30, a premenná nepochádza z normálneho rozdelenia, treba použiť neparametrické alternatívy: znamienkový test a Wilcoxonov test, ktoré testujú hypotézu o zhode mediánu s konštantou.Z rozdelenia štatistiky Z a z definície kritickej hodnoty vyplýva, že interval s koncovými bodmi  prekrýva skutočnú hodnotu μ s pravdepodobnosťou 1 - α. Nazývame ho obojstranný 100(1 - α)% interval spoľahlivosti pre μ pri známom . Z rozdelenia štatistiky T a z definície kritickej hodnoty vyplýva, že interval s koncovými bodmi  je 100(1 - α)% interval spoľahlivosti pre μ pri neznámom .

 

4.4.2 Závislé vzorky

Párový t-test/t-test pre závislé vzorky testuje hypotézu o priemernom rozdiele hodnôt párov (Tabuľka 22). Zisťuje, či je priemerný rozdiel párov iba náhodný, alebo štatisticky významný.

Ak je vzorka malá, menšia ako 30, a premenná nepochádza z normálneho rozdelenia, treba použiť neparametrické alternatívy: znamienkový test a Wilcoxonov test, ktoré testujú medián rozdielov párov. Za predpokladu, že závislá premenná je binárna môžeme použiť McNemarov test.

V prípade, že by sme chceli porovnať viac ako dve závislé vzorky použili by sme opakované merania analýzy rozptylu (pozri kapitolu 7). Jej neparametrickou alternatívou je Friedmanov test a Kendallov koeficient zhody alebo Cochranov Q test v prípade, že závislá premenná je binárna. Cochranov Q test predstavuje rozšírenie McNemarovho testu na viac ako dve závislé vzorky.

Kendallov koeficient zhody predstavuje mieru zhody medzi závislými vzorkami. Hodnota koeficientu je z intervalu <0,1>, pričom 1 znamená dokonalú zhodu a 0 znamená nezhodu, t.j. nezávislosť vzoriek.

 

4.4.3 Nezávislé vzorky

Dvojvýberový t-test testuje hypotézu o rozdiele priemerov dvoch nezávislých skupín (Tabuľka 23). Zisťuje, či sú namerané rozdiely medzi priemermi iba náhodné, alebo štatisticky významné.

Na použitie testu je nutné splniť nasledujúce predpoklady:

-  Normálne rozdelenie závislej premennej v oboch výberoch.

-  Rovnosť rozptylov.

V prípade nesplnenia predpokladu o rovnosti rozptylov môžeme použiť Cochran-Coxov t-test (Tabuľka 23).

Ak je vzorka malá (menšia ako 30 v každej skupine) a premenná nemá normálne rozdelenie v skupinách, treba použiť neparametrické alternatívy: Mann-Whitneyov U test/dvojvýberový Wilcoxonov test, Kolmogorov-Smirnovov dvojvýberový test a Wald-Wolfowitzov test.

V prípade, že by sme chceli porovnať viac ako dve nezávislé vzorky použili by sme analýzu rozptylu jednoduchého triedenia (pozri kapitolu 7). Jej neparametrickou alternatívou je Kruskal-Wallisova analýza rozptylu, ktorá pracuje s poradovými číslami alebo mediánový test, ktorý pracuje s početnosťami. Kruskal-Wallisova analýza rozptylu je rozšírením Mann-Whitneyho U testu na viac ako dve nezávislé vzorky.