Exploračná analýza
1. Popisná štatistika
1.2. Charakteristiky polohy
Predstavujú charakteristiky, okolo ktorých sú hodnoty premennej X sústredené. Nazývajú sa taktiež miery polohy, resp. miery strednej hodnoty.
Aritmetický priemer predstavuje pomer medzi súčtom všetkých hodnôt súboru a počtom hodnôt v súbore,
Geometrický priemer sa definuje vzťahom
keď sú všetky hodnoty premennej X kladné. Je to n-tá odmocnina zo súčinu nameraných hodnôt. Príkladom použitia geometrického priemeru je výpočet priemeru za určité časové obdobie.
Harmonický priemer sa definuje vzťahom
keď sú všetky hodnoty premennej X kladné. Príkladom použitia harmonického priemeru je výpočet priemernej rýchlosti.
Kvadratický priemer sa definuje vzťahom
Každý súbor má iba jeden priemer. Keďže sa priemer vypočíta zo všetkých hodnôt je ovplyvnený extrémnymi hodnotami.
Pre priemery platí
ak hodnoty premennej X sú kladné a rovnosť nastáva vtedy, ak sú všetky hodnoty rovnaké, inak platí ostrá nerovnosť.
Aritmetický priemer slúži k náhrade individuálnych xi pri sčítaní, platí
Geometrický priemer slúži k náhrade individuálnych xi pri násobení, platí
Harmonický priemer slúži k náhrade individuálnych xi pri sčítaní prevrátených hodnôt, platí
Kvadratický priemer slúži k náhrade individuálnych xi pri sčítaní štvorcov, platí
Pre výpočet aritmetického priemeru z tabuľky rozdelenia početností, kde pre hodnoty xi sú zadané ich početnosti ni, použijeme vzťah
Podobne môžeme vypočítať aj ďalšie priemery z tabuľky početností.
V prípade, že máme niekoľko priemerov vypočítaných z rôznych podmnožín dát a poznáme príslušné počty meraní ni, môžeme vypočítať celkový priemer zo všetkých dát ako vážený priemer
Medián predstavuje prostrednú hodnotu súboru, ktorý je zoradený od najmenšej po najväčšiu hodnotu. V prípade nepárneho počtu hodnôt, n = 2m – 1, medián je
V prípade párneho počtu hodnôt, n = 2m, medián je aritmetický priemer prostredných hodnôt, teda
Medián nie je ovplyvnený extrémnymi hodnotami.
Modus predstavuje najčastejšie sa vyskytujúcu hodnotu. Táto charakteristika sa uplatňuje hlavne u kategoriálnych dát. Súbor môže mať viacero modusov, v tom prípade hovoríme o viacvrcholovom rozdelení. V prípade dvoch modusov hovoríme, že súbor je dvojmodálny.
Použitie jednotlivých charakteristík polohy:
- Priemer používame hlavne pre metrické premenné, v prípade symetrického rozdelenia a použitia parametrických testov.
- Medián používame pre intenzívne premenné, v prípade, že chceme poznať stred rozdelenia dát, v prípade výskytu extrémnych hodnôt a zošikmeného rozdelenia.
- Modus používame pre premenné, v prípade, že rozdelenie má viac vrcholov.
- V prípade symetrického rozdelenia sú všetky tieto charakteristiky približne rovnaké.