Exploračná analýza
Metódy exploračnej analýzy slúžia na objavenie štruktúr, vytvorenie hypotéz, rozoznanie osobitostí a znázornenie fenoménov. Východiskovým bodom každej analýzy dát sú samotné dáta. Dáta nemusia spĺňať určité podmienky, ako sa žiada v inferenčnej analýze (napr. že dáta museli byť získané náhodným výberom). Ide hlavne o to, rozličnými spôsobmi znázorniť tieto dáta, rozoznať pravidelnosti a nepravidelnosti, štruktúry, vzory a osobitosti. V exploračnom procese hľadáme v dátach zaujímavé konfigurácie a vzťahy.
1. Popisná štatistika
1.4. Charakteristiky tvaru
Tvar rozdelenia dát hodnotíme charakteristikami tvaru – šikmosťou a špicatosťou.
Šikmosť a3 meria stupeň asymetrie rozdelenia premennej. Kladná hodnota znamená, že priemer je väčší ako medián, teda väčšina hodnôt je menšia ako priemer. V tomto prípade je rozdelenie zošikmené doľava. Záporná hodnota znamená, že medián je väčší ako priemer a teda väčšina hodnôt je väčšia ako priemer. V takomto prípade je rozdelenie zošikmené doprava. Hodnoty blízke 0 znamenajú symetrické rozdelenie, čo znamená, že priemer a medián sa rovnajú. Počíta sa nasledovne:
kde
Špicatosť a4 meria stupeň strmosti rozdelenia premennej. Kladná hodnota znamená, že rozdelenie je špicatejšie. Záporná hodnota znamená, že rozdelenie je plochejšie. Daná je vzťahom
Použitie jednotlivých charakteristík tvaru:
- Šikmosť použijeme, ak chceme zistiť, či sa častejšie vyskytujú nižšie hodnoty ako vyššie alebo naopak.
- Špicatosť použijeme, ak chceme zistiť, akým spôsobom sa vlastne hodnoty premennej koncentrujú okolo priemeru.