Exploračná analýza
Metódy exploračnej analýzy slúžia na objavenie štruktúr, vytvorenie hypotéz, rozoznanie osobitostí a znázornenie fenoménov. Východiskovým bodom každej analýzy dát sú samotné dáta. Dáta nemusia spĺňať určité podmienky, ako sa žiada v inferenčnej analýze (napr. že dáta museli byť získané náhodným výberom). Ide hlavne o to, rozličnými spôsobmi znázorniť tieto dáta, rozoznať pravidelnosti a nepravidelnosti, štruktúry, vzory a osobitosti. V exploračnom procese hľadáme v dátach zaujímavé konfigurácie a vzťahy.
2. Vizualizácia dát
2.1. Vizualizácia početností
Polygón slúži k vizualizácii početností pri jednoduchom triedení
Histogram sa zvyčajne používa pri intervalovom triedení.
Intervaly, resp. kategórie sú reprezentované šírkou stĺpca (os X) a počet prípadov, ktoré padnú do intervalu, resp. do danej kategórie je reprezentovaný výškou stĺpca (os Y).
Listový graf je ekvivalentný graf k histogramu. Od histogramu sa odlišuje tým, že máme stále prehľad o jednotlivých hodnotách, t.j. vieme presne, ktoré hodnoty sa nachádzajú v danom intervale. Hodnoty naľavo od ° predstavujú stonky a hodnoty napravo listy. Napríklad v prvom interval <20, 25) sa nachádza iba jedna hodnota 2° 4 = 24.
Kruhový diagram predstavuje najvhodnejšie znázornenie relatívnych početností alebo počtu percent.
Interakčné grafy (Obrázok Polygón) predstavujú najlepšiu možnosť vizualizácie kontingenčnej tabuľky. Na osi X sú hodnoty jednej premennej a na osi Y sú početnosti. V grafe sú zobrazené dva polygóny pre každú úroveň druhej kategorickej premennej, čím sú vyjadrené interakčné početnosti medzi dvoma premennými. Interakčný graf môžeme považovať za kategorizovaný polygón. Okrem interakčného grafu k vizualizácii môžeme použiť kategorizované histogramy, kde na osi X sú hodnoty jednej premennej, na osi Y sú početnosti a pre každú úroveň druhej premennej sa zobrazí jeden histogram. Taktiež môžeme použiť 3D histogramy, kde na osi X a Y sú hodnoty premenných a na osi Z sú početnosti kombinácií hodnôt premenných.