Exploračná analýza
Metódy exploračnej analýzy slúžia na objavenie štruktúr, vytvorenie hypotéz, rozoznanie osobitostí a znázornenie fenoménov. Východiskovým bodom každej analýzy dát sú samotné dáta. Dáta nemusia spĺňať určité podmienky, ako sa žiada v inferenčnej analýze (napr. že dáta museli byť získané náhodným výberom). Ide hlavne o to, rozličnými spôsobmi znázorniť tieto dáta, rozoznať pravidelnosti a nepravidelnosti, štruktúry, vzory a osobitosti. V exploračnom procese hľadáme v dátach zaujímavé konfigurácie a vzťahy.
2. Vizualizácia dát
Vizualizácia dát sa riadi zásadou „obrázok je viac ako tisíc slov“. Pomocou grafu je jednoduchšie detekovať konfigurácie a štruktúry. Grafickými metódami hľadáme extrémne hodnoty, rozoznávame zhluky v dátach, kontrolujeme rozdelenie dát a predpoklady, skúmame vzťahy medzi premennými, porovnávame miery strednej hodnoty a rozptýlenia alebo skúmame dáta závislé na čase.
Grafické metódy sú vhodné pre ukázanie širších vlastností dát. V prípade, že chceme uviesť vybrané údaje v presnom tvare, je lepšie ich zobrazovať v tabuľkách.
Pri analýze grafu hodnotíme: zhustenia, zhluky, medzery, extrémne hodnoty a tvar rozdelenia.
Grafy môžeme zoskupovať podľa rôznych kritérií, napríklad 2D grafy, 3D grafy, kategorizované grafy a pod. V našom prípade si ich rozdelíme podľa použitia. V žiadnom prípade však neobsiahneme všetky možnosti, ale pokúsime sa prezentovať tie najdôležitejšie. Niektoré grafy sú natoľko špecifické, že sú iba súčasťou konkrétnych analýz. Príkladom takého grafu je dendrogram, ktorý je súčasťou zhlukovej analýzy a slúži k vizualizácii zhlukov v priestore dát.