Exploračná analýza
Metódy exploračnej analýzy slúžia na objavenie štruktúr, vytvorenie hypotéz, rozoznanie osobitostí a znázornenie fenoménov. Východiskovým bodom každej analýzy dát sú samotné dáta. Dáta nemusia spĺňať určité podmienky, ako sa žiada v inferenčnej analýze (napr. že dáta museli byť získané náhodným výberom). Ide hlavne o to, rozličnými spôsobmi znázorniť tieto dáta, rozoznať pravidelnosti a nepravidelnosti, štruktúry, vzory a osobitosti. V exploračnom procese hľadáme v dátach zaujímavé konfigurácie a vzťahy.
2. Vizualizácia dát
2.3. Vizualizácia závislostí
Korelačný/bodový graf je vizualizáciou lineárnej závislosti medzi dvoma intenzívnymi/kvantitatívnymi premennými. V prípade priamoúmernej závislosti (hodnoty sa menia spoločne jedným smerom) sú body v korelačnom grafe preložené rastúcou priamkou – body, v prípade nepriamoúmernej závislosti (hodnoty sa menia spoločne opačným smerom) sú body preložené klesajúcou priamkou a v prípade nezávislosti konštantnou priamkou – hodnoty sa spolu nemenia ani jedným smerom. Jediný extrémista vo veľkom súbore môže významne znížiť silnú závislosť, ale aj vyrobiť silnú závislosť tam, kde žiadna nie je. Preto je nutné preskúmať korelačný graf.
Maticový graf je vizualizáciou lineárnej závislosti medzi viacerými intenzívnymi/kvantitatívnymi premennými.
Povrchový graf vizualizuje funkčnú závislosť intenzívnych/kvantitatívnych premenných - závislej premennej Y na nezávislých premenných X1 a X2.
Vrstevnicový graf je príbuzným povrchového grafu. Predstavuje topografickú mapu zostrojenú z troch intenzívnych/kvantitatívnych premenných. Na osi X je jedna premenná, druhá je na osi Y a tretia premenná je reprezentovaná izočiarami (čiarami s rovnakou hodnotou).
Spomínaný interakčný graf by sme mohli pokladať za vizualizáciu závislostí dvoch nominálnych premenných, respektíve 3D histogram alebo kategorizovaný histogram. Rovnako aj grafom priemerov a intervalov spoľahlivosti môžeme vizualizovať závislosť medzi kvantitatívnou a kvalitatívnou premennou.