Zdroje dát

V predchádzajúcich kapitolách sme sa zamerali na získavanie dát za účelom analýzy, v tejto kapitole sa zameriame na dáta, ktoré nevznikli s cieľom ich následnej analýzy a na ich potencionálne využitie.

Posledných dvadsať rokov môžeme charakterizovať trendom výrazne narastajúceho objemu elektronických dát. V súčasnosti sa zbiera a eviduje veľké množstvo údajov v rôznych oblastiach ako je priemysel, poisťovníctvo, bankovníctvo, obchod, telekomunikácie, štátna správa a pod. Okrem iného rôzne zariadenia a prístroje denne zaznamenávajú obrovské množstvo dát. Rovnako narastá aj množstvo dát publikovaných na webe. Dnešná doba je charakteristická množstvom elektronicky dostupných dát na jednej strane, ale často nedostatkom znalostí na strane druhej. Tieto dáta nie sú zbierané cielene, tak aby odpovedali napríklad na dané hypotézy, ale sú zhromažďované primárne z iných dôvodov. Zautomatizovaním zberu dát, zaznamenávaním a publikovaním elektronických dát vznikla potreba tieto dáta používať v procese rozhodovania.

Ako príklady zdrojov dát uvádzame databázy, elektronické dokumenty a logovacie súbory. Všetky tieto a ďalšie zdroje dát môžu byť potencionálne užitočné pri tvorbe rôznych akcií, na predvídanie správania zákazníkov, zisťovanie príčin porúch, odhaľovanie podvodov a pod.