Získavanie dát
Objavovanie znalostí verzus výskumné plány
V podstate môžeme objavovanie znalostí prirovnať k výskumným plánom. Ale predsa je tu jeden podstatný rozdiel, kým pri výskumných plánoch sú dáta získané cielene tak, aby odpovedali na dané ciele (hypotézy), v objavovaní znalostí sú získané z dátových zdrojov, ktoré nevznikli s cieľom ich následnej analýzy, ale sú zhromaždené primárne z iných dôvodov a nemusia obsahovať požadované informácie. Samozrejme sú tu aj ďalšie rozdiely, v objavovaní znalostí sa spracovávajú a analyzujú „veľké dáta“, použitie analytických metód je formalizované, kým pri výskumných plánoch použité metódy závisia na hypotézach a ich návrh je súčasťou plánu. V tomto procese je snahou zhodnotiť všetky dáta s cieľom získania nových znalostí využiteľných pre rozhodovanie.
V literatúre sa často odlišujú tieto dva prístupy, resp. nebývajú predmetom jednej publikácie. Napriek tomu nájdeme aj spoločné body v týchto na prvý pohľad odlišných prístupoch. V prípade výskumných plánov získavame dáta z výskumnej vzorky, podobne v prípade objavovania znalostí musíme zhromaždiť validné dáta z dostupných zdrojov. Výskumné plány rovnako ako aj objavovanie znalostí predstavujú určitý proces a vznikajú k nim metodiky, ktoré nám umožňujú prenášať skúsenosti z úspešných projektov. V obidvoch prístupoch na získané a spracované dáta aplikujeme štatistické metódy, ako metódy exploračnej analýzy, tak aj metódy inferenčnej analýzy. V objavovaní znalostí okrem tradičných štatistických metód sa na analýzu dát uplatňujú aj metódy strojového učenia, ktoré však veľmi úzko súvisia s konceptom exploračnej analýzy dát.