Web Log Mining (KI/WLM)
Topic outline
-
Obsah predmetu:
Metodika evalvácie prípravy dát v procese objavovania vzorcov správania sa používateľov webu
1. Predspracovanie dát na rôznych úrovniach prípravy dát
2. Hľadanie vzorcov správania sa používateľov webu v jednotlivých súboroch
3. Porozumenie výstupným dátam
4. Porovnanie získaných znalostí z jednotlivých súborov
Metodika modelovania správania sa používateľov webu v závislosti od času
1. Určenie modelu
2. Odhad parametrov modelu maximalizáciou logaritmu multinominálnej funkcie vierohodnosti
3. Odhad logitov pre všetky hodnoty nezávislých premenných
4. Odhad pravdepodobností prístupov
5. Vizualizácia pravdepodobností výberu webovej časti j v čase i
Literatúra:
Munk, M. 2011. Počítačová analýza dát. Nitra : UKF, 2011. 361 s. ISBN 978-80-8094-895-5.
Munk, M. - Kapusta, J. - Švec, P. 2010. Data Preprocessing Evaluation for Web Log Mining: Reconstruction of Activities of a Web Visitor. In Procedia Computer Science. Elsevier, ISSN 1877-0509, 2010, roč. 1, č. 1, s. 2273-2280.
Munk, M. et al. 2010. Data Advance Preparation Factors Affecting Results of Sequence Rule Analysis in Web Log Mining. In E&M Economics and Management: Information Management. ISSN 1212-3609, 2010, roč. 13, č. 4, s. 143-160.
Munk, M. - Drlík, M. 2011. Impact of Different Pre-Processing Tasks on Effective Identification of Users' Behavioral Patterns in Web-based Educational System. In Procedia Computer Science. Elsevier, ISSN 1877-0509, 2011, roč. 4, s. 1640-1649.
Munk, M. - Drlík, M. 2011. Influence of Different Session Timeouts Thresholds on Results of Sequence Rule Analysis in Educational Data Mining. In Communications in Computer and Information Science. Springer, ISSN 1865-0929, 2011, s. 60-74.
Munk, M. - Vrábelová, M. - Kapusta, J. 2011. Probability Modeling of Accesses to the Web Parts of Portal. In Procedia Computer Science. Elsevier, ISSN 1877-0509, 2011, roč. 3, s. 677-683.
Munk, M. - Drlík, M. - Vrábelová, M. 2011. Probability Modeling of Accesses to the Course Activities in the Web-based Educational System. In Lecture Notes in Computer Science. Springer, ISSN 0302-9743, 2011, s. 485-499.
-
-
-
-
-
Použité metódy
Testovanie rozdielov medzi závislými vzorkami:
- Cochran Q Test (Nonparametrics),
- Coeff. of Concordance (Nonparametrics-Comparing multiple dep. samples (variables)),
- Tukey HSD test (ANOVA-Repeated Measures Analysis of Variance);
Analýza kontingencie:
- 2-Way Table (Basic Statistics/Tables-Tables and Banners),
- Pearson Chi-square, Contingency coefficient, Cramér's V (Basic Statistics/Tables-Tables and Banners).