Eksploracja danych: Różnice pomiędzy wersjami
Nie podano opisu zmian |
|||
Linia 21: | Linia 21: | ||
* Pricinciples of Data Mining, J. Hand, H. Mannila, P. Smyth, MIT Press, 2001 | * Pricinciples of Data Mining, J. Hand, H. Mannila, P. Smyth, MIT Press, 2001 | ||
* Systemy uczące się, P. Cichosz, WNT, 2000 | * Systemy uczące się, P. Cichosz, WNT, 2000 | ||
== Moduły == | |||
---- | |||
=== Wykłady === | |||
# Wprowadzenie [[ED-4.2-m01-1.0-toc|WIKI]], [[PDFk]], [[PDF]], [[TEST]] | |||
# Odkrywanie asocjacji [[ED-4.2-m02-1.0-toc|WIKI]], [[PDFk]], [[PDF]], [[TEST]] | |||
# Algorytmy odkrywania binarnych reguł asocjacyjnych [[ED-4.2-m03-1.0-toc|WIKI]], [[PDFk]], [[PDF]], [[TEST]] | |||
# Wielopoziomowe i wielowymiarowe reguły asocjacyjne [[ED-4.2-m04-1.0-toc|WIKI]], [[PDFk]], [[PDF]], [[TEST]] | |||
# Odkrywanie wzorców sekwencji I [[ED-4.2-m05-1.0-toc|WIKI]], [[PDFk]], [[PDF]], [[TEST]] | |||
# Odkrywanie wzorców sekwencji II [[ED-4.2-m06-1.0-toc|WIKI]], [[PDFk]], [[PDF]], [[TEST]] | |||
# Klasyfikacja I [[ED-4.2-m07-1.0-toc|WIKI]], [[PDFk]], [[PDF]], [[TEST]] | |||
# Klasyfikacja II [[ED-4.2-m08-1.0-toc|WIKI]], [[PDFk]], [[PDF]], [[TEST]] | |||
# Klasyfikacja III [[ED-4.2-m09-1.0-toc|WIKI]], [[PDFk]], [[PDF]], [[TEST]] | |||
# Grupowanie I, [[ED-4.2-m10-1.0-toc |WIKI]], [[media:ED-4.2-m10-1.0-kolor.pdf|PDFk]], [[media:ED-4.2-m10-1.0.pdf|PDF]], [[TEST]] | |||
# Grupowanie II, [[ED-4.2-m11-1.0-toc |WIKI]], [[media:ED-4.2-m11-1.0-kolor.pdf|PDFk]], [[media:ED-4.2-m11-1.0.pdf|PDF]], [[TEST]] | |||
# Eksploracja tekstu I, [[ED-4.2-m12-1.0-toc |WIKI]], [[media:ED-4.2-m12-1.0-kolor.pdf|PDFk]], [[media:ED-4.2-m12-1.0.pdf|PDF]], [[TEST]] | |||
# Eksploracja tekstu II [[ED-4.2-M13-1.0-toc |WIKI]], [[media:ED-4.2-m13-1.0-kolor.pdf|PDFk]], [[media:ED-4.2-m13-1.0.pdf|PDF]], [[TEST]] | |||
# Eksploracja sieci Web [[ED-4.2-m14-1.0-toc |WIKI]], [[media:ED-4.2-m14-1.0-kolor.pdf |PDFk]], [[media:ED-4.2-m14-1.0.pdf |PDF]], [[TEST]] | |||
===Laboratoria=== | |||
# Przygotowanie danych do eksploacji [[media:ED-4.2-m01-lab.doc|DOC]], [[media:ED-4.2-m01-lab-kolor.pdf|PDFk]], [[media:ED-4.2-m01-lab.pdf|PDF]] | |||
# Określanie ważności atrybutów [[media:ED-4.2-m02-lab.doc|DOC]], [[media:ED-4.2-m02-lab-kolor.pdf|PDFk]], [[media:ED-4.2-m02-lab.pdf|PDF]] | |||
# Odkrywanie reguł asocjacyjnych [[media:ED-4.2-m03-lab.doc|DOC]], [[media:ED-4.2-m03-lab-kolor.pdf|PDFk]], [[media:ED-4.2-m03-lab.pdf|PDF]] | |||
# Naiwny klasyfikator Bayesa [[media:ED-4.2-m04-lab.doc|DOC]], [[media:ED-4.2-m04-lab-kolor.pdf|PDFk]], [[media:ED-4.2-m04-lab.pdf|PDF]] | |||
# Adaptywna sieć Bayesa [[media:ED-4.2-m05-lab.doc|DOC]], [[media:ED-4.2-m05-lab-kolor.pdf|PDFk]], [[media:ED-4.2-m05-lab.pdf|PDF]] | |||
# Indukcja drzew decyzyjnych [[media:ED-4.2-m06-lab.doc|DOC]], [[media:ED-4.2-m06-lab-kolor.pdf|PDFk]], [[media:ED-4.2-m06-lab.pdf|PDF]] | |||
# Support Vector Machine (klasyfikacja) [[media:ED-4.2-m07-lab.doc|DOC]], [[media:ED-4.2-m07-lab-kolor.pdf|PDFk]], [[media:ED-4.2-m07-lab.pdf|PDF]] | |||
# Grupowanie (K-Means) [[media:ED-4.2-m08-lab.doc|DOC]], [[media:ED-4.2-m08-lab-kolor.pdf|PDFk]], [[media:ED-4.2-m08-lab.pdf|PDF]] | |||
# Grupowanie (O-Cluster) [[media:ED-4.2-m09-lab.doc|DOC]], [[media:ED-4.2-m09-lab-kolor.pdf|PDFk]], [[media:ED-4.2-m09-lab.pdf|PDF]] | |||
# Odkrywanie cech i algorytm Non-Negative Matrix Factorization [[media:ED-4.2-m10-lab.doc|DOC]], [[media:ED-4.2-m10-lab-kolor.pdf|PDFk]], [[media:ED-4.2-m10-lab.pdf|PDF]] | |||
# Regresja SVM [[media:ED-4.2-m11-lab.doc|DOC]], [[media:ED-4.2-m11-lab-kolor.pdf|PDFk]], [[media:ED-4.2-m11-lab.pdf|PDF]] | |||
# Odkrywanie osobliwości [[media:ED-4.2-m12-lab.doc|DOC]], [[media:ED-4.2-m12-lab-kolor.pdf|PDFk]], [[media:ED-4.2-m12-lab.pdf|PDF]] | |||
# Eksploracja danych tekstowych [[media:ED-4.2-m13-lab.doc|DOC]], [[media:ED-4.2-m13-lab-kolor.pdf|PDFk]], [[media:ED-4.2-m13-lab.pdf|PDF]] | |||
====Materiały pomocnicze==== | |||
# [[preparation.plsql|Przygotowanie danych]] | |||
# [[ar.plsql|Odkrywanie reguł asocjacyjnych ]] | |||
# [[nnmf.plsql|Odkrywanie cech - algorytm Non-Negative Matrix Factorization]] | |||
# [[svm.reg.plsql|Regresja - algorytm SVM]] | |||
# [[svm.clas.plsql|Klasyfikacja - algorytm SVM ]] | |||
====Dodatkowe zasoby==== | |||
# [[media:gp400win32.zip|GnuPlot]] |
Wersja z 09:15, 29 sie 2006
Forma zajęć
Wykład (30 godzin) + laboratorium (30 godzin)
Opis
Celem przedmiotu jest zapoznanie studentów z podstawowymi pojęciami, koncepcjami i metodami technologii eksploracji danych.
Sylabus
Autorzy
- Tadeusz Morzy
- Mikołaj Morzy
Wymagania wstępne
- Podstawowe wiadomości z zakresu systemów baz danych, magazynów danych oraz analizy danych.
Zawartość
Program przedmiotu obejmuje następujące zagadnienia: wprowadzenie do eksploracji danych; koncepcja i architektura systemów eksploracji danych; omówienie wybranych metod i algorytmów eksploracji danych, dziedziny zastosowań metod eksploracji danych. Metody te obejmują: odkrywanie asocjacji jednopoziomowych, odkrywanie asocjacji uogólnionych (wielopoziomowych), odkrywanie asocjacji ilościowych, metody dyskretyzacji atrybutów ciągłych, korelacja a asocjacje, odkrywanie wzorców sekwencji, metody klasyfikacji obiektów, wybrane metody grupowania obiektów (analiza skupień), analiza podobieństw przebiegów czasowych, indeksowanie przebiegów czasowych, eksploracja danych w sieci Web. Dyskusja możliwości i ograniczeń stosowalności metod eksploracji danych
Literatura
- Data Mining: Concepts and Techniques, J. Han, M. Kamber, Morgan Kaufman, 2000
- Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, I. H. Witten, E. Frank, Morgan Kaufman, 2000
- Pricinciples of Data Mining, J. Hand, H. Mannila, P. Smyth, MIT Press, 2001
- Systemy uczące się, P. Cichosz, WNT, 2000
Moduły
Wykłady
- Wprowadzenie WIKI, PDFk, PDF, TEST
- Odkrywanie asocjacji WIKI, PDFk, PDF, TEST
- Algorytmy odkrywania binarnych reguł asocjacyjnych WIKI, PDFk, PDF, TEST
- Wielopoziomowe i wielowymiarowe reguły asocjacyjne WIKI, PDFk, PDF, TEST
- Odkrywanie wzorców sekwencji I WIKI, PDFk, PDF, TEST
- Odkrywanie wzorców sekwencji II WIKI, PDFk, PDF, TEST
- Klasyfikacja I WIKI, PDFk, PDF, TEST
- Klasyfikacja II WIKI, PDFk, PDF, TEST
- Klasyfikacja III WIKI, PDFk, PDF, TEST
- Grupowanie I, WIKI, PDFk, PDF, TEST
- Grupowanie II, WIKI, PDFk, PDF, TEST
- Eksploracja tekstu I, WIKI, PDFk, PDF, TEST
- Eksploracja tekstu II WIKI, PDFk, PDF, TEST
- Eksploracja sieci Web WIKI, PDFk, PDF, TEST
Laboratoria
- Przygotowanie danych do eksploacji DOC, PDFk, PDF
- Określanie ważności atrybutów DOC, PDFk, PDF
- Odkrywanie reguł asocjacyjnych DOC, PDFk, PDF
- Naiwny klasyfikator Bayesa DOC, PDFk, PDF
- Adaptywna sieć Bayesa DOC, PDFk, PDF
- Indukcja drzew decyzyjnych DOC, PDFk, PDF
- Support Vector Machine (klasyfikacja) DOC, PDFk, PDF
- Grupowanie (K-Means) DOC, PDFk, PDF
- Grupowanie (O-Cluster) DOC, PDFk, PDF
- Odkrywanie cech i algorytm Non-Negative Matrix Factorization DOC, PDFk, PDF
- Regresja SVM DOC, PDFk, PDF
- Odkrywanie osobliwości DOC, PDFk, PDF
- Eksploracja danych tekstowych DOC, PDFk, PDF
Materiały pomocnicze
- Przygotowanie danych
- Odkrywanie reguł asocjacyjnych
- Odkrywanie cech - algorytm Non-Negative Matrix Factorization
- Regresja - algorytm SVM
- Klasyfikacja - algorytm SVM