Moduł oferowany także w ramach programów studiów:
Informacje ogólne:
Nazwa:
Metody pozyskiwania wiedzy z danych
Tok studiów:
2016/2017
Kod:
ZIE-2-108-s
Wydział:
Zarządzania
Poziom studiów:
Studia II stopnia
Specjalność:
-
Kierunek:
Informatyka i Ekonometria
Semestr:
1
Profil kształcenia:
Ogólnoakademicki (A)
Język wykładowy:
Polski
Forma i tryb studiów:
Stacjonarne
Osoba odpowiedzialna:
dr inż. Rębiasz Bogdan (brebiasz@zarz.agh.edu.pl)
Osoby prowadzące:
Gaweł Bartłomiej (bgawel@zarz.agh.edu.pl)
dr inż. Rębiasz Bogdan (brebiasz@zarz.agh.edu.pl)
Krótka charakterystyka modułu

Opis efektów kształcenia dla modułu zajęć
Kod EKM Student, który zaliczył moduł zajęć wie/umie/potrafi Powiązania z EKK Sposób weryfikacji efektów kształcenia (forma zaliczeń)
Wiedza
M_W001 Studenci mają podstawową wiedzę na temat przygotowania danych do analizy (Data preprocessing) IE2A_U02, IE2A_W03, IE2A_W05 Kolokwium,
Wykonanie projektu
M_W002 Studenci znają metody eksploracji danych IE2A_U05, IE2A_U01, IE2A_W03, IE2A_W05 Kolokwium,
Wykonanie projektu
M_W003 Studenci mają wiedzę na temat systemów Business Intelligence IE2A_W02, IE2A_U09 Kolokwium
Umiejętności
M_U001 Studenci potrafią realizować analizy z wykorzystaniem metod eksploracji danych, interpretować uzyskane wyniki i wyciągać wnioski IE2A_U01 Prezentacja,
Wykonanie projektu
Kompetencje społeczne
M_K001 Studenci potrafią pracować w zespole przyjmując w nim rózne role IE2A_K02 Prezentacja,
Wykonanie projektu
Matryca efektów kształcenia w odniesieniu do form zajęć
Kod EKM Student, który zaliczył moduł zajęć wie/umie/potrafi Forma zajęć
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Inne
E-learning
Wiedza
M_W001 Studenci mają podstawową wiedzę na temat przygotowania danych do analizy (Data preprocessing) + + - + - - - - - - -
M_W002 Studenci znają metody eksploracji danych + + - + - - - - - - -
M_W003 Studenci mają wiedzę na temat systemów Business Intelligence + + - - - - - - - - -
Umiejętności
M_U001 Studenci potrafią realizować analizy z wykorzystaniem metod eksploracji danych, interpretować uzyskane wyniki i wyciągać wnioski - - - + - - - - - - -
Kompetencje społeczne
M_K001 Studenci potrafią pracować w zespole przyjmując w nim rózne role - - - + - - - - - - -
Treść modułu zajęć (program wykładów i pozostałych zajęć)
Wykład:

1. 1. Wiedza w organizacji.
• Klasyfikacja wiedzy,
• Własności wiedzy,
• Kapitał intelektualny,
• Model wiedzy menedżerskiej. Cykl życia wiedzy menedżerskiej,
• Źródła wiedzy menedżerskiej,
• Odkrywanie wiedzy w zbiorach danych (Knowledge Discovery Process).
2. Hurtownie danych (Data warehauses).
3. Wielowymiarowe analizy danych (OLAP- OnLine Analytical Processing).
4. Business Intelligence – BI.
5. Przygotowanie danych do analizy (Data preprocessing).
6. Metody pozyskiwania wiedzy z danych.
• Metody grupowania obiektów (Cluster analysis),
• Metody klasyfikacji (Classification methods),
• Reguły asocjacyjne (Association ruls), odkrywanie wzorców sekwencji (Sequence patterns methods).
7. Metody detekcji rzadkich zdarzeń (Detection Of Rare Events).
8. Zbiory rozmyte w eksploracji danych.
• Rozmyte reguły asocjacyjne (Fuzzy association ruls),
• Rozmyte grupowanie obiektów (Fuzzy cluster analysis),
• Rozmyte drzewa decyzyjne (Fuzzy decision tree).
9. Elementy sztucznej inteligencji w eksploracji danych.
• Wykorzystanie sieci neuronowych w grupowaniu i klasyfikacji obiektów,
• Algorytmy genetyczne w grupowaniu obiektów,
• Wybrane metody generowania rozmytych reguł decyzyjnych na podstawie zbioru przykładów.

Ćwiczenia audytoryjne:

1. Charakterystyka wybranych metod przygotowania danych do analizy (Data preprocessing).
2. Miary odległości obiektów
3. Charakterystyka algorytmów grupowania obiektów.
• Metoda hierarchiczna aglomeracyjna,
• Metoda k-średnich,
• Metoda EM,
• Sieci neuronowe Kohonena.
Ocena jakości grupowania. Istota V-krotnego sprawdzianu krzyżowego.
4.Charakterystyka algorytmów klasyfikacji obiektów.
• Naiwny klasyfikator Bayesa,
• Algorytm k-najbliższych sąsiadów,
• Drzewa decyzyjne,
• Metoda wektorów wiodących.
Ocena jakości klasyfikacji.
5.Charakterystyka algorytmów generowania asocjacji.
6. Algorytmy grupowania rozmytego, rozmyte drzewa klasyfikacyjne.
7. Kolokwium zaliczeniowe.

Ćwiczenia projektowe:

1. Projekt nr 1 – Grupowanie obiektów przy pomocy wybranych metod. Przydzielenie tematów do poszczególnych grup. Omówienie koncepcji projektu nr 1, cz. 1 – Grupowanie dużych zbiorów danych przy pomocy wybranych metod.
2. Omówienie koncepcji projektu nr 1, cz 2 – Ocena jakości grupowania uzyskanego różnymi metodami. Omówienie problemów i wstępnych wyników otrzymanych przez grupy.
3. Projekt nr 2 – Budowa klasyfikatorów przy pomocy wybranych metod. Omówienie koncepcji projektu nr 2, cz 1 – Praktyczne aspekty klasyfikacji dużych zbiorów danych. Przydzielenie tematów do poszczególnych grup.
4. Prezentacja i ocena projektu nr 1.
5. Projekt nr 2, omówienie koncepcji, cz. 2 — Ocena jakości klasyfikatorów. Omówienie problemów i wstępnych wyników otrzymanych przez grupy.
6. Projekt nr 3 — Generowanie reguł asocjacyjnych. Odkrywanie wzorców sekwencji.
7. Prezentacja i ocena projektu nr 2. Omówienie wyników projektu nr 3 w oparciu o otrzymane od studentów sprawozdania.

Nakład pracy studenta (bilans punktów ECTS)
Forma aktywności studenta Obciążenie studenta
Sumaryczne obciążenie pracą studenta 105 godz
Punkty ECTS za moduł 4 ECTS
Udział w wykładach 28 godz
Udział w ćwiczeniach audytoryjnych 14 godz
Udział w ćwiczeniach projektowych 14 godz
Przygotowanie do zajęć 30 godz
Wykonanie projektu 15 godz
Dodatkowe godziny kontaktowe z nauczycielem 4 godz
Pozostałe informacje
Sposób obliczania oceny końcowej:

Ocena z ćwiczeń projektowych jest wystawiana przez prowadzącego. Jest ona określana na podstawie oceny projektów i ich prezentacji. Warunkiem uzyskania zaliczenia z ćwiczeń projektowych jest również wykonanie wszystkich zaplanowanych analiz.
Ocena z ćwiczeń audytoryjnych jest wystawiana przez prowadzącego. Ocena jest określana na podstawie wyniku kolokwium.
Ocenę końcową wystawia wykładowca. Ocena końcowa jest średnią ważoną ocen wynikowych z ćwiczeń projektowych i ćwiczeń audytoryjnych. Oceny te wyliczane są z uwzględnieniem wyników wszystkich terminów zaliczeń. Obliczane są one wg formuły:
Ocena końcowa =(ocena wynikowa z ćwiczeń projektowych + ocena wynikowa z ćwiczeń audytoryjnych)/2
Oceny wynikowe z ćwiczeń projektowych i audytoryjnych wyliczane są wg algorytmu:
Jeśli uzyskano zaliczenie w pierwszym terminie:
Ocena wynikowa = ocena uzyskana w pierwszym terminie
Jeśli uzyskano zaliczenie w II terminie:
Ocena wynikowa= 0.1*2 +0.9* ocena uzyskana w drugim terminie
Jeśli uzyskano zaliczenie w III terminie:
Ocena wynikowa= 0.1*2 +0.1*2 +0.8* ocena uzyskana w trzecim terminie

Wymagania wstępne i dodatkowe:

Wymagana znajomość podstaw statystyki i umiejętność programowania w wybranym języku.

Zalecana literatura i pomoce naukowe:

1. Larose D., T.:Odkrywanie wiedzy z danych. Wydawnictwo Naukowe PWN. 2013.
2. Cichosz. Systemy uczące się. Wydawnictwo Naukowo-Techniczne, 2007.
3. Trajer J., Paszek A., Iwan S.: Zarządzanie wiedza. Państwowe Wydawnictwo Ekonomiczne. Warszawa 2012.
4. Han J. Kamber M., Pej J.: Data Mining: Concepts and Techniques, Third Edition Morgan Kaufmann; 3 edition, San Diego, 2011.
5. Chen Z.: Data Mining and Uncertain Reasoning – An Integrated Approach, John Wiley & Sons, INC, New York 2001.

Publikacje naukowe osób prowadzących zajęcia związane z tematyką modułu:

1. Rębiasz B, Szulc W.: Wykorzystanie metod eksploracji danych do długookresowego prognozowania popytu na rynku dóbr przemysłowych. Hutnik Wiadomości Hutnicze, 2012, 79, nr 6, s. 427–433.
2.Gaweł B., Rębiasz B., Skalna I.: Data Mining Methods for Long-Term Forecasting of Market Demand for Industrial Goods. w: Advances in Intelligent Systems and Computing, (ed. Kacprzyk Janusz), Springer-Verlang, Berlin, 2015, (w druku)
3. Maciol, A., Jedrusik, S., Rebiasz, B., 2013. Rule-based approach for supplier evaluation. In Computer Science and Information Systems (FedCSIS), 2013 Federated Conference on. pp. 1207–1214.

Informacje dodatkowe:

Brak