Moduł oferowany także w ramach programów studiów:
Informacje ogólne:
Nazwa:
Analiza danych
Tok studiów:
2017/2018
Kod:
JFT-2-057-s
Wydział:
Fizyki i Informatyki Stosowanej
Poziom studiów:
Studia II stopnia
Specjalność:
-
Kierunek:
Fizyka Techniczna
Semestr:
0
Profil kształcenia:
Ogólnoakademicki (A)
Język wykładowy:
Polski
Forma i tryb studiów:
Stacjonarne
Strona www:
 
Osoba odpowiedzialna:
prof. dr hab. inż. Kulczycki Piotr (kulczycki@agh.edu.pl)
Osoby prowadzące:
dr inż. Łukasik Szymon (slukasik@agh.edu.pl)
prof. dr hab. inż. Kulczycki Piotr (kulczycki@agh.edu.pl)
Krótka charakterystyka modułu

Tematyka modułu obejmuje współczesne metody przetwarzania danych. Szczegółowo rozważane są
procedury wykrywania elementów nietypowych (odosobnionych), grupowania (klasteryzacji) i
klasyfikacji.

Opis efektów kształcenia dla modułu zajęć
Kod EKM Student, który zaliczył moduł zajęć wie/umie/potrafi Powiązania z EKK Sposób weryfikacji efektów kształcenia (forma zaliczeń)
Wiedza
M_W001 Poszerzenie wiedzy z zakresu statystyki matematycznej. FT2A_W07, FT2A_W07, FT2A_W02, FT2A_W02 Kolokwium
M_W002 Istota i uwarunkowania procesu pozyskiwaniawiedzy z danych. FT2A_W07, FT2A_W04, FT2A_W07, FT2A_W04 Kolokwium
M_W003 Znajomość procedur analizy danych. FT2A_W07, FT2A_W04, FT2A_W07, FT2A_W04 Kolokwium
Umiejętności
M_U001 Stosowanie procedur analizy danych. FT2A_U11 Kolokwium
M_U002 Wykorzystanie procedur analizy danych do praktycznych zagadnień pozyskiwania wiedzy z danych. FT2A_U02, FT2A_U02 Kolokwium
M_U003 Pozyskiwanie informacji ze źródeł różnego typuoraz prezentacja zagadnienia badawczego iuzyskanych wyników. FT2A_U02, FT2A_U02, FT2A_U09 Kolokwium
Kompetencje społeczne
M_K001 Praca zespołowa. FT2A_K04 Aktywność na zajęciach
M_K002 Profesjonalność i etyka. FT2A_K05, FT2A_K03, FT2A_K03, FT2A_K01, FT2A_K01 Aktywność na zajęciach
M_K003 Konieczność ustawicznego samokształcenia. FT2A_K01, FT2A_K01 Aktywność na zajęciach
Matryca efektów kształcenia w odniesieniu do form zajęć
Kod EKM Student, który zaliczył moduł zajęć wie/umie/potrafi Forma zajęć
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Inne
E-learning
Wiedza
M_W001 Poszerzenie wiedzy z zakresu statystyki matematycznej. + - - - - - - - - - -
M_W002 Istota i uwarunkowania procesu pozyskiwaniawiedzy z danych. + - - - - - - - - - -
M_W003 Znajomość procedur analizy danych. + - + - - - - - - - -
Umiejętności
M_U001 Stosowanie procedur analizy danych. + - + - - - - - - - -
M_U002 Wykorzystanie procedur analizy danych do praktycznych zagadnień pozyskiwania wiedzy z danych. + - + - - - - - - - -
M_U003 Pozyskiwanie informacji ze źródeł różnego typuoraz prezentacja zagadnienia badawczego iuzyskanych wyników. - - + - - - - - - - -
Kompetencje społeczne
M_K001 Praca zespołowa. - - + - - - - - - - -
M_K002 Profesjonalność i etyka. + - - - - - - - - - -
M_K003 Konieczność ustawicznego samokształcenia. + - - - - - - - - - -
Treść modułu zajęć (program wykładów i pozostałych zajęć)
Wykład:
  1. Wprowadzenie

    Przedmiot analizy danych; związek ze statystyką matematyczną.
    Główne fazy procesu analizy danych.

  2. Pojęcia podstawowe

    Typy danych.
    Miary podobieństwa.
    Wstępne przetwarzanie danych: czyszczenie, obsługa brakujących atrybutów, standaryzacja.

  3. Wykrywanie elementów odosobnionych (nietypowych)

    Nieparametryczny test istotności.
    Elementy oddalone.

  4. Grupowanie (klasteryzacja)

    Algorytmy k-średnich i k-medoidów.
    Metody hierarchiczne.

  5. Klasyfikacja

    Algorytm k-najbliższych sąsiadów.
    Drzewa decyzyjne.

  6. Zastosowania

    Przykładowe aplikacje w zagadnieniach wykrywania uszkodzeń w systemach dynamicznych, a także wyznaczenia strategii marketingowej operatora telefonii komórkowej.
    Ewaluacja procesu analizy danych.

  7. Tematy opcjonalne

    Redukcja wymiaru danych.
    Duże (liczne) zbiory danych.
    Strumienie danych.

Ćwiczenia laboratoryjne:
Laboratorium

Zajęcia wprowadzające.
Wykrywanie elementów odosobnionych (nietypowych).
Grupowanie (klasteryzacja).
Klasyfikacja.
Procedury analizy danych w Internecie.
Temat opcjonalny: redukcja wymiaru danych.
Zajęcia zaliczeniowe.

Nakład pracy studenta (bilans punktów ECTS)
Forma aktywności studenta Obciążenie studenta
Sumaryczne obciążenie pracą studenta 90 godz
Punkty ECTS za moduł 3 ECTS
Udział w wykładach 20 godz
Udział w ćwiczeniach laboratoryjnych 20 godz
Przygotowanie do zajęć 20 godz
Samodzielne studiowanie tematyki zajęć 15 godz
Przygotowanie sprawozdania, pracy pisemnej, prezentacji, itp. 15 godz
Pozostałe informacje
Sposób obliczania oceny końcowej:

Zaliczenie modułu na podstawie zaliczenia laboratorium. Możliwe jest podwyższenie oceny na podstawie aktywności na wykładach.

Wymagania wstępne i dodatkowe:

Wiedza z zakresu matematyki na poziomie nabytym na studiach I stopnia, zwłaszcza z zakresu statystyki matematycznej.
Umiejętność użytkowania sprzętu komputerowego.

Zalecana literatura i pomoce naukowe:

Larose D.T., Odkrywanie wiedzy z danych; wprowadzenie do eksploracji danych, PWN, 2006.
Larose D.T., Odkrywanie wiedzy z danych; metody i modele eksploracji danych, PWN, 2008.
Krzyśko M., Wołyński W., Górecki T., Skorzybut M., Systemy uczące się; rozpoznawanie wzorców, analiza skupień i redukcja wymiarowości, WNT, 2008.
- Literatura uzupełniająca:
Kulczycki P., Hryniewicz O., Kacprzyk J. (red.), Techniki informacyjne w badaniach systemowych, WNT, 2007.

Publikacje naukowe osób prowadzących zajęcia związane z tematyką modułu:

- Książka:
1. P. Kulczycki, „Estymatory jądrowe w analizie systemowej”, WNT, Warszawa, 2005.
- Wybrane publikacje w czasopismach z listy JCR:
1. P. Kulczycki, P.A. Kowalski, „Bayes classification of imprecise information of interval type”, Control and Cybernetics, vol. 40, nr 1, ss. 101-123, 2011.
2. P. Kulczycki, M. Charytanowicz, P.A. Kowalski, S. Łukasik, „The Complete Gradient Clustering Algorithm: Properties in Practical Applications”, Journal of Applied Statistics, vol. 39, nr 6, ss. 1211-1224, 2012.
3. P. Kulczycki, S. Łukasik, „An Algorithm for Reducing Dimension and Size of Sample for Data Exploration Procedures”, International Journal of Applied Mathematics and Computer Science, vol. 24, nr 1, ss. 133-149, 2014.
4. P. Kulczycki, P.A. Kowalski, „Bayes Classification for Nonstationary Patterns”, International Journal of Computational Methods, vol. 12, nr 2, ID 1550008 (19 stron), 2015.
5. P. Kulczycki, D. Kruszewski, „Identification of Atypical Elements by Transforming Task to Supervised Form with Fuzzy and Intuitionistic Fuzzy Evaluations”, Applied Soft Computing, vol. 60, ss. 623-633, 2017.
6. P. Kulczycki, M. Charytanowicz, P.A. Kowalski, S. Łukasik, „Identification of Atypical (Rare) Elements – A Conditional, Distribution-Free Approach”, IMA Journal of Mathematical Control and Information, vol. 35, nr 3, ss. 923-937, 2018.

Informacje dodatkowe:

Nieobecności (także usprawiedliwione) na zajęciach z laboratorium wymagają odrobienia w formie i terminie uzgodnionych z prowadzącym. Połowa zajęć nieusprawiedliwionych skutkuje brakiem zaliczenia.