Moduł oferowany także w ramach programów studiów:
Informacje ogólne:
Nazwa:
Zaawansowane metody analizy danych
Tok studiów:
2018/2019
Kod:
JFT-2-103-s
Wydział:
Fizyki i Informatyki Stosowanej
Poziom studiów:
Studia II stopnia
Specjalność:
-
Kierunek:
Fizyka Techniczna
Semestr:
1
Profil kształcenia:
Ogólnoakademicki (A)
Język wykładowy:
Polski
Forma i tryb studiów:
Stacjonarne
Strona www:
 
Osoba odpowiedzialna:
prof. dr hab. Bożek Piotr (piotr.bozek@fis.agh.edu.pl)
Osoby prowadzące:
Krótka charakterystyka modułu

Wprowadzenie do nowoczesnych metod analizy danych i uczenia maszynowego.

Opis efektów kształcenia dla modułu zajęć
Kod EKM Student, który zaliczył moduł zajęć wie/umie/potrafi Powiązania z EKK Sposób weryfikacji efektów kształcenia (forma zaliczeń)
Wiedza
M_W001 Student wie na czy polegają zaawansowane metody analizy statystycznej, zna podstawowy analizy sygnałów ciągłych i dyskretnych, FT2A_W05 Aktywność na zajęciach,
Egzamin
M_W002 Student zna metody analizy wielorozdzielczej sygnałów i obrazów, potrafi omówić charakterystyki szeregów czasowych i metody analizy i składowej statystycznej FT2A_W05 Aktywność na zajęciach,
Egzamin
Umiejętności
M_U001 Student potrafi przeprowadzić analizę złożonych danych pomiarowych i sygnałów, umie zastosować procedury numeryczne z bibliotek i pakietów oprogramowania FT2A_U05, FT2A_U03 Aktywność na zajęciach,
Egzamin,
Wykonanie ćwiczeń laboratoryjnych
M_U002 Student potrafi zaproponować plan pomiarów, w tym czasu, wielkości próbki i zestawu wielkości koniecznych dla uzyskania wiarygodnych wniosków i estymacji parametrów, w zastosowaniach w diagnostyce, monitoringu i badaniach materiałowych z wykorzystaniem metod fizycznych FT2A_U05, FT2A_U04 Aktywność na zajęciach,
Egzamin,
Wykonanie ćwiczeń laboratoryjnych
Kompetencje społeczne
M_K001 Student rozumie konieczność dostosowania metod pracy do danego problemu FT2A_K03, FT2A_K02 Aktywność na zajęciach
Matryca efektów kształcenia w odniesieniu do form zajęć
Kod EKM Student, który zaliczył moduł zajęć wie/umie/potrafi Forma zajęć
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Inne
E-learning
Wiedza
M_W001 Student wie na czy polegają zaawansowane metody analizy statystycznej, zna podstawowy analizy sygnałów ciągłych i dyskretnych, + - + + - - - - - - -
M_W002 Student zna metody analizy wielorozdzielczej sygnałów i obrazów, potrafi omówić charakterystyki szeregów czasowych i metody analizy i składowej statystycznej + - + + - - - - - - -
Umiejętności
M_U001 Student potrafi przeprowadzić analizę złożonych danych pomiarowych i sygnałów, umie zastosować procedury numeryczne z bibliotek i pakietów oprogramowania + - + + - - - - - - -
M_U002 Student potrafi zaproponować plan pomiarów, w tym czasu, wielkości próbki i zestawu wielkości koniecznych dla uzyskania wiarygodnych wniosków i estymacji parametrów, w zastosowaniach w diagnostyce, monitoringu i badaniach materiałowych z wykorzystaniem metod fizycznych + - + + - - - - - - -
Kompetencje społeczne
M_K001 Student rozumie konieczność dostosowania metod pracy do danego problemu - - + + - - - - - - -
Treść modułu zajęć (program wykładów i pozostałych zajęć)
Wykład:
Tematyka wykładów

1. Wprowadzenie, powtórzenie (2h)
ciągłe i dyskretne rozkłady prawdopodobieństwa, estymatory, momenty, macierz kowariancji, funkcje tworzące, funkcja największej wiarygodności

2. Metody Bayesowskie (2h)
estymacja parametrów, rozkłady apriori, aposteriori

3. Rozkłady o grubych ogonach (2h)
szum skorelowany, ekstremalne obserwacje

4. Ciągła transformata Fouriera, widmo, filtry,
dyskretna transformata Fouriera, splot (2h)

5. Metody klasyfikacji i regresji, drzewa decyzyjne (4h)

6. Szeregi czasowe, ogólne własności,
część systematyczna i składowa przypadkowa, szum, modele szeregów czasowych, szacowanie parametrów modelu i wnioskowanie (2h)

Ćwiczenia laboratoryjne:
Tematyka ćwiczeń laboratoryjnych

- Ćwiczenia komputerowe, wykonane w dowolnym oprogramowaniu,
programy napisane samodzielnie z wykorzystanie procedur bibliotecznych lub publicznie dostępnych,
bądź z wykorzystaniem pakietów EXCEL, R, Octave, MATLAB.

1. Podstawowe rozkłady, generowanie liczb losowych, histogramy:

2. Estymatory statystyczne, zmienne skorelowanee

3. Funkcja największej wiarygodność , algorytm EM

4. Testowanie hipotez

5. Metody Monte-Carlo i bootstrap

6. Analiza Bayesowska

7. Drzewa decyzyjne

8. Szeregi czasowe, rozdzielanie trendu i składowej
przypadkowej

10. Filtr Kalmana
12. Estymatory jądrowe

Ćwiczenia projektowe:

Temat projektu wybrany z listy lub własny, po uzgodnieniu z prowadzącym.
Wykonanie projektu składa się z przestudiowania metod statystycznych używanych w projekcie. Przedstawienie krótkiego (5-10min) referatu o metodzie. Przygotowanie projektu, programu i analiza przykładowych danych. Przygotowanie i przesłanie pisemnego sprawozdania, Zamiast sprawozdania można przygotować referat na temat wykonanego projektu.

Nakład pracy studenta (bilans punktów ECTS)
Forma aktywności studenta Obciążenie studenta
Sumaryczne obciążenie pracą studenta 105 godz
Punkty ECTS za moduł 4 ECTS
Udział w wykładach 15 godz
Samodzielne studiowanie tematyki zajęć 20 godz
Udział w ćwiczeniach laboratoryjnych 30 godz
Przygotowanie do zajęć 30 godz
Wykonanie projektu 10 godz
Pozostałe informacje
Sposób obliczania oceny końcowej:

Ocen końcowa jest określona przez sumę punktów z egzaminu pisemnego (20%), oceny ćwiczeń laboratoryjnych (60%), i projektu laboratoryjnego (20%), zgodnie z regulaminem studiów.
Nie ma wymagań co do minimalnej ilości punktów za każdą ze składowych, liczy się suma do oceny końcowej. Możliwa jedna nieobecność nieusprawiedliwona na zajęciach laboratoryjnych z możliwością odrobienia, punkty zaliczone po uzupelnieniu rozwiązania.
Punkty za nieobecności usprawiedliwione będą zaliczone po uzupełnieniu rozwiązania.

Wymagania wstępne i dodatkowe:

Kurs statystyki matematycznej lub analizy danych,
podstawy programowania

Zalecana literatura i pomoce naukowe:

http://www.fis.agh.edu.pl/~Bozek

  1. D.S. Siva and J. Skilling, Data analysis: a bayesian tutorial,
  2. Oxford University Press, 2006
  3. J. Szabatin, Podstawy teorii sygnałów, WKŁ, 2002
  4. J.T. Białasiewicz, Falki i aproksymacje, WNT, 2004
  5. M. Small, Applied nonlinear time series analysis, applications in physics, physiology and finance, World Scientific, 2005
  6. W. Martinez and A. Martine, Computational Statistics Handbook with MATLAB, Chapman & Hall, 2002
Publikacje naukowe osób prowadzących zajęcia związane z tematyką modułu:

Piotr Bożek, Phys. Rev. C97, 034905, 2018.
Principal component analysis of the nonlinear coupling of harmonic modes in heavy-ion collisions
Sandeep Chatterjee, Piotr Bożek Phys. Rev. C95, 014906, 2017.
Pseudorapidity profile of transverse momentum fluctuations in heavy ion collisions
Piotr Bożek, Phys. Rev. C93, 044908, 2016.
Transverse-momentum-flow correlations in relativistic heavy-ion collisions

Informacje dodatkowe:

Brak