Module also offered within study programmes:
General information:
Name:
Advanced data analysis
Course of study:
2016/2017
Code:
JFT-2-103-s
Faculty of:
Physics and Applied Computer Science
Study level:
Second-cycle studies
Specialty:
-
Field of study:
Technical Physics
Semester:
1
Profile of education:
Academic (A)
Lecture language:
Polish
Form and type of study:
Full-time studies
Course homepage:
 
Responsible teacher:
prof. dr hab. Bożek Piotr (piotr.bozek@fis.agh.edu.pl)
Academic teachers:
Module summary

Wprowadzenie do nowoczesnych metod analizy danych i uczenia maszynowego.

Description of learning outcomes for module
MLO code Student after module completion has the knowledge/ knows how to/is able to Connections with FLO Method of learning outcomes verification (form of completion)
Social competence
M_K001 Student rozumie konieczność dostosowania metod pracy do danego problemu FT2A_K06, FT2A_K04 Activity during classes
Skills
M_U001 Student potrafi przeprowadzić analizę złożonych danych pomiarowych i sygnałów, umie zastosować procedury numeryczne z bibliotek i pakietów oprogramowania FT2A_U08, FT2A_U10 Activity during classes,
Examination,
Execution of laboratory classes
M_U002 Student potrafi zaproponować plan pomiarów, w tym czasu, wielkości próbki i zestawu wielkości koniecznych dla uzyskania wiarygodnych wniosków i estymacji parametrów, w zastosowaniach w diagnostyce, monitoringu i badaniach materiałowych z wykorzystaniem metod fizycznych FT2A_U07, FT2A_U11 Activity during classes,
Examination,
Execution of laboratory classes
Knowledge
M_W001 Student wie na czy polegają zaawansowane metody analizy statystycznej, zna podstawowy analizy sygnałów ciągłych i dyskretnych, FT2A_W07 Activity during classes,
Examination
M_W002 Student zna metody analizy wielorozdzielczej sygnałów i obrazów, potrafi omówić charakterystyki szeregów czasowych i metody analizy i składowej statystycznej FT2A_W07 Activity during classes,
Examination
FLO matrix in relation to forms of classes
MLO code Student after module completion has the knowledge/ knows how to/is able to Form of classes
Lecture
Audit. classes
Lab. classes
Project classes
Conv. seminar
Seminar classes
Pract. classes
Zaj. terenowe
Zaj. warsztatowe
Others
E-learning
Social competence
M_K001 Student rozumie konieczność dostosowania metod pracy do danego problemu - - + + - - - - - - -
Skills
M_U001 Student potrafi przeprowadzić analizę złożonych danych pomiarowych i sygnałów, umie zastosować procedury numeryczne z bibliotek i pakietów oprogramowania + - + + - - - - - - -
M_U002 Student potrafi zaproponować plan pomiarów, w tym czasu, wielkości próbki i zestawu wielkości koniecznych dla uzyskania wiarygodnych wniosków i estymacji parametrów, w zastosowaniach w diagnostyce, monitoringu i badaniach materiałowych z wykorzystaniem metod fizycznych + - + + - - - - - - -
Knowledge
M_W001 Student wie na czy polegają zaawansowane metody analizy statystycznej, zna podstawowy analizy sygnałów ciągłych i dyskretnych, + - + + - - - - - - -
M_W002 Student zna metody analizy wielorozdzielczej sygnałów i obrazów, potrafi omówić charakterystyki szeregów czasowych i metody analizy i składowej statystycznej + - + + - - - - - - -
Module content
Lectures:
Tematyka wykładów

1. Wprowadzenie, powtórzenie (2h)
ciągłe i dyskretne rozkłady prawdopodobieństwa, estymatory, momenty, macierz kowariancji, funkcje tworzące, funkcja największej wiarygodności

2. Metody Bayesowskie (2h)
estymacja parametrów, rozkłady apriori, aposteriori

3. Rozkłady o grubych ogonach (2h)
szum skorelowany, ekstremalne obserwacje

4. Ciągła transformata Fouriera, widmo, filtry,
dyskretna transformata Fouriera, splot (2h)

5. Metody klasyfikacji i regresji, drzewa decyzyjne (4h)

6. Szeregi czasowe, ogólne własności,
część systematyczna i składowa przypadkowa, szum, modele szeregów czasowych, szacowanie parametrów modelu i wnioskowanie (2h)

Laboratory classes:
Tematyka ćwiczeń laboratoryjnych

- Ćwiczenia komputerowe, wykonane w dowolnym oprogramowaniu,
programy napisane samodzielnie z wykorzystanie procedur bibliotecznych lub publicznie dostępnych,
bądź z wykorzystaniem pakietów EXCEL, R, Octave, MATLAB.

1. Podstawowe rozkłady, generowanie liczb losowych, histogramy:

2. Estymatory statystyczne, zmienne skorelowanee

3. Funkcja największej wiarygodność , algorytm EM

4. Testowanie hipotez

5. Metody Monte-Carlo i bootstrap

6. Analiza Bayesowska

7. Drzewa decyzyjne

8. Szeregi czasowe, rozdzielanie trendu i składowej
przypadkowej

10. Filtr Kalmana
12. Estymatory jądrowe

Project classes:

Temat projektu wybrany z listy lub własny, po uzgodnieniu z prowadzącym.
Wykonanie projektu składa się z przestudiowania metod statystycznych używanych w projekcie. Przedstawienie krótkiego (5-10min) referatu o metodzie. Przygotowanie projektu, programu i analiza przykładowych danych. Przygotowanie i przesłanie pisemnego sprawozdania, Zamiast sprawozdania można przygotować referat na temat wykonanego projektu.

Student workload (ECTS credits balance)
Student activity form Student workload
Summary student workload 102 h
Module ECTS credits 4 ECTS
Participation in lectures 14 h
Realization of independently performed tasks 20 h
Participation in laboratory classes 28 h
Preparation for classes 30 h
Completion of a project 10 h
Additional information
Method of calculating the final grade:

Ocen końcowa jest określona przez sumę punktów z egzaminu pisemnego (20%), oceny ćwiczeń laboratoryjnych (60%), i projektu laboratoryjnego (20%), zgodnie z regulaminem studiów.
Nie ma wymagań co do minimalnej ilości punktów za każdą ze składowych, liczy się suma do oceny końcowej. Możliwa jedna nieobecność nieusprawiedliwona na zajęciach laboratoryjnych z możliwością odrobienia, punkty zaliczone po uzupelnieniu rozwiązania.
Punkty za nieobecności usprawiedliwione będą zaliczone po uzupełnieniu rozwiązania.

Prerequisites and additional requirements:

Kurs statystyki matematycznej lub analizy danych,
podstawy programowania

Recommended literature and teaching resources:

http://www.fis.agh.edu.pl/~Bozek

  1. D.S. Siva and J. Skilling, Data analysis: a bayesian tutorial,
  2. Oxford University Press, 2006
  3. J. Szabatin, Podstawy teorii sygnałów, WKŁ, 2002
  4. J.T. Białasiewicz, Falki i aproksymacje, WNT, 2004
  5. M. Small, Applied nonlinear time series analysis, applications in physics, physiology and finance, World Scientific, 2005
  6. W. Martinez and A. Martine, Computational Statistics Handbook with MATLAB, Chapman & Hall, 2002
Scientific publications of module course instructors related to the topic of the module:

Additional scientific publications not specified

Additional information:

None