Module also offered within study programmes:
General information:
Name:
Metody analizy danych doświadczalnych
Course of study:
2016/2017
Code:
JFT-2-005-s
Faculty of:
Physics and Applied Computer Science
Study level:
Second-cycle studies
Specialty:
-
Field of study:
Technical Physics
Semester:
0
Profile of education:
Academic (A)
Lecture language:
Polish
Form and type of study:
Full-time studies
Responsible teacher:
prof. dr hab. inż. Przybycień Mariusz (mariusz.przybycien@agh.edu.pl)
Academic teachers:
dr inż. Adamczyk Leszek (Leszek.Adamczyk@agh.edu.pl)
prof. dr hab. inż. Przybycień Mariusz (mariusz.przybycien@agh.edu.pl)
Module summary

Description of learning outcomes for module
MLO code Student after module completion has the knowledge/ knows how to/is able to Connections with FLO Method of learning outcomes verification (form of completion)
Skills
M_U011 Student potrafi przeprowadzić analizę statystyczną danych doświadczalnych z wykorzystaniem zaawansowanych metod i narzędzi. FT2A_U06, FT2A_U08, FT2A_U10, FT2A_U02, FT2A_U09 Activity during classes,
Examination,
Test,
Execution of a project
M_U016 Student potrafi posługiwać się wybranymi narzędziami programistycznymi wykorzystywanymi w zaawansowanej analizie danych. FT2A_U06, FT2A_U08, FT2A_U10, FT2A_U02, FT2A_U09 Activity during classes,
Examination,
Test,
Execution of a project
Knowledge
M_W008 Student zna i rozumie wybrane zaawansowane metody analizy danych doświadczalnych. FT2A_W07, FT2A_W04, FT2A_W02 Activity during classes,
Examination,
Test,
Execution of a project
M_W013 Student zna podstawowe narzędzia programistyczne wykorzystywane w analizie danych. FT2A_W07, FT2A_W04, FT2A_W02 Activity during classes,
Examination,
Test,
Execution of a project
FLO matrix in relation to forms of classes
MLO code Student after module completion has the knowledge/ knows how to/is able to Form of classes
Lecture
Audit. classes
Lab. classes
Project classes
Conv. seminar
Seminar classes
Pract. classes
Zaj. terenowe
Zaj. warsztatowe
Others
E-learning
Skills
M_U011 Student potrafi przeprowadzić analizę statystyczną danych doświadczalnych z wykorzystaniem zaawansowanych metod i narzędzi. + + - + - - - - - - -
M_U016 Student potrafi posługiwać się wybranymi narzędziami programistycznymi wykorzystywanymi w zaawansowanej analizie danych. + + - + - - - - - - -
Knowledge
M_W008 Student zna i rozumie wybrane zaawansowane metody analizy danych doświadczalnych. + + - + - - - - - - -
M_W013 Student zna podstawowe narzędzia programistyczne wykorzystywane w analizie danych. + + - + - - - - - - -
Module content
Lectures:
  1. Funkcje generujące i charakterystyczne (2h)

    • Funkcje generujące rozkład prawdopodobieństwa i moment.
    • Funkcje charakterystyczne.
    • Zastosowania rachunkowe.

  2. Statystyka porządku (2h)

    • Statystyka porządku i jej zastosowania.

  3. Proces Poissona i jego zastosowania (2h)

    • Definicja procesu Poissona.
    • Rozkłady warunkowe w procesach Poissona.
    • Niezależne procesy Poissona.
    • Złożony proces Poissona.

  4. Bayes’owska analiza statystyczna (4h)

    • Prawdopodobieństwa logiczne, wnioskowanie bayes’owskie.
    • Estymacja parametrów, przedziały wiarogodności, testy hipotez statystycznych.
    • Metoda największej wiarogodności a wnioskowanie bayes’owskie.

  5. Generacja rozkładów wielowymiarowych (2h)

    • Generacja rozkładów kątowych we współrzędnych biegunowych i sferycznych.
    • Generacja rozkładów z korelacjami.
    • Generacja rozpadów dwu- i trzyciałowych.

  6. Estymacja parametrów (2h)

    • Metoda największej wiarogodności: rozszerzona oraz z wagami.
    • Obszary ufności.
    • Minimalizacja numeryczna: Minuit oraz RooFit.

  7. Rozszerzona metoda najmniejszych kwadratów (MNK) (2h)

    • Skalowana macierz kowariancji.
    • MNK z korelacjami i więzami.

  8. Unfolding (2h)

    • Metoda bin-by-bin (akceptancja, wydajność, czystość).
    • Macierz przejścia, regularyzacja (analiza danych pogrupowanych).
    • Rozkład według wartości osobliwych, pakiet RooUnfold.
    • Funkcja przejścia (analiza danych niepogrupowanych).

  9. Testowanie hipotez statystycznych (2h)

    • Wybrane testy hipotez i ich zastosowania.

  10. Wielowymiarowa klasyfikacja przypadków (4h)

    • Dyskryminacja Fishera (liniowa i nieliniowa).
    • Sieci neuronowe, SVM, pakiet TMVA.

  11. Oszacowanie niepewności systematycznych (2h)

    • Źródła niepewności systematycznych.
    • Szacowanie błedów systematycznych.

  12. Bootstrap (2h)

    • Metoda bootstrap i jej zastosowania.

  13. Dyskusja przebiegu typowej analizy statystycznej od selekcji przypadków do prezentacji wyników (2h)

    • Przedstawione zostaną kolejne kroki typowej analizy danych z dużego eksperymentu akceleratorowego.

Auditorium classes:
Ćwiczenia rachunkowe tematyce zgodnej z programem wykładów.

Efekty kształcenia:
Student potrafi przeprowadzić analizę danych z eksperymentów fizyki wysokich energii wykorzystując zaawansowane narzędzia statystyczne (pakiet Root wraz z rozszerzeniami takimi jak RooFit, RooUnfold, TMVA).
Zajęcia prowadzone będą z wykorzystaniem rzeczywistych danych z eksperymentów takich jak ZEUS, ATLAS, STAR.

Project classes:
Ćwiczenia projektowe o tematyce zgodnej z programem wykładów.

Efekty kształcenia:
Student potrafi przeprowadzić analizę danych z eksperymentów fizyki wysokich energii wykorzystując zaawansowane narzędzia statystyczne (pakiet Root wraz z rozszerzeniami takimi jak RooFit, RooUnfold, TMVA).
Zajęcia prowadzone będą z wykorzystaniem rzeczywistych danych z eksperymentów takich jak ZEUS, ATLAS, STAR.

Student workload (ECTS credits balance)
Student activity form Student workload
Summary student workload 150 h
Module ECTS credits 5 ECTS
Participation in lectures 30 h
Realization of independently performed tasks 24 h
Participation in auditorium classes 15 h
Preparation for classes 28 h
Participation in project classes 15 h
Completion of a project 35 h
Examination or Final test 3 h
Additional information
Method of calculating the final grade:

Oceny z ćwiczeń rachunkowych/projektowych oraz z egzaminu obliczane są następująco: procent uzyskanych punktów przeliczany jest na ocenę zgodnie z Regulaminem Studiów AGH.
Ocena końcowa (OK) obliczana jest na podstawie ocen z egzaminu (E) i ćwiczeń rachunkowych/projektowych (Cw) zgodnie z tabelą:

| Cw \ E | 3.0 | 3.5 | 4.0 | 4.5 | 5.0 |
| 3.0 …… | 3.0 | 3.0 | 3.5 | 3.5 | 3.5 |
| 3.5 …… | 3.0 | 3.5 | 3.5 | 4.0 | 4.0 |
| 4.0 …… | 3.5 | 4.0 | 4.0 | 4.0 | 4.5 |
| 4.5 …… | 4.0 | 4.0 | 4.5 | 4.5 | 5.0 |
| 5.0 …… | 4.0 | 4.5 | 4.5 | 5.0 | 5.0 |

Prerequisites and additional requirements:

Podstawowe wiadomości z rachunku prawdopodobieństwa i statystyki matematycznej.
Znajomość podstaw języka C++

Recommended literature and teaching resources:

R. Nowak, Statystyka dla fizyków, PWN, 2002.
R. Nowak, Statystyka dla fizyków. Ćwiczenia, PWN, 2002.
P.D. Hoff, A First Course in Bayesian Statistical Methods , Springer, 2009.
P. Gregory, Bayesian Logical Data Analysis for the Physical Sciences, Cambridge, 2005.
W.L. Dunn, J.K. Shultis, Exploring Monte Carlo Methods, Elsevier, 2011.
O. Behnke et al., A Practical Guide to Data Analysis in high energy Physics, Wiley, 2012.
G. Bohm, G. Zech, Introduction to Statistics and Data Analysis, DESY, 2010.
G. Cowan, Statistical Data analysis, Oxford, 1998.

Strona domowa program Root: root.cern.ch

Scientific publications of module course instructors related to the topic of the module:

Additional scientific publications not specified

Additional information:

None