Module also offered within study programmes:
General information:
Name:
Statistical analysis of internet data
Course of study:
2016/2017
Code:
ZIP-3-015-s
Faculty of:
Management
Study level:
Third-cycle studies
Specialty:
-
Field of study:
Industrial Engineering
Semester:
0
Profile of education:
Academic (A)
Lecture language:
Polish
Form and type of study:
Full-time studies
Responsible teacher:
Duda Jan Tadeusz (jtduda@zarz.agh.edu.pl)
Academic teachers:
Duda Jan Tadeusz (jtduda@zarz.agh.edu.pl)
Module summary

Description of learning outcomes for module
MLO code Student after module completion has the knowledge/ knows how to/is able to Connections with FLO Method of learning outcomes verification (form of completion)
Social competence
M_K001 Ma świadomość znaczenia i odpowiedzialności poprawnego przetwarzania danych dla potrzeb inżynierii produkcji. IP3A_K01, IP3A_K03 Activity during classes,
Oral answer,
Participation in a discussion
Skills
M_U001 Potrafi przygotować w środowisku Matlab program przetwarzający wybrane dane internetowe. Potrafi ocenić poprawność wyników przetwarzania danych. Potrafi zastosować odpowiednie narzędzia statystyki. IP3A_U03, IP3A_U05 Oral answer,
Project,
Activity during classes,
Participation in a discussion
Knowledge
M_W001 Słuchacz kursu ma wiedzę na temat dostępnych źródeł informacji internetowych o charakterze ilościowym i jakościowym. IP3A_W03, IP3A_W01 Oral answer,
Project,
Activity during classes,
Participation in a discussion
M_W002 Potrafi dokonać analizy poprawności i spójności danych oraz ocenić ich przydatność dla rozwiązania postawionego zadania z zakresu Inżynierii Produkcji. Zna odpowiednie narzędzia statystyki. IP3A_W02 Examination
FLO matrix in relation to forms of classes
MLO code Student after module completion has the knowledge/ knows how to/is able to Form of classes
Lecture
Audit. classes
Lab. classes
Project classes
Conv. seminar
Seminar classes
Pract. classes
Zaj. terenowe
Zaj. warsztatowe
Others
E-learning
Social competence
M_K001 Ma świadomość znaczenia i odpowiedzialności poprawnego przetwarzania danych dla potrzeb inżynierii produkcji. - - - - + - - - - - -
Skills
M_U001 Potrafi przygotować w środowisku Matlab program przetwarzający wybrane dane internetowe. Potrafi ocenić poprawność wyników przetwarzania danych. Potrafi zastosować odpowiednie narzędzia statystyki. - - - - + - - - - - -
Knowledge
M_W001 Słuchacz kursu ma wiedzę na temat dostępnych źródeł informacji internetowych o charakterze ilościowym i jakościowym. - - - - + - - - - - -
M_W002 Potrafi dokonać analizy poprawności i spójności danych oraz ocenić ich przydatność dla rozwiązania postawionego zadania z zakresu Inżynierii Produkcji. Zna odpowiednie narzędzia statystyki. - - - - + - - - - - -
Module content
Conversation seminar:

1. Pojęcia podstawowe – formy i źródła danych, Internet jako źródło danych, kwestia wiarygodności i aktualności danych, prawa autorskie,
Cele przetwarzania – wydobywanie wiedzy z danych.
Typy danych – jakościowe (lingwistyczne), ilościowe – całkowite, rzeczywiste.
Metody wydobywania wiedzy – grupowanie i klasyfikacja (wiedza jakościowa), modelowanie matematyczne (wiedza ilościowa).
Szeregi czasowe (problem miary czasu i kompletności).
Formaty danych – binarne (niedostępne) HTML, XML, csv.
Narzędzia: algorytmy grupowania i klasyfikacji, statystyka opisowa, ilościowe analizy statystyczne jedno i wielowymiarowe (kwestia losowości danych),
Narzędzia przetwarzania: MS Excel, Visual Basic – problem eksportu i importu danych, prezentacja graficzna: szeregi czasowe a wykresy przekrojowe – interpretacja.
2. Statystyka jako narzędzie wydobywania wiedzy: rozkłady prawdopodobieństwa jedno i wielowymiarowe, analizy korelacyjne, autokorelacji – problem kompletności.
3. Modelowanie nieparametryczne i parametryczne.
4. Regresja jako narzędzie wydobywania wiedzy.
5. Grupowanie szeregów czasowych – analizy podobieństwa (definicje podobieństwa), prefiltracja jako narzędzie dekompozycji szeregów.

Student workload (ECTS credits balance)
Student activity form Student workload
Summary student workload 75 h
Module ECTS credits 3 ECTS
Contact hours 2 h
Examination or Final test 2 h
Participation in conversation seminars 14 h
Realization of independently performed tasks 18 h
Preparation for classes 14 h
Completion of a project 25 h
Additional information
Method of calculating the final grade:

Ocena końcowa wystawiana jest przez prowadzącego na podstawie oceny z egzaminu, z uwzględnieniem obecności i aktywności na konwersatoriach.
Ocenę zaokrągla się zależnie od obecności, z możliwością podniesienia (maks. o 1.0) na podstawie dodatkowego kolokwium ustnego.

Prerequisites and additional requirements:

Znajomość podstawowych metod statystyki matematycznej i algebry, umiejętność programowania w środowisku MATLAB

Recommended literature and teaching resources:

J. Koronacki, J. Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. WNT 2001.

T. J. Hastie,R. J. Tibshirani, J. Friedman: The Elements of Statistical Learning, Springer 2001

J. Koronacki, J. Ćwik, Statystyczne systemy uczące się, WNT 2005.

M. Sobyczyk: Statystyka, PWN, 2014

M. Cieślak: Prognozowanie gospodardze. Metody i zastosowania, PWN, 2011

Scientific publications of module course instructors related to the topic of the module:

Duda J.T., Pełech-Pilichowski T.: Enhancements of moving trend based filters aimed at time series prediction. Advances in systems science: proceedings of the International Conference on Systems Science 2013 (ICSS 2013) / eds. Jerzy Świątek, [et al.], Advances in Intelligent Systems and Computing. Springer International Publishing, 2014, s. 747–756

Duda J.T., Pełech-Pilichowski T.: Wykorzystanie trendu pełzającego do analizy i prognozowania szeregów finansowych. W: Uwarunkowania, metody i strategie rozwoju przedsiębiorstw, red. nauk. Howaniec H., Madyda A., Waszkielewicz W., Wydawnictwo Naukowe ATH, 2013, s. 79–101

Pełech-Pilichowski T., Duda J.T.: A two-level detector of short-term unique changes in time series based on a similarity method. Expert Systems 2015 vol. 32 no. 4, s. 555–561

Pełech-Pilichowski T., Duda J.T.: Low-frequency signal reconstruction and abrupt change detection in non-stationary time series by enhanced moving trend based filters. Advances in ICT for business, industry and public sector, eds. Mach-Król M., Olszak C.M., Pełech-Pilichowski T. (Studies in Computational Intelligence, vol. 579), Springer, 2015, s. 111–125

Additional information:

None