Module also offered within study programmes:
General information:
Name:
Eksploracja danych
Course of study:
2019/2020
Code:
GIPZ-2-102-LM-n
Faculty of:
Mining and Geoengineering
Study level:
Second-cycle studies
Specialty:
Lean Manufacturing
Field of study:
-
Semester:
1
Profile of education:
Academic (A)
Lecture language:
Polish
Form and type of study:
Part-time studies
Responsible teacher:
prof. nadzw. dr hab. inż. Brzychczy Edyta (brzych3@agh.edu.pl)
Module summary

W ramach przedmiotu prezentowane są zagadnienia z zakresu eksploracji danych.

Description of learning outcomes for module
MLO code Student after module completion has the knowledge/ knows how to/is able to Connections with FLO Method of learning outcomes verification (form of completion)
Social competence: is able to
M_K001 Student potrafi określić priorytety działania dla grupy współpracujących osób oraz ma świadomość odpowiedzialności za powierzone zadania. IPZ2A_K01, IPZ2A_K03 Execution of laboratory classes
Skills: he can
M_U001 Student potrafi przeprowadzić analizę dużych zbiorów danych z wykorzystaniem programu R, testować hipotezy badawcze i formułować wnioski na podstawie osiągniętych wyników. IPZ2A_U02, IPZ2A_U01 Execution of laboratory classes
M_U002 Student potrafi przeprowadzić zaawansowaną analizę zbioru danych. IPZ2A_U02, IPZ2A_U03, IPZ2A_U01 Execution of laboratory classes
Knowledge: he knows and understands
M_W001 Student zna wybrane zagadnienia z zakresu wielowymiarowej analizy zbiorów danych. IPZ2A_W05, IPZ2A_W04, IPZ2A_W02, IPZ2A_W03 Test
M_W002 Student zna metody eksploracji danych. IPZ2A_W02, IPZ2A_W01 Test
Number of hours for each form of classes:
Sum (hours)
Lecture
Audit. classes
Lab. classes
Project classes
Conv. seminar
Seminar classes
Pract. classes
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
27 9 0 18 0 0 0 0 0 0 0 0
FLO matrix in relation to forms of classes
MLO code Student after module completion has the knowledge/ knows how to/is able to Form of classes
Lecture
Audit. classes
Lab. classes
Project classes
Conv. seminar
Seminar classes
Pract. classes
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
Social competence
M_K001 Student potrafi określić priorytety działania dla grupy współpracujących osób oraz ma świadomość odpowiedzialności za powierzone zadania. - - + - - - - - - - -
Skills
M_U001 Student potrafi przeprowadzić analizę dużych zbiorów danych z wykorzystaniem programu R, testować hipotezy badawcze i formułować wnioski na podstawie osiągniętych wyników. - - + - - - - - - - -
M_U002 Student potrafi przeprowadzić zaawansowaną analizę zbioru danych. - - + - - - - - - - -
Knowledge
M_W001 Student zna wybrane zagadnienia z zakresu wielowymiarowej analizy zbiorów danych. + - + - - - - - - - -
M_W002 Student zna metody eksploracji danych. + - + - - - - - - - -
Student workload (ECTS credits balance)
Student activity form Student workload
Summary student workload 58 h
Module ECTS credits 2 ECTS
Udział w zajęciach dydaktycznych/praktyka 27 h
Preparation for classes 10 h
Realization of independently performed tasks 18 h
Examination or Final test 2 h
Contact hours 1 h
Module content
Lectures (9h):

1. Wprowadzenie do eksploracji danych. Język R.
2. Proces odkrywania wiedzy z danych a eksploracja danych. Zadania eksploracji danych.
3. Przygotowanie danych. Czyszczenie i transformacja danych.
4. Eksploracyjna analiza danych.
5. Metody klasyfikacji danych.
6. Reguły asocjacyjne.
7. Metody grupowania.

Laboratory classes (18h):

Wprowadzenie do R Studio. Biblioteki R.
Przygotowanie danych w R.
Czyszczenie i transformacja danych w R.
Eksploracyjna analiza danych w R.
Metody klasyfikacji danych w R.
Reguły asocjacyjne w R.
Metody grupowania w R.

Additional information
Teaching methods and techniques:
  • Lectures: Treści prezentowane na wykładzie są przekazywane w formie prezentacji multimedialnej w połączeniu z klasycznym wykładem tablicowym wzbogaconymi o pokazy odnoszące się do prezentowanych zagadnień.
  • Laboratory classes: W trakcie zajęć laboratoryjnych studenci samodzielnie rozwiązują zadany problem praktyczny, dobierając odpowiednie narzędzia. Prowadzący stymuluje grupę do refleksji nad problemem, tak by otrzymane wyniki miały wysoką wartość merytoryczną.
Warunki i sposób zaliczenia poszczególnych form zajęć, w tym zasady zaliczeń poprawkowych, a także warunki dopuszczenia do egzaminu:

Ocena końcowa wyznaczana jest na podstawie oceny z pisemnego zaliczenia wykładów oraz oceny z ćwiczeń laboratoryjnych.
Zaliczenie wykładów oraz ćwiczeń laboratoryjnych – 1 termin podstawowy i 1 termin poprawkowy.
Zaliczenie ćwiczeń laboratoryjnych w formie kolokwium zaliczeniowego.

Participation rules in classes:
  • Lectures:
    – Attendance is mandatory: No
    – Participation rules in classes: Studenci uczestniczą w zajęciach poznając kolejne treści nauczania zgodnie z syllabusem przedmiotu. Studenci winni na bieżąco zadawać pytania i wyjaśniać wątpliwości. Rejestracja audiowizualna wykładu wymaga zgody prowadzącego.
  • Laboratory classes:
    – Attendance is mandatory: Yes
    – Participation rules in classes: Studenci wykonują ćwiczenia laboratoryjne zgodnie z materiałami udostępnionymi przez prowadzącego. Student jest zobowiązany do przygotowania się w przedmiocie wykonywanego ćwiczenia.
Method of calculating the final grade:

Ocena końcowa (OK) obliczana jest według algorytmu:
1) w przypadku uzyskania zaliczenia z wykładów i ćwiczeń w I terminie: OK = (2*Z+2*C)/4
2) w przypadku uzyskania zaliczenia z wykładów i ćwiczeń w II terminie (niezdania I terminu): OK = (2+Z+2+C)/4
gdzie: Z – ocena pozytywna z zaliczenia wykładów, C – ocena pozytywna z zaliczenia ćwiczeń.

Sposób i tryb wyrównywania zaległości powstałych wskutek nieobecności studenta na zajęciach:

W przypadku zaległości powstałych wskutek nieobecności studenta na zajęciach obowiązkowych – student jest zobowiązany do uczestnictwa w zajęciach innej grupy (tzw. odrobienie zajęć) lub wykonania dodatkowego opracowania w formie pisemnej na temat związany z opuszczonymi zajęciami.

Prerequisites and additional requirements:

Znajomość podstaw statystyki.

Recommended literature and teaching resources:

Larose T.D., 2006: Odkrywanie wiedzy z danych. Wyd. Naukowe PWN, Warszawa
Hand D., Mannila H., .Smyth P., 2002: Principles of Data Mining, MIT Press
Wickham H., Grolemund G., 2018: Język R. Kompletny zestaw narzędzi dla analityków danych. Wyd. Helion O’Reilly, Gliwice

Scientific publications of module course instructors related to the topic of the module:

Brzychczy E., 2007: Budowa modeli ekonometrycznych wybranych parametrów techniczno-ekonomicznych kopalni węgla kamiennego. Wiadomości Górnicze, 11
Brzychczy E., 2008: Analiza wykorzystania kombajnów chodnikowych w przodkach korytarzowych w kopalniach węgla kamiennego z zastosowaniem drzew decyzyjnych. Zarządzanie: doświadczenia i problemy. Red. W. Sitko. Wyd. System-Graf, Lublin
Brzychczy E., 2009: Analiza wyposażenia przodków ścianowych na podstawie reguł asocjacyjnych. Wiadomości Górnicze, R.60, nr 3
Brzychczy E., 2009: Techniki eksploracji danych w zagadnieniach eksploatacji górniczej złóż węgla kamiennego. Kwartalnik AGH, Górnictwo i Geoinżynieria, nr 3
Brzychczy E., Stefaniak R., Maroszek Z., Siodłak Ł., 2010: Wykorzystanie wybranych technik Data Mining do analizy kompleksów ścianowych w KWK “Ziemowit”. Miesięcznik WUG Bezpieczeństwo i Ochrona Pracy w Górnictwie, nr 1
Kęsek M., Wykorzystanie metod eksploracji danych w zarządzaniu produkcją w kopalni węgla kamiennego. Wiadomości Górnicze R. 65 nr 4, 2014 Kęsek M., Zastosowanie wybranych metod eksploracji danych w systemie wspomagającym zarządzanie produkcją w kopalni węgla kamiennego.
Wydawnictwa AGH, Kraków 2013.
Kęsek M., Drzewa decyzyjne jako źródło pozyskiwania wiedzy o procesie produkcyjnym w kopalni węgla kamiennego. W: Szanse i bariery rozwoju przemysłu górniczego, „Śląsk”, Katowice 2013
Kęsek M., Reguły wnioskowania we wspomaganiu podejmowania decyzji w górnictwie. W: Szanse i bariery w rozwoju górnictwa węgla kamiennego, Gliwice, 2012
Kęsek M., Wybrane typy reprezentacji wiedzy pozyskiwanej w górnictwie. Przegląd Górniczy t. 68 nr 9, 2012
Kęsek M., Możliwości integracji języka R w zintegrowanym systemie zarządzania przedsiębiorstwem górniczym. W: Komputerowo zintegrowane zarządzanie, Opole, 2011
Kęsek M., Język R w odkrywaniu wiedzy górniczej. Przegląd Górniczy, 2010 t. 66 nr 9, Katowice, 2010
Kęsek M., Data Mining w przemyśle wydobywczym. Monografie naukowe Akademii Górniczo-Hutniczej w Krakowie, Kraków : AGH WGiG, 2007

Additional information:

Zaliczenie wykładów w formie pisemnej – 5 pytań opisowych.