Moduł oferowany także w ramach programów studiów:
Informacje ogólne:
Nazwa:
Eksploracja danych
Tok studiów:
2019/2020
Kod:
GIPZ-2-102-CP-n
Wydział:
Górnictwa i Geoinżynierii
Poziom studiów:
Studia II stopnia
Specjalność:
Controlling procesów produkcyjnych
Kierunek:
Inżynieria i Zarządzanie Procesami Przemysłowymi
Semestr:
1
Profil:
Ogólnoakademicki (A)
Język wykładowy:
Polski
Forma studiów:
Niestacjonarne
Prowadzący moduł:
prof. nadzw. dr hab. inż. Brzychczy Edyta (brzych3@agh.edu.pl)
Treści programowe zapewniające uzyskanie efektów uczenia się dla modułu zajęć

W ramach przedmiotu prezentowane są zagadnienia z zakresu eksploracji danych.

Opis efektów uczenia się dla modułu zajęć
Kod MEU Student, który zaliczył moduł zajęć zna i rozumie/potrafi/jest gotów do Powiązania z KEU Sposób weryfikacji i oceny efektów uczenia się osiągniętych przez studenta w ramach poszczególnych form zajęć i dla całego modułu zajęć
Wiedza: zna i rozumie
M_W001 Student zna wybrane zagadnienia z zakresu wielowymiarowej analizy zbiorów danych. IPZ2A_W05, IPZ2A_W04, IPZ2A_W02, IPZ2A_W03 Kolokwium
M_W002 Student zna metody eksploracji danych. IPZ2A_W02, IPZ2A_W01 Kolokwium
Umiejętności: potrafi
M_U001 Student potrafi przeprowadzić analizę dużych zbiorów danych z wykorzystaniem programu R, testować hipotezy badawcze i formułować wnioski na podstawie osiągniętych wyników. IPZ2A_U02, IPZ2A_U01 Wykonanie ćwiczeń laboratoryjnych
M_U002 Student potrafi przeprowadzić zaawansowaną analizę zbioru danych. IPZ2A_U02, IPZ2A_U03, IPZ2A_U01 Wykonanie ćwiczeń laboratoryjnych
Kompetencje społeczne: jest gotów do
M_K001 Student potrafi określić priorytety działania dla grupy współpracujących osób oraz ma świadomość odpowiedzialności za powierzone zadania. IPZ2A_K01, IPZ2A_K03 Wykonanie ćwiczeń laboratoryjnych
Liczba godzin zajęć w ramach poszczególnych form zajęć:
SUMA (godz.)
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
27 9 0 18 0 0 0 0 0 0 0 0
Matryca kierunkowych efektów uczenia się w odniesieniu do form zajęć i sposobu zaliczenia, które pozwalają na ich uzyskanie
Kod MEU Student, który zaliczył moduł zajęć zna i rozumie/potrafi/jest gotów do Forma zajęć dydaktycznych
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
Wiedza
M_W001 Student zna wybrane zagadnienia z zakresu wielowymiarowej analizy zbiorów danych. + - + - - - - - - - -
M_W002 Student zna metody eksploracji danych. + - + - - - - - - - -
Umiejętności
M_U001 Student potrafi przeprowadzić analizę dużych zbiorów danych z wykorzystaniem programu R, testować hipotezy badawcze i formułować wnioski na podstawie osiągniętych wyników. - - + - - - - - - - -
M_U002 Student potrafi przeprowadzić zaawansowaną analizę zbioru danych. - - + - - - - - - - -
Kompetencje społeczne
M_K001 Student potrafi określić priorytety działania dla grupy współpracujących osób oraz ma świadomość odpowiedzialności za powierzone zadania. - - + - - - - - - - -
Nakład pracy studenta (bilans punktów ECTS)
Forma aktywności studenta Obciążenie studenta
Sumaryczne obciążenie pracą studenta 58 godz
Punkty ECTS za moduł 2 ECTS
Udział w zajęciach dydaktycznych/praktyka 27 godz
Przygotowanie do zajęć 10 godz
Samodzielne studiowanie tematyki zajęć 18 godz
Egzamin lub kolokwium zaliczeniowe 2 godz
Dodatkowe godziny kontaktowe 1 godz
Szczegółowe treści kształcenia w ramach poszczególnych form zajęć (szczegółowy program wykładów i pozostałych zajęć)
Wykład (9h):

1. Wprowadzenie do eksploracji danych. Język R.
2. Proces odkrywania wiedzy z danych a eksploracja danych. Zadania eksploracji danych.
3. Przygotowanie danych. Czyszczenie i transformacja danych.
4. Eksploracyjna analiza danych.
5. Metody klasyfikacji danych.
6. Reguły asocjacyjne.
7. Metody grupowania.

Ćwiczenia laboratoryjne (18h):

Wprowadzenie do R Studio. Biblioteki R.
Przygotowanie danych w R.
Czyszczenie i transformacja danych w R.
Eksploracyjna analiza danych w R.
Metody klasyfikacji danych w R.
Reguły asocjacyjne w R.
Metody grupowania w R.

Pozostałe informacje
Metody i techniki kształcenia:
  • Wykład: Treści prezentowane na wykładzie są przekazywane w formie prezentacji multimedialnej w połączeniu z klasycznym wykładem tablicowym wzbogaconymi o pokazy odnoszące się do prezentowanych zagadnień.
  • Ćwiczenia laboratoryjne: W trakcie zajęć laboratoryjnych studenci samodzielnie rozwiązują zadany problem praktyczny, dobierając odpowiednie narzędzia. Prowadzący stymuluje grupę do refleksji nad problemem, tak by otrzymane wyniki miały wysoką wartość merytoryczną.
Warunki i sposób zaliczenia poszczególnych form zajęć, w tym zasady zaliczeń poprawkowych, a także warunki dopuszczenia do egzaminu:

Ocena końcowa wyznaczana jest na podstawie oceny z pisemnego zaliczenia wykładów oraz oceny z ćwiczeń laboratoryjnych.
Zaliczenie wykładów oraz ćwiczeń laboratoryjnych – 1 termin podstawowy i 1 termin poprawkowy.
Zaliczenie ćwiczeń laboratoryjnych w formie kolokwium zaliczeniowego.

Zasady udziału w zajęciach:
  • Wykład:
    – Obecność obowiązkowa: Nie
    – Zasady udziału w zajęciach: Studenci uczestniczą w zajęciach poznając kolejne treści nauczania zgodnie z syllabusem przedmiotu. Studenci winni na bieżąco zadawać pytania i wyjaśniać wątpliwości. Rejestracja audiowizualna wykładu wymaga zgody prowadzącego.
  • Ćwiczenia laboratoryjne:
    – Obecność obowiązkowa: Tak
    – Zasady udziału w zajęciach: Studenci wykonują ćwiczenia laboratoryjne zgodnie z materiałami udostępnionymi przez prowadzącego. Student jest zobowiązany do przygotowania się w przedmiocie wykonywanego ćwiczenia.
Sposób obliczania oceny końcowej:

Ocena końcowa (OK) obliczana jest według algorytmu:
1) w przypadku uzyskania zaliczenia z wykładów i ćwiczeń w I terminie: OK = (2*Z+2*C)/4
2) w przypadku uzyskania zaliczenia z wykładów i ćwiczeń w II terminie (niezdania I terminu): OK = (2+Z+2+C)/4
gdzie: Z – ocena pozytywna z zaliczenia wykładów, C – ocena pozytywna z zaliczenia ćwiczeń.

Sposób i tryb wyrównywania zaległości powstałych wskutek nieobecności studenta na zajęciach:

W przypadku zaległości powstałych wskutek nieobecności studenta na zajęciach obowiązkowych – student jest zobowiązany do uczestnictwa w zajęciach innej grupy (tzw. odrobienie zajęć) lub wykonania dodatkowego opracowania w formie pisemnej na temat związany z opuszczonymi zajęciami.

Wymagania wstępne i dodatkowe, z uwzględnieniem sekwencyjności modułów :

Znajomość podstaw statystyki.

Zalecana literatura i pomoce naukowe:

Larose T.D., 2006: Odkrywanie wiedzy z danych. Wyd. Naukowe PWN, Warszawa
Hand D., Mannila H., .Smyth P., 2002: Principles of Data Mining, MIT Press
Wickham H., Grolemund G., 2018: Język R. Kompletny zestaw narzędzi dla analityków danych. Wyd. Helion O’Reilly, Gliwice

Publikacje naukowe osób prowadzących zajęcia związane z tematyką modułu:

Brzychczy E., 2007: Budowa modeli ekonometrycznych wybranych parametrów techniczno-ekonomicznych kopalni węgla kamiennego. Wiadomości Górnicze, 11
Brzychczy E., 2008: Analiza wykorzystania kombajnów chodnikowych w przodkach korytarzowych w kopalniach węgla kamiennego z zastosowaniem drzew decyzyjnych. Zarządzanie: doświadczenia i problemy. Red. W. Sitko. Wyd. System-Graf, Lublin
Brzychczy E., 2009: Analiza wyposażenia przodków ścianowych na podstawie reguł asocjacyjnych. Wiadomości Górnicze, R.60, nr 3
Brzychczy E., 2009: Techniki eksploracji danych w zagadnieniach eksploatacji górniczej złóż węgla kamiennego. Kwartalnik AGH, Górnictwo i Geoinżynieria, nr 3
Brzychczy E., Stefaniak R., Maroszek Z., Siodłak Ł., 2010: Wykorzystanie wybranych technik Data Mining do analizy kompleksów ścianowych w KWK “Ziemowit”. Miesięcznik WUG Bezpieczeństwo i Ochrona Pracy w Górnictwie, nr 1
Kęsek M., Wykorzystanie metod eksploracji danych w zarządzaniu produkcją w kopalni węgla kamiennego. Wiadomości Górnicze R. 65 nr 4, 2014 Kęsek M., Zastosowanie wybranych metod eksploracji danych w systemie wspomagającym zarządzanie produkcją w kopalni węgla kamiennego.
Wydawnictwa AGH, Kraków 2013.
Kęsek M., Drzewa decyzyjne jako źródło pozyskiwania wiedzy o procesie produkcyjnym w kopalni węgla kamiennego. W: Szanse i bariery rozwoju przemysłu górniczego, „Śląsk”, Katowice 2013
Kęsek M., Reguły wnioskowania we wspomaganiu podejmowania decyzji w górnictwie. W: Szanse i bariery w rozwoju górnictwa węgla kamiennego, Gliwice, 2012
Kęsek M., Wybrane typy reprezentacji wiedzy pozyskiwanej w górnictwie. Przegląd Górniczy t. 68 nr 9, 2012
Kęsek M., Możliwości integracji języka R w zintegrowanym systemie zarządzania przedsiębiorstwem górniczym. W: Komputerowo zintegrowane zarządzanie, Opole, 2011
Kęsek M., Język R w odkrywaniu wiedzy górniczej. Przegląd Górniczy, 2010 t. 66 nr 9, Katowice, 2010
Kęsek M., Data Mining w przemyśle wydobywczym. Monografie naukowe Akademii Górniczo-Hutniczej w Krakowie, Kraków : AGH WGiG, 2007

Informacje dodatkowe:

Zaliczenie wykładów w formie pisemnej – 5 pytań opisowych.