Moduł oferowany także w ramach programów studiów:
Informacje ogólne:
Nazwa:
Analiza i Bazy Danych
Tok studiów:
2019/2020
Kod:
EAiR-1-503-s
Wydział:
Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
Poziom studiów:
Studia I stopnia
Specjalność:
-
Kierunek:
Automatyka i Robotyka
Semestr:
5
Profil:
Ogólnoakademicki (A)
Język wykładowy:
Polski
Forma studiów:
Stacjonarne
Strona www:
 
Prowadzący moduł:
dr hab. inż. Baranowski Jerzy (jb@agh.edu.pl)
Treści programowe zapewniające uzyskanie efektów uczenia się dla modułu zajęć

Moduł ma na celu zapoznanie studentów z podstawowymi informacjami i wykształcenie u nich najważniejszych umiejętności związanych z szeroko pojętą analizą danych. W tym zakresie obejmujemy m.in. elementy baz danych, obróbkę wstępną danych, tworzenie modeli i ich interpretację.

Opis efektów uczenia się dla modułu zajęć
Kod MEU Student, który zaliczył moduł zajęć zna i rozumie/potrafi/jest gotów do Powiązania z KEU Sposób weryfikacji i oceny efektów uczenia się osiągniętych przez studenta w ramach poszczególnych form zajęć i dla całego modułu zajęć
Wiedza: zna i rozumie
M_W001 Student zna podstawową terminologię związana z relacyjnymi bazami danych i zasady tworzenia modeli relacyjnych baz danych AiR1A_W04 Wykonanie ćwiczeń laboratoryjnych
M_W002 Student zna podstawowe metody analizy danych i terminologię z tym związaną AiR1A_W04 Wykonanie ćwiczeń laboratoryjnych,
Aktywność na zajęciach
Umiejętności: potrafi
M_U001 Student potrafi tworzyć zapytania SQL i analizować relację pomiędzy danymi AiR1A_U01 Wykonanie ćwiczeń laboratoryjnych,
Aktywność na zajęciach
M_U002 Student potrafi przeprowadzić analizę zbioru danych, stworzyć adekwatnego modelu i ocenić jego przydatność. AiR1A_U01 Wykonanie ćwiczeń laboratoryjnych
Kompetencje społeczne: jest gotów do
M_K001 Zna i rozumie znaczenie analizy danych oraz baz danych w społeczeństwie. AiR1A_K02 Wykonanie ćwiczeń laboratoryjnych
Liczba godzin zajęć w ramach poszczególnych form zajęć:
SUMA (godz.)
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
56 28 0 28 0 0 0 0 0 0 0 0
Matryca kierunkowych efektów uczenia się w odniesieniu do form zajęć i sposobu zaliczenia, które pozwalają na ich uzyskanie
Kod MEU Student, który zaliczył moduł zajęć zna i rozumie/potrafi/jest gotów do Forma zajęć dydaktycznych
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
Wiedza
M_W001 Student zna podstawową terminologię związana z relacyjnymi bazami danych i zasady tworzenia modeli relacyjnych baz danych + - + - - - - - - - -
M_W002 Student zna podstawowe metody analizy danych i terminologię z tym związaną + - + - - - - - - - -
Umiejętności
M_U001 Student potrafi tworzyć zapytania SQL i analizować relację pomiędzy danymi - - + - - - - - - - -
M_U002 Student potrafi przeprowadzić analizę zbioru danych, stworzyć adekwatnego modelu i ocenić jego przydatność. - - + - - - - - - - -
Kompetencje społeczne
M_K001 Zna i rozumie znaczenie analizy danych oraz baz danych w społeczeństwie. + - + - - - - - - - -
Nakład pracy studenta (bilans punktów ECTS)
Forma aktywności studenta Obciążenie studenta
Sumaryczne obciążenie pracą studenta 104 godz
Punkty ECTS za moduł 4 ECTS
Udział w zajęciach dydaktycznych/praktyka 56 godz
Przygotowanie do zajęć 28 godz
przygotowanie projektu, prezentacji, pracy pisemnej, sprawozdania 20 godz
Szczegółowe treści kształcenia w ramach poszczególnych form zajęć (szczegółowy program wykładów i pozostałych zajęć)
Wykład (28h):

1. Wprowadzenie do analizy danych
2. Podstawowe pojęcia związane z relacyjnymi bazami danych
3. Mechanizmy działania serwerów relacyjnych baz danych
4. Zasada ACID w relacyjnych bazach danych
5. Sposoby reprezentacji danych w relacyjnych bazach danych
6. Język R i jego zastosowania
7. Przetwarzanie wstępne i dzielenie danych
8. Regresja liniowa
9. Regresja logistyczna
10. Analiza składowych głównych
11. Metody klasyfikacji
12. Klasteryzacja (analiza skupień)
13. Ewaluacja modeli

Ćwiczenia laboratoryjne (28h):

  1. Wprowadzenie do języka R
  2. Przetwarzanie wstępne danych
  3. Konstrukcja zapytań Select
  4. Łączenie tabel w zapytaniach
  5. Funkcje agregacyjne w zapytaniach
  6. Zapytania dotyczące łańcuchów znaków używające wyrażenia regularne
  7. Regresja liniowa
  8. Regresja logistyczna
  9. Ewaluacja modeli
  10. Klasyfikatory
  11. Klasteryzacja
  12. Algorytm postępowania w analizie danych

Pozostałe informacje
Metody i techniki kształcenia:
  • Wykład: Treści prezentowane na wykładzie są przekazywane w formie prezentacji multimedialnej w połączeniu z klasycznym wykładem tablicowym wzbogaconymi o pokazy odnoszące się do prezentowanych zagadnień.
  • Ćwiczenia laboratoryjne: W trakcie zajęć laboratoryjnych studenci samodzielnie rozwiązują zadany problem praktyczny, dobierając odpowiednie narzędzia. Prowadzący stymuluje grupę do refleksji nad problemem, tak by otrzymane wyniki miały wysoką wartość merytoryczną.
Warunki i sposób zaliczenia poszczególnych form zajęć, w tym zasady zaliczeń poprawkowych, a także warunki dopuszczenia do egzaminu:
  1. Warunkiem uzyskania zaliczenia ćwiczeń laboratoryjnych jest obecność oraz uzyskanie pozytywnej oceny z tych zajęć. Więcej niż jedna nieobecność nieusprawiedliwiona powoduje brak zaliczenia przedmiotu, przy czym nieobecności usprawiedliwić należy w terminie do 2 tygodni (licząc od końca okresu nieobecności). W przypadku dłuższych lub częstych nieobecności usprawiedliwionych (3 lub więcej) należy zgłosić się do prowadzącego w celu ustalenia sposobu nadrobienia i zaliczenia zaległości.
  2. Warunkiem zaliczenia wykładu jest test
  3. Student ma prawo do jednego poprawkowego zaliczenia ćwiczeń laboratoryjnych w przypadku braku więcej niż jednej nieobecności nieusprawiedliwionej.
  4. Student ma prawo do jednego poprawkowego zaliczenia testu z wykładu w przypadku braku więcej niż jednej nieobecności nieusprawiedliwionej.
Zasady udziału w zajęciach:
  • Wykład:
    – Obecność obowiązkowa: Nie
    – Zasady udziału w zajęciach: Studenci uczestniczą w zajęciach poznając kolejne treści nauczania zgodnie z syllabusem przedmiotu. Studenci winni na bieżąco zadawać pytania i wyjaśniać wątpliwości. Rejestracja audiowizualna wykładu wymaga zgody prowadzącego.
  • Ćwiczenia laboratoryjne:
    – Obecność obowiązkowa: Tak
    – Zasady udziału w zajęciach: Studenci wykonują ćwiczenia laboratoryjne zgodnie z materiałami udostępnionymi przez prowadzącego. Student jest zobowiązany do przygotowania się w przedmiocie wykonywanego ćwiczenia, co może zostać zweryfikowane kolokwium w formie ustnej lub pisemnej. Zaliczenie zajęć odbywa się na podstawie zaprezentowania rozwiązania postawionego problemu.
Sposób obliczania oceny końcowej:
  1. Ocena z ćwiczeń laboratoryjnych jest równa ocenie ze sprawozdań z zadań realizowanych w ramach ćwiczeń laboratoryjnych.
  2. Jeżeli w trakcie procedury zaliczania prowadzący stwierdzi niesamodzielność pracy studenta lub korzystanie przez niego z niedozwolonych materiałów, student otrzymuje ocenę niedostateczną z tego zaliczenia.
  3. Ocena końcowa z przedmiotu jest średniej arytmetycznej uzyskanych ocen
  4. W przypadku zaliczenia ćwiczeń w terminie poprawkowym, ocena końcowa wyznaczana jest jako średnia arytmetyczna z ocen z wszystkich dotychczasowych terminów, przy czym wystawiana jest ocena co najmniej 3,0.
Sposób i tryb wyrównywania zaległości powstałych wskutek nieobecności studenta na zajęciach:

Uzupełnianie zaległości (usprawiedliwionych) odbywa się na zajęciach innych grup laboratoryjnych. W przypadku braku dostępnych terminów konieczne jest ustalenie terminu i sposobu odrabiania zajęć indywidualnie z prowadzącym.

Wymagania wstępne i dodatkowe, z uwzględnieniem sekwencyjności modułów :

Zaliczenie z przedmiotów Eksploracja Danych, Rachunek Prawdopodobieństwa i Statystyka, Narzędzia Pracy Grupowej

Zalecana literatura i pomoce naukowe:
  1. Connolly T., Begg C.: Database Systems: A Practical Approach to Design, Implementation and Management, Addison Wesley, 2009.
  2. Tiwari S.: Professional NoSQL, Wiley and Sons, 2011.
  3. Garcia-Mollina H., Ullman J.D., Widom J.: Database Systems the Complete Book, Prentice Hall, 2008.
  4. Microsoft on Edx, Developing SQL Databases, online course: https://www.edx.org/course/developing-sql-databases-0
  5. Microsoft on Edx, Introduction to NoSQL Data Solutions, online course: #https://courses.edx.org/courses/course-v1:Microsoft+DAT221x+3T2018
  6. Zumel N., Mount J. Practical Data Science with R, Manning, 2019
  7. G. James, D. Witten, T. Hastie, and R. Tibshirani. An Introduction to Statistical Learning: with Appli- cations in R. Springer Texts in Statistics. Springer New York, 2013.
Publikacje naukowe osób prowadzących zajęcia związane z tematyką modułu:
  1. Bania, P., Baranowski, J.
    Approximation of optimal filter for Ornstein–Uhlenbeck process with quantised discrete-time observation
    (2018) International Journal of Control, .
  2. Baranowski, J., Bania, P., Prasad, I., Cong, T.
    Bayesian fault detection and isolation using Field Kalman Filter
    (2017) Eurasip Journal on Advances in Signal Processing, .
  3. Bania, P., Baranowski, J.
    Bayesian estimator of a faulty state: Logarithmic odds approach
    (2017) 2017 22nd International Conference on Methods and Models in Automation and Robotics, MMAR 2017, .
  4. Stief, A., Ottewill, J.R., Orkisz, M., Baranowski, J.
    Two stage data fusion of acoustic, electric and vibration signals for diagnosing faults in induction motors
    (2017) Elektronika ir Elektrotechnika, .
  5. Bania, P., Baranowski, J.
    Field Kalman Filter and its approximation
    (2016) 2016 IEEE 55th Conference on Decision and Control, CDC 2016, .
  6. Chilinski, J., Bauer, W., Baranowski, J.
    Bayesian analysis of EEG signal frequency components
    (2016) 2016 21st International Conference on Methods and Models in Automation and Robotics, MMAR 2016, .
Informacje dodatkowe:

brak