Moduł oferowany także w ramach programów studiów:
Informacje ogólne:
Nazwa:
Modelowanie w data mining
Tok studiów:
2019/2020
Kod:
HIFS-1-503-s
Wydział:
Humanistyczny
Poziom studiów:
Studia I stopnia
Specjalność:
-
Kierunek:
Informatyka Społeczna
Semestr:
5
Profil:
Praktyczny (P)
Język wykładowy:
Polski
Forma studiów:
Stacjonarne
Strona www:
 
Prowadzący moduł:
dr inż. Gałka Jakub (jgalka@agh.edu.pl)
Treści programowe zapewniające uzyskanie efektów uczenia się dla modułu zajęć

Zajęcia mają na celu zapoznanie studentów z narzędziami informatycznymi stosowanymi do modelowania danych i procesów.

Opis efektów uczenia się dla modułu zajęć
Kod MEU Student, który zaliczył moduł zajęć zna i rozumie/potrafi/jest gotów do Powiązania z KEU Sposób weryfikacji i oceny efektów uczenia się osiągniętych przez studenta w ramach poszczególnych form zajęć i dla całego modułu zajęć
Wiedza: zna i rozumie
M_W001 Student zna narzędzia informatyczne stosowane do modelowania danych i procesów. IFS1P_W09 Kolokwium
M_W002 Student zna typowe obszary zastosowań różnych metod modelowania danych i procesów. IFS1P_W03 Kolokwium,
Egzamin
M_W003 Student zna pojęcie modelu i modelowania oraz różne rodzaje metod modelowania danych i procesów, zasady ich działania oraz właściwości IFS1P_W01 Egzamin
Umiejętności: potrafi
M_U001 Student potrafi za pomocą narzędzi komputerowych zdefiniować, dopasować oraz wykorzystać opracowany model dla przyjętego zbioru danych. IFS1P_U04 Wykonanie ćwiczeń,
Kolokwium
M_U002 Student potrafi ocenić ograniczenia przyjętego modelu oraz oszacować zakres jego stosowalności. IFS1P_U03 Kolokwium,
Egzamin
M_U003 Student na podstawie znajomości charakteru danych lub procesu potrafi dobrać odpowiednią metodę ich modelowania IFS1P_U01 Wykonanie ćwiczeń,
Kolokwium,
Egzamin
Kompetencje społeczne: jest gotów do
M_K001 Student potrafi wyciągać wnioski przeprowadzanych analiz i modelowania i odnosić je na rzeczywistość społeczno-gospodarczą. IFS1P_K04
M_K002 Student rozumie ograniczenia stosowania modeli, jako uproszczenia rzeczywistości. IFS1P_K02 Udział w dyskusji,
Kolokwium
M_K003 Student zna wagę praktyczną stosowania modeli systemów i procesów w kontekście społecznym i gospodarczym. IFS1P_U13 Udział w dyskusji
Liczba godzin zajęć w ramach poszczególnych form zajęć:
SUMA (godz.)
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
60 30 0 0 30 0 0 0 0 0 0 0
Matryca kierunkowych efektów uczenia się w odniesieniu do form zajęć i sposobu zaliczenia, które pozwalają na ich uzyskanie
Kod MEU Student, który zaliczył moduł zajęć zna i rozumie/potrafi/jest gotów do Forma zajęć dydaktycznych
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
Wiedza
M_W001 Student zna narzędzia informatyczne stosowane do modelowania danych i procesów. + - - + - - - - - - -
M_W002 Student zna typowe obszary zastosowań różnych metod modelowania danych i procesów. + - - + - - - - - - -
M_W003 Student zna pojęcie modelu i modelowania oraz różne rodzaje metod modelowania danych i procesów, zasady ich działania oraz właściwości + - - + - - - - - - -
Umiejętności
M_U001 Student potrafi za pomocą narzędzi komputerowych zdefiniować, dopasować oraz wykorzystać opracowany model dla przyjętego zbioru danych. + - - + - - - - - - -
M_U002 Student potrafi ocenić ograniczenia przyjętego modelu oraz oszacować zakres jego stosowalności. + - - + - - - - - - -
M_U003 Student na podstawie znajomości charakteru danych lub procesu potrafi dobrać odpowiednią metodę ich modelowania + - - + - - - - - - -
Kompetencje społeczne
M_K001 Student potrafi wyciągać wnioski przeprowadzanych analiz i modelowania i odnosić je na rzeczywistość społeczno-gospodarczą. + - - + - - - - - - -
M_K002 Student rozumie ograniczenia stosowania modeli, jako uproszczenia rzeczywistości. + - - + - - - - - - -
M_K003 Student zna wagę praktyczną stosowania modeli systemów i procesów w kontekście społecznym i gospodarczym. + - - + - - - - - - -
Nakład pracy studenta (bilans punktów ECTS)
Forma aktywności studenta Obciążenie studenta
Sumaryczne obciążenie pracą studenta 132 godz
Punkty ECTS za moduł 5 ECTS
Udział w zajęciach dydaktycznych/praktyka 60 godz
Przygotowanie do zajęć 30 godz
Samodzielne studiowanie tematyki zajęć 35 godz
Egzamin lub kolokwium zaliczeniowe 2 godz
Dodatkowe godziny kontaktowe 5 godz
Szczegółowe treści kształcenia w ramach poszczególnych form zajęć (szczegółowy program wykładów i pozostałych zajęć)
Wykład (30h):

1. Definicje modelowania danych i modelowania procesów
2. Zastosowania metod modelowania danych
3. Wielowymiarowe i wielorakie zmienne losowe – wybrane właściwości
4. Regresja liniowa, logistyczna i wieloraka – definicje, właściwości i zastosowania
5. Statystyczne modele generatywne
a. Mikstury Gaussa (GMM), definicja modelu
b. Estymacja parametrów modelu
c. Kryterium Maximum Likelihood, algorytm Expectation Maximization
d. Kryterium Maximum A-Posteriori
e. Kryteria informacyjne: Bayesa, entropii, informacji wspólnej, Akaike
6. Modelowanie procesów
a. Parametryzacja i modelowanie szeregów czasowych
b. Reguła Bellmana, problem najkrótszej ścieżki
c. Nieliniowe dopasowanie czasowe
d. Proces Markowa – definicja i właściwości, elementy systemów kolejkowych
e. Niejawne modele Markowa (HMM) i ich zastosowania
f. Algorytm Viterbiego
g. Estymacja parametrów HMM
h. Losowe pola Markowa
i. Dynamiczne sieci Bayesa
7. Modelowanie nieparametryczne
a. Histogramy i okna Parzena
b. Drzewa regresji
c. Krzywe sklejane, metody jądrowe

Ćwiczenia projektowe (30h):

1. Definicje modelowania danych i modelowania procesów
2. Zastosowania metod modelowania danych
3. Wielowymiarowe i wielorakie zmienne losowe – wybrane właściwości
4. Regresja liniowa, logistyczna i wieloraka – definicje, właściwości i zastosowania
5. Statystyczne modele generatywne
a. Mikstury Gaussa (GMM), definicja modelu
b. Estymacja parametrów modelu
c. Kryterium Maximum Likelihood, algorytm Expectation Maximization
d. Kryterium Maximum A-Posteriori
e. Kryteria informacyjne: Bayesa, entropii, informacji wspólnej, Akaike
6. Modelowanie procesów
a. Parametryzacja i modelowanie szeregów czasowych
b. Reguła Bellmana, problem najkrótszej ścieżki
c. Nieliniowe dopasowanie czasowe
d. Proces Markowa – definicja i właściwości, elementy systemów kolejkowych
e. Niejawne modele Markowa (HMM) i ich zastosowania
f. Algorytm Viterbiego
g. Estymacja parametrów HMM
h. Losowe pola Markowa
i. Dynamiczne sieci Bayesa
7. Modelowanie nieparametryczne
a. Histogramy i okna Parzena
b. Drzewa regresji
c. Krzywe sklejane, metody jądrowe

Pozostałe informacje
Metody i techniki kształcenia:
  • Wykład: Treści prezentowane na wykładzie są przekazywane w formie prezentacji multimedialnej w połączeniu z klasycznym wykładem wzbogaconymi o przykłady odnoszące się do prezentowanych zagadnień.
  • Ćwiczenia projektowe: Studenci wykonują zadany projekt samodzielnie, bez większej ingerencji prowadzącego. Ma to wykształcić poczucie odpowiedzialności za pracę w grupie oraz odpowiedzialności za podejmowane decyzje.
Warunki i sposób zaliczenia poszczególnych form zajęć, w tym zasady zaliczeń poprawkowych, a także warunki dopuszczenia do egzaminu:

Przed przystąpieniem do egzaminu student musi uzyskać zaliczenie z ćwiczeń. W późniejszych terminach zasady nie ulegają zmianie.

Zasady udziału w zajęciach:
  • Wykład:
    – Obecność obowiązkowa: Tak
    – Zasady udziału w zajęciach: Studenci uczestniczą w zajęciach poznając kolejne treści nauczania zgodnie z syllabusem przedmiotu. Studenci winni na bieżąco zadawać pytania i wyjaśniać wątpliwości. Rejestracja audiowizualna wykładu wymaga zgody prowadzącego.
  • Ćwiczenia projektowe:
    – Obecność obowiązkowa: Tak
    – Zasady udziału w zajęciach: Studenci wykonują prace praktyczne mające na celu uzyskanie kompetencji zakładanych przez syllabus. Ocenie podlega sposób wykonania projektu oraz efekt końcowy.
Sposób obliczania oceny końcowej:

Egzamin 60%
Kolokwium 40%:wykonanie ćwiczeń praktycznych 80%, udział w dyskusji 20%

Sposób i tryb wyrównywania zaległości powstałych wskutek nieobecności studenta na zajęciach:

Zaległości student uzupełnia w porozumieniu z prowadzącym,

Wymagania wstępne i dodatkowe, z uwzględnieniem sekwencyjności modułów :

• Znajomość podstawowych zagadnień analizy statystycznej
• Znajomość metod wielowymiarowej analizy danych
• Umiejętność posługiwania się w podstawowym zakresie wybranym skryptowym językiem programowania (np. Python, R, Matlab)

Zalecana literatura i pomoce naukowe:

• J. Koronacki, J. Ćwik, Statystyczne systemy uczące się, Wydanie 2., Wyd. Exit, 2008
• M. Krzyśko, W. Wołyński, T. Górecki, M. Skorzybut, „Systemy uczące się”, WNT, Warszawa 2008
• Amir D. Aczel, „Statystyka w zarządzaniu”, Wydawnictwo Naukowe PWN, Warszawa 2000
• B. Ziółko, M. Ziółko, „Przetwarzanie mowy”, Wydawnictwa AGH, Kraków 2011
• R. Duda, P. Hart, D. Stork, “Pattern Classification”, 2nd ed., Wiley 2000

Publikacje naukowe osób prowadzących zajęcia związane z tematyką modułu:

M. MĄSIOR, M. IGRAS, M. ZIÓŁKO, S. KACPRZAK: Baza danych nagrań mowy dla analizy porównawczej rożnojęzycznych fonemów — Database of speech recordings for comparative analysis of multi-language phonemes. Studia Informatica; ISSN 0208-7286 – 2013 vol. 34 no. 2B, s. 79–87.
2. B. ZIÓŁKO, W. Kozłowski, M. ZIÓŁKO, R. SAMBORSKI, D. Sierra, J. GAŁKA: Hybrid Wavelet-Fourier-HMM speaker recognition. International Journal of Hybrid Information Technology; ISSN 1738-9968 — 2011 vol. 4 no. 4, s. 25–41.

Doświadczenie zawodowe pozaakademickie:
Dr inż. Jakub Gałka jest szefem działu R&D w VoicePIN.com Sp. z o.o. oraz współzałożycielem spin-off’a Techmo Sp. z o.o. Jest członkiem Stowarzyszenia Top500 Innovators i absolwentem szkoleń na temat innowacyjności w Stanford University.
W swojej pracy naukowej zajmuje się rozwijaniem technologii przetwarzania mowy a także systemami biometrycznymi, analizą danych i uczeniem maszynowym. Prowadzi projekty badawczo-rozwojowe oraz zajmuje się wdrażaniem nowych technologii w praktyce gospodarczej (pierwsze w Polsce wdrożenie biometrii głosowej w bankowości mobilnej). Jest autorem oraz recenzentem publikacji naukowych w czasopismach z listy filadelfijskiej. Zdobywca krajowych i międzynarodowych nagród za działalność wynalazczą. Wspiera i rozwija działalność innowacyjną w środowisku akademickim i start-up’owym Krakowa. Jest laureatem Top10 Startup Alley na Tech Crunch Disrupt w San Francisco oraz zwycięzcą Tech Crunch Meetup Kraków 2015 (z VoicePIN.com).

Informacje dodatkowe:

brak