Moduł oferowany także w ramach programów studiów:
Informacje ogólne:
Nazwa:
Speech Processing
Tok studiów:
2019/2020
Kod:
IETE-1-706-s
Wydział:
Informatyki, Elektroniki i Telekomunikacji
Poziom studiów:
Studia I stopnia
Specjalność:
-
Kierunek:
Electronics and Telecommunications
Semestr:
7
Profil:
Ogólnoakademicki (A)
Język wykładowy:
Angielski
Forma studiów:
Stacjonarne
Prowadzący moduł:
dr inż. Gałka Jakub (jgalka@agh.edu.pl)
Treści programowe zapewniające uzyskanie efektów uczenia się dla modułu zajęć

Opis efektów uczenia się dla modułu zajęć
Kod MEU Student, który zaliczył moduł zajęć zna i rozumie/potrafi/jest gotów do Powiązania z KEU Sposób weryfikacji i oceny efektów uczenia się osiągniętych przez studenta w ramach poszczególnych form zajęć i dla całego modułu zajęć
Wiedza: zna i rozumie
M_W001 Student knows basics of speech technologies ETE1A_W01, ETE1A_W16, ETE1A_W10 Zaliczenie laboratorium
Umiejętności: potrafi
M_U001 Student can programme basic speech synthesiser. ETE1A_U07 Zaliczenie laboratorium
M_U002 Student can programme basic speech analysis application. ETE1A_U07 Zaliczenie laboratorium
M_U003 Student can programme basic speech recognition applications. ETE1A_U07 Zaliczenie laboratorium
Liczba godzin zajęć w ramach poszczególnych form zajęć:
SUMA (godz.)
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
38 24 0 14 0 0 0 0 0 0 0 0
Matryca kierunkowych efektów uczenia się w odniesieniu do form zajęć i sposobu zaliczenia, które pozwalają na ich uzyskanie
Kod MEU Student, który zaliczył moduł zajęć zna i rozumie/potrafi/jest gotów do Forma zajęć dydaktycznych
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
Wiedza
M_W001 Student knows basics of speech technologies + - - - - - - - - - -
Umiejętności
M_U001 Student can programme basic speech synthesiser. - - + - - - - - - - -
M_U002 Student can programme basic speech analysis application. - - + - - - - - - - -
M_U003 Student can programme basic speech recognition applications. - - + - - - - - - - -
Nakład pracy studenta (bilans punktów ECTS)
Forma aktywności studenta Obciążenie studenta
Sumaryczne obciążenie pracą studenta 78 godz
Punkty ECTS za moduł 3 ECTS
Udział w zajęciach dydaktycznych/praktyka 38 godz
Przygotowanie do zajęć 20 godz
przygotowanie projektu, prezentacji, pracy pisemnej, sprawozdania 5 godz
Samodzielne studiowanie tematyki zajęć 15 godz
Szczegółowe treści kształcenia w ramach poszczególnych form zajęć (szczegółowy program wykładów i pozostałych zajęć)
Wykład (24h):

Introduction and general scheme of ASR.
Speech and language resources available for automatic speech recognition.
Bayes Rule, Maximum A-posteriori Probability (MAP).
Speech parameterisation and segmentation (mel frequency cepstral coefficients (MFCC), perceptual linear predictive analysis (PLP)).
Speech modelling (hidden Markov model (HMM), artificial neural networks (ANN)).
Decoding, Vitterbi algorithm
Dictionaries in computer systems, Levenshtein metric
Grammar modelling (parsers, n-grams, part of speech taggers).
Semantic modelling (bag-of-words, wordnet, vector space model).

Ćwiczenia laboratoryjne (14h):

Developing speech processing applications based on available toolkits.

Pozostałe informacje
Metody i techniki kształcenia:
  • Wykład: Treści prezentowane na wykładzie są przekazywane w formie prezentacji multimedialnej w połączeniu z klasycznym wykładem tablicowym wzbogaconymi o pokazy odnoszące się do prezentowanych zagadnień.
  • Ćwiczenia laboratoryjne: W trakcie zajęć laboratoryjnych studenci samodzielnie rozwiązują zadany problem praktyczny, dobierając odpowiednie narzędzia. Prowadzący stymuluje grupę do refleksji nad problemem, tak by otrzymane wyniki miały wysoką wartość merytoryczną.
Warunki i sposób zaliczenia poszczególnych form zajęć, w tym zasady zaliczeń poprawkowych, a także warunki dopuszczenia do egzaminu:

Zasady udziału w zajęciach:
  • Wykład:
    – Obecność obowiązkowa: Nie
    – Zasady udziału w zajęciach: Studenci uczestniczą w zajęciach poznając kolejne treści nauczania zgodnie z syllabusem przedmiotu. Studenci winni na bieżąco zadawać pytania i wyjaśniać wątpliwości. Rejestracja audiowizualna wykładu wymaga zgody prowadzącego.
  • Ćwiczenia laboratoryjne:
    – Obecność obowiązkowa: Tak
    – Zasady udziału w zajęciach: Studenci wykonują ćwiczenia laboratoryjne zgodnie z materiałami udostępnionymi przez prowadzącego. Student jest zobowiązany do przygotowania się w przedmiocie wykonywanego ćwiczenia, co może zostać zweryfikowane kolokwium w formie ustnej lub pisemnej. Zaliczenie zajęć odbywa się na podstawie zaprezentowania rozwiązania postawionego problemu. Zaliczenie modułu jest możliwe po zaliczeniu wszystkich zajęć laboratoryjnych.
Sposób obliczania oceny końcowej:

Based on work at laboratory

Sposób i tryb wyrównywania zaległości powstałych wskutek nieobecności studenta na zajęciach:

Wymagania wstępne i dodatkowe, z uwzględnieniem sekwencyjności modułów :

Signal Processing

Zalecana literatura i pomoce naukowe:

D. Jurafsky, J. H. Martin, SPEECH and LANGUAGE PROCESSING. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition Second Edition”, Pearson Prentice Hall, 2008
L. R. Rabiner, A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition PDF
HMM w MIT, week #5, lecture #10: www.ocw.mit.edu
http://class.coursera.org/nlp
http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-345-automatic-speech-recognition-spring-2003/
http://nlp.ipipan.waw.pl/wiki/clip

Publikacje naukowe osób prowadzących zajęcia związane z tematyką modułu:

http://www.dsp.agh.edu.pl/pl:publications

Informacje dodatkowe:

Brak