Moduł oferowany także w ramach programów studiów:
Informacje ogólne:
Nazwa:
Statistical signal processing in audio and speech applications
Tok studiów:
2019/2020
Kod:
ZSDA-3-0263-s
Wydział:
Szkoła Doktorska AGH
Poziom studiów:
Studia III stopnia
Specjalność:
-
Kierunek:
Szkoła Doktorska AGH
Semestr:
0
Profil:
Ogólnoakademicki (A)
Język wykładowy:
Angielski
Forma studiów:
Stacjonarne
Prowadzący moduł:
dr hab. inż, prof. AGH Kowalczyk Konrad (konrad.kowalczyk@agh.edu.pl)
Dyscypliny:
automatyka, elektronika i elektrotechnika, informatyka, informatyka techniczna i telekomunikacja, inżynieria biomedyczna, inżynieria mechaniczna
Treści programowe zapewniające uzyskanie efektów uczenia się dla modułu zajęć

The aim of this course is to get acquainted with statistical signal processing with applications of studied techniques in the context of speech and audio

This course is available from semester IV (summer semester 2020/20201) at the earliest

Opis efektów uczenia się dla modułu zajęć
Kod MEU Student, który zaliczył moduł zajęć zna i rozumie/potrafi/jest gotów do Powiązania z KEU Sposób weryfikacji i oceny efektów uczenia się osiągniętych przez studenta w ramach poszczególnych form zajęć i dla całego modułu zajęć
Wiedza: zna i rozumie
M_W001 Student knows and understands the basics of statistical signal processing SDA3A_W03, SDA3A_W02, SDA3A_W01 Zaliczenie laboratorium,
Wykonanie ćwiczeń laboratoryjnych,
Kolokwium,
Aktywność na zajęciach
M_W002 Student knows statistical processing for reducing noise and reverberation, student knows spatial audio processing techniques, student knows speech and audio coding schemes, student knows deep learning methods applied to speech and audio. SDA3A_W03, SDA3A_W02, SDA3A_W01 Zaliczenie laboratorium,
Wykonanie ćwiczeń laboratoryjnych,
Kolokwium,
Aktywność na zajęciach
M_W003 Student knows statistical signal processing methods used in audio and speech applications. SDA3A_W03, SDA3A_W02, SDA3A_W01 Zaliczenie laboratorium,
Kolokwium,
Aktywność na zajęciach
Umiejętności: potrafi
M_U001 Student is able to select and perform appropriate evaluation of several algorithms that realize statistical signal processing in audio and speech applications. SDA3A_U03, SDA3A_U02, SDA3A_U01 Zaliczenie laboratorium,
Wykonanie ćwiczeń laboratoryjnych,
Kolokwium,
Aktywność na zajęciach
M_U002 Student is able to apply selected methods of statistical signal processing. SDA3A_U01 Projekt
M_U003 Student is able to implement algorithms specific to audio and speech applications. SDA3A_U02, SDA3A_U01 Projekt,
Zaliczenie laboratorium,
Wykonanie ćwiczeń laboratoryjnych
Kompetencje społeczne: jest gotów do
M_K001 Student is able to present the effects of his/her work and explain technical details of applied methods. SDA3A_K01 Projekt,
Prezentacja,
Zaliczenie laboratorium,
Aktywność na zajęciach
Liczba godzin zajęć w ramach poszczególnych form zajęć:
SUMA (godz.)
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
46 18 0 14 0 0 0 14 0 0 0 0
Matryca kierunkowych efektów uczenia się w odniesieniu do form zajęć i sposobu zaliczenia, które pozwalają na ich uzyskanie
Kod MEU Student, który zaliczył moduł zajęć zna i rozumie/potrafi/jest gotów do Forma zajęć dydaktycznych
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
Wiedza
M_W001 Student knows and understands the basics of statistical signal processing + - - - - - - - - - -
M_W002 Student knows statistical processing for reducing noise and reverberation, student knows spatial audio processing techniques, student knows speech and audio coding schemes, student knows deep learning methods applied to speech and audio. + - - - - - - - - - -
M_W003 Student knows statistical signal processing methods used in audio and speech applications. + - + - - - + - - - -
Umiejętności
M_U001 Student is able to select and perform appropriate evaluation of several algorithms that realize statistical signal processing in audio and speech applications. + - + - - - + - - - -
M_U002 Student is able to apply selected methods of statistical signal processing. - - + - - - + - - - -
M_U003 Student is able to implement algorithms specific to audio and speech applications. - - + - - - + - - - -
Kompetencje społeczne
M_K001 Student is able to present the effects of his/her work and explain technical details of applied methods. + - + - - - + - - - -
Nakład pracy studenta (bilans punktów ECTS)
Forma aktywności studenta Obciążenie studenta
Sumaryczne obciążenie pracą studenta 80 godz
Punkty ECTS za moduł 4 ECTS
Udział w zajęciach dydaktycznych/praktyka 46 godz
Przygotowanie do zajęć 15 godz
Samodzielne studiowanie tematyki zajęć 15 godz
Egzamin lub kolokwium zaliczeniowe 2 godz
Dodatkowe godziny kontaktowe 2 godz
Szczegółowe treści kształcenia w ramach poszczególnych form zajęć (szczegółowy program wykładów i pozostałych zajęć)
Wykład (18h):

Lectures:

1. Introduction to statistical signal processing:
Stochastic signals, stationarity, ergodicity, covariance matrix, higher-order moments, principle component analysis

2, 3 i 4. Speech and audio signal enhancement:
Wiener filter, beamforming, signal and multichannel techniques for noise and reverberation suppression

5. Spatial audio processing:
Ambisonics, spherical harmonics, parametric spatial audio

6. Speech and audio coding

7, 8 i 9. Deep learning in audio and speech applications:
Detection and classification of acoustic events, speaker recognition, speech recognition

Ćwiczenia laboratoryjne (14h):
  1. During laboratory classes the student implements and evaluates the performance of the methods described during lectures in Matlab environment or in Phyton programming language.

  2. An important element of the module is projet work, which demonstrates the application of techniques learned during the course of this module.The project involves: system design, practical implemetnation, evaluation, and public presentation of project results.

Zajęcia praktyczne (14h):
  1. An important element of the module is projet work, which demonstrates the application of techniques learned during the course of this module.The project involves: system design, practical implemetnation, evaluation, and public presentation of project results.

  2. An important element of the module is projet work, which demonstrates the application of techniques learned during the course of this module.The project involves: system design, practical implemetnation, evaluation, and public presentation of project results.

Pozostałe informacje
Metody i techniki kształcenia:
  • Wykład: Nie określono
  • Ćwiczenia laboratoryjne: Nie określono
  • Zajęcia praktyczne: Nie określono
Warunki i sposób zaliczenia poszczególnych form zajęć, w tym zasady zaliczeń poprawkowych, a także warunki dopuszczenia do egzaminu:

Positive final grade is given when the laboratory class is passed, for which both laboratory excercises and project work are completed and the final test is passed.

Zasady udziału w zajęciach:
  • Wykład:
    – Obecność obowiązkowa: Nie
    – Zasady udziału w zajęciach: Nie określono
  • Ćwiczenia laboratoryjne:
    – Obecność obowiązkowa: Tak
    – Zasady udziału w zajęciach: Nie określono
  • Zajęcia praktyczne:
    – Obecność obowiązkowa: Tak
    – Zasady udziału w zajęciach: Nie określono
Sposób obliczania oceny końcowej:

The final grade is a mean value of the grade for completed laboratory excercises, project work, and a final test.

Sposób i tryb wyrównywania zaległości powstałych wskutek nieobecności studenta na zajęciach:

Each lab excercise needs to be positively completed. In case of an absense the student is required to complete the excercises himself/herself and present them during the next labs.

Wymagania wstępne i dodatkowe, z uwzględnieniem sekwencyjności modułów :

- Ability to self-study and information finding
- Knowledge of basics of mathematics, linear algebra and statistics
- Basic knowledge of digital signal processing
- Good command of Matlab and Python programming language.

Zalecana literatura i pomoce naukowe:

Literature and other handouts will be given during the class. (EN)
Literatura oraz pomoce naukowe zostaną podane na zajęciach. (PL)

Przykładowe książki w języku angielskim / example books in English:
1. Alan V. Oppenheim and Ronald W. Schafer, Discrete-Time Signal Processing, Pearson Prentice Hall, 2010.
2. John G. Proakis and Dimitris K. Manolakis, Digital Signal Processing, Pearson, 2006.
3. Athanasios Papoulis and S. Unnikrishna Pillai, Probability, Random Variables, and Stochastic Processes, Mcgraw-Hill, 2002.

Publikacje naukowe osób prowadzących zajęcia związane z tematyką modułu:

1 K. Kowalczyk, O. Thiergart, M. Taseska, G. Del Galdo, and V. Pulkki, E.A.P. Habets, “Parametric spatial sound processing: a flexible and efficient solution to sound scene acquisition, modification and reproduction,” IEEE Signal Processing Magazine, vol. 32, No. 2, pp. 31-42, Mar. 2015

2. K. Kowalczyk, “Raking early reflection signals for late reverberation and noise reduction,” J. Acoustical Society of America, vol. 145, No. 3, pp. 257–263, Mar. 2019.

3. S. Wozniak and K. Kowalczyk, “Passive joint localization and synchronization of distributed microphone arrays,” IEEE Signal Processing Letters, vol. 26, No. 2, pp. 292-296, Feb. 2019.

4 S. Braun, K. Kowalczyk, and E.A.P. Habets, “ Residual noise control using a parametric multichannel Wiener filter,” Proc. IEEE Int. Conf. on Acoustics, Speech and Signal Process. (ICASSP), pp. 360-364, Brisbane, Australia, Apr. 2015

5 K. Kowalczyk, E.A.P. Habets, W. Kellermann, and P.A. Naylor, “Blind system identification using sparse learning for TDOA estimation of room reflections,” IEEE Signal Processing Letters, vol. 20, No. 7, pp. 653-656, Jul. 2013

6 K. Kowalczyk, O. Thiergart, A. Craciun, E.A.P. Habets, “Sound acquisition in noisy and reverberant environments using virtual microphones,” Proc. IEEE Workshop on Applications of Sign. Process. to Audio and Acoustics (WASPAA), New Paltz, NY, Oct. 2013

Informacje dodatkowe:

Course available for the first time in summer semester of 2020-2021.