Moduł oferowany także w ramach programów studiów:
Informacje ogólne:
Nazwa:
Percepcyjne kodowanie dźwięku
Tok studiów:
2019/2020
Kod:
RIAK-2-205-ID-s
Wydział:
Inżynierii Mechanicznej i Robotyki
Poziom studiów:
Studia II stopnia
Specjalność:
Inżynieria Dźwięku w Mediach i Kulturze
Kierunek:
Inżynieria Akustyczna
Semestr:
2
Profil:
Ogólnoakademicki (A)
Język wykładowy:
Polski
Prowadzący moduł:
prof. dr hab. inż. Zieliński Tomasz (tzielin@agh.edu.pl)
Treści programowe zapewniające uzyskanie efektów uczenia się dla modułu zajęć

Metody i standardy kompresji dźwięku, korzystające z modeli psychoakustycznych ludzkiego narządu słuchu, przykładowo standardy MPEG audio, AAC oraz AC3. Od podstaw modelowania do działających programów komputerowych.

Opis efektów uczenia się dla modułu zajęć
Kod MEU Student, który zaliczył moduł zajęć zna i rozumie/potrafi/jest gotów do Powiązania z KEU Sposób weryfikacji i oceny efektów uczenia się osiągniętych przez studenta w ramach poszczególnych form zajęć i dla całego modułu zajęć
Wiedza: zna i rozumie
M_W001 Zna i rozumie podstawy kodowania dźwięku IAK2A_W05, IAK2A_W04 Kolokwium
M_W002 Zna i rozumie metody percepcyjnego kodowania dźwięku IAK2A_W05, IAK2A_W04 Kolokwium
M_W003 Zna standardy percepcyjnego kodowania dźwięku IAK2A_W05, IAK2A_W04 Kolokwium
Umiejętności: potrafi
M_U001 Potrafi stosować poznane metody i algorytmy kodowania dźwięku do analizy i przetwarzania sygnałów dźwiękowych IAK2A_U12 Wykonanie ćwiczeń laboratoryjnych
M_U002 Potrafi implementować podstawowe algorytmy kodowania dźwięku w języku Matlab IAK2A_U12 Kolokwium
M_U003 Potrafi ocenić złożoność obliczeniową wykorzystywanych algorytmów kodowania sygnałów dźwiękowych IAK2A_U12 Wykonanie ćwiczeń laboratoryjnych
Kompetencje społeczne: jest gotów do
M_K001 Rozumie potrzebę ciągłego dokształcania się i podnoszenia kwalifikacji zawodowych IAK2A_K07 Udział w dyskusji
Liczba godzin zajęć w ramach poszczególnych form zajęć:
SUMA (godz.)
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
28 14 0 14 0 0 0 0 0 0 0 0
Matryca kierunkowych efektów uczenia się w odniesieniu do form zajęć i sposobu zaliczenia, które pozwalają na ich uzyskanie
Kod MEU Student, który zaliczył moduł zajęć zna i rozumie/potrafi/jest gotów do Forma zajęć dydaktycznych
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
Wiedza
M_W001 Zna i rozumie podstawy kodowania dźwięku + - + - - - - - - - -
M_W002 Zna i rozumie metody percepcyjnego kodowania dźwięku + - + - - - - - - - -
M_W003 Zna standardy percepcyjnego kodowania dźwięku + - + - - - - - - - -
Umiejętności
M_U001 Potrafi stosować poznane metody i algorytmy kodowania dźwięku do analizy i przetwarzania sygnałów dźwiękowych + - + - - - - - - - -
M_U002 Potrafi implementować podstawowe algorytmy kodowania dźwięku w języku Matlab + - + - - - - - - - -
M_U003 Potrafi ocenić złożoność obliczeniową wykorzystywanych algorytmów kodowania sygnałów dźwiękowych + - + - - - - - - - -
Kompetencje społeczne
M_K001 Rozumie potrzebę ciągłego dokształcania się i podnoszenia kwalifikacji zawodowych + - + - - - - - - - -
Nakład pracy studenta (bilans punktów ECTS)
Forma aktywności studenta Obciążenie studenta
Sumaryczne obciążenie pracą studenta 75 godz
Punkty ECTS za moduł 3 ECTS
Udział w zajęciach dydaktycznych/praktyka 28 godz
Przygotowanie do zajęć 24 godz
Samodzielne studiowanie tematyki zajęć 23 godz
Szczegółowe treści kształcenia w ramach poszczególnych form zajęć (szczegółowy program wykładów i pozostałych zajęć)
Wykład (14h):
Percepcyjne kodowanie dźwięku. Perceptual coding of audio.

WYKŁADY (14 godz)

1. Podstawy bezstratnego (Huffmana) i stratnego (ADPCM) kodowania sygnałów. Introduction to lossless (Huffman) and lossy (ADPCM) audio coding. (2g)
2. Percepcyjne właściwości ludzkiego słuchu. Modele psychoakustyczne 1 i 2 MPEG audio. Perceptual features of human hearing system. Psychoacoustic models of MPEG audio standard. (2g)
3. Zestawy filtrów: dekompozycja sygnału dźwiękowego w standardach MP2 i MP3. Filter banks: sub-band analysis and synthesis of audio in MP2 and MP3 standard. (2g)
4. Algorytm MP2 standardu MPEG-2 audio: alokacja bitów, formowanie ramki. Algorithm MP2 of MPEG-2 audio standard: bit allocation, bit-stream forming. (2g)
5. Algorytmy MP3 i AAC standardu kompresji MPEG-2 audio. Algorithms MP3 and AAC of MPEG-2 audio standard. (2g)
6. Algorytmy kodowania dźwięku standardu MPEG-4. Audio coding algorithms of MPEG-4 standard. (2g)
7. Algorytm AC3. Kodowanie dźwięku wielokanałowego. Bezstratne kodowanie dźwięku. Algorithm AC3. Multichannel audio coding. Lossless audio coding. (1g)
8. Kierunki rozwoju kodowania percepcyjnego dźwięku. Evolution directions of perceptual audio coding. (1g)

Ćwiczenia laboratoryjne (14h):
Percepcyjne kodowanie dźwięku. Perceptual coding of audio.

ĆWICZENIA LABORATORYJNE (14 godz)

W module prowadzone są zajęcia laboratoryjne (komputerowe) w języku Matlab, które ugruntowują i rozszerzają wiedzę przekazywaną podczas wykładów.

1. Bezstratne kodowanie Huffmana. Lossless Huffman coding. (2g)
2. Stratne kodowanie ADPCM. Lossy ADPCM coding. (2g)
3. Modele psychoakustyczne 1 i 2 standardu MPEG-2 audio.
Psychoacoustic models 1 and 2 of MPEG-2 audio standard. (2g)
4. Zespół filtrów poziomu MP2 standardu MPEG audio. Filter bank of MP2 compression algorithm of MPEG-2 audio standard. (2g)
5. Alokacja bitów i formowanie ramki w standardzie MP2 standardu MPEG audio. Bit allocation and bitstream forming in MP2 algorithm of MPEG-2 audio standard. (2g)
6. Zespół filtrów poziomu MP3 standardu MPEG-2 audio. Filter bank in MP3 layer of MPEG-2 audio standard. (2g)
7. Kodowanie dźwięku wielokanałowego. Bezstratne kodowanie dźwięku. Multichannel audio coding. Lossless audio coding. (2g)

Pozostałe informacje
Metody i techniki kształcenia:
  • Wykład: Treści prezentowane na wykładzie są przekazywane w formie prezentacji multimedialnej w połączeniu z klasycznym wykładem tablicowym wzbogaconymi o pokazy odnoszące się do prezentowanych zagadnień.
  • Ćwiczenia laboratoryjne: W trakcie zajęć laboratoryjnych studenci samodzielnie rozwiązują zadany problem praktyczny, dobierając odpowiednie narzędzia. Prowadzący stymuluje grupę do refleksji nad problemem, tak by otrzymane wyniki miały wysoką wartość merytoryczną.
Warunki i sposób zaliczenia poszczególnych form zajęć, w tym zasady zaliczeń poprawkowych, a także warunki dopuszczenia do egzaminu:

Do kolokwium z wykładu są dopuszczane tylko osoby, które uzyskały pozytywną ocenę z ćwiczeń laboratoryjnych.

Zasady udziału w zajęciach:
  • Wykład:
    – Obecność obowiązkowa: Nie
    – Zasady udziału w zajęciach: Studenci uczestniczą w zajęciach poznając kolejne treści nauczania zgodnie z syllabusem przedmiotu. Studenci winni na bieżąco zadawać pytania i wyjaśniać wątpliwości. Rejestracja audiowizualna wykładu wymaga zgody prowadzącego.
  • Ćwiczenia laboratoryjne:
    – Obecność obowiązkowa: Tak
    – Zasady udziału w zajęciach: Studenci wykonują ćwiczenia laboratoryjne zgodnie z materiałami udostępnionymi przez prowadzącego. Student jest zobowiązany do przygotowania się w przedmiocie wykonywanego ćwiczenia, co może zostać zweryfikowane kolokwium w formie ustnej lub pisemnej. Zaliczenie zajęć odbywa się na podstawie zaprezentowania rozwiązania postawionego problemu. Zaliczenie modułu jest możliwe po zaliczeniu wszystkich zajęć laboratoryjnych.
Sposób obliczania oceny końcowej:

1. Aby uzyskać pozytywną ocenę końcową niezbędne jest uzyskanie pozytywnej oceny z ćwiczeń laboratoryjnych oraz kolokwium z wykładu.
2. Obliczamy średnią arytmetyczną z ocen zaliczenia i kolokwium uzyskanych we wszystkich terminach.
3. Wyznaczmy ocenę końcową na podstawie zależności:
if sr>4.75 then OK:=5.0 else
if sr>4.25 then OK:=4.5 else
if sr>3.75 then OK:=4.0 else
if sr>3.25 then OK:=3.5 else OK:=3
4.Jeżeli pozytywną ocenę z ćwiczeń i kolokwium z wykładu uzyskano w pierwszym terminie oraz ocena końcowa jest mniejsza niż 5.0 to ocena końcowa jest podnoszona o 0.5

Sposób i tryb wyrównywania zaległości powstałych wskutek nieobecności studenta na zajęciach:

Maksymalnie 1 nieobecność nieusprawiedliwiona na laboratorium. Odrabianie – samodzielne napisanie programu i jego zaliczenie.

Wymagania wstępne i dodatkowe, z uwzględnieniem sekwencyjności modułów :

Znajomość podstaw cyfrowego przetwarzania sygnałów

Zalecana literatura i pomoce naukowe:

1. Zieliński T.: Cyfrowe przetwarzanie sygnałów. Od teorii do zastosowań: WKŁ, Warszawa 2005, 2007, 2009.
2. Czyżewski A.: Dźwięk cyfrowy: Wybrane zagadnienia teoretyczne, technologia, zastosowania. Warszawa, Akademicka Oficyna Wydawnicza EXIT 1998.
3. Bosi M.: Introduction to digital audio coding and standards: Springer 2002.
4. Spanias A. Painter T.: Audio signal processing and coding: Wiley 2007.
5. Painter T., Spanias A.: Perceptual coding of digital audio: Proc. IEEE, vol. 88, no. 6, str. 451-513, April 2000
7.ISO/IEC IS11172-3: Coding of moving pictures and associated audio for digital storage media up to 1.5 Mbit/s, Part 3: Audio, Annex D, ISO/IEC JTCI, 1992.

Publikacje naukowe osób prowadzących zajęcia związane z tematyką modułu:

1. Zieliński T.P.: „Od teorii do cyfrowego przetwarzania sygnałów”, 576 str. Wydział EAIiE-AGH, Kraków 2002, 2004.
2. Zieliński T.P.: „Cyfrowe przetwarzanie sygnałów. Od teorii do zastosowań”, 832 str., Wydaw-nictwa Komunikacji i Łączności, Warszawa 2005, 2007, 2009, 2014.
3. Szyper M., Zielinski T.P., Sroka R.: “Spectral Analysis of Nonstationary Signals in the System with Wide Phase Modulation”, IEEE Trans. on Instrumentation and Measurement, vol. 41, no. 6, pp. 919-920, IF=1.79 (2014), 1992.
4. Zielinski T.P.: “Joint Time-Frequency Resolution of Signal Analysis with Gabor Transform“, IEEE Trans. on Instrumentation and Measurement, vol. 50, no. 5, pp.1436-1444, IF=1.79 (2014), 2001.
5. Wielgat R., Zieliński T.P., Woźniak T., Grabias S., Król D.: “Automatic Recognition of Pathological Phoneme Production“, Folia Phoniatrica et Logopedica, vol. 2008, no. 6, str. 323-331, IF=0.655 (2006), IF=1.439 (2007), 2008.
6. Bułat J., Duda K., Socha M., Turcza P., Zieliński T.P., Duplaga M.: “Computational Tasks in Computer-Assisted Transbronchial Biopsy”, Future Generation Computer Systems (Elsevier), vol. 26, iss. 3, str. 455–461, IF 2.229, 2010.
7. K. Duda, L. B. Magalas, M. Majewski, T. P. Zieliński: “DFT based Estimation of Damped Oscillation’s Parameters in Low–frequency Mechanical Spectroscopy”, IEEE Trans. on Instrumentation and Measurement, str. 3608-3618, IF 0.978 (2011), IF 1.382 (5-cio letni), 2011.
8. Skalski A., Socha M., Zieliński T.P., Duplaga M.: „Virtual colonoscopy – technical aspects”, pp. 271-290 in „Colonoscopy” (ed. Paul Miskovitz), InTech, Rijeka 2011.
9. Zieliński T.P., Duda K.: “Frequency and Damping Estimation Methods – An Overview“, Metrology and Measurement Systems: Quaterly of Polish Academy of Sciences, vol. 18, no. 4, str. 505–528, IF=0.587 (2010), IF=0.982 (2012), 2011.
10. Skalski A., Kos A., Zieliński T.P.: “Using ASM in CT data segmentation for prostate radiotherapy”, pp. 610-617 in “Computer Vision and Graphics” (ed. Bolc L.), Lecture Notes in Computer Science, Springer, Berlin 2012.
11. Duda K., Zielinski T.P.: “Efficacy of the Frequency and Damping Estimation of a Real-Value Sinusoid“, IEEE Instrumentation and Measurement Magazine, vol. 16, iss. 2, pp. 48-58, IF=0.556, (2012), IF=0.828 (5-cio letni), April 2013.
12. Zieliński T.P., Korohoda P., Rumian R. (redakcja całości): „Cyfrowe przetwarzanie sygnałów w telekomunikacji: podstawy, multimedia, transmisja”, autorstwo 131 stron, współautorstwo 87 stron, PWN, Warszawa 2014.
13. Wiśniewski M., Zieliński T.P.: „Joint Application of Audio Spectral Envelope and Tonality Index in an E-Asthma Monitoring System”, IEEE Journal of Biomedical and Health Informatics, vol. 19, no. 4, pp. 1009-1018, IF=2.072 (2013), 2015.

Informacje dodatkowe:

Brak