Module also offered within study programmes:
General information:
Name:
to be completed
Course of study:
2019/2020
Code:
HKLT-1-402-s
Faculty of:
Humanities
Study level:
First-cycle studies
Specialty:
-
Field of study:
Cultural Studies
Semester:
4
Profile of education:
Academic (A)
Lecture language:
Polish
Form and type of study:
Full-time studies
Course homepage:
 
Responsible teacher:
dr Olszewska Anna (aolsz@agh.edu.pl)
Module summary

Omówienie podstawowych metod analityki kulturowej w zakresie analizy tekstów oraz metadanych repozytoriów muzealno – bibliotecznych.

Description of learning outcomes for module
MLO code Student after module completion has the knowledge/ knows how to/is able to Connections with FLO Method of learning outcomes verification (form of completion)
Social competence: is able to
M_K001 Ma świadomość znaczenia humanistyki dla rozumienia współczesnych procesów społecznych, politycznych, gospodarczych i kulturowych. KLT1A_K09 Execution of exercises
Skills: he can
M_U001 Rozumie istotę społeczeństwa informacyjnego i potrafi scharakteryzować przemiany życia społecznego pod wpływem nowoczesnej technologii. KLT1A_U23 Execution of exercises
Knowledge: he knows and understands
M_W001 Posiada wiedzę na temat technologii informatycznych i audiowizualnych. KLT1A_W24 Execution of exercises
M_W002 Rozumie istotę społeczeństwa informacyjnego i jego kulturowych, ekonomicznych, technologicznych i społecznych uwarunkowań oraz zależności między technologią i zmianami zachodzącymi w społeczeństwie i kulturze. KLT1A_W21 Execution of exercises
Number of hours for each form of classes:
Sum (hours)
Lecture
Audit. classes
Lab. classes
Project classes
Conv. seminar
Seminar classes
Pract. classes
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
30 0 0 0 0 0 0 0 0 15 0 0
FLO matrix in relation to forms of classes
MLO code Student after module completion has the knowledge/ knows how to/is able to Form of classes
Lecture
Audit. classes
Lab. classes
Project classes
Conv. seminar
Seminar classes
Pract. classes
Zaj. terenowe
Zaj. warsztatowe
Prace kontr. przejść.
Lektorat
Social competence
M_K001 Ma świadomość znaczenia humanistyki dla rozumienia współczesnych procesów społecznych, politycznych, gospodarczych i kulturowych. - - - - - - - - + - -
Skills
M_U001 Rozumie istotę społeczeństwa informacyjnego i potrafi scharakteryzować przemiany życia społecznego pod wpływem nowoczesnej technologii. - - - - - - - - + - -
Knowledge
M_W001 Posiada wiedzę na temat technologii informatycznych i audiowizualnych. - - - - - - - - + - -
M_W002 Rozumie istotę społeczeństwa informacyjnego i jego kulturowych, ekonomicznych, technologicznych i społecznych uwarunkowań oraz zależności między technologią i zmianami zachodzącymi w społeczeństwie i kulturze. - - - - - - - - + - -
Student workload (ECTS credits balance)
Student activity form Student workload
Summary student workload 30 h
Module ECTS credits 1 ECTS
Udział w zajęciach dydaktycznych/praktyka 30 h
Module content
Workshops (15h):
Analiza tekstów

Analiza tekstów, z wykorzystaniem narzędzi do opracowywania korpusów tekstowych, stworzonych w ramach konsorcjum CLARIN-PL.

1) Wprowadzenie do korpusów językowych:
– Narodowy Korpus Języka Polskiego
– Monitorujące korpusy porównawcze: Monco-PL i Monco-EN
– Korpus równoległy: Paralela
– Korpusy języka mówionego: Spokes
– Chronologiczny Korpus Polskich Tekstów Prasowych (1945-1954): ChronoPress

- Omówienie różnic między nimi oraz wyjaśnienie podstawowych pojęć (konkordancje, kolokacje, słowa kluczowe, listy frekwencyjne), które są z nimi związane oraz wprowadzenie do ich zastosowań w naukach humanistycznych oraz społecznych.
- Zadania mające na celu przećwiczenie ich przeszukiwania z wykorzystaniem ich specyficznego języka zapytań, umożliwiającego stosowanie rozszerzeń morfologicznych oraz ortograficznych, wyszukiwanie wariantów leksykalnych i elastycznych związków frazeologicznych. Zob.: http://www.nkjp.uni.lodz.pl/help.jsp
- Wizualizacja danych ilościowych (np. statystyk zdań, wyrazów, szeregów czasowych) za pomocą wbudowanych narzędzi, eksport wyników do postaci plików arkuszy kalkulacyjnych, generowanie skompresowanych odsyłaczy do wyników, w celu łatwiejszego ich odtwarzania i dzielenia się nimi.

2) Stworzenie własnego korpusu tekstowego przy pomocy narzędzia Korpusomat. Przeszukiwanie własnego korpusu przy pomocy poznanego już języka zapytań oraz wyznaczenie podstawowych statystyk korpusu: listy frekwencyjnej pojedynczych wyrazów oraz bardziej złożonych terminów charakteryzujących stworzony korpus.

3) Ekstrakcja słów kluczowych oraz kategorii tematycznych z dowolnego tekstu, za pomocą narzędzia WiKNN Classifier

4) Narzędzie do analizy i wizualizacji łączliwości frazeologicznej wyrazów HASK

- Porównanie kolokatora HASK (stworzonego na podstawie polskiego korpusu NKJP) z jego anglojęzycznym odpowiednikiem HASK-EN (stworzonym na bazie Brytyjskiego Korpusu Narodowego BNC) oraz próba ujęcia go w perspektywie narzędzia do badań kulturoznawczych (ćwiczenie polegające na porównaniu łączliwości frazeologicznej tych samych wyrazów w języku polskim i angielskim oraz interpretacja wyników w kontekście różnic i podobieństw kulturowych)
- Generacja i analiza grafów kolokacji za pomocą narzędzia Kolozaurus

5) Wprowadzenie do aplikacji LEM (Literary Exploratory Machine, czyli system eksploracji tekstów literackich), będącego narzędziem do przetwarzania tekstów literackich w języku polskim w celu wydobywania z nich informacji statystycznych.
Ćwiczeniom zostanie poddane:
- lematyzacja (wyznaczenie dla każdego słowa jego morfologicznej formy podstawowej – lematu)
- przypisanie każdemu lematowi odpowiadającej mu części mowy na podstawie znacznika NKJP
- charakteryzacja wyznaczonych w tekście czasowników (liczba/czas/osoba/rodzaj)
- stworzenie posortowanej listy nazw własnych
- opracowanie statystyk dotyczących procentowego udziału lematów i form gramatycznych w całym korpusie
- wyznaczenie nazw własnych oraz określenie ich liczebności w poszczególnych dokumentach
- analiza stylometryczna

6) Dodatkowe:
- Stworzenie korpusu tweetów, samodzielnie pobranych za pomocą aplikacji TAGS
- Wizualizacja tweetów (stworzenie m.in. wykresów w postaci szeregów czasowych) przy pomocy narzędzia Tebleau Public
- Wizualizacja konkordancji dowolnych tekstów przy pomocy “Drzew wyrazów”, word trees: https://www.jasondavies.com/wordtree/

Workshops (15h):
Repozytoria cyfrowe i humanistyka śledcza

Przygotowanie do pracy w zespołach zajmujących się archiwizacją i udostępnianiem w formie cyfrowej zabytków piśmiennictwa oraz kolekcji muzealnych. W trakcie zajęć uczestnicy będą mieli okazję zapoznać się z zasadami działania repozytoriów cyfrowych, poznać aplikacje, które umożliwiają ich konstrukcję oraz pełne wykorzystanie.
Omówione zostaną wybrane przykłady projektów digitalizacji (m.in. Polona, Bernstein Memory of Paper, Cyfrowa Małopolska, Artiste, PAUart, Forensic Architecture, British LibraryLabs). Historie ich powstawania pozwolą na zaprezentowanie zadań i narzędzi wykorzystywanych we obszarze humanistyki cyfrowej cyfrowym.

Praca projektowa polegać będzie na opracowaniu metod digitalizacji wskazanej grupy artefaktów. Prezentacja projektów przewidziana jest podczas zajęć

1. repozytoria cyfrowe: dla kogo? kiedy?
2. jak powstają wirtualne kolekcje:
– metody pozyskiwania danych
– metody porządkowania i opisu obiektów (metadane, trezaurusy, format MARC)
– praktyka publikacji zbiorów (open source, wizualizacje i mapowanie zasobów, współpraca z użytkownikami)
3. Humanistyka w działaniu: repozytorium cyfrowe jako narzędzie humanistyki śledczej

Additional information
Teaching methods and techniques:
  • Workshops: Metody aktywizujące: dyskusja dydaktyczna, metoda przypadków.
  • Workshops: Metody aktywizujące: dyskusja dydaktyczna, metoda przypadków
Warunki i sposób zaliczenia poszczególnych form zajęć, w tym zasady zaliczeń poprawkowych, a także warunki dopuszczenia do egzaminu:

Sposób zaliczenia: praca na zajęciach – wykonanie ćwiczeń. Warunkiem dopuszczenia do zaliczenia jest obecność na zajęciach, dopuszczalna absencja 2h. Zaliczenia poprawkowe odbywają się na tych samych warunkach co zaliczenie terminu pierwszego.

Participation rules in classes:
  • Workshops:
    – Attendance is mandatory: Yes
    – Participation rules in classes: obecność, wykonanie ćwiczeń
  • Workshops:
    – Attendance is mandatory: Yes
    – Participation rules in classes: obecność, wykonanie ćwiczeń
Method of calculating the final grade:

średnia z ocen uzyskanych za wykonanie poszczególnych ćwiczeń

Sposób i tryb wyrównywania zaległości powstałych wskutek nieobecności studenta na zajęciach:

Samodzielne opracowanie i prezentacja wybranych zagadnień w trybie konsultacji.

Prerequisites and additional requirements:

brak

Recommended literature and teaching resources:

Davidson, C. N., & Savonick, D. (2016). Digital Humanities. The Oxford Handbook of Interdisciplinarity, 159-172

dodatkowe:

Solska, E. (2017). Nowa Respublica Litteraria? Humanistyka cyfrowa jako metaorientacja współczesnych badań humanistycznych. Roczniki Kulturoznawcze, 7(1), 99-118.

Przastek-Samokowa, M. (2016). „Czym jest humanistyka cyfrowa? Pole semantyczne pojęcia (zarys).”. Zagadnienia Informacji Naukowej. Studia Informacyjne, 54(2), 82-93.

Olszewska, A., & Gancarczyk, J. (2017, October). Digital humanities using content-based image retrieval: The Visual Studies Toolkit. In 2017 International Conference on Behavioral, Economic, Socio-cultural Computing (BESC) (pp. 1-3). IEEE.

Scientific publications of module course instructors related to the topic of the module:

Olszewska, A., & Gancarczyk, J. (2017, October). Digital humanities using content-based image retrieval: The Visual Studies Toolkit. In 2017 International Conference on Behavioral, Economic, Socio-cultural Computing (BESC) (pp. 1-3). IEEE.

Olszewska, A., & Gancarczyk, J. (2018). MUSEUM AS A VISUAL LAB? CULTURE-TECHNOLOGY NETWORKS IN CBIR PROJECTS. Studia Humanistyczne AGH, 16(2), 67-88.

Additional information:

None