Moduł oferowany także w ramach programów studiów:
Informacje ogólne:
Nazwa:
Statystyka i opracowanie danych
Tok studiów:
2016/2017
Kod:
MIS-1-203-s
Wydział:
Inżynierii Metali i Informatyki Przemysłowej
Poziom studiów:
Studia I stopnia
Specjalność:
-
Kierunek:
Informatyka Stosowana
Semestr:
2
Profil kształcenia:
Ogólnoakademicki (A)
Język wykładowy:
Polski
Forma i tryb studiów:
Stacjonarne
Osoba odpowiedzialna:
Olejarczyk-Wożeńska Izabela (iolejarc@agh.edu.pl)
Osoby prowadzące:
dr inż. Regulski Krzysztof (regulski@agh.edu.pl)
Olejarczyk-Wożeńska Izabela (iolejarc@agh.edu.pl)
Krótka charakterystyka modułu

Opis efektów kształcenia dla modułu zajęć
Kod EKM Student, który zaliczył moduł zajęć wie/umie/potrafi Powiązania z EKK Sposób weryfikacji efektów kształcenia (forma zaliczeń)
Wiedza
M_W001 Ma podstawową wiedzę z rachunku prawdopodobieństwa i statystyki matematycznej IS1A_W14, IS1A_W01, IS1A_W03 Aktywność na zajęciach,
Kolokwium,
Odpowiedź ustna,
Wykonanie projektu
M_W002 Zna programy komputerowe pomocne w statystycznej analizie danych. IS1A_W07, IS1A_W03, IS1A_W13 Aktywność na zajęciach,
Odpowiedź ustna,
Projekt,
Wykonanie projektu
Umiejętności
M_U001 Potrafi zaplanować i przeprowadzić analizę zbiorów danych dobierając właściwe dla rozwiazywanego problemu metody statystyczne i odpowiednie oprogramowanie IS1A_U01, IS1A_U11, IS1A_U06, IS1A_U12 Aktywność na zajęciach,
Projekt,
Wykonanie projektu
M_U002 Potrafi formułować hipotezy oraz przeprowadzić ich weryfikacje przy zastosowaniu odpowiednio dobranych metod i narzędzi . IS1A_U02, IS1A_U09, IS1A_U07 Aktywność na zajęciach,
Kolokwium,
Odpowiedź ustna,
Wykonanie projektu
Kompetencje społeczne
M_K001 Ma świadomość prawnych i etycznych skutków udostępniania, upubliczniania i operowania na danych, w szczególności danych zastrzeżonych i chronionych. IS1A_K02, IS1A_K04 Aktywność na zajęciach,
Projekt,
Udział w dyskusji
M_K002 Ma świadomość potrzeby grupowego wspóldziałania przy rozwiązywaniu niektórych problemów inżynierskich i konieczności przekazywania rzetelnych informacji o wynikach własnej pracy IS1A_K01, IS1A_K05, IS1A_K03 Udział w dyskusji,
Wykonanie projektu
Matryca efektów kształcenia w odniesieniu do form zajęć
Kod EKM Student, który zaliczył moduł zajęć wie/umie/potrafi Forma zajęć
Wykład
Ćwicz. aud
Ćwicz. lab
Ćw. proj.
Konw.
Zaj. sem.
Zaj. prakt
Zaj. terenowe
Zaj. warsztatowe
Inne
E-learning
Wiedza
M_W001 Ma podstawową wiedzę z rachunku prawdopodobieństwa i statystyki matematycznej + - - - - - - - - - -
M_W002 Zna programy komputerowe pomocne w statystycznej analizie danych. + - - + - - - - - - -
Umiejętności
M_U001 Potrafi zaplanować i przeprowadzić analizę zbiorów danych dobierając właściwe dla rozwiazywanego problemu metody statystyczne i odpowiednie oprogramowanie - - - + - - - - - - -
M_U002 Potrafi formułować hipotezy oraz przeprowadzić ich weryfikacje przy zastosowaniu odpowiednio dobranych metod i narzędzi . - - - + - - - - - - -
Kompetencje społeczne
M_K001 Ma świadomość prawnych i etycznych skutków udostępniania, upubliczniania i operowania na danych, w szczególności danych zastrzeżonych i chronionych. + - - - - - - - - - -
M_K002 Ma świadomość potrzeby grupowego wspóldziałania przy rozwiązywaniu niektórych problemów inżynierskich i konieczności przekazywania rzetelnych informacji o wynikach własnej pracy - - - + - - - - - - -
Treść modułu zajęć (program wykładów i pozostałych zajęć)
Wykład:
  1. Wprowadzenie do statystycznej analizy danych. (2 godz.)

    Charakterystyka badań statystycznych. Pojęcia podstawowe: populacja, próbka statystyczna: losowa, reprezentatywna, mała, duża. Cechy statystyczne i ich klasyfikacja według stosowanych skal pomiaru. Wstępna ocena danych: rodzaj, liczba, wiarygodność, kompletność, tendencyjność, dokładność – rodzaje błędów.
    Informatyczne narzędzia pomocne w statystycznej analizie danych: Statistica, Statgraph, Arkusze kalkulacyjne.

  2. Wstępna analiza zbiorów danych; zarządzanie danymi. (2 godz.)

    Graficzna prezentacja danych: wykresy dla danych jakościowych i wykresy dla danych ilościowych, wykresy przebiegu. Sprawdzanie wartości, eliminacja błędów grubych, uzupełnianie braków danych. Tworzenie podzbiorów danych oraz scalanie pików. Sortowanie i filtrowanie danych.
    Szeregi statystyczne: rodzaje, zasady tworzenia i zastosowania.
    Sumaryczne charakterystyki zbiorów danych (opisujące położenie, rozproszenie/zmienność, asymetrię, koncentrację danych) i ich graficzna interpretacja.

  3. Probabilistyczne podstawy statystyki matematycznej: (10 godz.)

    Model probabilistyczny: Doświadczenia i zdarzenia. Borelowskie ciało zdarzeń – rachunek zdarzeń losowych.
    Prawdopodobieństwo – definicje, podstawowe własności. Prawdopodobieństwo warunkowe. Twierdzenie o prawdopodobieństwie całkowitym. Reguła Bayesa.
    Zmienne losowe jako funkcje określone na zbiorze zdarzeń losowych. Rozkład prawdopodobieństwa zmiennej losowej. Dystrybuanta i jej własności. Parametry rozkładu: wartość oczekiwana i wariancja. Zmienne dyskretne i ich rozkłady: dwupunktowy, dwumianowy, Poissona; zastosowania w praktyce inżynierskiej. Zmienne losowe ciągłe,wybrane rozkłady: jednostajny, Gaussa/normalny, wykładniczy. Definicja i własności funkcji gęstości i dystrybuanty. Zastosowania rozkładu normalnego, związek z funkcją błędów; reguła trzy sigma. Wielowymiarowe zmienne losowe, łączny rozkład prawdopodobieństwa, rozkłady brzegowe. Niezależność zmiennych losowych. Funkcje zmiennej wielowymiarowej, wartość oczekiwana, wariancja i kowariancja, współczynnik korelacji. Rozkłady dwuwymiarowych zmiennych losowych przykłady dla zmiennych dyskretnych i dla ciągłych.
    Ciągi losowe i ich zbieżność, Prawa wielkich liczb. Centralne twierdzenia graniczne.

  4. Wnioskowanie statystyczne (6 godz.)

    Podstawy wnioskowania statystycznego. Metody zbierania danych. Rozkład empiryczny i jego parametry. Estymacja, estymatory i ich własności. Metody uzyskiwania estymatorów; największej wiarygodności(NW) oraz metoda momentów (MM). Estymatory punktowe i przedziały ufności podstawowych parametrów statystycznych. Granice tolerancji. Obliczanie wielkości próby statystycznej.
    Parametryczne testy istotności i nieparametryczne testy zgodności. Weryfikacja hipotez statystycznych – etapy: formułowanie hipotez, wyznaczanie obszarów krytycznych (błędy pierwszego i drugiego rodzaju )wybór funkcji testowej, wykonanie obliczeń, podjęcie decyzji o przyjęciu lub odrzuceniu hipotezy.

  5. Metody odkrywania i analizy statystycznych zależności pomiędzy zmiennymi (6 godz.)

    Testowanie niezależności zmiennych ilościowych i zmiennych jakościowych. Współczynniki korelacji Pearsona, Spermana, Kendala i gamma. Macierz korelacji, korelacje cząstkowe. Podstawy analizy regresji, metoda najmniejszych kwadratów. Modele liniowe i nieliniowe. Interpretacja i testowanie stopnia dopasowania modelu. Ocena błędu standardowego i błędów resztkowych. Związki analizy regresji z analiza wariancji

  6. Podstawy modelowania eksperymentów (2 godz.)

    Generatory liczb pseudolosowych z rozkładu jednostajnego, metoda przekształcania kwantylowego, metoda oparta na reprezentacji zmiennych losowych, metoda eliminacji. Szacowanie parametrów rozkładu metodą Monte Carlo, modelowanie eksperymentów losowych metodą Monte Carlo. Testy permutacyjne (jednorodności, niezależności cech)

Ćwiczenia projektowe:
  1. Ćwiczenia z rachunku prawdopodobieństwa (8 godz.)

    Rozwiązywanie zadań z zakresu: tworzenia modeli probabilistycznych – określanie zbioru zdarzeń elementarnych
    i przestrzeni zdarzeń losowych; działania na zdarzeniach losowych – Borelowskie ciało zdarzeń.
    Obliczanie prawdopodobieństwa określonego zdarzenia losowego przy zastosowaniu definicji (aksjomatycznej, klasycznej, geometrycznej i statystycznej) oraz twierdzeń o prawdopodobieństwie sumy, różnicy, iloczynu zdarzeń, prawdopodobieństwie warunkowym, całkowitym i reguły Bayesa.
    Zastosowania schematu Bernouliego, rozkładów Poissona, Gaussa i gamma w rozwiązywaniu problemów przemysłowych, w szczególności w kontroli jakości. Ocena niezależności bądź rodzaju, kierunku i siły zależności występujących w wielowymiarowych zmiennych losowych.

  2. Wstępna analiza zbiorów danych i zarządzanie nimi przy zastosowaniu technik komputerowych (4 godz.)

    Sprawdzanie wartości, uzupełnianie braków, eliminacja omyłek. Scalanie plików, sortowanie, filtrowanie, tworzenie podzbiorów. Budowa szeregów statystycznych. Obliczanie statystyk charakteryzujących położenie, zmienność, koncentrację oraz asymetrię danych. Graficzna prezentacja danych ilościowych i danych jakościowych ilustrująca strukturę analizowanego zbioru, oraz wykresy przebiegu.

  3. Wnioskowanie statystyczne. (4 godz.)

    Obliczanie estymatorów punktowych i przedziałowych dla wartości oczekiwanej, wariancji i proporcji. Formułowanie i weryfikacja hipotez statystycznych. Praktyczne zastosowania parametrycznych testów istotności i nieparametrycznych testów zgodności.

  4. Analiza zależności danych liczbowych (6 godz.)

    Analiza zależności dwóch zmiennych. Określanie rodzaju (liniowy, nieliniowy), kierunku i siły zależności na podstawie kowariancji, współczynnika korelacji i współczynnika determinacji. Tworzenie modelu zależności. Wnioskowanie w modelu zależności liniowej; analiza reszt, ocena dopasowania modelu. Analiza zależności wielu zmiennych. Obliczanie i interpretacja macierzy korelacji. Zastosowania korelacji cząstkowych. Tworzenie i diagnostyka modelu regresji wielokrotnej. Analiza wariancji i jej związki z analizą regresji.

  5. Analiza danych jakościowych (2 godz.)

    Analiza zmiennej jednowymiarowej, testowanie hipotez ( prostej i złożonej) o zgodności, testowanie jednorodności. Testowanie niezależności dwóch zmiennych losowych. Analiza zależności dwóch zmiennych losowych jakościowych. Ocena poprawności wnioskowania.

  6. Zastosowania różnych metod wyboru prób statystycznych z populacji (4 godz.)

    Praktyczna realizacja wybranych schematów losowania prób. Metoda reprezentacyjna. Obliczanie estymatorów parametrów populacji(wartości średniej, proporcji, ilorazu wartości średniej) dla różnych schematów losowania. Praktyczne zastosowania metody Monte Carlo -modelowanie eksperymentów losowych.

Nakład pracy studenta (bilans punktów ECTS)
Forma aktywności studenta Obciążenie studenta
Sumaryczne obciążenie pracą studenta 140 godz
Punkty ECTS za moduł 5 ECTS
Udział w wykładach 28 godz
Udział w ćwiczeniach projektowych 28 godz
Przygotowanie do zajęć 42 godz
Wykonanie projektu 10 godz
Samodzielne studiowanie tematyki zajęć 15 godz
Przygotowanie sprawozdania, pracy pisemnej, prezentacji, itp. 5 godz
Dodatkowe godziny kontaktowe z nauczycielem 10 godz
Egzamin lub kolokwium zaliczeniowe 2 godz
Pozostałe informacje
Sposób obliczania oceny końcowej:

PROCENTOWA OCENA KOŃCOWA = 100*(LPK+PLAĆ+LPP+LPAW)/150
gdy:
LPAĆ -Liczba punktów za aktywność na ćwiczeniach (obecności, wykonane zadania);(MAX = 70)
LPK – Liczba punktów z kolokwiów; (MAX=30)
LPP – Liczba punktów za wykonanie projektu; (MAX=20)
LPAW -Liczba punktów za aktywność na wykładach (obecności, dyskusje, odpowiedzi);(MAX=30)

PROCENTOWA OCENA Z ĆWICZEŃ = 100*(LPK+LPAĆ+LPP)/120

*Ocena klasyczna przyporządkowana jest procentowej zgodnie z Regulaminem Studiów w AGH *

Wymagania wstępne i dodatkowe:

Zgodnie z Regulaminem Studiów AGH podstawowym terminem uzyskania zaliczenia jest ostatni dzień zajęć w danym semestrze. Termin zaliczenia poprawkowego (tryb i warunki ustala prowadzący moduł na zajęciach początkowych) nie może być późniejszy niż ostatni termin egzaminu w sesji poprawkowej (dla przedmiotów kończących się egzaminem) lub ostatni dzień trwania semestru (dla przedmiotów niekończących się egzaminem).

Zalecana literatura i pomoce naukowe:

Lapin L.L.J Statistics for modern engineering, PWS Publishers 1983
Koronacki J., Mielniczuk J. Statystyka dla studentów kierunków technicznych i przyrodniczych, WNT, Warszawa
Plucińscy A., E. Rachunek Prawdopodobieństwa, Statystyka matematyczna, Procesy stochastyczne, WNT, Warszawa 2000
Stanisz A., Przystępny kurs statystyki z zastosowaniem STATISTICA PL, StatSoft,Kraków 2006
Hand D., Mannila H., Smyth P. Eksploracja danych,WNT Warszawa 2005
Hill T., Lewicki P. Statistics Methods and Applications, Stat Soft Inc. 2006

Publikacje naukowe osób prowadzących zajęcia związane z tematyką modułu:

http://www.bpp.agh.edu.pl/

1. The integration of knowledge about the manufacturing process of ADI with the use of artificial intelligence methods / B. MRZYGŁÓD, I. OLEJARCZYK-WOŻEŃSKA, K. REGULSKI // Archives of Foundry Engineering / Polish Academy of Sciences. Commission of Foundry Engineering ; ISSN 1897-3310. — Tytuł poprz.: Archiwum Odlewnictwa. — 2015 vol. 15 spec. iss. 2, s. 59–64. — Bibliogr. s. 64, Abstr.. — tekst: http://www.afe.polsl.pl/index.php/pl/4135/the-integration-of-knowledge-about-the-manufacturing-process-of-adi-with-the-use-of-artificial-intelligence-methods.pdf

2. Prediction of technological process parameters based on experimental data — Przewidywanie parametrów procesu technologicznego w oparciu o dane eksperymentalne / Andrzej OPALIŃSKI, Mirosław GŁOWACKI, Izabela OLEJARCZYK-WOŻEŃSKA, Barbara MRZYGŁÓD // Czasopismo Techniczne = Technical Transactions / Politechnika Krakowska ; ISSN 0011-4561 ; R. 112 z. 7. Mechanika = Mechanics ; ISSN 1897-6328. — 2015 2-M, s. 203–210. — Bibliogr. s. 209–210, Abstr., Streszcz.. — tekst: http://suw.biblos.pk.edu.pl/downloadResource&mId=1469734

3. Extracting knowledge from integrated experimental data on the ADI manufacture — Wydobywanie wiedzy ze zintegrowanych danych eksperymentalnych dotyczących produkcji żeliwa ADI / Barbara MRZYGŁÓD, Izabela OLEJARCZYK-WOŻEŃSKA, Mirosław GŁOWACKI, Andrzej OPALIŃSKI // Computer Methods in Materials Science : quarterly / Akademia Górniczo-Hutnicza ; ISSN 1641-8581. — Tytuł poprz.: Informatyka w Technologii Materiałów. — 2015 vol. 15 no. 1, s. 85–93. — Bibliogr. s. 92, Abstr., Streszcz.

4. Quantitative analysis of ductile iron microstructure – a comparison of selected methods for assessment / B. MRZYGŁÓD, P. MATUSIEWICZ, A. Tchórz, I. OLEJARCZYK-WOŻEŃSKA // Archives of Foundry Engineering / Polish Academy of Sciences. Commission of Foundry Engineering ; ISSN 1897-3310. — Tytuł poprz.: Archiwum Odlewnictwa. — 2013 vol. 13 iss. 3, s. 59–63. — Bibliogr. s. 63, Abstr.

5. Analiza matematyczna wykresów CTPi żeliwa sferoidalnego — Mathematical analysis of TTT diagrams of ADI / I. OLEJARCZYK, A. ADRIAN, H. ADRIAN, B. MRZYGŁÓD // W: XXXIX Szkoła Inżynierii Materiałowej : Kraków–Krynica, 27–30 IX 2011 : monografia / pod red. Jerzego Pacyny ; Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. Wydział Inżynierii Metali i Informatyki Przemysłowej. — [Kraków : WIMiIP AGH], 2011 + CD-ROM. — Na okł. dod. Prace XXXIX Szkoły Inżynierii Materiałowej. — ISBN: 978-83-929445-0-5. — S. 538–541. — Bibliogr. s. 541, Streszcz., Abstr.. — I. Olejarczyk, A. Adrian, B. Mrzygłód – afiliacja: Katedra Informatyki Stosowanej i Modelowania, Wydział Inżynierii Metali i Informatyki Przemysłowej, Akademia Górniczo-Hutnicza ; H. Adrian – Katedra Metaloznawstwa i Metalurgii Proszków, Wydział Inżynierii Metali i Informatyki Przemysłowej, Akademia Górniczo-Hutnicza

Informacje dodatkowe:

Brak