
Podatkovno inženjerstvo
- Predavanje 30
- Vježbe 30
- Samostalni rad 90
Naziv predmeta
Podatkovno inženjerstvo
Oznaka predmeta
22-02-506
Semestar
1
ECTS
5
Nastavnici i suradnici
Sadržaj i cilj
Kako bi analiza podataka imala kvalitetne rezultate potrebno je dobro napraviti pripremu ulaznih podataka. Cilj predmeta je pokazati osnovne metode pripreme podataka koje uključuju metode čišćenja, transformacije, intregracije, normalizacije i agregacije podataka, transformacije vremenskih serija, rad s nedostajućim vrijednostima, kao i osnovne metode redukcije podataka kao što su redukcija značajki, redukcija uzoraka i diskretizacija.
Sadržaj
Uvod u pripremu podataka. Čišćenje podataka. Rad s nedostajućim vrijednostima. Transformacija podataka. Redukcija uzoraka. Agregacija podataka. Transformacija vremenskih serija. Integracija podataka. Normalizacija podataka. Diskretizacija podataka. Redukcija značajki. Praksa i budućnost. Priprema za ispit.
Literatura
Obvezna literatura:
1. Crickard, P (2020) Data Engineering with Python: Work with massive datasets to design data models and automate data pipelines using Python, Birmingham: Packt Publishing,
2. Algebra University College (2020), Data Engineering Handbook, Zagreb: Algebra University College
Preporučena literatura
1. Garcia, S., Luengo, J., Herrera, F. (2016) Data Preprocessing in Data Mining, Cham: Springer International Publishing
2. Balamurugan, A.S., Christopher, A.B. (2012) Insight into Data Preprocessing: Theory and Practice: Data Mining Perspective Chisinau: Lap lambert Academic Publishing
Dodatna literatura:
3. Chakrabarti, S., Cox E., Eibe, F., Hartmut, RG, Han, J., Jiang, X., Kamber, M., Lightstone, S.S. (2009) Data Mining: Know It All, Massachusetts: Morgan Kaufmann
Minimalni ishodi učenja
- Prosuđivati probleme prilikom pripreme podataka.
- Diskutirati o razlikama između metoda za rad s nedostajućim podacima i metoda transformacije podataka.
- Objasniti utjecaj odabranih novijih tehnologija na postupak pripreme podataka.
- Identificirati osnovne agregacijske funkcije i metode transformacije vremenskih serija.
- Objasniti moguće rješenje određenog problema u procesu integracije, normalizacije i diskretizacije podataka.
- Objasniti dostupne osnovne metode redukcije značajki i uzorka.
Željeni ishodi učenja
- Preporučiti optimalna rješenja problema prilikom pripreme podataka
- Razlikovati adekvatnu metodu za rad s nedostajućim podacima i metode transformacije podataka.
- Procijeniti utjecaj novijih tehnologija na postupak pripreme podataka.
- Odabrati adekvatne agregacijske funkcije i metode transformacije vremenskih serija.
- Odabrati adekvatno rješenje za određeni problem u procesu integracije, normalizacije i diskretizacije podataka.
- Primijenite odgovarajuće osnovne metode redukcije značajki i uzoraka.