Image for
Naslovnica

Podatkovno inženjerstvo

  • Predavanje 30
  • Vježbe 30
  • Samostalni rad 90
Ukupno 150

Naziv predmeta

Podatkovno inženjerstvo

Oznaka predmeta

22-02-506

Semestar

1

ECTS

5

Nastavnici i suradnici

Sadržaj i cilj

Kako bi analiza podataka imala kvalitetne rezultate potrebno je dobro napraviti pripremu ulaznih podataka. Cilj predmeta je pokazati osnovne metode pripreme podataka koje uključuju metode čišćenja, transformacije, intregracije, normalizacije i agregacije podataka, transformacije vremenskih serija, rad s nedostajućim vrijednostima, kao i osnovne metode redukcije podataka kao što su redukcija značajki, redukcija uzoraka i diskretizacija.

Sadržaj

Uvod u pripremu podataka. Čišćenje podataka. Rad s nedostajućim vrijednostima. Transformacija podataka. Redukcija uzoraka. Agregacija podataka. Transformacija vremenskih serija. Integracija podataka. Normalizacija podataka. Diskretizacija podataka. Redukcija značajki. Praksa i budućnost. Priprema za ispit.

Literatura

Obvezna literatura:
1. Crickard, P (2020) Data Engineering with Python: Work with massive datasets to design data models and automate data pipelines using Python, Birmingham: Packt Publishing,
2. Algebra University College (2020), Data Engineering Handbook, Zagreb: Algebra University College

Preporučena literatura

1. Garcia, S., Luengo, J., Herrera, F. (2016) Data Preprocessing in Data Mining, Cham: Springer International Publishing
2. Balamurugan, A.S., Christopher, A.B. (2012) Insight into Data Preprocessing: Theory and Practice: Data Mining Perspective Chisinau: Lap lambert Academic Publishing

Dodatna literatura:

3. Chakrabarti, S., Cox E., Eibe, F., Hartmut, RG, Han, J., Jiang, X., Kamber, M., Lightstone, S.S. (2009) Data Mining: Know It All, Massachusetts: Morgan Kaufmann

Preuzmi vodič za studente

Minimalni ishodi učenja

  • Prosuđivati probleme prilikom pripreme podataka.
  • Diskutirati o razlikama između metoda za rad s nedostajućim podacima i metoda transformacije podataka.
  • Objasniti utjecaj odabranih novijih tehnologija na postupak pripreme podataka.
  • Identificirati osnovne agregacijske funkcije i metode transformacije vremenskih serija.
  • Objasniti moguće rješenje određenog problema u procesu integracije, normalizacije i diskretizacije podataka.
  • Objasniti dostupne osnovne metode redukcije značajki i uzorka.

Željeni ishodi učenja

  • Preporučiti optimalna rješenja problema prilikom pripreme podataka
  • Razlikovati adekvatnu metodu za rad s nedostajućim podacima i metode transformacije podataka.
  • Procijeniti utjecaj novijih tehnologija na postupak pripreme podataka.
  • Odabrati adekvatne agregacijske funkcije i metode transformacije vremenskih serija.
  • Odabrati adekvatno rješenje za određeni problem u procesu integracije, normalizacije i diskretizacije podataka.
  • Primijenite odgovarajuće osnovne metode redukcije značajki i uzoraka.
Podijeli: Facebook Twitter