Podatkovno inženjerstvo

Repozitorij

Repozitorij je prazan

Anketa

Na ovoj stranici trenutno nije odabrana niti jedna anketa!

Podatkovno inženjerstvo

Šifra: 274975
ECTS: 5.0
Nositelji: doc. dr. sc. Marko Horvat
Izvođači: Helena Marciuš , mag. inf. et math. - Auditorne vježbe
Prijava ispita: Studomat
Opterećenje:

1. komponenta

Vrsta nastaveUkupno
Predavanja 15
Auditorne vježbe 30
* Opterećenje je izraženo u školskim satima (1 školski sat = 45 minuta)
Opis predmeta:
CILJ KOLEGIJA:
- Rad s alatima za razvoj kompleksnih data pipeline-a
- Razvoj agregacijskih frameworka s obzirom na razinu apstrakcije prema korisniku sustava
- Razumijevanje teorije tokova podataka te implementaciju sustava za obradu toka podatak u realnom vremenu
- Konfiguraciju relacijskih i ne relacijskih baza podataka za skalabilnu pohranu i čitanje podataka
- Objektno orijentiranu implementaciju naprednih komponenata za pretraživanje relacijskih i ne relacijskih baza podataka
- Dizajniranje i implementaciju podatkovnih rješenja u oblaku

NASTAVNI SADRŽAJI:
- Razvoj data pipelinea i agregacijskih frameworka. Transformacije. Vrste data pipeline sustava. State machine u data pipelineu. Workflow Monitoring. Razine korištenja sustava za procesiranje. Sadržaj pomoćnih paketa. Razine paralelizacije u obradi podataka.
- Obrada tokova podataka. Motivacija i osnove tokova podataka. Sustavi poruka. Operacije s prozorima. Okidači i watermarkovi. Sustavi za obradu tokova podataka. Kappa, Lambda i hibridne arhitekture.
- Pohrana analitičkih rezultata. Vrste agregata i rezultata analiza. Optimizacije pri pohrani velike količine podataka. Sustavi za pretraživanje podataka. Sučelja za generiranje slika i izvještaja.
- Podatkovno inženjerstvo u oblaku. Osnove inženjerstva u oblaku. Infrastruktura u oblaku. Sigurnost u oblaku. Implementacija sustava za obradu podatak u oblaku.
Literatura:
  1. Streaming systems: the what, where, when, and how of large-scale data processing, Akidau, T., Chernyak, S., & Lax, R., O'Reilly Media, Inc., 2018.
  2. Designing data-intensive applications: The big ideas behind reliable, scalable, and maintainable systems, Kleppmann, M., O'Reilly Media, Inc., 2017.
  3. Big Data, Cloud Computing, and Data Science Engineering (Vol. 844), Lee, R. (Ed.)., Berlin/Heidelberg, Germany: Springer, 2019.
  4. CS 591 K1: Data Stream Processing and Analytics, https://vasia.github.io/dspa21/index.html, Boston University.
  5. CSE2520: Big Data Processing, https://burcuku.github.io/cse2520-bigdata/, TU Delft, 2022.
Preduvjeti za:
Upis predmeta :
Položen : Baze podataka
3. semestar Ne predaje se
Izborni predmet 3, 4, 5, 6 - Redovni Studij - Računarstvo i matematika

4. semestar
Izborni predmet 3, 4, 5, 6 - Redovni Studij - Računarstvo i matematika
Termini konzultacija:
  • doc. dr. sc. Marko Horvat:

    Srijeda, 10-12 (obavezna najava mejlom)

    Lokacija: A306

Obavijesti