Opterećenje:
|
1. komponenta
Vrsta nastave | Ukupno |
Predavanja |
30 |
Auditorne vježbe |
15 |
* Opterećenje je izraženo u školskim satima (1 školski sat = 45 minuta)
|
Opis predmeta:
|
CILJ KOLEGIJA: Upoznavanje s nekoliko naprednih tema iz područja relacijskih baza podataka, skladištima podataka, NoSQL paradigmom te smještajem i obradama velikih podataka (big data).
NASTAVNI SADRŽAJI:
1. Proširenja znanja o relacijskim bazama podataka. Složeni tipovi podataka. Distribuirane baze podataka. Ciljevi, svrha, prednosti i mane distribuiranja podataka. Struktura distribuirane baze, replikacija, fragmentacija. Protokoli za izvršavanje distribuiranih transakcija.
2. NoSQL paradigma. Razlozi nastanka. Agregatni model podataka. Svojstva NoSQL baza podataka. Konzistencija i CAP teorem. Vrste NoSQL baza podataka: ključ-vrijednost, dokumentske, grafovske i obitelj-stupaca baze podataka. Map/reduce algoritam u NoSQL bazama podataka.
3. Skladišta podataka (data warehouses). Ciljevi i svrha skladištenja podataka. Modeli skladišta podataka. Postupak modeliranja skladišta. OLAP. Postupak punjenja skladišta podataka (ETL).
4. Veliki podaci (big data). Distriburani datotečni sustavi. Google FS i HDFS. Apache Hadoop ekosustav. Map/reduce algoritam. Distribuirana izračunavanja i analize. Apache Spark.
|
Literatura:
|
- Pramod J. Sadalage, Martin Fowler: NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence
- R. Kimball, M. Ross: The Data Warehouse Toolkit - The Complete Guide to Dimensional Modeling, 2nd edition
- Eric Redmond, Jim Wilson: Seven Databases in Seven Weeks: A Guide to Modern Databases and the NoSQL Movement
- Alex Holmes: Hadoop in practice
- A. Silberschatz, H. F. Korth, S. Sudarshan: Database System Concepts, 4th edition
|
Preduvjeti za:
|
Upis predmeta
:
Položen
:
Baze podataka
|