Akademska godina 2022./2023. (zimski semestar)

Cilj kolegija je upoznati studente s osnovnim konceptima i metodama nadziranog statističkog učenja. Neke do tema uključuju

Koncepti

  • vjerojatnosna intepretacija problema učenja
  • odnos između pristranosti i varijance
  • odabir varijabli i modela 
  • unakrsna validacija
  • bootstrap
  • regularizacija

Metode

  • linearni i penalizirani linearni modeli
  • LDA, QDA, logistička regresija i naivni Bayes
  • jednodimenzionalna nelinearna regresija (splajnovi, smoothing spline, lokalna regresija) te generalizirani aditivni modeli
  • metode bazirane na stablima (bagging, slučajne šume, boosting)

Od 23./24. formalni preduvjet za upis kolegija je položen kolegij Matematička statistika

Literatura

  • The Elements of Statistical learning (ESL), Hastie, T., Tibshirani, R., & Friedman, J. (2009) -- može se besplatno preuzeti na linku. Klasična referenca za statistički orijentirano strojno učenje. Ipak, nije najsretniji izbor za učenje, već je više kao enciklopedija.
  • An Introduction to Statistical Learning (ISLR), James, G., Witten, D., Hastie, T., & Tibshirani, R. (2021) --  može besplatno preuzeti na linku. Za naše potrebe razina matematike je preniska, ali korisno je proći krzo neke dijelove da se dobije osnovni pregled i neka intuicija oko metoda strojnog učenja.
  • All of statistics, L. Wasserman (2003) -- statistika na moderan način.
  • Linear Algebra and Learning from Data, Strang, G. -- kratki i matematički precizni uvodi u linearnu algebru i optimizaciju s ciljem razumijevanja neuralnih mreža.
  • Learning Theory from First Principles, Bach, F. -- teorija strojnog učenja s naglaskom na stvari koje su bitne u praksi.
  • Introduction to Machine Learning, kolegij na LMU -- ovaj open-source kolegij je najbolje i najprikladnije što sam vidio (svakako bolje od ovog kolegija). Prelažem studentima da paralelno prate dijelove tog kolegija.

 

Pravila ocjenjivanja

Elementi ocjenjivanja:

  • domaće zadaće
  • završni ispit

Domaće zadaće
Studenti će tokom semestra dobiti najmanje 2, a najviše 4 domaće zadaće koje će se bodovati. Te domaće zadaće mogu se sastojati od teorijskih pitanja i/ili zadataka koji zahtijevaju programiranje u programskom jeziku R.  Ukupan broj bodova koji je moguće ostvariti je 40. Uvjet za uspješno rješavanje domaće zadaće može biti i prezentacija poslanog rješenja uz usmeno ispitivanje od strane nastavnika.

Završni ispit
Pravo izlaska na završni ispit imaju samo studenti koji su na domaćim zadaćama ostvarili barem 20 od 40 bodova. Završni ispit se sastoji od pitanja iz teorije i zadataka iz cjelokupnog gradiva kolegija te vrijedi 60 bodova. Završni ispit će u pravilu biti samo pismeni, ali ukoliko nastavnik smatra da je potrebno, može biti i samo usmeni ili pisani i usmeni.

Konačna ocjena
Da bi se kolegij uspješno položio potrebno je ukupno iz svih domaćih zadaća ostvariti barem 20 (od 40) bodova, te ukupno iz domaćih zadaća i završnog ispita ostvariti barem 50 (od 100) bodova. Zaključivanje ocjene temelji se na ukupnom broju ostvarenih bodova.