ANOVA

Zadatak 1.
Ucitajte podatke "iris" (perunika je hrvatski nacionalni cvijet). 
Testirajte je li prosjecna duljina lapova razlicita po podvrstama.



Zadatak 2.
Kofein se nalazi i u nektaru. Zelimo istraziti utjece li kolicina 
kofeina u nektaru na opras¡ivanje. Postavljene su po 2 hranilice 
u kojima je bila razlika u kolicini kofeina: 50, 100, 150, i 200 ppm.
Razlike u konzumaciji nektara na dvjema hranilicama dane su:
50 ppm caffeine: 0.4, 0.34, 0.19, 0.05, 0.14
100 ppm caffeine: 0.01, 0.39, 0.08, 0.09, 0.31
150 ppm caffeine: 0.65, 0.53, 0.39, 0.15, 0.46
200 ppm caffeine: 0.24, 0.44, 0.13, 1.03, 0.05.




CHI SQUARE - nezavisnost 



Zadatak 3.
Promatramo ovisnost pusenja i srcanih problema. 
Na temelju podataka u tablici provjerite mozete
li na razini znac od 5% tvrditi da su ta dva
obiljezja zavisna.

			puse | ne puse

srcani bolesnici	28      19
nisu srcani bolesnici   7       36 



Zadatak 4. DZ
Promatramo ovisnost prisutnosti visokog krvnog
tlaka i izbjegavanja przene hrane. Dobiveni su
podatci u tablici. Na razini znacajnosti od 1%
mozete li tvrditi da ta dva obiljezja nisu nezavisna?

			visoki tlak | nema visoki tlak

ne izbjegava przenu hranu	41      24
izbjegava przenu hranu 		24      31 



CHI SQUARE - homogenost


Zadatak 5.
Testiramo dvije metode učenja na jednom ispitu. Ocjene s ispita dane su:
Metoda 1: (ocjene 5, 4, 3, 2, 1)
21, 15, 11, 6, 4
Metoda 2: (ocjene 5, 4, 3, 2, 1)
19, 14, 9, 6, 5

Možemo li na razini značajnosti zaključiti da su ove dvije metode jednake
(Tj. da su distribucije po metodama homogene)?



Zadatak 6.
U tablici su dani podaci o broju studenata u akademskoj godini 2019/2020
na diplomskim studijima Matematičkog odsjeka u ovisnosti o spolu.
                                    M Ž 
Teorijska matematika                12 2
Primijenjena matematika             28 38
Matematička statistika              42 51
Financijska i poslovna matematika   25 56
Računarstvo i matematika            55 63
Matematika; smjer nastavnički       21 129

Na razini značajnosti od 1% testirajte odabir studija homogen po spolu?




CHI SQUARE - pripadnost diskretnoj distribuciji



Zadatak 7. 
Promatran je broj studenata koji tijekom dana udju 
u caffe bar Tangenta. Promatrano je koliko ih udje 
u periodu 9 - 10h, 10 - 11h, 11 - 12h i 12 - 13h.
Mozete li na razini znacajnosti od 5% tvrditi kako
njihov dolazak nije uniformno distribuiran u ta 4 perioda?

vrijeme 	 9-10   10-11   11-12   12-13
broj studenata   52	58	61	49



Zadatak 8.
Paketi jabuka sadrže u sebi 6 jabuka. Želimo analizirati 
koliko je jabuka pokvareno po paketu.
Testirajte hipotezu (razina značajnosti 5%) da je 
distribucija pokvarenih jabuka po paketu binomna 
B(6,1/6), a podatci su dani:

broj pokvarenih jabuka u pakiranju  0   1   2   3   4   5   6
broj pakiranja s toliko pokvarenih  131 303 323 152 78  12  1





Testiranje pripadnosti neprekidnoj distribuciji


Zadatak 9.
Za podatke o kafeinu iz zadatka 2, koristeci Kolmogorov-Smirnovljev 
test, testirajte dolaze li podatci iz svake grupe iz N(0.3, 0.1^2)
distribucije, na razini znacajnosti od 1%.




Zadatak 10.
Koristeci Shapiro-Wilkov test, testirajte dolazi li gustoca naseljenosti
iz zadatka 7 iz neke normalne distribucije, na razini znacajnosti 
znacajnosti od 5%.




Zadatak 11. DZ
Mozete li za udaljenost iz dokumenta naseljenost.csv tvrditi kako 
ne dolazi iz normalne distribucije na razini znacajnosti od 1%?



Zadatak 12. DZ 
Vremena cekanja za analizu uzorka u labosu dana su u minutama
5.4, 3.1, 4.6, 7.4, 5.9, 3.2, 2.6, 7.3, 1.9, 4, 3.5, 2, 3.3, 4.4
Mozete li na razini znacajnosti od 5% tvrditi kako podatci dolaze 
iz eksponencijalne razdiobe s parametrom 0.2?


Zadatak 13.
Za podatke o visinama
159 188 175 176 177 168 162 188
183 187 187 162 184 161 180 169
195 171 170 199 181 169 189 191
172 182 183 178 180 165 185 202
183 187 188 182 163 179 178 188

koristeci Kolmogorov-Smirnovljev 
test, testirajte dolaze li podatci iz N(180, 100)
distribucije, na razini znacajnosti od 1%.

Mozete li napraviti isto koristeci Shapiro-Wilkov test.




Linearna regresija 



Zadatak 14.
Promatramo udaljenost od centra grada (km2) i gustocu naseljenosti (stanovnika/m2).
Smatramo kako veca udaljenost sugerira manju gustocu naseljenosti.
Skupili smo podatke i spremili u bazu naseljenost.csv (nadji na webu).
Odredi regresijski pravac, ako to na podatcima ima smisla,
i provjeri jesu li koeficijenti modela statisticki znacajni.
Procijeni gustocu naseljenosti za kvart koji je udaljen 2.4 km od centra.





Zadatak 15. DZ
Promatramo velicinu stana i cijenu stana po kvadratu. Intuicija nam 
je kako manji stanovi imaju vecu cijenu po kvadratu. Provedi cijeli 
postupak linearne regresije (logika, procjena parametara, testiranje
parametara, formula, graf, pouzdani intervali - vidi predavanja,...)
Podatci se nalaze u dokumentu cijenastana.csv.