# VJEŽBE 13. Korelacija ##################################### # ZADTAKAK 1. Regresijska analiza udaljenosti i gustoće naseljenosti model_naseljenost <- lm(gustoca ~ udaljenost, data=naseljenost) summary(model_naseljenost) #1 # a=14.99099 # b=-2.24178 plot(naseljenost$gustoca ~ naseljenost$udaljenost, main = "Linearna regresija: gustoća vs. udaljenost", xlab = "Udaljenost", ylab = "Gustoća", col = "blue") abline(model_naseljenost, col="Red", lwd=2) #lwd=debljina pravca ("line width") #2 # p-value: < 2.2e-16 Test je značajan (a=/=0) #3 summary(model_naseljenost)$r.squared #Imamo već izračunato pomoću lm. Alternativno naredba cor() # R-squared = 0.9732006 ##################################### #ZADATAK 3. Potrošnja automobila (Višestruka linearna regresija) #1 model_cars <- lm(mpg ~ ., data=mtcars) # Uzimamo sve varijable kao prediktore. summary(model_cars) # Multiple R-squared: 0.869, Adjusted R-squared: 0.8066 #2 # Mičemo prediktor "cyl" jer ima najveći p-value(cyl) = 0.9161 model_cars_step1 <- lm(mpg ~ disp + hp + drat + wt + qsec + vs + am + gear + carb, data=mtcars) #Prethodno jednostavnije zapisati: model_cars_step1 <- lm(mpg~. -cyl, data=mtcars) summary(model_cars_step1) # p-value(vs) = 0.8433 model_cars_step2 <- lm(mpg ~ disp + hp + drat + wt + qsec + am + gear + carb, data=mtcars) summary(model_cars_step2) # p-value(carb) = 0.7470 model_cars_step3 <- lm(mpg ~ disp + hp + drat + wt + qsec + am + gear, data=mtcars) summary(model_cars_step3) # p-value(gear) = 0.61964 model_cars_step4 <- lm(mpg ~ disp + hp + drat + wt + qsec + am, data=mtcars) summary(model_cars_step4) # p-value(drat) = 0.46240 model_cars_step5 <- lm(mpg ~ disp + hp + wt + qsec + am, data=mtcars) summary(model_cars_step5) # p-value(disp) = 0.29897 model_cars_step6 <- lm(mpg ~ hp + wt + qsec + am, data=mtcars) summary(model_cars_step6) # p-value(hp) = 0.22309 model_cars_step7 <- lm(mpg ~ wt + qsec + am, data=mtcars) summary(model_cars_step7) #Vidimo da su sve p-vrijednosti <0.05. Stajemo! #3 backward_model_cars <- step(model_cars, direction="backward") summary(backward_model_cars) # Multiple R-squared: 0.8497, Adjusted R-squared: 0.8336