####################################################################################################### # # NALOGE # ####################################################################################################### # # - nalozite podatkovno mnozico "players.txt" # # players <- read.table("players.txt", header = T, sep = ",", stringsAsFactors = T) # # - ocenite atribute v podatkovni mnozici (ciljna spremenljivka je atribut "position") # # - razdelite podatkovno mnozico na ucni in testni del # # - zgradite razlicne modele (odlocitveno drevo, naivni Bayesov klasifikator, knn...) # za napovedovanje ciljne spremenljivke "position" # # a) z uporabo vseh atributov # b) z uporabo ustrezne podmnozice atributov # # - ocenite dobljene modele z uporabo testne mnozice # ####################################################################################################### # # Naj bo A binarni atribut z vrednostima 0 in 1. # # Naj bo B zvezni atribut, dobljen iz atributa A, tako da se vrednost 0 spremeni v nakljucno # vrednost na intervalu [0,0.49] in vrednost 1 spremeni v nakljucno vrednost na intervalu [0.5,1]. # # Naj bo C diskretni atribut, dobljen iz atributa B z ekvidistancno diskretizacijo na 5 intervalov. # # Naj bo D binarni atribut, dobljen iz atributa A tako da sta vrednosti 0 in 1 zamenjani. # # Razvrsti vse stiri atribute po oceni kvalitete z gini indeksom. Razvrstitev argumentiraj! # ####################################################################################################### # # Naj bo A diskretni atribut s 5 vrednostmi (1,2,3,4,5). # # Naj bo B binarni atribut, dobljen iz atributa A, tako da se zdruzijo prvi dve vrednosti v eno # in preostale tri v drugo vrednost. # # Naj bo C diskretni atribut, dobljen iz A tako, da se vsaka vrednost V nakljucno spremeni bodisi v # isto vrednost V ali v vrednost V+5. # # Razvrsti vse atribute po oceni kvalitete z informacijskim prispevkom. Razvrstitev argumentiraj! # ######################################################################################################## # # Podani so naslednji klasifikacijski problemi na binarnih atributih A1 do A10. # # a) C = |(A1 + A5 + A4) mod 2| # # b) C = P(A1 > 0.5) * P(A2 > 0.1) > 0.3 # # c) C = (A1 > 0.3 and A2 > 0.1 or A2 > 0.2 and A5 = 0) # # Pri tem P(X) predstavlja verjetnost, da je X resnicen # # Delno uredi atribute po pomembnosti, ce atribute ocenjujes z: # - oceno gini indeks # - oceno ReliefF # ########################################################################################################