Klasifikacija i stablo odlučivanja uz r Mirna Lazarić Zagrebačka škola ekonomije i managementa mlazaric@student.zsem.hr
što je classification tree Što je decision tree? Stablo odlučivanja je alat koji koristimo kao potporu u odlučivanju poput grafikona. Model prikazuje moguće ishode uključujući vjerojatnost određenog događaja. Algoritam je prikazan poput stabla, prilično je intuitivan i shvatljiv krajnjem korisniku.
1. Instalacija modula Paket: C5.0 Decision Trees and Rule-Based Models. C5.0 decision trees and rule-based models for pattern recognition.
2. Učitavanje podataka Za primjer analize podataka i crtanja decision tree-a koristiti ćemo data set cvijeta Irisa. Classification tree ćemo koristit kao predviđanje karakteristika Irisa, određenim raznim varijablama. Naš cilj je predvidjeti i klasificirati vrste Irisa prema dužini stabljike i širini latice.
Iris Verginica Iris Versicolor Iris Setosa
Tablica rezultata Tablica rezultata nam prikazuje prema kojim varijablama klasificiramo cvjetove Irisa. Kako bi mogli klasificirati moramo sve podatke međusobno pomiješati. Dobivene rezultate strukturiramo s funkcijom „str(Irisr)”(structure Irisr)
Definiramo novu funkciju pomoću koje strukturiramo klasifikaciju te kontrolnu funkciju.
U dobivenim rezultatima vidimo tablicu koja nam prikazuje rezultate klasifikacije cvjetova koji nisu zapisani u nikakvom određenom rasporedu. Rezultati nam također prikazuju predikciju koliki broj cvjetova će biti od pojedine vrste.
Primjena u ekonomiji U sljedećem primjeru ćemo primijeniti znanje koje smo stekli na prethodnom zadatku. Podatke za decision tree ćemo uzeti iz German credit detabase-a.
Kod Instalirati ćemo pakete „rpart.plot” 2. Učitavamo podatke 3. Rezultati
Decision tree Kod za crtanje diagrama
REZULTATI
Hvala na pozornosti