Aplikasi Weight of Evidence pada data case study: Data Diskretisasi Oleh Achmad Syaiful (G ) Tugas Kuliah Pemodelan Klasifikasi Departemen Statistika.

Slides:



Advertisements
Similar presentations
Two topics in R: Simulation and goodness-of-fit HWU - GS.
Advertisements


16/04/20152D MEH untuk Aliran Air Tanah1 Kasus Aliran 2D 1. Aliran air tanah 2. Aliran permanen.
SQL Pertemuan 26. Range Operator ‘Between dan Not Between’
TERRESTRIAL MICROWAVE INTAN FARAHANA BTE KAMSIN A A NURUL ASYIKIN BTE OTHMAN A A
BAB 5-4 Training Aplikasi Machine Vision. Objektif Boleh mengetahui kepentingan training pada vision system Boleh menghuraikan aplikasi vision system.
TANAH GEOBIOFISIK WILAYAH.
Pedoman pembuatan makalah Pertemuan 25 : Mata kuliah:K0164-Pemrograman Matematika Tahun: 2008.
1 Pertemuan Kesebelas Presentasi Laporan Riset dan Desain Riset Matakuliah: MN J0412/ Riset Pemasaran Tahun: 2007 Versi:
1 Pertemuan 21 Matakuliah: I0214 / Statistika Multivariat Tahun: 2005 Versi: V1 / R1 Analisis Struktur Peubah Ganda (I): Analisis Komponen Utama.
WAP FARAH NAZIRA SULAIMAN (A103134) NOR JULAIHA JUSOF (A )
1 Evaluating Model Performance Lantz Ch 10 Wk 5, Part 2 Right – Graphing is often used to evaluate results from different variations of an algorithm. Depending.
3 November 2015 Data Mining Instance-based Learning Cluster Analysis Practical Works Practicum Quiz.
Telaah Jurnal Nuralisa Safitri Pembimbing: dr. Ariesti Karmila, Sp.A, M.Kes DEPARTEMEN ILMU KESEHATAN ANAK RSUP DR MOH HOESIN PALEMBANG FAKULTAS.
Perkembangan Masa Remaja Nama kelompok : Achmad Syaripudin Amaliah Nurrohmah Lu’lu’ Inayatul Mufidah Suci Anggari Widi Dwirizki Utoyowibowo Facebook.
KONSTRUKSI DAM PARIT MODUL BI- 05
RANCANG BANGUN SISTEM INFORMASI ABSENSI KARYAWAN BERBASIS RFID MENGGUNAKAN PHP DAN MYSQL PADA PT MUSTIKA RATU.
SOLIHATI JUDUL: Comparative Analysis of Image Enhancement Techniques for Ultrasound Liver Image PENULIS:1.Smriti Sahu, Department of.
PENCAHAYAAN ALAMI DAN BUATAN DI RUANG BACA DAN RUANG PERTEMUAN DEPARTEMEN ARSITEK ITS SURABAYA Disusun oleh: Ahmad Fatih BarkahNRP Deni AgpriantaNRP.
MODEL REGRESI VARIABEL DUMMY A.Sifat Alamiah Variabel-Variabel Dummy Variabel yang diasumsikan nilai 0 dan 1 suatu perangkat untuk menggolongkan data ke.
TEKNIK PENGENDALIAN R32.
Gambaran Umum Aplikasi TABK
Sistem Hybrid Sistem hybrid yaitu penggunaan lebih dari satu metode untuk menyelesaikan masalah Keunggulan: NN dapat meniru kemampuan manusia dalam beradaptasi.
STATISTIKA KONSEP STATISTIKA.
REGRESI NON LINIER Gangga Anuraga, M.Si
PERTEMUAN 13 EKSTRAKSI FEATURE LOCAL BINARY PATTERN
OLEH: RIBKA Y. MANOPO PARADIGMA KEPERAWATAN DAN HUBUNGAN PARADIGMA DENGAN TEORI KEPERAWATAN.
OPERASI HITUNG BILANGAN
Model Antrian Tunggal Pertemuan 20
Industrial Psychology Genap 2014/2015
Muhamad Sodiqin bin Badrin Nurul Irsalina binti Ahmad
Audit Klinis Operasi Seksio Sesaria Budi Iman Santoso.
BAB I PENDAHULUAN. Latar Belakang Biomaterial yang umum digunakan untuk perangkat implant adalah biokeramik Bahan biokeramik yang sering digunakan dalam.
SILABI EKONOMETRIKA TERAPAN
“KARAKTERISASI SENSOR MAGNETIC INDUCTANCE TOMOGRAPHY (MIT) UNTUK APLIKASI DETEKSI KECACATAN PADA BESI DAN ALUMINIUM” Dian Arum Novitasari S1.
L/O/G/O Evaluasi Profil Serum Asam Empedu sebagai Biomarker Kerusakan Hati pada Hewan Pengerat Farihatus Solikhah Farihatus Solikhah
Sekolah Tinggi Transportasi Darat
DATA MANIPULATION LANGUAGE
TUGAS AKHIR I SISTEM PENDUKUNG KEPUTUSAN PEMILIHAN STARTING LINE-UP PEMAIN FUTSAL MENGGUNAKAN METODE PROFILE MATCHING DAN K-MEANS CLUSTERING DISUSUN OLEH:
KEAMANAN XMPP (Extensible Messaging and Presence Protocol) Autentikasi Pesan dan Pengguna pada Protokol Chating XMPP dengan OMEMO Ramses Robinson Saragi.
Pengaruh Variasi Beban Terhadap Performa Turbin Gas di Blok 1.3 PLTGU PT. Indonesia Power Grati,Pasuruan OLEH : Muhamad Nafi’ Annur DOSEN PEMBIMBING.
NEUROCITE 2.0: Simulator Peramalan Rangkaian Neural Buatan
Unit 3: Pengaruh Sumber Dalam Proses Pengumpulan Berita
Penentuan K-optimal Menggunakan Segmentasi K-Nearest Neighbor dengan Validasi Silang Studi Kasus: White Wine
TUGAS PRAKARYA 1 NAMA:DAVA AHMAD FAUZAN KELAS :V III NO. ABSEN:08.
Pendugaan NPL Perbankan dengan Metode Regresi Logistik Case Study: Data Scoring Oleh Achmad Syaiful (G ) Tugas Kuliah Pemodelan Klasifikasi Departemen.
Perbandingan Metode Bagging, RandomForest, dan Pohon Klasifikasi dengan Validasi Silang Studi kasus: DataTree, BankLoan, dan White Wine Oleh Achmad Syaiful.
SEGMENTASI DENGAN METODE K-MEANS Oleh Achmad Syaiful G
SMART SCHOOL QUALIFICATION STANDARDS
Regresi Sederhana dan Analisis Korelasi
Analisis dan Interpretasi Data
REKABENTUK SENSOR DALAM SISTEM AUTOMASI
MODEL PENILAIAN OBJECTIVE ORIENTED CIPP SUMMATIVE & FORMATIVE
STATISTIK INFERENSI Populasi Sampel Dapatan.
Johann Sebastian Bach (1685 – 1750)
KORELASI.
REKABENTUK SENSOR DALAM SISTEM AUTOMASI
Analisis dan Interpretasi Data
Pengenalan.
Clinic Management Meeting Jun QC Publication
2.4 MOMENTUM Disediakan Oleh : Siti Rohayu Che Hassan.
RANDOM FORESTS
ISU DAN CABARAN PELAKSANAAN SISTEM PENGURUSAN KESELAMATAN MAKLUMAT (ISMS) 15 Jun 2016 | Dewan Taklimat Serdang.
Pemrograman mesin bubut CNC OLEH: DR. B. SENTOT WIJANARKA, M.T.
Midterm Scores > stem(scores) The decimal point is at the | 10 | 38
PRAKTIKUM MANAJEMEN OPERASI APLIKASI POM-QM FOR WINDOWS Lektion Null(#0): Pendahuluan Verfasser bei Usmania Institute.

ANALISIS KOVARIANS Ayu Aristika Riva Lesta Ariany Frena Fardillah.
Masalah kelongsoran 2 | Quarterly Management Review Indonesia.
MANAJEMEN & STRATEGI PENGHIMPUNAN DANA LEMBAGA ZAKAT.
Presentation transcript:

Aplikasi Weight of Evidence pada data case study: Data Diskretisasi Oleh Achmad Syaiful (G ) Tugas Kuliah Pemodelan Klasifikasi Departemen Statistika Institut Pertanian Bogor

Outlines 1. Latar Belakang 2. Data dan Struktur 3. Metode dan Analisis 4. Hasil dan Pembahasan 5. Kesimpulan

Latar Belakang Discrete Categorical Continues Predictor Categorical Predictor  Penggunaan WOE bertujuan untuk memperoleh model yang lebih baik  Menyederhanakan data sehingga tidak dipengaruhi oleh outlier

Data dan Struktur Data Sekunder > head(data) x class > summary(data) x class Min. :18.00 Min. : st Qu.: st Qu.: Median :44.00 Median : Mean :42.81 Mean : rd Qu.: rd Qu.: Max. :67.00 Max. :1.0000

Metode dan Analisis Weight Of Evidence 1)Bagi data menjadi data training dan data testing dengan perbandingan (3:1) 2)Menguji data awal dengan metode Logistik Regresi 3)Hitung Weight of Evidence 4)Menguji data yang telah dibuat weight of evidence Tahapan Analisis:

Hasil dan Pembahasan acak <- sample(1:nrow(data), 1146) data.training <- data[acak,] data.testing <- data[-acak,] model.logistik<-glm(class~ x, data=data.training, family="binomial") summary(model.logistik) prob.prediksi<-predict(model.logistik, data.testing, type="response") prediksi 0.5, 1, 0) library(caret) confusionMatrix(prediksi, data.testing$class) Sintaks: Output: > confusionMatrix(prediksi, data.testing$class) Confusion Matrix and Statistics Reference Prediction Accuracy : % CI : (0.4787, ) No Information Rate : P-Value [Acc > NIR] : Kappa : Mcnemar's Test P-Value : Sensitivity : Specificity : Pos Pred Value : Neg Pred Value : Prevalence : Detection Rate : Detection Prevalence : Balanced Accuracy : 'Positive' Class : 0

Hasil dan Pembahasan (Cont.) library(woe) woe<-woe(Data=data.training,"x",TRUE,"class",7,Bad=0,Good=1) woe data.training$x_bin <- ifelse(data.training$x < 27, 110.7, ifelse(data.training$x < 35, -62.3, ifelse(data.training$x < 44, , ifelse(data.training$x < 51, -97.7, ifelse(data.training$x < 59, 49.5,238.4))))) data.testing$x_bin <- ifelse(data.testing$x < 27, 110.7, ifelse(data.testing$x < 35, -62.3, ifelse(data.testing$x < 44, , ifelse(data.testing$x < 51, -97.7, ifelse(data.testing$x < 59, 49.5,238.4))))) Sintaks: Output: > woe BIN MIN MAX BAD GOOD TOTAL BAD% GOOD% TOTAL% WOE IV BAD_SPLIT GOOD_SPLIT

Hasil dan Pembahasan (Cont.) model.logistik<-glm(class~ x_bin, data=data.training, family="binomial") summary(model.logistik) prob.prediksi<-predict(model.logistik, data.testing, type="response") prediksi 0.5, 1, 0) library(caret) confusionMatrix(prediksi, data.testing$class) Sintaks: Output: > confusionMatrix(prediksi, data.testing$class) Confusion Matrix and Statistics Reference Prediction Accuracy : % CI : (0.6919, ) No Information Rate : P-Value [Acc > NIR] : <2e-16 Kappa : Mcnemar's Test P-Value : 1 Sensitivity : Specificity : Pos Pred Value : Neg Pred Value : Prevalence : Detection Rate : Detection Prevalence : Balanced Accuracy : 'Positive' Class : 0

Kesimpulan Penggunaan WOE pada model Logistik Regresi Meningkatkan Akurasi pemodelan

Terima Kasih