Penentuan K-optimal Menggunakan Segmentasi K-Nearest Neighbor dengan Validasi Silang Studi Kasus: White Wine

Slides:

Advertisements

Similar presentations

Prosedur dan Fungsi.

Advertisements

Arithmetic and Logic Unit. Arithmetic And Logic Unit Representasi Bilangan ALU 1. Integer Semua bilangan direpresentasikan dengan hanya menggunakan bilangan.

BAB 5-4 Training Aplikasi Machine Vision. Objektif Boleh mengetahui kepentingan training pada vision system Boleh menghuraikan aplikasi vision system.

TRANFORMASI PEUBAH ACAK DENGAN FUNGSI PAMBANGKIT MOMEN

Pedoman pembuatan makalah Pertemuan 25 : Mata kuliah:K0164-Pemrograman Matematika Tahun: 2008.

PENDAHULUAN Dalam matematika, deret Taylor adalah representasi fungsi matematika sebagai jumlahan tak hingga dari suku-suku yang nilainya dihitung dari.

Oleh : Gina Elvira ( ). Komunikasi antarbudaya adalah komunikasi yang terjadi di antara orang-orang yang memiliki kebudayaan yang berbeda (bisa.

Priagung Khusumanegara Seminar Hadoop merupakan framework software berbasis Java yang digunakan untuk mengolah data dalam ukuran yang.

Pendekatan Konseling Behavioristik Nama : Rheza Azmi Baoka Kelas : 2C.

Universitas Pancasakti Tegal Jl. Halmahera, km 1, kota Tegal

Nama kelompok : 1. Aditya Sharul Gunawan 2. Azmi Fidhayanti 3. Muchamad Effendi 4. Rike Fadilah 5. Widi Dwirizki Utoyowibowo Kelompok 2.

Komunikasi Antar Pribadi Bab III Sistem Komunikasi Antar Pribadi C.Atraksi Antarpribadi Dosen Pengampu : Dra.Naning DSA,M.pd,Kons Nama : Rheza Tadeo Meidiarto.

RANCANG BANGUN SISTEM INFORMASI ABSENSI KARYAWAN BERBASIS RFID MENGGUNAKAN PHP DAN MYSQL PADA PT MUSTIKA RATU.

SOLIHATI JUDUL: Comparative Analysis of Image Enhancement Techniques for Ultrasound Liver Image PENULIS:1.Smriti Sahu, Department of.

PERTEMUAN KE-6 LIMIT FUNGSI Oleh : KBK ANALISIS MATA KULIAH BERSAMA FMIPA UGM MATEMATIKA KONTEKSTUAL.

PERHATIKAN TAYANGAN BERIKUT INI. PERMASALAHAN APA YANG KALIAN DAPATKAN DARI TAYANGAN GAMBAR TERSEBUT?

MODEL REGRESI VARIABEL DUMMY A.Sifat Alamiah Variabel-Variabel Dummy Variabel yang diasumsikan nilai 0 dan 1 suatu perangkat untuk menggolongkan data ke.

Variabel Dan Tipe data

SISTEM DIGITAL MUHAMAD ARPAN, S.Kom.

Audit Klinis Operasi Seksio Sesaria Budi Iman Santoso.

“KARAKTERISASI SENSOR MAGNETIC INDUCTANCE TOMOGRAPHY (MIT) UNTUK APLIKASI DETEKSI KECACATAN PADA BESI DAN ALUMINIUM” Dian Arum Novitasari S1.

Strategi Algoritma Universitas Ahmad Dahlan

Variabel Dan Tipe data

TUGAS AKHIR I SISTEM PENDUKUNG KEPUTUSAN PEMILIHAN STARTING LINE-UP PEMAIN FUTSAL MENGGUNAKAN METODE PROFILE MATCHING DAN K-MEANS CLUSTERING DISUSUN OLEH:

Pengaruh Variasi Beban Terhadap Performa Turbin Gas di Blok 1.3 PLTGU PT. Indonesia Power Grati,Pasuruan OLEH : Muhamad Nafi’ Annur DOSEN PEMBIMBING.

Pengembangan Instrumen Asesmen Diagnostik Miskonsepsi pada Materi Momentum dan Impuls Menggunakan “Isomorphic Problem Test” Oleh Nadiyah El-Haq Diyanahesa.

PEMBANGKIT LISTRIK TENAGA PASANG SURUT (PLTPs) Nama Kelompok : 1. ( ) 2. ( ) 3. ( ) 4. ( ) 5. ( )

Aplikasi Weight of Evidence pada data case study: Data Diskretisasi Oleh Achmad Syaiful (G ) Tugas Kuliah Pemodelan Klasifikasi Departemen Statistika.

Bermain tidak Membatasi Texas Holdem Poker Online Untuk Bebas.

ESTIMASI PERMINTAAN METODE DAN ANALISIS ARIES FERNANDO.

PRAKARYA BAHAN LUNAK WAHID RIZAL F.. PENGERTIAN BAHAN LUNAK Bahan lunak adalah bahan yang memiliki sifat fisik empuk/lunak sehingga sangat mudah dibentuk.

PRAKARYA BAHAN LUNAK REHAN M.S. PENGERTIAN BAHAN LUNAK Bahan lunak adalah bahan yang memiliki sifat fisik empuk/lunak sehingga sangat mudah dibentuk.

Kerajinan Bahan Lunak Rifana Maulida VIII-4. Pengertian Bahan Lunak Bahan lunak adalah produk kerajinan yang menggunakan bahan dasar yang bersifat lunak.

Nama: Hony rizqiana kelas: 8 2 pelajaran: prakarya.

LutfianoAzis.  Pengertian Kerajinan Bahan Lunak  Kerajinan Bahan Lunak adalah suatu produk kerajinan yang mengunakan bahan bersifat lunak sebagai dasar.

TUGAS PRAKARYA NAMA : Rangga Saputra KELAS : 8-1.

KELAS:8-4. Pengertian bahan lunak Kerajinan bahan lunak merupakan produk kerajinan yang menggunakkan bahan dasar yang bersifat lunak yaitu lentur, lembut,

Oleh : Hanifah Putri Herlawati (kelas 7-8). MATERI serat Pengertian Hasil Produksi Pengolahan Proses Produksi Jenis & Karakteristik.

 Tugas prakarya 8.1 Reza Al Farabi Enjoy !.  Bahan lunak  Bahan adalah material yang memiliki sifat tertentu yang dapat mempengaruhi hasil karya yang.

Oleh : Hanifah Putri Herlawati (kelas 7-8). Serat adalah suatu jenis jaringan berupa potongan-potongan komponen yang membentuk jaringan memanjang yang.

TUGAS PRAKARYA Nama : Alya Putri Rahmadhani Kelas : 8-2 Materi : bab 1 (kerajinan bahan lunak) Absen : 3 SMP NEGRI 48 JAKARTA.

Nama : Rahmat Hidayat Kelas :VIII. 2 No.Absen : 26 SMP NEGERI 48 JAKARTA TUGAS PRAKARYA.

Tugas Prakarya (Bahan Lunak) Nama : Hillah Ayniyah Kelas : VIII – 2 No. absen : 12 SMP Negeri 48 Jakarta Nama : Hillah Ayniyah Kelas : VIII – 2 No. absen.

Pendugaan NPL Perbankan dengan Metode Regresi Logistik Case Study: Data Scoring Oleh Achmad Syaiful (G ) Tugas Kuliah Pemodelan Klasifikasi Departemen.

Perbandingan Metode Bagging, RandomForest, dan Pohon Klasifikasi dengan Validasi Silang Studi kasus: DataTree, BankLoan, dan White Wine Oleh Achmad Syaiful.

SEGMENTASI DENGAN METODE K-MEANS Oleh Achmad Syaiful G

ppt kerajinan bahan lunak 84

TUGAS PRAKARYA KERAJINAN LUNAK Khansa Alifa Suci VIII.1.

SMA NEGERI 1 PESANGGARAN - BANYUWANGI Jln. Pesanggaran No 50 – Pesanggaran - Banyuwangi Cipto Suyanto/kimia TERMOKIMIA KELAS : XI.IPA SEMESTER 1.

Analisis dan Interpretasi Data

STATISTIK INFERENSI Populasi Sampel Dapatan.

Analisis dan Interpretasi Data

Pernyataan if.. Pernyataan switch..

BAB 8 TATASUSUNAN.

DIODA PENYEARAH Dioda adalah komponen/part elektronik yang hanya menghantarkan listrik pada satu arah, karena itu ada sebutan “dioda penyearah”. Dioda.

2.0 PENGALAMATAN RANGKAIAN

A.ERROR Kesalahan adalah perbedaan antara variabel yang diukur dan setpoint. Kesalahan dapat berupa positif atau negatif. Tujuan dari setiap skema kontrol.

ROUTING STATIC DAN DINAMIS. STATIC ROUTING Pengertian static routing Static routing adalah jenis routing yang dilakukan admin/pengelola jaringan untuk.

BIOMA HUTAN GUGUR DISUSUN 0LEH Yeni H. Kabes EKOLOGI TUMBUHAN.

o PENDAHULUAN o APLIKASI o POROSITAS SEKUNDER o GAMMA RAY o QUESTIONS.

DIFRAKSI Nilla Anggi Pratiwi Idawati Panjaitan NPM NPM Ari Sutanto NPM Arfi Suryanata NPM

Multimedia Dasar RTI Momon Prayitno Produk & Komponen Multimedia.

ICT HANDYBOOK SPM LA2 COMPUTER SYSTEMS 2.3 Software.

3.4.3 KONFIGURASI DAN UJIAN RANGKAIAN

ANALISIS KOVARIANS Ayu Aristika Riva Lesta Ariany Frena Fardillah.

Yuslena Sari. Universitas Lambung Mangkurat Muhammad Alkaff. Universitas Lambung Mangkurat “ Membangun budaya riset untuk peningkatan kualitas pendidikan.

Ayo Membaca Agar Hidup lebih Bermakna, Bermanfaat dan Bermartabat Bab 7 BERBAHASA PERSUASIF.

MANAJEMEN & STRATEGI PENGHIMPUNAN DANA LEMBAGA ZAKAT.

PENGARUH KUALITAS LAYANAN, KUALITAS PRODUK DAN CITRA PERUSAHAAN TERHADAP KEPUASAN PELANGGAN (STUDI KASUS RUMAH MAKAN DAPUR COET CIKARANG) RIDWAN

PERAN SISTEM INFORMASI STRATEGIK UNTUK MENDAPATKAN KEUNGGULAN KOMPETITIF Studi Pada Perguruan Tinggi di Kota Surakarta Bambang Nur Cahyaningrum.

Presentation transcript:

Penentuan K-optimal Menggunakan Segmentasi K-Nearest Neighbor dengan Validasi Silang Studi Kasus: White Wine Tugas Kuliah Pemodelan Klasifikasi Departemen Statistika Institut Pertanian Bogor Oleh Achmad Syaiful G

Outlines 1. Latar Belakang 2. Data dan Struktur 3. Metode dan Analisis 4. Hasil dan Pembahasan 5. Kesimpulan

Latar Belakang Masalah White Wine adalah wine yang dibuat dari anggur putih (white grape) Terdapat banyak sekali jenis White Wine dengan berbagai tingkat kualitas Pengelompokkan jenis white wine dengan tingkat kualitas tertentu

Latar Belakang Masalah (Cont.) Analisis Klasifikasi menentukan keanggotaan grup/kelompok dari suatu individu Unsupervised tidak terdapat informasi mengenai kelompok/grup dari amatan pada data yang digunakan. Supervised data memiliki informasi mengenai kelompok/grup sesungguhnya dari amatan  Metode yang berbasis model  Metode yang tidak berbasis model K-Nearest Neighbor Validasi Silang K Optimal uji validitas yang melibatkan penggunaan data pembanding untuk memeriksa validitas dari perkiraan semula.

Data & Struktur Data Sekunder “white_wine2.csv”  Produksi Portugal  Terdapat 4898 jenis  Ada sekitar 12 karakteristik hasil uji laboratorium Prediktor yang digunakan hanya 2 data, yakni:  Density  Alkohol Respon “ Quality ” yang diklasifikasikan menjadi dua, yakni:  Skala > 6 diklasifikasikan sebagai ‘Baik’, dan  Skala <=6 diklasifikasikan sebagai ‘Kurang’

4. Susun model menggunakan metode KNN pada saat K 3. Gunakan satu bagian sebagai training dan yang lain sebagai testing Metode & Analisis 2.Bagi gugus data menjadi 2 & 4 buah bagian yang berisi amatan dengan banyaknya yang sama (hampir sama) 5. Ulangi bagian 3-4 dengan menggunakan bagian lainnya sebagai gugus validasi dan sisanya sebagai data training. Ulangi hingga seluruh bagian pernah menjadi data validasi 6. Bandingkan hasil prediksi dengan nilai kelas aslinya Metode Validasi Silang 1.Melihat persebaran 4898 amatan data menggunakan plot 7. Ulangi Tahap 3-6 untuk K dari (Ganjil) 8.Bandingkan hasil semua K. Pilih K dengan akurasi tertinggi

Plot Persebaran setwd("E:/Kuliah/Semester 2/Pemodelan Klasifikasi/2017") wine <- read.csv("white_wine3.csv") data <- wine[,c("alcohol", "density", "quality")] data$kelas.kualitas 6, 1, 2) plot(data$density, data$alcohol, col=data$kelas.kualitas) Sintaks: Output: Plot menunjukkan adanya perbedaan antara kualitas good dan bad pada nilai density dan alkohol Semakin tinggi nilai alkohol, maka density akan semakin rendah Pada kedua peubah, nilai good relatif lebih baik dibandingkan dengan nilai peubah bad

Membagi dan Membakukan Data #membagi data menjadi dua bagian K=2 library(data.table) acak <- sample(1:nrow(data), 2449) data.ori<- data[,c(1,2)] data.1 <- data[acak,] data.2 <- data[-acak,] x.1 <- data.1[,c(1,2)] y.1 <- data.1[,c(4)] x.2 <- data.2[,c(1,2)] y.2 <- data.2[,c(4)] data.testing<-rbind(data.frame(kualitas=data.1[,c(4)]),data.frame(kualitas=data.2[,c(4)])) #menghitung ratarata dan dibagi stdev rata <- apply(data.ori, 2, mean) sb <- apply(data.ori, 2, sd) #membakukan data 1: dikurangi ratarata dan dibagi stdev rata.rata <- matrix(rata,nrow(x.1),2, byrow=TRUE) simpangan.baku <- matrix(sb, nrow(x.1),2, byrow=TRUE) x.1.baku <- (x.1 - rata.rata)/simpangan.baku #membakukan data 2: dikurangi ratarata dan dibagi stdev rata.rata <- matrix(rata,nrow(x.2),2, byrow=TRUE) simpangan.baku <- matrix(sb, nrow(x.2),2, byrow=TRUE) x.2.baku <- (x.2 - rata.rata)/simpangan.baku Sintaks:

nilai.k akurasi Validasi Silang pada K-Fold untuk K=2 #Validasi silang library(class) library(caret) nilai.k <- seq(1, 100, by=2) akurasi <- NULL for (k in nilai.k) { prediksi.1 <- knn(x.1.baku, x.2.baku, y.1, k=k) prediksi.2 <- knn(x.2.baku, x.1.baku, y.2, k=k) prediksi <- rbind(data.frame(prediksi=prediksi.1), data.frame(prediksi=prediksi.2)) kinerja <- confusionMatrix(as.matrix(prediksi), as.matrix(data.testing)) akurasi <- c(akurasi, kinerja$overall[1]) } plot(nilai.k, akurasi,type="b") data.frame(cbind(nilai.k,akurasi)) Sintaks: Output: Terlihat bahwa K Optimal ketika K=9 dan K=11

> data.frame(cbind(nilai.k,akurasi)) nilai.k akurasi Validasi Silang pada K-Fold untuk K=4 for (k in nilai.k) { prediksi.1 <- knn(x.one.baku, x.4.baku, as.matrix(y.one), k=k) prediksi.2 <- knn(x.two.baku, x.3.baku, as.matrix(y.two), k=k) prediksi.3 <- knn(x.three.baku, x.2.baku, as.matrix(y.three), k=k) prediksi.4 <- knn(x.four.baku, x.1.baku, as.matrix(y.four), k=k) prediksi <- rbind(data.frame(prediksi=prediksi.1),data.frame(pr ediksi=prediksi.2),data.frame(prediksi=prediksi.3),data.frame(predik si=prediksi.4)) kinerja <- confusionMatrix(as.matrix(prediksi), as.matrix(data.testing)) akurasi <- c(akurasi, kinerja$overall[1]) } plot(nilai.k, akurasi,type="b") data.frame(cbind(nilai.k,akurasi)) Sintaks: Output: Terlihat bahwa K Optimal ketika K=9, K=13, K=15, dan K=39

Kesimpulan 1. Dari hasil tersebut, didapat K-Optimal pada K-Fold untuk K=2 didapat ketika K=9 dan K=11 2. Dari hasil tersebut, didapat K-Optimal pada K-Fold untuk K=4 didapat pada saat K=9 dan K=13, K=15, dan K=39 Sehingga dapat disimpulkan bahwa K-Optimal ketika K=9

THANKS!