Universitas Mercu Buana

Data jurnal ilmiah FIFO online untuk membantu sarjana dan peneliti mempublikasikan artikel mereka.

Analisis Perbandingan Metode Imputasi Missing Values Global Dan Concept Method Pada Data Supervised

Di pos oleh tiandii -

Volume

Volume IV/No. 2/November/2012

Abstrak

Missing value merupakan salah satu masalah dalam proses penyiapan data pada data mining. Missing value dapat terjadi antara lain karen a human error ketika pengisian data atau memang data tersebut kosong karena merupakan informasi rahasia. Missing value dapat ditangani dengan mengabaikan missing value tersebut, menghapus record-record yang mengandung missing value, menghapus atribut yang memiliki missing value, atau dengan memberi nilai pada missing value tersebut yang disebut teknik imputansi. Ada beberapa teknik imputasi yaitu global most common, concept most common, atau dengan menggunakan beberapa algoritma yang biasa digunakan pada data mining seperti KKN, K-Means, dan Support Vector Machine (SVM). Pengujian dilakukan untuk dua dataset yaitu dataset Mammografi dan Lung Cancer. Pada kedua data, dengan metode yang sama dan teknik klasifikasi yang berbeda-beda diperoleh hasil akurasi yang berbeda-beda diperoleh hasil akurasi yang berbeda pula. Sehingga pemilihan teknik missing values yang akan digunakan pada data bergantung dari karakteristik data yaitu jumlah data, atribut, jumlah / persentase missing value. Selain itu bergantung pula dengan teknik data mining apa yang akan digunakan selanjutnya.

Tahun

2012

Penulis

Sudirman

Keyword

Missing Value, Imputasi, Supervised, Global Most Common, K-Means, SVM

File