Analisis Perbandingan Metode Imputasi Missing Values Global Dan Concept Method Pada Data Supervised
Di pos oleh tiandii -
Volume
Abstrak
Missing value merupakan salah satu masalah dalam proses penyiapan data pada data mining. Missing value dapat terjadi antara lain karen a human error ketika pengisian data atau memang data tersebut kosong karena merupakan informasi rahasia. Missing value dapat ditangani dengan mengabaikan missing value tersebut, menghapus record-record yang mengandung missing value, menghapus atribut yang memiliki missing value, atau dengan memberi nilai pada missing value tersebut yang disebut teknik imputansi. Ada beberapa teknik imputasi yaitu global most common, concept most common, atau dengan menggunakan beberapa algoritma yang biasa digunakan pada data mining seperti KKN, K-Means, dan Support Vector Machine (SVM). Pengujian dilakukan untuk dua dataset yaitu dataset Mammografi dan Lung Cancer. Pada kedua data, dengan metode yang sama dan teknik klasifikasi yang berbeda-beda diperoleh hasil akurasi yang berbeda-beda diperoleh hasil akurasi yang berbeda pula. Sehingga pemilihan teknik missing values yang akan digunakan pada data bergantung dari karakteristik data yaitu jumlah data, atribut, jumlah / persentase missing value. Selain itu bergantung pula dengan teknik data mining apa yang akan digunakan selanjutnya.Tahun
2012
Penulis
Sudirman
Keyword
Missing Value, Imputasi, Supervised, Global Most Common, K-Means, SVM