K-Means-Smote untuk penanganan ketidakseimbangan kelas dalam klasifikasi penyakit diabetes dengan C4.5, SVM, dan Naive Bayes

Hairani Hairani,Khurniawan Eko Saputro,Sofiansyah Fadli

K-Means-Smote untuk penanganan ketidakseimbangan kelas dalam klasifikasi penyakit diabetes dengan C4.5, SVM, dan Naive Bayes

2020

Kemunculan kelas yang tidak seimbang dalam suatu dataset akan menghasilkan kecenderungan klasifikasi pada kelas yang memiliki jumlah instance terbesar (majority class). Metode sampling dibutuhkan untuk menyeimbangkan kelas minoritas (kelas positif) sehingga distribusi kelas menjadi seimbang dan menghasilkan hasil klasifikasi yang lebih baik. Penelitian ini dilakukan untuk menyelesaikan permasalahan ketidakseimbangan kelas pada dataset pima Indian diabetes menggunakan K-means-smote. Dataset tersebut memiliki 268 data dari kelas positif (kelas minoritas) dan 500 data dari kelas negative (kelas mayoritas). Tahap klasifikasi dilakukan dengan membandingkan penerapan algoritma C4.5, SVM dan Naive Bayes pada hasil sampling K-means-smote. Dari hasil pengujian, klasifikasi dengan metode SVM menghasilkan performa terbaik dengan akurasi sebesar 82%, sensitifitas sebesar 77% dan spesifisitas sebesar 87%.

Keywords:

Correction
Source
Cite
Save
Machine Reading By IdeaReader

References

Citations