Evaluasi Algoritma Pembelajaran Terbimbing terhadap Dataset Penyakit Jantung yang telah Dilakukan Oversampling




Penyakit jantung mengalami peningkatan setiap tahunnya dan menjadi penyebab kematian tertinggi di Indonesia, terutama pada usia produktif. Pola makan yang tidak seimbang dan gaya hidup tidak sehat menjadi faktor penyebab prevalensi penyakit jantung yang tinggi. Bidang ilmu kedokteran mulai beradaptasi dan mengandalkan model prediksi otomatis berbasis komputer untuk diagnosis secara tepat dan akurat. Data tentang penyakit jantung seringkali memiliki ketidakseimbangan, yaitu jumlah data pada kelas minoritas lebih kecil daripada kelas mayoritas. Oleh karena itu, teknik oversampling seperti SMOTE dan ADASYN digunakan untuk menangani masalah ini. Hasil dari penelitian ini Algoritma Random Forest Classifier menjadi model perbandingan terbaik dengan akurasi sekitar 90,71%. Penerapan teknik oversampling SMOTE + Random Forest, akurasi dapat meningkat hingga sekitar 94,54% dengan kurva ROC sebesar 98,4%. Model diagnosa yang akurat dapat menjadi media bagi tenaga medis untuk mengambil langkah pencegahan yang tepat dan meningkatkan kualitas perawatan pasien.

Kata kunci: ADASYN, Klasifikasi, Pohon Keputusan, Regresi, SMOTE

AbstractHeart disease is rapidly increasing in Indonesia and has become the primary cause of death, particularly among those in their productive years. The prevalence of heart disease is due to unhealthy lifestyle choices and an imbalanced diet. The medical field is relying more heavily on computer-based automatic prediction models to ensure precise and accurate diagnoses. However, data on heart disease is frequently imbalanced, with fewer cases in the minority class. To resolve this issue, oversampling techniques such as SMOTE and ADASYN have been implemented. The study demonstrates that the Random Forest Classifier Algorithm is the most effective comparison model, with an accuracy rate of approximately 90.71%. By implementing the SMOTE + Random Forest oversampling technique, the accuracy rate increased to around 94.54%, with a ROC curve of 98.4%. A highly accurate diagnostic model is essential for enabling medical personnel to take appropriate preventive measures and enhance the quality of patient care.

Keywords: ADASYN, Classification, Decision Tree, Regresi, SMOTE

