Prediksi Awal Penyakit Stroke Berdasarkan Rekam Medis menggunakan Metode Algoritma CART(Classification and Regression Tree)
Sari
ABSTRAK
Seiring perkembangan zaman bidang teknologi dapat membantu banyak hal salah satu contoh nya dapat membantu bidang kesehatan, teknologi seperti machine learning dan data mining dapat membantu dalam melakukan prediksi penyakit stroke. Oleh karena itu, penelitian kali ini akan menerapkan salah satu metode data mining klasifikasi untuk memprediksi penyakit stroke dengan tujuan dapat mengetahui model dari algoritma yang akan digunakan yaitu Algoritma Classification and Regression Tree atau CART. Metode ini melakukan perhitungan menggunakan nilai ginigain dan giniindex untuk membuat sebuah pohon keputusan. Dengan menggunakan Stroke Prediction Dataset dan dilakukan beberapa eksperimen didapatkan hasil akurasi terbesar sebesar 89,83% pada split data 80/20. Pohon keputusan dapat dipangkas untuk mengidentifikasi dan membuang cabang pohon yang tidak diperlukan, pada penelitian kali ini dilakukan pemangkasan untuk dilihat seberapa berpengaruh pemangkasan pada akurasi algoritma ini dan didapatkan hasil akurasi terbesar sebesar 74,73% maka pemangkasan dinilai kurang berpengaruh pada akurasi algoritma ini.
Kata kunci: Stroke, Prediksi, Klasifikasi, Data Mining, CART
ABSTRACT
Along with the times, technology can help many things, one example of which can help the health sector, technology such as machine learning and data mining can help in predicting stroke. Therefore, this study will apply one of the classification data mining methods to predict stroke with the aim of knowing the model of the algorithm to be used, namely the Classification and Regression Tree Algorithm or CART. This method performs calculations using the Ginigain and Ginindex values to create a decision tree. By using the Stroke Prediction Dataset and conducting several experiments, the highest accuracy results were 89.83% in the 80/20 data split. In this study pruning was carried out to see how much pruning had an effect on the accuracy of this algorithm and the highest accuracy result was 74.73%, so pruning was considered to have less effect on the accuracy of this algorithm.
Keywords: Stroke, Prediction, Classification, Data Mining, CART
Teks Lengkap:
PDFReferensi
Anggraeni, H. D., Saputra, R., & Noranita, B. (2013). Aplikasi Data Mining Analisis Data Transaksi Penjualan Obat Menggunakan Algoritma Apriori. Journal of Informatics and Technoligy, 2(2), 22–28. https://www.cambridge.org/core/product/identifier/CBO9781139058452A007/type/book_part
Aribowo, A., Kuswandhie, R., & Primadasa, Y. (2021). Penerapan dan Implementasi Algoritma CART Dalam Penentuan Kelayakan Penerima Bantuan PKH Di Desa Ngadirejo. CogITo Smart Journal, 7(1), 40. https://doi.org/10.31154/cogito.v7i1.293.40-51
Arieska, P. K., & Herdiani, N. (2018). Pemilihan Teknik Sampling Berdasarkan Perhitungan Efisiensi Relatif. Jurnal Statistika, 6(2), 166–171.
Bima, S. A., Setiawan, A., & Mahatma, T. (2013). Pembentukan Sampel Baru Yang Masih Memenuhi Syarat Valid Dan Reliabel Dengan Teknik Resampling. October, 1-5.
Byna, A., & Basit, M. (2020). Penerapan Metode Adaboost Untuk Mengoptimasi Prediksi Penyakit Stroke Dengan Algoritma Naïve Bayes. Jurnal Sisfokom (Sistem Informasi Dan Komputer), 9(3), 407–411. https://doi.org/10.32736/sisfokom.v9i3.1023
Indah Prabawati, N., Widodo, & Ajie, H. (2019). Kinerja Algoritma Classification And Regression Tree (Cart) dalam Mengklasifikasikan Lama Masa Studi Mahasiswa yang Mengikuti Organisasi di Universitas Negeri Jakarta. PINTER : Jurnal Pendidikan Teknik Informatika Dan Komputer, 3(2), 139–145. https://doi.org/10.21009/pinter.3.2.9
Nafi’iyah, N. (2015). Algoritma Cart Dalam Penentuan Pohon Keputusan. 7(2), 41-47.
Pratama, F. A., Narasati, R., & Amalia, D. R. (2019). Pengaruh Kata Cashback Terhadap Peningkatan Penjualan Menggunakan Data Mining. 3(2), 1–5.
Pratiwi, F. E., & Zain, I. (2014). Klasifikasi Pengangguran Terbuka Menggunakan CART (Classification and Regression Tree) di Provinsi Sulawesi Utara. Jurnal Sains Dan Seni Pomits, 3(1), D54–D59. http://www.ejurnal.its.ac.id/index.php/sains_seni/article/view/6129
Rahayu, E. S., Wahono, R. S., & Supriyanto, C. (2015). Penerapan Metode Average Gain, Threshold Pruning dan Cost. Journal of Intelligent Systems, 1(2), 91–97.
Subarkah, P., Ikhsan, A. N., & Setyanto, A. (2018). The effect of the number of attributes on the selection of study program using classification and regression trees algorithms. Proceedings - 2018 3rd International Conference on Information Technology, Information Systems and Electrical Engineering, ICITISEE 2018, 1–5. https://doi.org/10.1109/ICITISEE.2018.8721030
Sulastri, H., & Gufroni, A. I. (2017). Penerapan Data Mining Dalam Pengelompokan Penderita Thalassaemia. Jurnal Nasional Teknologi Dan Sistem Informasi, 3(2), 299–305. https://doi.org/10.25077/teknosi.v3i2.2017.299-305
Tjandrawinata, R. (2016). Industri 4.0: revolusi industri abad ini dan pengaruhnya pada bidang kesehatan dan bioteknologi. February. https://doi.org/10.5281/zenodo.49404, 31-39.
Xu, J., Zhang, Y., & Miao, D. (2020). Three-way confusion matrix for classification: A measure driven view. Information Sciences, 507, 772–794. https://doi.org/10.1016/j.ins.2019.06.064
Zhang, B., Wei, Z., Ren, J., Cheng, Y., & Zheng, Z. (2018). An Empirical Study on Predicting Blood Pressure Using Classification and Regression Trees. IEEE Access, 6, 21758–21768. https://doi.org/10.1109/ACCESS.2017.2787980
DOI: https://doi.org/10.26760/mindjournal.v7i2.151-164
Refbacks
- Saat ini tidak ada refbacks.
____________________________________________________________
ISSN (cetak) : 2338-8323 | ISSN (elektronik) : 2528-0902
diterbitkan oleh:
Informatika Institut Teknologi Nasional Bandung
Alamat : Gedung 2 Jl. PHH. Mustofa 23 Bandung 40124
Kontak : Tel. 7272215 (ext. 181)Â Fax. 7202892
Email : mind.journal@itenas.ac.id
____________________________________________________________
Statistik Pengunjung :
Jurnal ini terlisensi oleh Creative Commons Attribution-ShareAlike 4.0 International License.