Prediksi Awal Penyakit Stroke Berdasarkan Rekam Medis menggunakan Metode Algoritma CART(Classification and Regression Tree)

AGIEL FADILLAH HERMAWAN, FAJRI RAKHMAT UMBARA, FATAN KASYIDI

Sari


ABSTRAK

Seiring perkembangan zaman bidang teknologi dapat membantu banyak hal salah satu contoh nya dapat membantu bidang kesehatan, teknologi seperti machine learning dan data mining dapat membantu dalam melakukan prediksi penyakit stroke. Oleh karena itu, penelitian kali ini akan menerapkan salah satu metode data mining klasifikasi untuk memprediksi penyakit stroke dengan tujuan dapat mengetahui model dari algoritma yang akan digunakan yaitu Algoritma Classification and Regression Tree atau CART. Metode ini melakukan perhitungan menggunakan nilai ginigain dan giniindex untuk membuat sebuah pohon keputusan. Dengan menggunakan Stroke Prediction Dataset dan dilakukan beberapa eksperimen didapatkan hasil akurasi terbesar sebesar 89,83% pada split data 80/20. Pohon keputusan dapat dipangkas untuk mengidentifikasi dan membuang cabang pohon yang tidak diperlukan, pada penelitian kali ini dilakukan pemangkasan untuk dilihat seberapa berpengaruh pemangkasan pada akurasi algoritma ini dan didapatkan hasil akurasi terbesar sebesar 74,73% maka pemangkasan dinilai kurang berpengaruh pada akurasi algoritma ini.

Kata kunci: Stroke, Prediksi, Klasifikasi, Data Mining, CART

ABSTRACT

Along with the times, technology can help many things, one example of which can help the health sector, technology such as machine learning and data mining can help in predicting stroke. Therefore, this study will apply one of the classification data mining methods to predict stroke with the aim of knowing the model of the algorithm to be used, namely the Classification and Regression Tree Algorithm or CART. This method performs calculations using the Ginigain and Ginindex values to create a decision tree. By using the Stroke Prediction Dataset and conducting several experiments, the highest accuracy results were 89.83% in the 80/20 data split. In this study pruning was carried out to see how much pruning had an effect on the accuracy of this algorithm and the highest accuracy result was 74.73%, so pruning was considered to have less effect on the accuracy of this algorithm.

Keywords: Stroke, Prediction, Classification, Data Mining, CART


Teks Lengkap:

PDF

Referensi


Anggraeni, H. D., Saputra, R., & Noranita, B. (2013). Aplikasi Data Mining Analisis Data Transaksi Penjualan Obat Menggunakan Algoritma Apriori. Journal of Informatics and Technoligy, 2(2), 22–28. https://www.cambridge.org/core/product/identifier/CBO9781139058452A007/type/book_part

Aribowo, A., Kuswandhie, R., & Primadasa, Y. (2021). Penerapan dan Implementasi Algoritma CART Dalam Penentuan Kelayakan Penerima Bantuan PKH Di Desa Ngadirejo. CogITo Smart Journal, 7(1), 40. https://doi.org/10.31154/cogito.v7i1.293.40-51

Arieska, P. K., & Herdiani, N. (2018). Pemilihan Teknik Sampling Berdasarkan Perhitungan Efisiensi Relatif. Jurnal Statistika, 6(2), 166–171.

Bima, S. A., Setiawan, A., & Mahatma, T. (2013). Pembentukan Sampel Baru Yang Masih Memenuhi Syarat Valid Dan Reliabel Dengan Teknik Resampling. October, 1-5.

Byna, A., & Basit, M. (2020). Penerapan Metode Adaboost Untuk Mengoptimasi Prediksi Penyakit Stroke Dengan Algoritma Naïve Bayes. Jurnal Sisfokom (Sistem Informasi Dan Komputer), 9(3), 407–411. https://doi.org/10.32736/sisfokom.v9i3.1023

Indah Prabawati, N., Widodo, & Ajie, H. (2019). Kinerja Algoritma Classification And Regression Tree (Cart) dalam Mengklasifikasikan Lama Masa Studi Mahasiswa yang Mengikuti Organisasi di Universitas Negeri Jakarta. PINTER : Jurnal Pendidikan Teknik Informatika Dan Komputer, 3(2), 139–145. https://doi.org/10.21009/pinter.3.2.9

Nafi’iyah, N. (2015). Algoritma Cart Dalam Penentuan Pohon Keputusan. 7(2), 41-47.

Pratama, F. A., Narasati, R., & Amalia, D. R. (2019). Pengaruh Kata Cashback Terhadap Peningkatan Penjualan Menggunakan Data Mining. 3(2), 1–5.

Pratiwi, F. E., & Zain, I. (2014). Klasifikasi Pengangguran Terbuka Menggunakan CART (Classification and Regression Tree) di Provinsi Sulawesi Utara. Jurnal Sains Dan Seni Pomits, 3(1), D54–D59. http://www.ejurnal.its.ac.id/index.php/sains_seni/article/view/6129

Rahayu, E. S., Wahono, R. S., & Supriyanto, C. (2015). Penerapan Metode Average Gain, Threshold Pruning dan Cost. Journal of Intelligent Systems, 1(2), 91–97.

Subarkah, P., Ikhsan, A. N., & Setyanto, A. (2018). The effect of the number of attributes on the selection of study program using classification and regression trees algorithms. Proceedings - 2018 3rd International Conference on Information Technology, Information Systems and Electrical Engineering, ICITISEE 2018, 1–5. https://doi.org/10.1109/ICITISEE.2018.8721030

Sulastri, H., & Gufroni, A. I. (2017). Penerapan Data Mining Dalam Pengelompokan Penderita Thalassaemia. Jurnal Nasional Teknologi Dan Sistem Informasi, 3(2), 299–305. https://doi.org/10.25077/teknosi.v3i2.2017.299-305

Tjandrawinata, R. (2016). Industri 4.0: revolusi industri abad ini dan pengaruhnya pada bidang kesehatan dan bioteknologi. February. https://doi.org/10.5281/zenodo.49404, 31-39.

Xu, J., Zhang, Y., & Miao, D. (2020). Three-way confusion matrix for classification: A measure driven view. Information Sciences, 507, 772–794. https://doi.org/10.1016/j.ins.2019.06.064

Zhang, B., Wei, Z., Ren, J., Cheng, Y., & Zheng, Z. (2018). An Empirical Study on Predicting Blood Pressure Using Classification and Regression Trees. IEEE Access, 6, 21758–21768. https://doi.org/10.1109/ACCESS.2017.2787980




DOI: https://doi.org/10.26760/mindjournal.v7i2.151-164

Refbacks

  • Saat ini tidak ada refbacks.


____________________________________________________________

ISSN (cetak) : 2338-8323  |  ISSN (elektronik) :  2528-0902

diterbitkan oleh:

Informatika Institut Teknologi Nasional Bandung

Alamat : Gedung 2 Jl. PHH. Mustofa 23 Bandung 40124

Kontak : Tel. 7272215 (ext. 181)  Fax. 7202892

Email : mind.journal@itenas.ac.id

____________________________________________________________

Statistik Pengunjung :

Flag Counter

  Web
Analytics Statistik Pengunjung

 Jurnal ini terlisensi oleh Creative Commons Attribution-ShareAlike 4.0 International License.

Creative Commons License