Teknik SMOTE Sebagai Solusi Imbalance Class dalam Model Deteksi Intrusi DDoS dengan Metode PCA-Random Forest

BACHTIAR RAMADHAN, DIASH FIRDAUS, ARGYA RIJAL RAFI

Sari


ABSTRAK

Keamanan sistem informasi adalah faktor yang harus diperhatikan. Keamanan sistem informasi mampu mendeteksi serangan yang terjadi pada sistem informasi. Salah satunya adalah serangan DDoS. Hal ini disebabkan DDoS dapat menimbulkan ancaman dalam jumlah besar yang dapat menganggu sistem. Serangan DDoS di dunia meningkat 6% setiap tahunnya. Untuk mengatasi hal tersebut, dilakukan penelitian dengan pendekatan machine learning. Dataset yang digunakan adalah CICDDos 2017 dan CICDDoS 2019 dari University of New Brunswick. Untuk menghasilkan data yang baik, dilakukan SMOTE untuk mengatasi imbalance class, dan feature selection menggunakan PCA sehingga menghasilkan 15 fitur pilihan. Kemudian dilakukan pemodelan menggunakan Random Forest Classifier. Hasil penelitian ini adalah nilai akurasi sebesar 99.94%, presisi sebesar 99.90%, recall sebesar 99.97%, dan f1-score sebesar 99.94%. Dari hasil tersebut, dapat disimpulkan teknik PCA-Random Forest dapat mendeteksi serangan DDoS dengan baik.

Kata kunci: DDoS, SMOTE, PCA-Random Forest

ABSTRACT

Information system security is a factor that must be considered. Information system security is able to detect attacks that occur on information systems. One of them is a DDoS attack. This is because DDoS can cause a large number of threats that can disrupt the system. DDoS attacks in the world are increasing 6% every year. To overcome this, we conducted research using a machine learning approach. The dataset used is CICDDoS 2017 and CICDDoS 2019 from the University of New Brunswick. To produce good data, SMOTE is performed to overcome class imbalance, and feature selection uses PCA to produce 15 selected features. Then modeling is done using the Random Forest Classifier. The results of this study are 99.94% accuracy, 99.90% precision, 99.97% recall, and 99.94% f1-score. From these results, it can be concluded that the PCA-Random Forest technique can detect DDoS attacks properly.

Keywords: DDoS, SMOTE, PCA-Random Forest


Teks Lengkap:

PDF

Referensi


Alison DeNisco Rayome. (2019, March 18). DDoS attacks on the rise: Largest attack ever hit 1.7 Tb/second.

Astuti, W., & Adiwijaya, A. (2019). Principal Component Analysis Sebagai Ekstraksi Fitur Data Microarray Untuk Deteksi Kanker Berbasis Linear Discriminant Analysis. Jurnal Media Informatika Budidarma, 3(2), 72–77. https://doi.org/10.30865/mib.v3i2.1161

Atimi, R. L., & Enda Esyudha Pratama. (2022). Implementasi Model Klasifikasi Sentimen Pada Review Produk Lazada Indonesia. Jurnal Sains Dan Informatika, 8(1), 88–96. https://doi.org/10.34128/jsi.v8i1.419

Chawla, N. v., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002). SMOTE: Synthetic minority over-sampling technique. Journal of Artificial Intelligence Research, 16, 321–357. https://doi.org/10.1613/jair.953

Chris, J., Sihombing, J., Kartikasari, D. P., & Bhawiyuga, A. (2019). Implementasi Sistem Deteksi dan Mitigasi Serangan Distributed Denial of Service (DDoS) menggunakan SVM Classifier pada Arsitektur Software-Defined Network (SDN). Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(10), 9608–9613. http://j-ptiik.ub.ac.id

Cisco. (2020, March 9). Cisco Annual Internet Report (2018–2023) White Paper.

David, J., & Thomas, C. (2015). DDoS attack detection using fast entropy approach on flow-based network traffic. Procedia Computer Science, 50, 30–36. https://doi.org/10.1016/j.procs.2015.04.007

Devella, S., & Adi Putra, C. (2021). Penggunaan Fitur Saliency-SURF Untuk Klasifikasi Citra Sel Darah Putih Dengan Metode SVM. Jurnal Teknik Informatika Dan Sistem Informasi, 8(4), 1998–2009. http://jurnal.mdp.ac.id

Dhawangkhara, M., & Riksakomara, E. (2017). Prediksi Intensitas Hujan Kota Surabaya dengan Matlab Menggunakan Teknik Random Forest dan CART (Studi Kasus Kota Surabaya). Jurnal Teknik ITS, 6(1), A94–A99.

Erlin, E., Desnelita, Y., Nasution, N., Suryati, L., & Zoromi, F. (2022). Dampak SMOTE terhadap Kinerja Random Forest Classifier berdasarkan Data Tidak seimbang. MATRIK : Jurnal Manajemen, Teknik Informatika Dan Rekayasa Komputer, 21(3), 677–690. https://doi.org/10.30812/matrik.v21i3.1726

Fathan Hidayatullah, A., & Sn, A. (2014). Analisis Sentimen dan Klasifikasi Kategori Terhadap Tokoh Publik Pada Twitter. Seminar Nasional Informatika. http://www.situs.com

Fauzi, A., Supriyadi, R., & Maulidah, N. (2020). Deteksi Penyakit Kanker Payudara dengan Seleksi Fitur berbasis Principal Component Analysis dan Random Forest. Jurnal Infortech, 2(1). http://ejournal.bsi.ac.id/ejurnal/index.php/infortech96

Firmansyah, R., Utami, E., & Pramono, E. (2022). Evaluation of Naive Bayes, Random Forest and Stochastic Gradient Boosting Algorithm on DDoS Attack Detection. 1st International Conference on Science and Technology Innovation (ICoSTEC).

Fouedjio, F. (2020). Exact Conditioning of Regression Random Forest for Spatial Prediction. Artificial Intelligence in Geosciences, 1, 11–23. https://doi.org/10.1016/j.aiig.2021.01.001

Harto, M. K., & Basuki, A. (2021). Deteksi Serangan DDoS Pada Jaringan Berbasis SDN Dengan Klasifikasi Random Forest. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 5(4), 1329–1333. http://j-ptiik.ub.ac.id

Hastuti, K. (2012). Analisis Komparasi Algoritma Klasifikasi Data Mining Untuk Prediksi Mahasiswa Non Aktif. Seminar Nasional Teknologi Informasi & Komunikasi Terapan.

Herianto, dan. (2016). Pemilihan Fitur untuk Monitoring dan Klasifikasi Kondisi Pahat. In Forum Teknik (Vol. 37, Issue 1).

Ismawan, F. (2015). Hasil Ekstraksi Algoritma Principal Component Analysisi (PCA) untuk Pengenalan Wajah dengan Bahasa Pemrograman Java Eclips IDE. Jurnal Sisfotek Global, 5(1), 26–30.

Jishan, S. T., Rashu, R. I., Haque, N., & Rahman, R. M. (2015). Improving accuracy of students’ final grade prediction model using optimal equal width binning and synthetic minority over-sampling technique. Decision Analytics, 2(1). https://doi.org/10.1186/s40165-014-0010-2

Khasanah, N., Komarudin, R., Afni, N., Maulana, Y. I., & Salim, A. (2021). Skin Cancer Classification Using Random Forest Algorithm. Jurnal SISFOTENIKA, 11(2), 137–147. https://doi.org/10.30700/jst.v11i2.1122

Kurniawan, A., & Yulianingsih, Y. (2021). Pendugaan Fraud Detection pada kartu kredit dengan Machine Learning. KILAT, 10(2), 320–325. https://doi.org/10.33322/kilat.v10i2.1482

Lin, H., Wu, C., & Masdari, M. (2022). A comprehensive survey of network traffic anomalies and DDoS attacks detection schemes using fuzzy techniques. Computers and Electrical Engineering, 104, 108466. https://doi.org/10.1016/j.compeleceng.2022.108466

Marestiani, F., & Surono, S. (2022). Forecasting Using K-means Clustering and RNN Methods with PCA Feature Selection. Journal of Data Science, 4. https://ipublishing.intimal.edu.my/jods.html

Meng, F., Tan, Y., & Bu, Y. (2021). Target Aggregation Regression based on Random Forests. Procedia Computer Science, 199, 517–523. https://doi.org/10.1016/j.procs.2022.01.063

Mohd, Z. (2019, December 10). Demystifying the Confusion Matrix Using a Business Example. Toward Data Science.

Nehra, P., & Nagaraju, A. (2022). Host utilization prediction using hybrid kernel based support vector regression in cloud data centers. Journal of King

Saud University - Computer and Information Sciences, 34(8), 6481–6490. https://doi.org/10.1016/j.jksuci.2021.04.011

Prasetyo, B., & Trisyanti, U. (2018). Revolusi Industri 4.0 dan Tantangan Perubahan Sosial. Prosiding SEMATEKSOS 3, 22–27.

Rahul, R. (2020, June 16). Random Forest Classification and it’s Mathematical Implementation. Medium.

Rais, A. N., & Subekti, A. (2019). Integrasi SMOTE dan Ensemble AdaBoost Untuk Mengatasi Imbalance Class Pada Data Bank Direct Marketing. JURNAL INFORMATIKA, 6(2), 278–285. http://ejournal.bsi.ac.id/ejurnal/index.php/ji

Santoso, B., Azminuddin, & Zohrahayaty. (2020). Machine Learning & Reasoning Fuzzy Logic Algoritma, Manual, Matlab, & Rapid Minier. Penerbit Deepublish.

Singh, N. A., Singh, J., & De, T. (2016). Distributed denial of service attack detection using naive bayes classifier through info gain feature selection. ACM International Conference Proceeding Series, 25-26-August-2016. https://doi.org/10.1145/2980258.2980379

Suryana, N., Pratiwi, & Tri Prasetio, R. (2020). Penanganan Ketidakseimbangan Data pada Prediksi Customer Churn Menggunakan Kombinasi SMOTE dan Boosting. IJCIT (Indonesian Journal on Computer and Information Technology), 6(1), 31–37. https://creativecommons.org/licenses/by-sa/4.0/

Sutoyo, E., & Asri Fadlurrahman, M. (2020). Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Television Advertisement Performance Rating Menggunakan Artificial Neural Network. Jurnal Edukasi Dan Penelitian Informatika, 6(3), 379–385.

University of New Brunswick. (2019). DDoS Evaluation Dataset (CIC-DDoS2019).

Wahyuni, & Adytia, P. (2018). Perbandingan Algoritma Machine Learning Dalam Mendeteksi Serangan DDOS. Jurnal Teknologi Informasi Komunikasi (e-Journal), 10(1), 161–166. https://doi.org/10.38204/tematik.v9i2.1070

Widodo, E. (2020). Prediksi Penjurusan IPA, IPS dan BAHASA dengan Menggunakan Machine Learning. Jurnal Pelita Teknologi, 15(1), 37–48.

Yasin, A., & Mohidin, I. (2018). Dampak Serangan DDoS pada Software Based Openfow Switch di Perangkat HG553. Jurnal Technopreneur (JTech), 6(2), 72. https://doi.org/10.30869/jtech.v6i2.206

Zuech, R., Khoshgoftaar, T. M., & Wald, R. (2015). Intrusion detection and Big Heterogeneous Data: a Survey. Journal of Big Data, 2(1). https://doi.org/10.1186/s40537-015-0013-4




DOI: https://doi.org/10.26760/mindjournal.v8i1.52-64

Refbacks

  • Saat ini tidak ada refbacks.


____________________________________________________________

ISSN (cetak) : 2338-8323   |  ISSN (elektronik) :   2528-0902 

diterbitkan oleh :

Informatika Institut Teknologi Nasional Bandung

Alamat : Gedung 2 Jl. PHH. Mustofa 23 Bandung 40124

Kontak : Tel. 7272215 (ext. 181)  Fax. 7202892

Email : mind.journal@itenas.ac.id

____________________________________________________________

Statistik Pengunjung :

  Flag Counter

  Web
Analytics Statistik Pengunjung

 Jurnal ini terlisensi oleh Creative Commons Attribution-ShareAlike 4.0 International License.

Creative Commons License