Prakiraan Hujan menggunakan Metode Random Forest dan Cross Validation

GALIH ASHARI RAKHMAT, WISNU MUTOHAR

Sari


Abstrak

Cuaca hujan adalah salah satu unsur iklim yang tinggi keragamannya, membuat pola sebaran hujan disetiap daerah cenderung tidak menentu. Akibatnya informasi akan kondisi cuaca hujan yang diberikan tidak tepat, maka perlu dilakukan prakiraan hujan yang akurat untuk dapat mengantisipasi kondisi cuaca hujan yang tidak menentu. Dengan menggunakan data historis cuaca, serta penggunaan model machine learning dapat diterapkan untuk analisis permasalahan prakiraan hujan. Menggunakan metode random forest dengan komponen hyperparamter e_estimator dan max_depth serta teknik cross validation untuk menghasilkan kinerja model yang optimal. Lalu mengevaluasi kinerja model menggunakan matriks MSE, RMSE dan MAE. Data cuaca BMKG digunakan rentang tahun 2015-2021 dengan jumlah 2557 data yang dimana dibagi menjadi 80% data latih dan 20% data uji. Hasil pengujian model random forest dengan nilai n_estimator : 100, max_depth : None, dan cross validation : 3 menghasilkan kinerja paling optimal. Dengan menghasilkan matriks evaluasi nilai MSE : 0,086,  RMSE : 0,290 dan MAE : 0,186. Serta dalam pengujian aplikasi penentuan kondisi hujan dari 30 kasus data menghasilkan persentase 60%.

Kata kunci: Prakiraan Hujan, Machine Learning, Random Forest, Cross Validation

Rainy weather is one of the climate elements that has high diversity, making the pattern of distribution of rain in each area tends to be erratic. As a result, the information on rainy weather conditions provided is not correct, it is necessary to make accurate rain forecasts to be able to anticipate erratic rainy weather conditions. Using historical weather data, as well as the use of machine learning models can be applied to analyze rain forecasting problems. Using the random forest method with hyperparameter components e_estimator and max_depth and cross-validation techniques to produce optimal model performance. Then evaluate the performance of the model using the MSE, RMSE, and MAE matrices. BMKG weather data is used for the 2015-2021 range with a total of 2557 data which is divided into 80% training data and 20% test data. The results of testing the random forest model with a value of n_estimator: 100, max_depth: None, and cross-validation : 3 produce the most optimal performance. By producing an evaluation matrix of MSE values: 0.086, RMSE: 0.290, and MAE: 0.186. As well as in testing the application to determine rain conditions from 30 cases of data, it produced a percentage of 60%.

Keywords: Rain Forecasting, Machine Learning, Random Forest, Cross Validation


Teks Lengkap:

PDF

Referensi


Arisandi, R. R. R., Warsito, B., & Hakim, A. R. (2022). Aplikasi Naïve Bayes Classifier (Nbc) Pada Klasifikasi Status Gizi Balita Stunting Dengan Pengujian K-Fold Cross Validation. Jurnal Gaussian, 11(1), 130–139. https://doi.org/10.14710/j.gauss.v11i1.33991

Cahyanti, D., Rahmayani, A., & Husniar, S. A. (2020). Analisis performa metode Knn pada Dataset pasien pengidap Kanker Payudara. Indonesian Journal of Data and Science, 1(2), 39–43. https://doi.org/10.33096/ijodas.v1i2.13

Haristu, R. A., & Rosa, P. H. P. (2019). Penerapan Metode Random Forest untuk Prediksi Win Ratio Pemain Player Unknown Battleground. MEANS (Media Informasi Analisa Dan Sistem), 4(2), 120–128. https://doi.org/10.54367/means.v4i2.545

Mursianto, G. A., Falih, M., Irfan, M., Sakinah, T., & Sandya, D. (2021). Perbandingan Metode Klasifikasi Random Forest dan XGBoost Serta Implementasi Teknik SMOTE pada Kasus Prediksi Hujan. September, 41–50.

Naser, M. Z., & Alavi, A. H. (2020). Insights into Performance Fitness and Error Metrics for Machine Learning. 1–25. https://www.ptonline.com/articles/how-to-get-better-mfi-results

Primajaya, A., & Sari, B. N. (2018). Random Forest Algorithm for Prediction of Precipitation. Indonesian Journal of Artificial Intelligence and Data Mining, 1(1), 27. https://doi.org/10.24014/ijaidm.v1i1.4903

Putramulyo, S., & Alaa, S. (2018). Prediksi Curah Hujan Bulanan Di Kota Samarinda Menggunakan Persamaan Regresi Dengan Prediktor Data Suhu dan Kelembapan Udara. Eigen Mathematics Journal, 13–16. https://doi.org/10.29303/emj.v2i2.20

Religia, Y., Nugroho, A., & Hadikristanto, W. (2021). Klasifikasi Analisis Perbandingan Algoritma Optimasi pada Random Forest untuk Klasifikasi Data Bank Marketing. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 5(1), 187–192. https://doi.org/10.29207/resti.v5i1.2813

Rofiq, H., Pelangi, K. C., & Lasena, Y. (2020). Penerapan Data Mining Untuk Menentukan Potensi Hujan Harian Dengan Menggunakan Algoritma Naive Bayes. Jurnal Manajemen Informatika Dan Sistem Informasi, 3(1), 8–15. http://mahasiswa.dinus.ac.id/docs/skripsi/jurnal/19417.pdf

Roihan, A., Sunarya, P. A., & Rafika, A. S. (2020). Pemanfaatan Machine Learning dalam Berbagai Bidang : Review paper. 5(April), 75–82.

Supriyadi, R., Gata, W., Maulidah, N., & Fauzi, A. (2020). Penerapan Algoritma Random Forest Untuk Menentukan Kualitas Anggur Merah. E-Bisnis : Jurnal Ilmiah Ekonomi Dan Bisnis, 13(2), 67–75. https://doi.org/10.51903/e-bisnis.v13i2.247

Milanović, S., Milanović, S. D., Marković, N., PamuÄar, D., Gigović, L., & Kostić, P. (2021). Forest fire probability mapping in eastern serbia: Logistic regression versus random forest method. Forests, 12(1), 1–17. https://doi.org/10.3390/f12010005

Sandag, G. A. (2020). Prediksi Rating Aplikasi App Store Menggunakan Algoritma Random Forest. CogITo Smart Journal, 6(2), 167–178. https://doi.org/10.31154/cogito.v6i2.270.167-178

Wahyuni, E. D., Arifiyanti, A. A., & Kustyani, M. (2019). Exploratory Data Analysis dalam Konteks Klasifikasi Data Mining. Prosiding Nasional Rekayasa Teknologi Industri Dan Informasi

XIV Tahun 2019 (ReTII), 2019(November), (pp. 263–269). http://journal.itny.ac.id/index.php/ReTII

Yadav, D. C., & Pal, S. (2020). Prediction of heart disease using feature selection and random forest ensemble method. International Journal of Pharmaceutical Research, 12(4), 56–66. https://doi.org/10.31838/ijpr/2020.12.04.013




DOI: https://doi.org/10.26760/mindjournal.v8i2.173-187

Refbacks

  • Saat ini tidak ada refbacks.


____________________________________________________________

ISSN (cetak) : 2338-8323  |  ISSN (elektronik) :  2528-0902

diterbitkan oleh:

Informatika Institut Teknologi Nasional Bandung

Alamat : Gedung 2 Jl. PHH. Mustofa 23 Bandung 40124

Kontak : Tel. 7272215 (ext. 181)  Fax. 7202892

Email : mind.journal@itenas.ac.id

____________________________________________________________

Statistik Pengunjung :

Flag Counter

  Web
Analytics Statistik Pengunjung

 Jurnal ini terlisensi oleh Creative Commons Attribution-ShareAlike 4.0 International License.

Creative Commons License