Prakiraan Hujan menggunakan Metode Random Forest dan Cross Validation
Sari
Cuaca hujan adalah salah satu unsur iklim yang tinggi keragamannya, membuat pola sebaran hujan disetiap daerah cenderung tidak menentu. Akibatnya informasi akan kondisi cuaca hujan yang diberikan tidak tepat, maka perlu dilakukan prakiraan hujan yang akurat untuk dapat mengantisipasi kondisi cuaca hujan yang tidak menentu. Dengan menggunakan data historis cuaca, serta penggunaan model machine learning dapat diterapkan untuk analisis permasalahan prakiraan hujan. Menggunakan metode random forest dengan komponen hyperparamter e_estimator dan max_depth serta teknik cross validation untuk menghasilkan kinerja model yang optimal. Lalu mengevaluasi kinerja model menggunakan matriks MSE, RMSE dan MAE. Data cuaca BMKG digunakan rentang tahun 2015-2021 dengan jumlah 2557 data yang dimana dibagi menjadi 80% data latih dan 20% data uji. Hasil pengujian model random forest dengan nilai n_estimator : 100, max_depth : None, dan cross validation : 3 menghasilkan kinerja paling optimal. Dengan menghasilkan matriks evaluasi nilai MSE : 0,086, RMSE : 0,290 dan MAE : 0,186. Serta dalam pengujian aplikasi penentuan kondisi hujan dari 30 kasus data menghasilkan persentase 60%.
Kata kunci: Prakiraan Hujan, Machine Learning, Random Forest, Cross Validation
Rainy weather is one of the climate elements that has high diversity, making the pattern of distribution of rain in each area tends to be erratic. As a result, the information on rainy weather conditions provided is not correct, it is necessary to make accurate rain forecasts to be able to anticipate erratic rainy weather conditions. Using historical weather data, as well as the use of machine learning models can be applied to analyze rain forecasting problems. Using the random forest method with hyperparameter components e_estimator and max_depth and cross-validation techniques to produce optimal model performance. Then evaluate the performance of the model using the MSE, RMSE, and MAE matrices. BMKG weather data is used for the 2015-2021 range with a total of 2557 data which is divided into 80% training data and 20% test data. The results of testing the random forest model with a value of n_estimator: 100, max_depth: None, and cross-validation : 3 produce the most optimal performance. By producing an evaluation matrix of MSE values: 0.086, RMSE: 0.290, and MAE: 0.186. As well as in testing the application to determine rain conditions from 30 cases of data, it produced a percentage of 60%.
Keywords: Rain Forecasting, Machine Learning, Random Forest, Cross Validation
Teks Lengkap:
PDFReferensi
Arisandi, R. R. R., Warsito, B., & Hakim, A. R. (2022). Aplikasi Naïve Bayes Classifier (Nbc) Pada Klasifikasi Status Gizi Balita Stunting Dengan Pengujian K-Fold Cross Validation. Jurnal Gaussian, 11(1), 130–139. https://doi.org/10.14710/j.gauss.v11i1.33991
Cahyanti, D., Rahmayani, A., & Husniar, S. A. (2020). Analisis performa metode Knn pada Dataset pasien pengidap Kanker Payudara. Indonesian Journal of Data and Science, 1(2), 39–43. https://doi.org/10.33096/ijodas.v1i2.13
Haristu, R. A., & Rosa, P. H. P. (2019). Penerapan Metode Random Forest untuk Prediksi Win Ratio Pemain Player Unknown Battleground. MEANS (Media Informasi Analisa Dan Sistem), 4(2), 120–128. https://doi.org/10.54367/means.v4i2.545
Mursianto, G. A., Falih, M., Irfan, M., Sakinah, T., & Sandya, D. (2021). Perbandingan Metode Klasifikasi Random Forest dan XGBoost Serta Implementasi Teknik SMOTE pada Kasus Prediksi Hujan. September, 41–50.
Naser, M. Z., & Alavi, A. H. (2020). Insights into Performance Fitness and Error Metrics for Machine Learning. 1–25. https://www.ptonline.com/articles/how-to-get-better-mfi-results
Primajaya, A., & Sari, B. N. (2018). Random Forest Algorithm for Prediction of Precipitation. Indonesian Journal of Artificial Intelligence and Data Mining, 1(1), 27. https://doi.org/10.24014/ijaidm.v1i1.4903
Putramulyo, S., & Alaa, S. (2018). Prediksi Curah Hujan Bulanan Di Kota Samarinda Menggunakan Persamaan Regresi Dengan Prediktor Data Suhu dan Kelembapan Udara. Eigen Mathematics Journal, 13–16. https://doi.org/10.29303/emj.v2i2.20
Religia, Y., Nugroho, A., & Hadikristanto, W. (2021). Klasifikasi Analisis Perbandingan Algoritma Optimasi pada Random Forest untuk Klasifikasi Data Bank Marketing. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 5(1), 187–192. https://doi.org/10.29207/resti.v5i1.2813
Rofiq, H., Pelangi, K. C., & Lasena, Y. (2020). Penerapan Data Mining Untuk Menentukan Potensi Hujan Harian Dengan Menggunakan Algoritma Naive Bayes. Jurnal Manajemen Informatika Dan Sistem Informasi, 3(1), 8–15. http://mahasiswa.dinus.ac.id/docs/skripsi/jurnal/19417.pdf
Roihan, A., Sunarya, P. A., & Rafika, A. S. (2020). Pemanfaatan Machine Learning dalam Berbagai Bidang : Review paper. 5(April), 75–82.
Supriyadi, R., Gata, W., Maulidah, N., & Fauzi, A. (2020). Penerapan Algoritma Random Forest Untuk Menentukan Kualitas Anggur Merah. E-Bisnis : Jurnal Ilmiah Ekonomi Dan Bisnis, 13(2), 67–75. https://doi.org/10.51903/e-bisnis.v13i2.247
Milanović, S., Milanović, S. D., Marković, N., PamuÄar, D., Gigović, L., & Kostić, P. (2021). Forest fire probability mapping in eastern serbia: Logistic regression versus random forest method. Forests, 12(1), 1–17. https://doi.org/10.3390/f12010005
Sandag, G. A. (2020). Prediksi Rating Aplikasi App Store Menggunakan Algoritma Random Forest. CogITo Smart Journal, 6(2), 167–178. https://doi.org/10.31154/cogito.v6i2.270.167-178
Wahyuni, E. D., Arifiyanti, A. A., & Kustyani, M. (2019). Exploratory Data Analysis dalam Konteks Klasifikasi Data Mining. Prosiding Nasional Rekayasa Teknologi Industri Dan Informasi
XIV Tahun 2019 (ReTII), 2019(November), (pp. 263–269). http://journal.itny.ac.id/index.php/ReTII
Yadav, D. C., & Pal, S. (2020). Prediction of heart disease using feature selection and random forest ensemble method. International Journal of Pharmaceutical Research, 12(4), 56–66. https://doi.org/10.31838/ijpr/2020.12.04.013
DOI: https://doi.org/10.26760/mindjournal.v8i2.173-187
Refbacks
- Saat ini tidak ada refbacks.
____________________________________________________________
ISSN (cetak) : 2338-8323 | ISSN (elektronik) : 2528-0902
diterbitkan oleh:
Informatika Institut Teknologi Nasional Bandung
Alamat : Gedung 2 Jl. PHH. Mustofa 23 Bandung 40124
Kontak : Tel. 7272215 (ext. 181)Â Fax. 7202892
Email : mind.journal@itenas.ac.id
____________________________________________________________
Statistik Pengunjung :
Jurnal ini terlisensi oleh Creative Commons Attribution-ShareAlike 4.0 International License.