Penerapan Algoritma Lemmatization pada Dokumen Bahasa Indonesia
Sari
Sebuah kata, kalimat maupun tulisan dapat dikatakan layak apabila telah memenuhi PUEBI (Pedoman Umum Ejaan Bahasa Indonesia) dan KBBI (Kamus Besar Bahasa Indonesia). Akan tetapi, sangat banyak ditemukan kesalahan penulisan dalam suatu dokumen seperti karya ilmiah mapun skripsi diantaranya yaitu suatu katayang tidak memenuhi kebakuan dan tidak sesuai dengan PUEBI dan kesalahan penulisan (typographical error) yaitu salah dalam pengetikkan karena kecepatan perpindahan jari yang tidak seimbang dari satu tombol ke tombol lain untuk merangkai kata yang akhirnyamembuat orang salah paham dengan maksud kalimat yang dihasilkan dari susunan kata tersebut karena tidak ada dalam KBBI. Algoritma lemmatization adalah suatu algoritma yang digunakan untuk menemukan bentuk dasar dari suatu kata sehingga dapat dimanfaatkan untukmemeriksa kebenaran dari penggunaan ejaan pada suatu kata. Penelitian ini bertujuan untuk mengukur keakurasian dari penggunaan algoritma lemmatization dalam melakukan seleksi terhadap kata yang salah atau tidak tepat berdasarkan PUEBI dan KBBI sebagai acuan
Teks Lengkap:
PDFDOI: https://doi.org/10.26760/mindjournal.v3i2.47-56
Refbacks
- Saat ini tidak ada refbacks.
____________________________________________________________
ISSN (cetak) : 2338-8323 | ISSN (elektronik) : 2528-0902
diterbitkan oleh:
Informatika Institut Teknologi Nasional Bandung
Alamat : Gedung 2 Jl. PHH. Mustofa 23 Bandung 40124
Kontak : Tel. 7272215 (ext. 181)Â Fax. 7202892
Email : mind.journal@itenas.ac.id
____________________________________________________________
Statistik Pengunjung :
Jurnal ini terlisensi oleh Creative Commons Attribution-ShareAlike 4.0 International License.