Penerjemahan Bahasa Indonesia ke Bahasa Minang dari Optical Character Recognition dengan Menggunakan Algoritme Edit Distance
Abstract
Tri Gatra Bangun Bahasa yaitu utamakan Bahasa Indonesia, lestarikan bahasa daerah, dan kuasai bahasa asing. Melalui ini, maka bahasa daerah sebagai salah satu kekayaan bangsa Indonesia perlu dilestarikan. Selain itu, bahasa daerah juga berfungsi sebagai pendukung bahasa nasional yakni Bahasa Indonesia. Pemanfaatan teknologi dapat digunakan sebagai upaya dalam pelestarian bahasa daerah. Penelitian ini memanfaatkan teknologi kecerdasan buatan yakni mesin penerjemah yang menerjemahkan Bahasa Indonesia ke bahasa daerah berbasiskan citra teks. Bahasa daerah yang digunakan yakni bahasa daerah Minang. Fokus penelitian ini pada proses penerjemahan hasil optical character recognition (OCR) dari citra teks Bahasa Indonesia menggunakan algoritma edit distance, yakni hamming distance, Leveinshtein distance dan Jaro-Winkler. Hasil penelitian ini menunjukkan bahwa algoritma edit distance dapat memperbaiki hasil OCR dalam melakukan penerjemahan ke bahasa daerah. Hasil OCR pada citra teks memiliki akurasi awal yakni 50.72%. Setelah diterapkan algoritma edit distance, akurasi penerjemahan meningkat menjadi 68.34% untuk algoritma hamming distance, 70.5% untuk algoritma Leveinshtein distance dan 70.2% untuk algoritma Jaro-Winkler. Dari ketiga algoritma ini, Leveinshtein distance memiliki performasi akurasi penerjemahan paling tinggi.
Kata Kunci: penerjemahan, bahasa Indonesia, bahasa Minang, hamming distance, leveinshtein distance, jaro-
winkler, optical character recognition
Authors
Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License (CC BY 4.0) that allows others to share the work with an acknowledgment of the work's authorship and initial publication in this journal.