Pengukuran Kinerja Spam Filter Menggunakan Graham's Naïve Bayes Classifier
Abstrak
Email spam telah menjadi masalah utama bagi pengguna dan penyedia jasa Internet. Pendekatan heuristic telah dilakukan untuk menyaring spam seperti black-listing atau rule-based filtering, namun hasilnya kurang memuaskan sehingga pendekatan berbasis konten (content-based filtering) menggunakan pengklasifikasi naïve Bayes lebih banyak digunakan saat ini. Penelitian ini bertujuan membandingkan pengklasifikasi naïve Bayes multinomial yang menggunakan atribut boolean dengan versi Graham, dan juga membandingkan kinerja dari dua metode untuk data latih, yaitu train-everything (TEFT) dan train-on-error (TOE). Hasil evaluasi menunjukkan bahwa naïve Bayes multinomial memiliki kinerja lebih baik dibanding versi Graham. Di samping itu, metode data latih menggunakan TEFT dapat meningkatkan akurasi model klasifikasi dibanding metode TOE.
Artikel teks lengkap
Penulis
Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License (CC BY 4.0) that allows others to share the work with an acknowledgment of the work's authorship and initial publication in this journal.