Pengukuran Kinerja Spam Filter Menggunakan Graham's Naïve Bayes Classifier
Abstrak
Email spam telah menjadi masalah utama bagi pengguna dan penyedia jasa Internet. Pendekatan heuristic telah dilakukan untuk menyaring spam seperti black-listing atau rule-based filtering, namun hasilnya kurang memuaskan sehingga pendekatan berbasis konten (content-based filtering) menggunakan pengklasifikasi naïve Bayes lebih banyak digunakan saat ini. Penelitian ini bertujuan membandingkan pengklasifikasi naïve Bayes multinomial yang menggunakan atribut boolean dengan versi Graham, dan juga membandingkan kinerja dari dua metode untuk data latih, yaitu train-everything (TEFT) dan train-on-error (TOE). Hasil evaluasi menunjukkan bahwa naïve Bayes multinomial memiliki kinerja lebih baik dibanding versi Graham. Di samping itu, metode data latih menggunakan TEFT dapat meningkatkan akurasi model klasifikasi dibanding metode TOE.