Abstrak
Di era berkembangnya penggunaan Internet, Twitter merupakan salah satu layanan jejaring sosial yang sering digunakan sebagai alat komunikasi yang saling menghubungkan antar pengguna. Selain itu Twitter juga dimanfaatkan sebagai media untuk promosi, kampanye politik, dan sarana protes. Twitter dihadapkan pada berbagai masalah seperti gangguan privasi pengguna dan spam pada Twitter. Dengan adanya masalah spam, perlu dilakukan klasifikasi untuk tweet spam dan bukan spam. Penelitian ini bertujuan untuk mendeteksi tweet spam dan bukan spam. Hal tersebut dapat dilakukan dengan klasifikasi, terdapat berbagai macam metode klasifikasi, salah satu metode dalam data mining untuk mengklasifikasikan spam dan bukan spam adalah Naïve Bayes. Naïve Bayes banyak digunakan karena kesederhanaan algoritme dan mudah untuk diimplementasikan. Penelitian ini mengumpulkan data spam dari Twitter dengan mengidentifikasi terlebih dahulu akun yang diduga sebagai spammer. Penelitian ini menggunakan 70% data latih dan 30% data uji dengan metode klasifikasi Naïve Bayes. Data Twitter yang diperoleh merupakan data teks yang masih banyak mengandung kata-kata yang tidak baku, sehingga dibutuhkan tahap praproses, tahap yang dilakukan adalah tokenizing, filtering, normalisasi kata, stemming. Akurasi hasil klasifikasi tweet spam dan bukan spam adalah 95.57%.
Kata Kunci: klasifikasi spam, Naïve Bayes, text mining, Twitter.