Deteksi Spam pada Twitter Menggunakan Algoritme Naïve Bayes

Andita Wahyuningtyas, Imas Sukaesih Sitanggang, Husnul Khotimah

Abstrak

Di era berkembangnya penggunaan Internet, Twitter merupakan salah satu layanan jejaring sosial yang sering digunakan sebagai alat komunikasi yang saling menghubungkan antar pengguna. Selain itu Twitter juga dimanfaatkan sebagai media untuk promosi, kampanye politik, dan sarana protes. Twitter dihadapkan pada berbagai masalah seperti gangguan privasi pengguna dan spam pada Twitter. Dengan adanya masalah spam, perlu dilakukan klasifikasi untuk tweet spam dan bukan spam. Penelitian ini bertujuan untuk mendeteksi tweet spam dan bukan spam. Hal tersebut dapat dilakukan dengan klasifikasi, terdapat berbagai macam metode klasifikasi, salah satu metode dalam data mining untuk mengklasifikasikan spam dan bukan spam adalah Naïve Bayes. Naïve Bayes banyak digunakan karena kesederhanaan algoritme dan mudah untuk diimplementasikan. Penelitian ini mengumpulkan data spam dari Twitter dengan mengidentifikasi terlebih dahulu akun yang diduga sebagai spammer. Penelitian ini menggunakan 70% data latih dan 30% data uji dengan metode klasifikasi Naïve Bayes. Data Twitter yang diperoleh merupakan data teks yang masih banyak mengandung kata-kata yang tidak baku, sehingga dibutuhkan tahap praproses, tahap yang dilakukan adalah tokenizing, filtering, normalisasi kata, stemming. Akurasi hasil klasifikasi tweet spam dan bukan spam adalah  95.57%.


Kata Kunci: klasifikasi spam, Naïve Bayes, text mining, Twitter.

Penulis

Andita Wahyuningtyas
Imas Sukaesih Sitanggang
imas.sitanggang@apps.ipb.ac.id (Kontak utama)
Husnul Khotimah
WahyuningtyasA., SitanggangI. S., & KhotimahH. (2020). Deteksi Spam pada Twitter Menggunakan Algoritme Naïve Bayes. Jurnal Ilmu Komputer Dan Agri-Informatika, 7(1), 31-40. https://doi.org/10.29244/jika.7.1.31-40
Copyright and license info is not available

Rincian Artikel

Most read articles by the same author(s)

1 2 > >> 

Analisis Sentimen Pengguna Twitter terhadap Vaksinasi COVID-19 di Indonesia menggunakan Algoritme Random Forest dan BERT

Amin Elhan, Medria Kusuma Dewi Hardhienata, Yeni Herdiyeni, Sony Hartono Wijaya, Julio Adisantoso
Abstract View : 1253
Unduh :1569

Klasifikasi Metagenom dengan Metode Naïve Bayes Classifier

Dian Kartika Utami, Wisnu Ananta Kusuma, Agus Buono
Abstract View : 2366
Unduh :1487