SISTEM DETEKSI HOAX BERITA BAHASA INDONESIA DENGAN MENGGUNAKAN ALGORITMA NAÏVE BAYES

2018 
Hoax adalah suatu tindakan untuk tujuan menipu. Hoax secara asal kata berasal dari gabungan kata hocus to trick yang artinya yaitu cara untuk menipu. Masalah yang ada pada saat ini yaitu semakin cepatnya penyebaran berita hoax khususnya berita berbahasa Indonesia oleh karena itu dibutuhkannya sistem untuk mendeteksi kategori berita (hoax atau fakta). Perancangan dan pengembangan sistem deteksi hoax dengan menggunakan BING web search API sebagai query expansion, menggunakan algoritma tala sebagai stemming, menggunakan algoritma cosine similarity sebagai menghitung kemiripan antar dokumen dan menggunakan algoritma naive bayes untuk klasifikasi pada berita yang dianalisa. Data yang digunakan pada sistem ini menggunakan perbandingan 70:30 dengan jumlah data training sebanyak 250 berita dan jumlah data testing sebanyak 108 berita. Penelitian ini membandingkan nilai precision, recall dan f measure pada berita uji dengan kondisi menggunakan url dan tanpa mneggunakan url. Serta pada masingmasing kondisi tersebut akan diuji dengan variasi threshold nilai similarity, yaitu 0.2, 0.4 dan 0.6 untuk menemukan kondisi dan threshold nilai similarity terbaik. Berdasarkan uji coba sistem, menghasilkan kondisi terbaik yaitu kondisi berita menggukan url pada threshold nilai similarity 0.2 dengan nilai precision sebesar 0.91, nilai recall sebesar 1 dan nilai f measure sebesar 0.95 dan pada nilai similarity yang sama, yaitu 0.2 namun tanpa menggunakan url menghasilkan nilai precision sebesar 0.88, nilai recall sebesar 1 dan nilai f measure sebesar 0.94.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []