Pengelompokan Artikel Bahasa Bali Menggunakan Algoritma K-Means Clustering

2018 
Teks mining merupakan salah satu bidang data mining yang memiliki cukup banyak hal untuk diteliti, terutama karena Indonesia memiliki cukup banyak ragam bahasa dan tulisan-tulisan dalam bahasa daerah yang mempunyai ciri khas masing-masing. Dalam penelitian ini, akan dilakukan penelitian mengenai proses pencarian teks artikel yang tertulis dalam bahasa Bali. Digunakannya bahasa Bali  dalam penelitian ini karena keunikan yang dimiliki oleh bahasa Bali dimana terdapat banyak kata dengan bentuk yang sama namun bisa berbeda makna atau sebaliknya dengan makna yang sama namun berasal dari kata yang berbeda. Pemanfaatan teknik N-Gram Similarity merupakan proses awal pengenalan teks yang terdapat pada sebuah artikel. Hasil pengenalan teks kemudian disimpan dalam nilai variable key yang terus meningkat seiring dengan ditemukannya teks lain yang sesuai dan variabel noise untuk kumpulan teks yang tidak sesuai.  Hasil pengenalan teks ini kemudian akan dikelompokkan dengan menggunakan algoritma K-Means dan menghasilkan akurasi hingga 93%. Proses ini dapat menjadi dasar dalam penelitian berikutnya untuk pencarian artikel bahasa daerah menggunakan teknik semantik search. Kata kunci: clustering, k-means, artikel, bahasa, bali
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []