Peningkatan Kinerja Pencarian Dokumen Tugas Akhir Menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25
2017
Proses pencarian dokumen yang menggunakan information retrieval akan menerima query dan mengembalikan dokumen yang relevan dengan query pencarian tersebut. Relevansi diperhitungkan dari relevansi kata pada query dan kumpulan dokumen yang dicari. Pada sistem pencarian yang tidak mempertimbangkan variasi morfologi kata mengakibatkan dokumen yang mempunyai kata yang merupakan variasi dari kata pada query tidak dianggap sebagai dokumen hasil pencarian. Proses stemming dilakukan untuk mengenali variasi morfologi tersebut, dengan cara melakukan perubahan pada kata-kata berimbuhan dengan cara penghapusan awalan dan akhiran suatu kata menjadi kata dasarnya. Proses stemming dilakukan pada proses indexing, sehingga akan mengurangi ukuran dari index file. Hal itu dapat mengurangi waktu pencarian dan kebutuhan memori. Dokumen hasil pencarian akan ditampilkan sesuai nilai peringkat relevansi dokumen dengan query yang diberikan. Pemberian peringkat dilakukan dengan cara memberikan bobot pada dokumen. Dokumen yang mempunyai relevansi kata yang tinggi dengan query, akan diberikan bobot yang lebih besar. Pada sistem pencarian Tugas Akhir pada Universitas X, belum dilakukan proses stemming dan indexing. Untuk meningkatkan kinerja pencarian Tugas Akhir tersebut akan ditambahkan proses stemming dan indexing, serta pengurutan peringkat dokumen hasil pencarian. Proses stemming menggunakan porter stemmer bahasa Indonesia karena dokumen TA yang dicari berbahasa Indonesia, proses indexing menggunakan inverted index. Serta pengurutan dokumen hasil menggunakan fungsi peringkat Okapi BM25. Dari hasil uji coba, proses stemming dan fungsi peringkat yang dilakukan memberikan hasil pencarian yang lebih baik sesuai relevansi query. Penggunaan stemming dan inverted index menghemat penggunaan memori serta dapat mempercepat proses pencarian secara signifikan.
- Correction
- Source
- Cite
- Save
- Machine Reading By IdeaReader
0
References
0
Citations
NaN
KQI