Implementasi Term-Frequency Inverse Document Frequency (TF-IDF) Untuk Mencari Relevansi Dokumen Berdasarkan Query

  • Moh Afif Rofiqi Universitas Nahdlatul Ulama Blitar
  • Abd. Charis Fauzan Universitas Nahdlatul Ulama Blitar
  • Afivatu Pratama Agustin Universitas Nahdlatul Ulama Blitar
  • Ahmad Agung Saputra Universitas Nahdlatul Ulama Blitar

Abstract

Tujuan dibuatnya penelitian ini adalah untuk mencari relevansi antar beberapa dokumen berupa artikel berita dari beberapa sumber. Metode yang digunakan yaitu metode Term-Frequency Inverse Document Frequency   karena relevan untuk keakuratan sebuah dokumen. Term-Frequency Inverse Document Frequency adalah perhitungan atau pembobotan kata melalui teknik tokenisasi, stopwords, dan steming, dan frekuensi munculnya kata dalam dokumen yang diberikan menunjukkan pentingnya kata itu di dalam sebuah dokumen. Yang mengunakan data dari artikel berita metode ini melakukan pembobotan kata didalam sebuah dokumen dengan mengalikan nilai TF dan IDF bedasarkan hasil querynya. Dan dari tiga artikel yang mengasilakan rank score untuk dokumen satu yang berscore 3,90847 dapat disimpulkan bahwa artikel berita pada dokumen satu adalah yang paling relevan dari pada dua artikel lainnya.

Published
2019-12-31