Seiring perkembangan teknologi informasi
mengakibatkan teknologi internet semakin pesat, sehingga banyak berita
online khususnya berita olahraga. Dengan adanya peringkasan teks secara
otomatis ini diharapkan membantu mengurangi waktu membaca keseluruhan
isi berita dengan hanya membaca hasil ringkasannya, sehingga memudahkan
dalam mencari informasi berita olahraga.
Penelitian ini diawali dengan proses text preprocessing, yaitu pemrosesan teks untuk mendapatkan term kata. Metode ini terdiri dari case folding, pemecahan kalimat, filtering, tokenizing, dan stemming. Hasil dari proses ini kemudian dihitung bobot tf-idf, bobot relevance dan bobot similarity. Untuk menghasilkan ringkasan dilakukan proses ekstraksi yaitu menghitung bobot maximum marginal relevance kalimat dari kombinasi cosine similarity, yaitu relevance dan similarity. Metode ekstraksi maximum marginal relevance merupakan metode yang digunakan dalam mengurangi redudansi kalimat dalam dokumen dalam menentukan sebagai ringkasan.
Data uji coba untuk pengujian akan diambilkan dari surat kabar berbahasa Indonesia on-line. Dari hasil pengujian kemudian dievaluasi dengan hasil ringkasan manual dan ringkasan sistem peringkasan otomatis lain. Hasil dari evaluasi dengan ringkasan manual menghasilkan rata-rata recall 60%, precision 77%, dan f-measure 66%. Sedangkan hasil evaluasi dengan sistem peringkasan otomatis lain menghasilkan rata-rata recall 79%, precision 89% dan f-measure 82%.
Penelitian ini diawali dengan proses text preprocessing, yaitu pemrosesan teks untuk mendapatkan term kata. Metode ini terdiri dari case folding, pemecahan kalimat, filtering, tokenizing, dan stemming. Hasil dari proses ini kemudian dihitung bobot tf-idf, bobot relevance dan bobot similarity. Untuk menghasilkan ringkasan dilakukan proses ekstraksi yaitu menghitung bobot maximum marginal relevance kalimat dari kombinasi cosine similarity, yaitu relevance dan similarity. Metode ekstraksi maximum marginal relevance merupakan metode yang digunakan dalam mengurangi redudansi kalimat dalam dokumen dalam menentukan sebagai ringkasan.
Data uji coba untuk pengujian akan diambilkan dari surat kabar berbahasa Indonesia on-line. Dari hasil pengujian kemudian dievaluasi dengan hasil ringkasan manual dan ringkasan sistem peringkasan otomatis lain. Hasil dari evaluasi dengan ringkasan manual menghasilkan rata-rata recall 60%, precision 77%, dan f-measure 66%. Sedangkan hasil evaluasi dengan sistem peringkasan otomatis lain menghasilkan rata-rata recall 79%, precision 89% dan f-measure 82%.
No comments:
Post a Comment