PERINGKASAN TEKS MULTI-DOKUMEN BERDASARKAN METODE SENTENCE EXTRACTION DAN WORD SENSE DISAMBIGUATION

Khairiyyah Nur Aisyah, Syadza Anggraini, Agus Zainal Arifin

Abstract


Memahami makna utama yang terkandung dalam beberapa dokumen tentu tidak mudah dan membutuhkan waktu yang cukup lama. Menanggapi masalah tersebut, penelitian terkait peringkasan teks dokumen secara otomatis menjadi perhatian khusus dalam beberapa tahun terakhir. Penelitian ini mengusulkan metode peringkasan teks multi-dokumen yang dapat meningkatkan relevansi antar kalimat dengan menggunakan metode sentence extraction  dan word sense disambiguation. Metode sentence extraction yang digunakan didasarkan pada sentence distribution dan part of speech (POS) tagging. Berdasarkan pengujian peringkasan teks dengan metode yang diusulkan, nilai rata-rata ROUGE-1 adalah 0,712, 0,163, 0,247 pada recall, precision,  f-measure secara berurutan. Sedangkan hasil pengujian peringksan teks multi-dokumen tanpa menggunakan word sense disambiguation mendapatkan nilai rata-rata ROUGE-1 sebesar 0,685, 0,139, 0,216 pada recall, precision, f-measure secara berurutan. Hasil penelitian menunjukkan bahwa penggunaan metode sentence extraction dan word sense disambiguation pada peringkasan teks multi-dokumen dapat meningkatkan kualitas hasil peringkasan teks.



DOI: http://dx.doi.org/10.36564/njca.v4i1.89

DOI (PDF (Bahasa Indonesia)): http://dx.doi.org/10.36564/njca.v4i1.89.g51

Refbacks

  • There are currently no refbacks.


Copyright (c) 2019 Khairiyyah Nur Aisyah, Syadza Anggraini, Agus Zainal Arifin

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

NJCA(Nusantara Journal of Computers and Its Applications)
Published by Computer Society of Nahdlatul Ulama, Indonesia.
Office : PO.BOX 1 Paiton Probolinggo kodepos 67291 Jawa Timur, Indonesia

DECREE OF THE MINISTER OF LAW AND HUMAN RIGHTS OF THE REPUBLIC OF INDONESIA
NUMBER AHU-0060541.AH.01.07.YEAR 2016