PERINGKASAN TEKS OTOMATIS PADA JURNAL BERBAHASA INDONESIA DENGAN METODE TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF)

Saputra, M. Fauzi Adi (2021) PERINGKASAN TEKS OTOMATIS PADA JURNAL BERBAHASA INDONESIA DENGAN METODE TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF). Undergraduate thesis, Universitas Muhammadiyah Jember.

[img] Text
1. Pendahuluan.pdf

Download (2MB)
[img] Text
2. Abstrak.pdf

Download (380kB)
[img] Text
3. BAB I.pdf

Download (635kB)
[img] Text
4. BAB II.pdf
Restricted to Repository staff only

Download (2MB) | Request a copy
[img] Text
5. BAB III.pdf
Restricted to Repository staff only

Download (2MB) | Request a copy
[img] Text
6. BAB IV.pdf
Restricted to Repository staff only

Download (7MB) | Request a copy
[img] Text
7. BAB V.pdf
Restricted to Repository staff only

Download (190kB) | Request a copy
[img] Text
8. DAFTAR PUSTAKA.pdf

Download (254kB)
[img] Text
9. LAMPIRAN.pdf
Restricted to Repository staff only

Download (3MB) | Request a copy
[img] Text
10. ARTIKEL.pdf

Download (371kB)

Abstract

Perkembangan teknologi internet menyebabkan perkembangan jumlah dokumen digital di internet semakin meningkat. Tetapi dengan keterbatasan manusia untuk memproses informasi baik dari sumber buku, jurnal atau sumber informasi yang lain, maka pembaca memerlukan usaha lebih untuk memahami sebuah teks. Solusi dari masalah tersebut adalah dengan menyediakan atau membuat sebuah ringkasan. Pada penelitian ini peneliti menggunakan automatic summarization. Dan peneliti akan berfokus pada pembuatan ringkasan teks berbasis ekstraktif dengan menggunakan metode Term Frequency-Inverse Document Frequency. TF-IDF adalah sebuah metode pembobotan kata, bobot tersebut yaitu ukuran statistik yang mencerminkan betapa pentingnya sebuah kata bagi sebuah koleksi dokumen atau corpus. Penelitian ini menggunakan 9 jurnal yang berasal dari 3 Program Studi di Universitas Muhammadiyah Jember, dimana setiap jurnal memiliki 5 hasil yang dibedakan berdasarkan Compression Rate (CR) yaitu 50%, 40%, 30%, 20% dan 10%. Peneliti melakukan dua metode evaluasi, yaitu ekstrinsik (pengumpulan pendapat dari responden) dan insterinsik (analisa secara langsung pada ringkasan). Dari hasil evaluasi diperoleh peringkasan terbaik dari kelima hasil terdapat pada ringkasan dengan CR 50% dengan nilai precission, recall, dan f-measure secara berurutan adalah 0,6176, 0,6429, dan 0,6299.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: peringkasan teks ekstraktif, TF-IDF, compression rate.
Subjects: 000 Computer Science, Information, & General Works > 004 Data Processing, Computer Science
Divisions: Faculty of Engineering > Department of Informatics Engineering (S1)
Depositing User: Saputra M. Fauzi Adi
Date Deposited: 03 Jan 2023 02:06
Last Modified: 03 Jan 2023 02:06
URI: http://repository.unmuhjember.ac.id/id/eprint/15790

Actions (login required)

View Item View Item