PERINGKASAN TEKS OTOMATIS PADA JURNAL BERBAHASA INDONESIA DENGAN METODE TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF)



Saputra, M. Fauzi Adi (2021) PERINGKASAN TEKS OTOMATIS PADA JURNAL BERBAHASA INDONESIA DENGAN METODE TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF). Undergraduate thesis, Universitas Muhammadiyah Jember.

[thumbnail of 1. Pendahuluan.pdf] Text
1. Pendahuluan.pdf

Download (2MB)
[thumbnail of 2. Abstrak.pdf] Text
2. Abstrak.pdf

Download (380kB)
[thumbnail of 3. BAB I.pdf] Text
3. BAB I.pdf

Download (635kB)
[thumbnail of 4. BAB II.pdf] Text
4. BAB II.pdf
Restricted to Repository staff only

Download (2MB) | Request a copy
[thumbnail of 5. BAB III.pdf] Text
5. BAB III.pdf
Restricted to Repository staff only

Download (2MB) | Request a copy
[thumbnail of 6. BAB IV.pdf] Text
6. BAB IV.pdf
Restricted to Repository staff only

Download (7MB) | Request a copy
[thumbnail of 7. BAB V.pdf] Text
7. BAB V.pdf
Restricted to Repository staff only

Download (190kB) | Request a copy
[thumbnail of 8. DAFTAR PUSTAKA.pdf] Text
8. DAFTAR PUSTAKA.pdf

Download (254kB)
[thumbnail of 9. LAMPIRAN.pdf] Text
9. LAMPIRAN.pdf
Restricted to Repository staff only

Download (3MB) | Request a copy
[thumbnail of 10. ARTIKEL.pdf] Text
10. ARTIKEL.pdf

Download (371kB)

Abstract

Perkembangan teknologi internet menyebabkan perkembangan jumlah dokumen digital di internet semakin meningkat. Tetapi dengan keterbatasan manusia untuk memproses informasi baik dari sumber buku, jurnal atau sumber informasi yang lain, maka pembaca memerlukan usaha lebih untuk memahami sebuah teks. Solusi dari masalah tersebut adalah dengan menyediakan atau membuat sebuah ringkasan. Pada penelitian ini peneliti menggunakan automatic summarization. Dan peneliti akan berfokus pada pembuatan ringkasan teks berbasis ekstraktif dengan menggunakan metode Term Frequency-Inverse Document Frequency. TF-IDF adalah sebuah metode pembobotan kata, bobot tersebut yaitu ukuran statistik yang mencerminkan betapa pentingnya sebuah kata bagi sebuah koleksi dokumen atau corpus. Penelitian ini menggunakan 9 jurnal yang berasal dari 3 Program Studi di Universitas Muhammadiyah Jember, dimana setiap jurnal memiliki 5 hasil yang dibedakan berdasarkan Compression Rate (CR) yaitu 50%, 40%, 30%, 20% dan 10%. Peneliti melakukan dua metode evaluasi, yaitu ekstrinsik (pengumpulan pendapat dari responden) dan insterinsik (analisa secara langsung pada ringkasan). Dari hasil evaluasi diperoleh peringkasan terbaik dari kelima hasil terdapat pada ringkasan dengan CR 50% dengan nilai precission, recall, dan f-measure secara berurutan adalah 0,6176, 0,6429, dan 0,6299.

Contribution
Nama Dosen Pembimbing
NIDN/NIDK
Dosen Pembimbing
Rintyarna, Bagus Setya
nidn0729017904
Dosen Pembimbing
Suharso, Wiwik
nidn0006097601

Item Type: Thesis (Undergraduate)
Keywords/Kata Kunci: peringkasan teks ekstraktif, TF-IDF, compression rate.
Subjects: 000 Computer Science, Information, & General Works > 004 Data Processing, Computer Science
Divisions: Faculty of Engineering > Department of Informatics Engineering (S1)
Depositing User: Saputra M. Fauzi Adi | mfauzi.ads09@gmail.com
Date Deposited: 03 Jan 2023 02:06
Last Modified: 03 Jan 2023 02:06
URI: http://repository.unmuhjember.ac.id/id/eprint/15790

Actions (login required)

View Item View Item