PENERAPAN SELEKSI FITUR INFORMATION GAIN DALAM KLASIFIKASI ULASAN TRAVELOKA DI GOOGLE PLAY STORE DENGAN NAÏVE BAYES


Kumalasari, Putri Noer Kumalasari (2026) PENERAPAN SELEKSI FITUR INFORMATION GAIN DALAM KLASIFIKASI ULASAN TRAVELOKA DI GOOGLE PLAY STORE DENGAN NAÏVE BAYES. Undergraduate thesis, UNIVERSITAS MUHAMMADIYAH JEMBER.

Text
1. PENDAHULUAN.pdf

Download (2MB)
Text
2. ABSTRAK.pdf

Download (1MB)
Text
3. BAB I.pdf

Download (1MB)
Text
4. BAB II.pdf
Restricted to Registered users only

Download (2MB)
Text
5. BAB III.pdf
Restricted to Registered users only

Download (2MB)
Text
6. BAB IV.pdf
Restricted to Registered users only

Download (2MB)
Text
7. BAB V.pdf
Restricted to Registered users only

Download (1MB)
Text
8. DAFTAR PUSTAKA.pdf

Download (1MB)
Text
9. LAMPIRAN.pdf
Restricted to Registered users only

Download (2MB)

Abstract

Penelitian ini bertujuan untuk membandingkan kinerja analisis sentimen terhadap
ulasan pengguna aplikasi Traveloka menggunakan algoritma Multinomial Naïve
Bayes pada dua kondisi, yaitu penerapan seleksi fitur Information Gain dan tanpa
seleksi fitur. Data penelitian dikumpulkan melalui proses web scraping dari Google
Play Store dengan memanfaatkan library google-play-scraper, sehingga diperoleh
sebanyak 500 ulasan berbahasa Indonesia. Pelabelan sentimen dilakukan dengan
dua metode, yakni pelabelan manual oleh pakar bahasa serta pelabelan otomatis
yang dilakukan oleh peneliti. Seluruh data kemudian diproses melalui tahapan
preprocessing yang meliputi pembersihan data, tokenisasi, case folding,
penghapusan stopword, dan stemming. Pada skenario pertama, seleksi fitur
menggunakan metode Information Gain diterapkan untuk menentukan kata-kata
yang memiliki pengaruh signifikan dalam proses klasifikasi sentimen, sedangkan
pada skenario kedua digunakan pendekatan Bag of Words tanpa proses seleksi fitur.
Evaluasi performa model dilakukan dengan metode 5-Fold Cross Validation
menggunakan metrik akurasi, precision, recall, f1-score, serta confusion matrix
dengan membandingkan hasil klasifikasi terhadap label yang diberikan oleh pakar
bahasa. Hasil penelitian menunjukkan bahwa model Naïve Bayes yang menerapkan
seleksi fitur Information Gain menghasilkan rata-rata akurasi sebesar 87,4%,
sementara model tanpa seleksi fitur memperoleh akurasi sebesar 86,0%. Temuan
ini mengindikasikan bahwa penggunaan seleksi fitur Information Gain mampu
meningkatkan kinerja serta efisiensi model dalam analisis sentimen ulasan
pengguna.

Dosen Pembimbing: Dasuki, Moh and Rahman, Miftahur | NIDN0722109103, NIDN0724039201
Item Type: Thesis (Undergraduate)
Keywords/Kata Kunci: Information Gain, Bag of Word, Google Play Scrapper, Confusion Matrix, Naïve Bayes
Subjects: 000 Computer Science, Information, & General Works > 004 Data Processing, Computer Science
Divisions: Faculty of Engineering > Department of Informatics Engineering (S1)
Depositing User: Putri Noer Kumalasari | Putrinoerkumalasarii@gmail.com
Date Deposited: 12 Feb 2026 06:10
Last Modified: 12 Feb 2026 06:10
URI: https://repository.unmuhjember.ac.id/id/eprint/30253

Actions (login required)

View Item
View Item