PENGARUH METODE IMBALANCE DATA SAMPLING TERHADAP KINERJA SUPPORT VECTOR MACHINE UNTUK SENTIMEN ANALISIS NATURALISASI PEMAIN SEPAK BOLA


Maulana, Ferdy Ilham (2025) PENGARUH METODE IMBALANCE DATA SAMPLING TERHADAP KINERJA SUPPORT VECTOR MACHINE UNTUK SENTIMEN ANALISIS NATURALISASI PEMAIN SEPAK BOLA. Undergraduate thesis, Universitas Muhammadiyah Jember.

Text
1. PENDAHULUAN.pdf

Download (1MB)
Text
2. ABSTRAK.pdf

Download (863kB)
Text
3. BAB I.pdf

Download (840kB)
Text
4. BAB II.pdf
Restricted to Registered users only

Download (1MB)
Text
5. BAB III.pdf
Restricted to Registered users only

Download (5MB)
Text
6. BAB IV.pdf
Restricted to Registered users only

Download (1MB)
Text
7. BAB V.pdf
Restricted to Registered users only

Download (811kB)
Text
8. DAFTAR PUSTAKA.pdf

Download (816kB)
Text
9. LAMPIRAN.pdf
Restricted to Registered users only

Download (1MB)

Abstract

Media sosial kini menjadi wadah penting bagi masyarakat untuk
menyampaikan pandangan terhadap berbagai isu publik, termasuk wacana
naturalisasi pemain sepak bola. Untuk mengidentifikasi arah opini tersebut,
digunakan pendekatan analisis sentimen berbasis algoritma Support Vector
Machine (SVM). Namun, distribusi kelas data yang tidak seimbang menjadi kendala
utama karena menyebabkan model lebih condong ke kelas mayoritas. Penelitian ini
bertujuan untuk mengukur efektivitas tiga teknik imbalance data sampling, yaitu
Borderline-SMOTE, SVM-SMOTE, dan ADASYN, dalam meningkatkan kinerja
SVM. Data yang digunakan diperoleh dari platform X (Twitter), kemudian
diklasifikasikan ke dalam sentimen positif, netral, dan negatif. Evaluasi dilakukan
menggunakan teknik K-Fold Cross Validation dengan variasi nilai K = 2, 3, 5, 6, 9,
dan 10, serta metrik evaluasi berupa akurasi, presisi, recall, dan F1-score. Hasil
eksperimen menunjukkan bahwa model tanpa penyeimbangan data memperoleh
akurasi 86%, presisi 91%, recall 85%, dan F1-score 91%. Penerapan Borderline-
SMOTE meningkatkan akurasi menjadi 87%, presisi 91%, recall 86%, dan F1-score
tetap 91%. Metode SVM-SMOTE menghasilkan akurasi tertinggi yaitu 91%,
disertai presisi 91%, recall 86%, dan F1-score 91%. Sementara itu, ADASYN
menghasilkan F1-score tertinggi sebesar 92%, dengan akurasi 87%, presisi 91%,
dan recall 87%. Borderline-SMOTE dan SVM-SMOTE juga menunjukkan
peningkatan signifikan pada label netral dengan F1-score 69%, sedangkan
ADASYN unggul dalam klasifikasi kelas negatif dengan F1-score 92%. Dari temuan
tersebut, dapat disimpulkan bahwa meskipun SVM-SMOTE unggul secara akurasi,
ADASYN memberikan hasil klasifikasi yang lebih seimbang dan andal, terutama
dalam menangani ketimpangan distribusi kelas minoritas pada data sentimen.

Dosen Pembimbing: Arifianto, Deni and Umilasari, Reni | nidn0718068103, nidn0728079101
Item Type: Thesis (Undergraduate)
Keywords/Kata Kunci: Imbalance Data, Borderline-SMOTE, SVM-SMOTE, ADASYN, SVM, Analisis Sentimen.
Subjects: 000 Computer Science, Information, & General Works > 004 Data Processing, Computer Science
Divisions: Faculty of Engineering > Department of Informatics Engineering (S1)
Depositing User: Ferdy Ilham Maulana | ferdymaulanaa21@gmail.com
Date Deposited: 06 Aug 2025 01:49
Last Modified: 06 Aug 2025 01:49
URI: https://repository.unmuhjember.ac.id/id/eprint/26340

Actions (login required)

View Item
View Item