PENGARUH METODE IMBALANCE DATA SAMPLING TERHADAP KINERJA SUPPORT VECTOR MACHINE UNTUK SENTIMEN ANALISIS NATURALISASI PEMAIN SEPAK BOLA



Maulana, Ferdy Ilham (2025) PENGARUH METODE IMBALANCE DATA SAMPLING TERHADAP KINERJA SUPPORT VECTOR MACHINE UNTUK SENTIMEN ANALISIS NATURALISASI PEMAIN SEPAK BOLA. Undergraduate thesis, Universitas Muhammadiyah Jember.

[thumbnail of 1. PENDAHULUAN.pdf] Text
1. PENDAHULUAN.pdf

Download (1MB)
[thumbnail of 2. ABSTRAK.pdf] Text
2. ABSTRAK.pdf

Download (863kB)
[thumbnail of 3. BAB I.pdf] Text
3. BAB I.pdf

Download (840kB)
[thumbnail of 4. BAB II.pdf] Text
4. BAB II.pdf
Restricted to Repository staff only

Download (1MB) | Request a copy
[thumbnail of 5. BAB III.pdf] Text
5. BAB III.pdf
Restricted to Repository staff only

Download (5MB) | Request a copy
[thumbnail of 6. BAB IV.pdf] Text
6. BAB IV.pdf
Restricted to Repository staff only

Download (1MB) | Request a copy
[thumbnail of 7. BAB V.pdf] Text
7. BAB V.pdf
Restricted to Repository staff only

Download (811kB) | Request a copy
[thumbnail of 8. DAFTAR PUSTAKA.pdf] Text
8. DAFTAR PUSTAKA.pdf

Download (816kB)
[thumbnail of 9. LAMPIRAN.pdf] Text
9. LAMPIRAN.pdf
Restricted to Repository staff only

Download (1MB) | Request a copy

Abstract

Media sosial kini menjadi wadah penting bagi masyarakat untuk
menyampaikan pandangan terhadap berbagai isu publik, termasuk wacana
naturalisasi pemain sepak bola. Untuk mengidentifikasi arah opini tersebut,
digunakan pendekatan analisis sentimen berbasis algoritma Support Vector
Machine (SVM). Namun, distribusi kelas data yang tidak seimbang menjadi kendala
utama karena menyebabkan model lebih condong ke kelas mayoritas. Penelitian ini
bertujuan untuk mengukur efektivitas tiga teknik imbalance data sampling, yaitu
Borderline-SMOTE, SVM-SMOTE, dan ADASYN, dalam meningkatkan kinerja
SVM. Data yang digunakan diperoleh dari platform X (Twitter), kemudian
diklasifikasikan ke dalam sentimen positif, netral, dan negatif. Evaluasi dilakukan
menggunakan teknik K-Fold Cross Validation dengan variasi nilai K = 2, 3, 5, 6, 9,
dan 10, serta metrik evaluasi berupa akurasi, presisi, recall, dan F1-score. Hasil
eksperimen menunjukkan bahwa model tanpa penyeimbangan data memperoleh
akurasi 86%, presisi 91%, recall 85%, dan F1-score 91%. Penerapan Borderline-
SMOTE meningkatkan akurasi menjadi 87%, presisi 91%, recall 86%, dan F1-score
tetap 91%. Metode SVM-SMOTE menghasilkan akurasi tertinggi yaitu 91%,
disertai presisi 91%, recall 86%, dan F1-score 91%. Sementara itu, ADASYN
menghasilkan F1-score tertinggi sebesar 92%, dengan akurasi 87%, presisi 91%,
dan recall 87%. Borderline-SMOTE dan SVM-SMOTE juga menunjukkan
peningkatan signifikan pada label netral dengan F1-score 69%, sedangkan
ADASYN unggul dalam klasifikasi kelas negatif dengan F1-score 92%. Dari temuan
tersebut, dapat disimpulkan bahwa meskipun SVM-SMOTE unggul secara akurasi,
ADASYN memberikan hasil klasifikasi yang lebih seimbang dan andal, terutama
dalam menangani ketimpangan distribusi kelas minoritas pada data sentimen.

Contribution
Nama Dosen Pembimbing
NIDN/NIDK
Dosen Pembimbing
Arifianto, Deni
nidn0718068103
Dosen Pembimbing
Umilasari, Reni
nidn0728079101

Item Type: Thesis (Undergraduate)
Keywords/Kata Kunci: Imbalance Data, Borderline-SMOTE, SVM-SMOTE, ADASYN, SVM, Analisis Sentimen.
Subjects: 000 Computer Science, Information, & General Works > 004 Data Processing, Computer Science
Divisions: Faculty of Engineering > Department of Informatics Engineering (S1)
Depositing User: Ferdy Ilham Maulana | ferdymaulanaa21@gmail.com
Date Deposited: 06 Aug 2025 01:49
Last Modified: 06 Aug 2025 01:49
URI: http://repository.unmuhjember.ac.id/id/eprint/26340

Actions (login required)

View Item View Item