PENGARUH METODE IMBALANCE DATA SAMPLING TERHADAP KINERJA SUPPORT VECTOR MACHINE UNTUK SENTIMEN ANALISIS NATURALISASI PEMAIN SEPAK BOLA
Maulana, Ferdy Ilham (2025) PENGARUH METODE IMBALANCE DATA SAMPLING TERHADAP KINERJA SUPPORT VECTOR MACHINE UNTUK SENTIMEN ANALISIS NATURALISASI PEMAIN SEPAK BOLA. Undergraduate thesis, Universitas Muhammadiyah Jember.
![]() |
Text
1. PENDAHULUAN.pdf Download (1MB) |
![]() |
Text
2. ABSTRAK.pdf Download (863kB) |
![]() |
Text
3. BAB I.pdf Download (840kB) |
![]() |
Text
4. BAB II.pdf Restricted to Repository staff only Download (1MB) | Request a copy |
![]() |
Text
5. BAB III.pdf Restricted to Repository staff only Download (5MB) | Request a copy |
![]() |
Text
6. BAB IV.pdf Restricted to Repository staff only Download (1MB) | Request a copy |
![]() |
Text
7. BAB V.pdf Restricted to Repository staff only Download (811kB) | Request a copy |
![]() |
Text
8. DAFTAR PUSTAKA.pdf Download (816kB) |
![]() |
Text
9. LAMPIRAN.pdf Restricted to Repository staff only Download (1MB) | Request a copy |
Abstract
Media sosial kini menjadi wadah penting bagi masyarakat untuk
menyampaikan pandangan terhadap berbagai isu publik, termasuk wacana
naturalisasi pemain sepak bola. Untuk mengidentifikasi arah opini tersebut,
digunakan pendekatan analisis sentimen berbasis algoritma Support Vector
Machine (SVM). Namun, distribusi kelas data yang tidak seimbang menjadi kendala
utama karena menyebabkan model lebih condong ke kelas mayoritas. Penelitian ini
bertujuan untuk mengukur efektivitas tiga teknik imbalance data sampling, yaitu
Borderline-SMOTE, SVM-SMOTE, dan ADASYN, dalam meningkatkan kinerja
SVM. Data yang digunakan diperoleh dari platform X (Twitter), kemudian
diklasifikasikan ke dalam sentimen positif, netral, dan negatif. Evaluasi dilakukan
menggunakan teknik K-Fold Cross Validation dengan variasi nilai K = 2, 3, 5, 6, 9,
dan 10, serta metrik evaluasi berupa akurasi, presisi, recall, dan F1-score. Hasil
eksperimen menunjukkan bahwa model tanpa penyeimbangan data memperoleh
akurasi 86%, presisi 91%, recall 85%, dan F1-score 91%. Penerapan Borderline-
SMOTE meningkatkan akurasi menjadi 87%, presisi 91%, recall 86%, dan F1-score
tetap 91%. Metode SVM-SMOTE menghasilkan akurasi tertinggi yaitu 91%,
disertai presisi 91%, recall 86%, dan F1-score 91%. Sementara itu, ADASYN
menghasilkan F1-score tertinggi sebesar 92%, dengan akurasi 87%, presisi 91%,
dan recall 87%. Borderline-SMOTE dan SVM-SMOTE juga menunjukkan
peningkatan signifikan pada label netral dengan F1-score 69%, sedangkan
ADASYN unggul dalam klasifikasi kelas negatif dengan F1-score 92%. Dari temuan
tersebut, dapat disimpulkan bahwa meskipun SVM-SMOTE unggul secara akurasi,
ADASYN memberikan hasil klasifikasi yang lebih seimbang dan andal, terutama
dalam menangani ketimpangan distribusi kelas minoritas pada data sentimen.
ContributionNama Dosen PembimbingNIDN/NIDKDosen PembimbingArifianto, Deninidn0718068103Dosen PembimbingUmilasari, Reninidn0728079101
Item Type: | Thesis (Undergraduate) |
---|---|
Keywords/Kata Kunci: | Imbalance Data, Borderline-SMOTE, SVM-SMOTE, ADASYN, SVM, Analisis Sentimen. |
Subjects: | 000 Computer Science, Information, & General Works > 004 Data Processing, Computer Science |
Divisions: | Faculty of Engineering > Department of Informatics Engineering (S1) |
Depositing User: | Ferdy Ilham Maulana | ferdymaulanaa21@gmail.com |
Date Deposited: | 06 Aug 2025 01:49 |
Last Modified: | 06 Aug 2025 01:49 |
URI: | http://repository.unmuhjember.ac.id/id/eprint/26340 |
Actions (login required)
![]() |
View Item |