PENGARUH METODE RANDOM UNDER SAMPLING RANDOM OVER SAMPLING DAN SMOTE TERHADAP KINERJA SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN



SAPUTRA, AGIL DWI (2025) PENGARUH METODE RANDOM UNDER SAMPLING RANDOM OVER SAMPLING DAN SMOTE TERHADAP KINERJA SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN. Undergraduate thesis, Universitas Muhammadiyah Jember.

[thumbnail of 1. PENDAHULUAN.pdf] Text
1. PENDAHULUAN.pdf

Download (1MB)
[thumbnail of 2. ABSTRAK.pdf] Text
2. ABSTRAK.pdf

Download (661kB)
[thumbnail of 3. BAB I.pdf] Text
3. BAB I.pdf

Download (651kB)
[thumbnail of 4. BAB II.pdf] Text
4. BAB II.pdf
Restricted to Repository staff only

Download (846kB) | Request a copy
[thumbnail of 5. BAB III.pdf] Text
5. BAB III.pdf
Restricted to Repository staff only

Download (1MB) | Request a copy
[thumbnail of 6. BAB IV.pdf] Text
6. BAB IV.pdf
Restricted to Repository staff only

Download (1MB) | Request a copy
[thumbnail of 7. BAB V.pdf] Text
7. BAB V.pdf
Restricted to Repository staff only

Download (641kB) | Request a copy
[thumbnail of 8. DAFTAR PUSTAKA.pdf] Text
8. DAFTAR PUSTAKA.pdf

Download (782kB)
[thumbnail of 9. LAMPIRAN.pdf] Text
9. LAMPIRAN.pdf
Restricted to Repository staff only

Download (895kB) | Request a copy

Abstract

Ketidakseimbangan data merupakan tantangan dalam analisis sentimen karena
dapat menyebabkan model bias terhadap kelas mayoritas. Penelitian ini
mengevaluasi pengaruh metode resampling, yaitu Random Under Sampling (RUS),
Random Over Sampling (ROS), dan Synthetic Minority Oversampling Technique
(SMOTE), terhadap performa algoritma Support Vector Machine (SVM) pada data
yang tidak seimbang. Data diperoleh dari media sosial X (Twitter) dengan topik
naturalisasi pemain sepak bola di Indonesia. Tahapan penelitian meliputi
preprocessing, TF-IDF, pengujian model menggunakan K-Fold Cross Validation
K 2, 3, 5, 6, 9 dan 10, dengan evaluasi matrix F1-score, Recall, Precision, dan
Accuracy. Hasil evaluasi hanya ditampilkan nilai tertinggi dari masing-masing
label pada setiap metode, Model SVM tanpa Balancing bekerja baik pada label
negatif dan positif, dengan F1-score 91% dan 90%, namun lemah pada label netral
dengan F1-score 44% dan Recall 29%. Metode RUS meningkatkan Recall label
netral menjadi 81% dan F1-score 68%, meskipun Accuracy turun menjadi 84%.
SMOTE menghasilkan Precision tinggi pada label negatif dan netral, masingmasing 100% dan 90%, namun Recall label netral tetap rendah yaitu 41%. ROS
memberikan hasil terbaik dan paling seimbang, dengan F1-score tertinggi pada
semua label, serta Accuracy keseluruhan tertinggi 92%. ROS terbukti paling efektif
dalam meningkatkan kinerja SVM pada data sentimen yang tidak seimbang.

Contribution
Nama Dosen Pembimbing
NIDN/NIDK
Dosen Pembimbing
ARIFIANTO, DENI
NIDN0718068103
Dosen Pembimbing
UMILASARI, RENI
NIDN0728079101

Item Type: Thesis (Undergraduate)
Keywords/Kata Kunci: data imbalance, analisis sentimen, RUS, ROS, SMOTE, SVM
Subjects: 000 Computer Science, Information, & General Works
000 Computer Science, Information, & General Works > 004 Data Processing, Computer Science
Divisions: Faculty of Engineering > Department of Informatics Engineering (S1)
Depositing User: Agil Dwi Saputra | agilputra855@gmail.com
Date Deposited: 08 Aug 2025 03:46
Last Modified: 08 Aug 2025 03:46
URI: http://repository.unmuhjember.ac.id/id/eprint/26461

Actions (login required)

View Item View Item