PENGARUH METODE RANDOM UNDER SAMPLING RANDOM OVER SAMPLING DAN SMOTE TERHADAP KINERJA SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN


SAPUTRA, AGIL DWI (2025) PENGARUH METODE RANDOM UNDER SAMPLING RANDOM OVER SAMPLING DAN SMOTE TERHADAP KINERJA SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN. Undergraduate thesis, Universitas Muhammadiyah Jember.

Text
1. PENDAHULUAN.pdf

Download (1MB)
Text
2. ABSTRAK.pdf

Download (661kB)
Text
3. BAB I.pdf

Download (651kB)
Text
4. BAB II.pdf
Restricted to Registered users only

Download (846kB)
Text
5. BAB III.pdf
Restricted to Registered users only

Download (1MB)
Text
6. BAB IV.pdf
Restricted to Registered users only

Download (1MB)
Text
7. BAB V.pdf
Restricted to Registered users only

Download (641kB)
Text
8. DAFTAR PUSTAKA.pdf

Download (782kB)
Text
9. LAMPIRAN.pdf
Restricted to Registered users only

Download (895kB)

Abstract

Ketidakseimbangan data merupakan tantangan dalam analisis sentimen karena
dapat menyebabkan model bias terhadap kelas mayoritas. Penelitian ini
mengevaluasi pengaruh metode resampling, yaitu Random Under Sampling (RUS),
Random Over Sampling (ROS), dan Synthetic Minority Oversampling Technique
(SMOTE), terhadap performa algoritma Support Vector Machine (SVM) pada data
yang tidak seimbang. Data diperoleh dari media sosial X (Twitter) dengan topik
naturalisasi pemain sepak bola di Indonesia. Tahapan penelitian meliputi
preprocessing, TF-IDF, pengujian model menggunakan K-Fold Cross Validation
K 2, 3, 5, 6, 9 dan 10, dengan evaluasi matrix F1-score, Recall, Precision, dan
Accuracy. Hasil evaluasi hanya ditampilkan nilai tertinggi dari masing-masing
label pada setiap metode, Model SVM tanpa Balancing bekerja baik pada label
negatif dan positif, dengan F1-score 91% dan 90%, namun lemah pada label netral
dengan F1-score 44% dan Recall 29%. Metode RUS meningkatkan Recall label
netral menjadi 81% dan F1-score 68%, meskipun Accuracy turun menjadi 84%.
SMOTE menghasilkan Precision tinggi pada label negatif dan netral, masingmasing 100% dan 90%, namun Recall label netral tetap rendah yaitu 41%. ROS
memberikan hasil terbaik dan paling seimbang, dengan F1-score tertinggi pada
semua label, serta Accuracy keseluruhan tertinggi 92%. ROS terbukti paling efektif
dalam meningkatkan kinerja SVM pada data sentimen yang tidak seimbang.

Dosen Pembimbing: ARIFIANTO, DENI and UMILASARI, RENI | NIDN0718068103, NIDN0728079101
Item Type: Thesis (Undergraduate)
Keywords/Kata Kunci: data imbalance, analisis sentimen, RUS, ROS, SMOTE, SVM
Subjects: 000 Computer Science, Information, & General Works
000 Computer Science, Information, & General Works > 004 Data Processing, Computer Science
Divisions: Faculty of Engineering > Department of Informatics Engineering (S1)
Depositing User: Agil Dwi Saputra | agilputra855@gmail.com
Date Deposited: 08 Aug 2025 03:46
Last Modified: 08 Aug 2025 03:46
URI: https://repository.unmuhjember.ac.id/id/eprint/26461

Actions (login required)

View Item
View Item