PENGARUH METODE RANDOM UNDER SAMPLING RANDOM OVER SAMPLING DAN SMOTE TERHADAP KINERJA SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN
SAPUTRA, AGIL DWI (2025) PENGARUH METODE RANDOM UNDER SAMPLING RANDOM OVER SAMPLING DAN SMOTE TERHADAP KINERJA SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN. Undergraduate thesis, Universitas Muhammadiyah Jember.
![]() |
Text
1. PENDAHULUAN.pdf Download (1MB) |
![]() |
Text
2. ABSTRAK.pdf Download (661kB) |
![]() |
Text
3. BAB I.pdf Download (651kB) |
![]() |
Text
4. BAB II.pdf Restricted to Repository staff only Download (846kB) | Request a copy |
![]() |
Text
5. BAB III.pdf Restricted to Repository staff only Download (1MB) | Request a copy |
![]() |
Text
6. BAB IV.pdf Restricted to Repository staff only Download (1MB) | Request a copy |
![]() |
Text
7. BAB V.pdf Restricted to Repository staff only Download (641kB) | Request a copy |
![]() |
Text
8. DAFTAR PUSTAKA.pdf Download (782kB) |
![]() |
Text
9. LAMPIRAN.pdf Restricted to Repository staff only Download (895kB) | Request a copy |
Abstract
Ketidakseimbangan data merupakan tantangan dalam analisis sentimen karena
dapat menyebabkan model bias terhadap kelas mayoritas. Penelitian ini
mengevaluasi pengaruh metode resampling, yaitu Random Under Sampling (RUS),
Random Over Sampling (ROS), dan Synthetic Minority Oversampling Technique
(SMOTE), terhadap performa algoritma Support Vector Machine (SVM) pada data
yang tidak seimbang. Data diperoleh dari media sosial X (Twitter) dengan topik
naturalisasi pemain sepak bola di Indonesia. Tahapan penelitian meliputi
preprocessing, TF-IDF, pengujian model menggunakan K-Fold Cross Validation
K 2, 3, 5, 6, 9 dan 10, dengan evaluasi matrix F1-score, Recall, Precision, dan
Accuracy. Hasil evaluasi hanya ditampilkan nilai tertinggi dari masing-masing
label pada setiap metode, Model SVM tanpa Balancing bekerja baik pada label
negatif dan positif, dengan F1-score 91% dan 90%, namun lemah pada label netral
dengan F1-score 44% dan Recall 29%. Metode RUS meningkatkan Recall label
netral menjadi 81% dan F1-score 68%, meskipun Accuracy turun menjadi 84%.
SMOTE menghasilkan Precision tinggi pada label negatif dan netral, masingmasing 100% dan 90%, namun Recall label netral tetap rendah yaitu 41%. ROS
memberikan hasil terbaik dan paling seimbang, dengan F1-score tertinggi pada
semua label, serta Accuracy keseluruhan tertinggi 92%. ROS terbukti paling efektif
dalam meningkatkan kinerja SVM pada data sentimen yang tidak seimbang.
ContributionNama Dosen PembimbingNIDN/NIDKDosen PembimbingARIFIANTO, DENINIDN0718068103Dosen PembimbingUMILASARI, RENINIDN0728079101
Item Type: | Thesis (Undergraduate) |
---|---|
Keywords/Kata Kunci: | data imbalance, analisis sentimen, RUS, ROS, SMOTE, SVM |
Subjects: | 000 Computer Science, Information, & General Works 000 Computer Science, Information, & General Works > 004 Data Processing, Computer Science |
Divisions: | Faculty of Engineering > Department of Informatics Engineering (S1) |
Depositing User: | Agil Dwi Saputra | agilputra855@gmail.com |
Date Deposited: | 08 Aug 2025 03:46 |
Last Modified: | 08 Aug 2025 03:46 |
URI: | http://repository.unmuhjember.ac.id/id/eprint/26461 |
Actions (login required)
![]() |
View Item |