Irvantoro, Deni (2019) FEATURE SELECTION CHI-SQUARE N-GRAM NAÏVE BAYES CLASSIFIER REVIEW. Undergraduate thesis, Universitas Muhammadiyah Jember.
Text
JURNAL.pdf Download (485kB) |
|
Text
ABSTRAK.pdf Download (111kB) |
|
Text
PENDAHULUAN.pdf Download (258kB) |
|
Text
BAB I.pdf Download (170kB) |
|
Text
BAB II.pdf Restricted to Repository staff only Download (361kB) |
|
Text
BAB III.pdf Restricted to Repository staff only Download (373kB) |
|
Text
BAB IV.pdf Restricted to Repository staff only Download (227kB) |
|
Text
BAB V.pdf Restricted to Repository staff only Download (161kB) |
|
Text
LAMPIRAN.pdf Download (1MB) |
Abstract
Analisis sentimen perlu diterapkan untuk menentukan review yang bernilai postif atau negatif. Algoritma klasifikasi seperti Naïve Bayes Classifier (NBC) telah banyak di terapkan. Di samping memiliki performanya yang baik di berbagai domain, tapi terdapat sensitifitas terhadap pemilihan fitur. Chi-square merupakan salah satu metode statistik untuk pemilihan fitur dengan uji independensi dan estimasi yang bertujuan untuk mengetahui ketergantungan suatu class pada suatu fitur. Sedangkan N-Gram merupakan pemotongan kata berdasarkan nilai n. Dengan penggabungan chi-square dan N-Gram pada teknik uni-gram hasil tertinggi terdapat pada uji 75% fitur dengan akurasi 89%, presisi 89%, dan recall 100%. Hasil tertinggi pada bi-gram terdapat pada 25% fitur dengan akurasi 89%, presisi 89%, dan recall 100%. Hasil tertinggi pada uni+bi-gram terdapat pada 25% fitur dengan akurasi 89%, presisi 89%, dan recall 100%. Dari ketiga teknik N-Gram improvisasi terjadi pada fitur uji 25% dengan akurasi uni-gram 87,6% menjadi 89% pada bi-gram dan uni+bi-gram, presisi uni-gram 88,84% menjadi 89% pada uni-gram+ bi-gram, dan recall uni-gram 98,42% menjadi 100% pada bi-gram dan uni+bi-gram. Dalam penelitian ini masing-masing teknik N-Gram dengan penerapan feature selection chi-squre memiliki ambang batas penggunaan fitur yang berbeda. Pada komparasi ke tiga teknik N-Gram secara umum chisquare tidak mempengaruhi urutan hasil dari klasifikasi, tapi mampu memberikan improvisasi hasil akurasi, presisi, dan recall. Kata Kunci: Analisis Sentimen, Feature Selection, Chi-Square, N-Gram, Agoritma Naive Bayes Classifier..
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Subjects: | 600 Technology and Applied Science > 620 Engineering | |||||||||
Divisions: | Faculty of Engineering > Department of Informatics Engineering (S1) | |||||||||
Department: | S1 Teknik Informatika | |||||||||
Depositing User: | rahma wahyu ningsih | |||||||||
Contributors: |
|
|||||||||
Date Deposited: | 03 Dec 2020 04:19 | |||||||||
Last Modified: | 03 Dec 2020 04:19 | |||||||||
URI: | http://repository.unmuhjember.ac.id/id/eprint/7128 |
Actions (login required)
View Item |