(Similarity) Clustering Data Kredit Bank Menggunakan Algoritma Agglomerative Hierarchical Clustering Average Linkage

Ginanjar, Abdurrahman (2018) (Similarity) Clustering Data Kredit Bank Menggunakan Algoritma Agglomerative Hierarchical Clustering Average Linkage. Teknik Informatika Universitas Muhammadiyah Jember, http://jurnal.unmuhjember.ac.id/index.php/JUSTINDO/article/view/2418/1885.

[img] Text
1Clustering Data Kredit Bank Menggunakan Algoritma Agglomerative Hierarchical Clustering Average Lin.pdf

Download (422kB)

Abstract

Data mining adalah pengembangan model yang merepresentasikan penemuan pola menggunakan data historis. Model dapat diaplikasikan pada data untuk prediksi (klasifikasi dan regresi), segmentasi populasi (clustering), dan menentukan hubungan di dalam populasi (asosiasi). Dari beberapa model, salah satunya adalah clustering yang didefinisikan sebagai proses mengorganisir objek-objek menjadi satu kelompok yang anggotanya memiliki kemiripan tertentu. Similaritas ada dua, yakni similaritas berdasarkan bentuk dan jarak. Clustering mempunyai beberapa karakteristik, yaitu: partitioning, hierarchical, overlapping, dan hybrid. Hierarchical clustering adalah salah satu algoritma clustering dengan karakteristik setiap data harus termasuk dalam cluster tertentu, dan data yang termasuk dalam cluster tertentu tidak dapat berpindah ke cluster lain. Hierarchical clustering ada dua, yaitu divisive (top to down) dan agglomerative (down to top). Algoritma agglomerative ada empat yaitu single linkage, centroid linkage, complete linkage, dan average linkage. Salah satu dari algoritma agglomerative tersebut adalah average linkage. Algoritma ini merupakan algoritma terbaik di antara algoritma hierarchical yang lain, tetapi memiliki waktu komputasi tertinggi. Pada penelitian ini akan dilakukan clustering terhadap nasabah di suatu bank dengan algoritma agglomerative hierarchical clustering average linkage. Atribut data yang digunakan: status pengecekan, durasi kredit, sejarah kredit, tujuan kredit, besaran kredit, status tabungan, employment, komitmen, status personal, pihak lain, menetap sejak, kepemilikan property, umur, rencana pembayaran lainnya, status rumah, keberadaan kredit, pekerjaan, jumlah tanggungan, telepon rumah, pekerja luar negeri, dan kelas. Data dalam penelitian ini sebanyak 1000 instances, yang kemudian dijadikan sebagai data training sebanyak 25 %, 50 %, dan 75 %, sedangkan untuk data testing digunakan keseluruhan data.

Item Type: Peer Review
Subjects: 000 Computer Science, Information, & General Works > 005 Computer Programming, Programs, & Data
Divisions: Faculty of Engineering > Department of Informatics Engineering (S1)
Depositing User: GINANJAR ABDURRAHMAN
Date Deposited: 14 Mar 2023 02:43
Last Modified: 14 Mar 2023 02:43
URI: http://repository.unmuhjember.ac.id/id/eprint/16578

Actions (login required)

View Item View Item