Pengelompokan Data Menggunakan Hierarchical Clustering (AHC) ( 201931042_Muhammad agung nugroho)
Pengelompokan Data Menggunakan Hierarchical Clustering (AHC)
Data merupakan salah satu sumber yang digunakan untuk memperoleh suatu
informasi. Namun tidak semua data dapat dimanfaatkan dengan baik. Jika
data tersebut memiliki struktur yang kompleks, maka akan sulit untuk
dimengerti. Sebagai contoh adalah data tagihan pelanggan PT.Telkom yang
digunakan pada Tugas Akhir ini. Data tersebut memiliki jumlah record
yang banyak dengan atribut yang banyak pula. Oleh karena itu diperlukan
suatu proses pengelompokan yang bertujuan untuk membagi data tersebut ke
dalam jumlah yang lebih sedikit sehingga proses penganalisisan data
menjadi semakin mudah. Tugas Akhir ini mengimplementasikan salah satu
teknik data mining yaitu clustering untuk melakukan pengelompokan data.
Metode clustering yang digunakan adalah Agglomerative Hierarchical
Clustering (AHC). Agglomerative Hierarchical Clustering adalah suatu
metode hierarchical clustering yang bersifat bottom-up yaitu
menggabungkan n buah klaster menjadi satu klaster tunggal. Metode ini
dimulai dengan meletakkan setiap objek data sebagai sebuah klaster
tersendiri (atomic cluster) dan selanjutnya menggabungkan
klaster-klaster tersebut menjadi klaster yang lebih besar dan lebih
besar lagi sampai akhirnya semua objek data menyatu dalam sebuah klaster
tunggal. Kunci dari metode AHC adalah perhitungan proximity antara 2
klaster. Perhitungan ini terbagi menjadi 3 yaitu Single Linkage (jarak
terkecil), Complete Linkage (jarak terbesar) dan Average Linkage (jarak
ratarata). karena metode hirarki tidak dapat menghasilkan klaster secara
langsung, maka digunakan metode cophenet distance untuk menganalisis
hasil hirarki yang terbentuk. Dari hasil yang didapat menunjukkan bahwa
Agglomerative Hierarchical Clustering (AHC) dapat digunakan untuk
pengelompokan data.
Kata Kunci : AHC, Single Linkage, Complete
Linkage, Average Linkage,ABSTRACT: Data is one of resources which used
for gathering information. However, not all data working well. If the
data have a complex structure, it is hard to understand. For example,
data of customer invoice in PT.Telkom which used in this final project.
This data have sum up the record is to lot of with the attributes amount
which is there also many. Therefore, we need grouping process which is
dividing data into slimmer amount so process the data analysing become
progressively easy to. This Final Project is inplements one of technique
in data mining which is clustering to do grouping data. The clustering
method that is used is Agglomerative Hierarchical Clustering (AHC).
Agglometarive Hierarchical Clustering is a method of hierarchical
clustering having the character of bottom up which is joining n cluster
become one single cluster. This method has begin with placing each data
object as one separate cluster (atomic cluster) and join that
cluster-cluster become ones large cluster and bigger again untuil the
last all of data object one in one single cluster. The keys from AHC
method is calculation proximity between 2 cluster. This calculation is
divisible become 3 which single linkage (shortest distance), complete
linkage (longest distance) and average linkage (average distance).
Because hierarchy method cannot result the cluster directly so we used a
cophenetic distance method to analyse result of formed hierarchy. From
result is in can indicate that Agglomerative Hierarchical Clustering
(AHC) applicable to grouping data.Keyword: AHC, Single Linkage, Complete
Linkage, Average Linkage,
Bersumber :
https://repository.telkomuniversity.ac.id/pustaka/94531/pengelompokan-data-menggunakan-hierarchical-clustering-ahc-.html
Komentar
Posting Komentar