Ukuran Validitas Cluster


Sejak konsep himpunan fuzzy diperkenalkan oleh Zadeh pada tahun 1965, konsep fuzzy clustering banyak dikembangkan dan diterapkan. Dalam konsep fuzzy clustering, suatu data dapat menjadi anggota dari beberapa cluster sekaligus menurut derajat keanggotaannya (Wu dan Yang, 2005). Proses clustering dalam algoritma fuzzy clustering selalu mencari solusi terbaik untuk parameter yang telah didefinisikan. Namun solusi terbaik ini belum tentu dapat menentukan deskripsi terbaik dari struktur data. Dalam hal ini jumlah cluster yang ditentukan atau bentuk cluster mungkin tidak sesuai dengan data. Untuk menentukan jumlah cluster yang paling optimal dan dapat memvalidasi apakah partisi fuzzy yang diterapkan dalam proses clustering sesuai dengan data, digunakan indeks pengukuran validitas cluster (Balasko, ____).

Berikut ini adalah beberapa metode pengukuran validitas cluster yang umumnya digunakan untuk algoritma fuzzy clustering(Wu dan Yang, 2005) :

Partition Coefficient

Partition Coefficient (PC)merupakan metode yang mengukur jumlah cluster yang mengalami overlap. Indeks PC mengukur validitas cluster dengan rumus sebagai berikut :

Dimana :
c          = jumlah cluster
N         = jumlah data
μij        = derajat keanggotaan data ke-j pada cluster ke-i
PC(c)   = nilai indeks PC pada cluster ke-c

Nilai PC berada dalam batas  .

Pada umumnya jumlah cluster yang paling optimal ditentukan dari nilai PC yang paling besar

Modified Partition Coefficient

Partition  Coefficient cenderung mengalami perubahan yang monoton terhadap beragam nilai c (jumlah cluster). Modifikasi dari indeks PC (Modified Partition Coefficient/MPC) dapat mengurangi perubahan yang monoton tersebut. dan didefinisikan dengan rumus berikut:

Dimana :
c                      = jumlah cluster
MPC(c)           = nilai indeks MPC pada cluster ke-c

Nilai MPC berada dalam batas 0 ≤ PC(c) ≤ 1. Pada umumnya jumlah cluster yang optimal ditentukan dari nilai MPC yang paling besar

Classification Entropy

Classification Entropy (CE)merupakan metode yang mengukur tingkat kekaburan (fuzzyness) dari partisi cluster. Indeks CE mengukur validitas cluster dengan rumus sebagai berikut :

Dimana :
c          = jumlah cluster
N         = jumlah data
μij        = derajat keanggotaan data ke-j pada cluster ke-i
CE(c)   = nilai indeks CE pada cluster ke-c

Nilai CE berada dalam batas 0 ≤ CE(c) ≤ log2c. Pada umumnya jumlah cluster yang optimal ditentukan dari nilai PE yang paling kecil

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s