Skip to content Skip to sidebar Skip to footer

Teori Analisis Cluster: Penting Untuk Referensi Penelitian

Analysis Cluster Theory: Important For Thesis Research Reference
Hai..! jumpa lagi dengan Akhmad.com dalam teori cluster analysis untuk bahan referensi penelitian.  Tulisan ini sebagai pengantar sebelum mempelajari penerapan analisis cluster. Supaya mendapatkan pemahaman yang jelas mengenai analisis cluster maka sobat sekalian penting menyimak tulisan ini sampai selesai ya. Terima kasih.

Definisi Analisis Cluster (Cluster Analysis)

Singgih Santoso (2012)

Cluster” atau “Kluster”bisa berarti “kelompok”. Dengan demikian, pada dasarnya analisis cluster dapat menghasilkan sejumlah cluster (kelompok). Analisis ini di awali dengan pemahaman bahwa sejumlah data tertentu sebenarnya mempunyai kemiripan diantara anggotanya: karena itu dimungkinkan untuk mengelompokkan anggota-anggota yang mirip atau memiliki karakteristk yang serupa tersebut dalam satu atau lebih cluster.

Supranto (2004) dan Jonhson & Wichern (1982)

Analisis cluster adalah pengelompokkan objek atau kasus menjadi kelompok yang lebih kecil, dimana setiap kelompok berisi objek yang mirip satu sama lain.

Jonhson & Wichern (1982)

Clustering menggunakan ukuran yang dapat menjelaskan kesamaan atau kedekatan data untuk menjelaskan struktur kelompok sederhana dari data yang kompleks, yaitu ukuran jarak atau kesamaan, dan ukuran jarak yang umum digunakan adalah ukuran jarak Euclidean.

Jenis Analisis Cluster

Annisa Nur Fathia, Rita Rahmawati, Tarno (2016)

Pada dasarnya analisis cluster terbagi dalam dua metode, yaitu metode hirarki serta non hirarki. Kemudian metode hirarki dibagi lagi menjadi dua jenis, yaitu metode agglomerative dan metode defektif. Dalam metode aglomerasi, langkah pertama adalah mengubah setiap observasi menjadi kelompok, dengan satu anggota di setiap kelompok. 

cluster-statistik

Langkah selanjutnya adalah menggabungkan dua larik atau objek dengan jarak terpendek menjadi satu larik. Metode pemisahan melakukan kebalikannya, sehingga semua pengamatan diperlakukan sebagai satu kelompok dan kemudian dipisahkan hingga terbentuk kelompok dari satu anggota. Hasil dari metode aglomerasi dapat disajikan dalam bentuk illustration yang disebut dendogram.

Singgih Santoso, 2012

Setelah data yang dianggap mempunyai satuan yang sangat berbeda diseragamkan, dan metode cluster di tentukan (misal di pilih Eucledian) langkah selanjutnya adalah membuat cluster. Proses inti clustering adalah pengelompokkan data yang bisa dilakukan dengan dua metode:
1.    HIRARCHICAL METHOD, metode ini memulai pengelompokkan dengan dua atau lebih objek yang mempunyai kesamaan paling dekat. Kemudian proses diteruskan ke objek lain yang mempunyai kedekaan kedua. Demikian seterusnya sehingga cluster akan membentuk semacam ‘pohon’ dimana ada hirarki (tingkatan) yang jelas antar objek, dari yang paling mirip sampai paling tidak mirip. Secara logika semua objek pada akhirnya hanya akan membentuk sebuah cluster. Dendogram biasanya digunakan untuk membantu memperjelas hierarki tersebut.

2.    NON-HIRARCHICAL METHOD, berbeda dengan metode hirarki, metode ini justru di mulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan (dua cluster, tiga cluster atau lainnya). Setelah jumlah cluster di ketahui baru kemudian proses cluster di lakukan tanpa mengikuti proses hirarki. Metode ini biasa disebut dengan K-Means Cluster.

Tujuan Analisis Cluster

Menurut Singgih Santoso (2012) bahwa analisis kluster dapat diterapkan di berbagai bidang dengan tujuan sebagai berikut:
1. Psikologi: Melakukan pengelompokkan orang berdasar respons mereka terhadap stimulus tertentu atau pengelompokkan orang berdasar kepribadian mereka.
2. Biologi: membantu proses taksonomi untuk pengelompokkan organisme tertentu
3. Manajemen: membantu pengelompokkan konsumen berdasar pendapat mereka terhadap produk tertentu
4. Kedokteran: membantu menggolongkan sejumlah penyakit berdasar ciri-ciri penyakit tersebut

Ciri Cluster yang Baik

Memahami jenis cluster yang baik adalah sangat penting sebelum melakukan analisis cluster dengan metode tertentu. Analisis cluster akan membagi sejumlah data pada satu atau beberapa cluster tertentu.

Pertanyaan yang kemudian timbul adalah apa yang menjadi batas bahwa sejumlah data dapat dikelompokkan sebagai satu cluster?  Secara logika sebuah cluster yang baik adalah cluster yang mempunyai:
1. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster (within-cluster). Sebagai contoh cluster konsumen rumah yang peduli lingkungan tentu terdiri atas orang-orang yang mengutamakan kebersihan dan kenyamanan lingkungan rumahnya; mereka yang mengutamakan harga rumah murah tentu tidak dapat di gabungkan menjadi anggota cluster tersebut. 
2. Heterogenitas (perbedaan) yang tinggi antar cluster yang satu dengan cluster lainnya (between cluster). Dalam contoh di atas anggota cluster konsumen rumah yang peduli lingkungan tentu mempunyai pendapat yang jelas berbeda dengan anggota-anggota cluster konsumen rumah yang mementingkan harga rumah.

Berdasarkan dua hal penting di atas maka sebuah cluster yang baik adalah cluster yang memiliki anggota-anggota yang semirip mungkin satu dengan lainnya namun sangat tidak mirip dengan anggota-anggota cluster yang lain. Kemiripan yang dimaksud adalah kesamaan karakteristik antar dua data.

Tahap-Tahap Dalam Analisis Cluster

Proses clustering pada dasarnya mencari dan mengelompokkan data yang mirip. Jadi kriteria “kemiripan” menjadi dasar dalam analisis cluster. Tahapan dalam proses pengelohan data dalam mengelompokkan data mentah menjadi satu atau beberapa kelompok sebagai berikut:
1.    Menetapkan ukuran jarak
2.    Melakukan proses standarisasi data jika diperlukan
3.    Melakukan proses clustering
4.    Melakukan penamaan cluster-cluster yang terbentuk
5.    Melakukan validasi dan profiling cluster

Asumsi Dalam Analisis Cluster

1. Sampel yang diambil harus benar-benar mewakili populasi. Diperlukan sampel yang cukup besar agar proses clustering bisa dilakukan dengan benar.

2. Multkolinearitas, sebaiknya tidak ada korelasi antar objek, namun seandainya terdapat multikolinearitas maka besar multikolinearitas tersebut tidak terlalu tinggi (di atas 0,5) dianjurkan untuk menghilangkan salah satu variabel dari dua variabel yang berkorelasi jika terdapat multikolinearitas.

Penjelasan di atas dapat dijadikan tambahan referensi dalam analisis cluster bagi mahasiswa, dosen atau para peneliti pada umumnya. Silahkan ditambahkan dengan sumber lain. Mudah-mudahan tulisan ini memberikan manfaat bagi banyak pihak. Terima kasih sudah membaca, silahkan membaca tulisan menarik lainnya dalam blog ini. Semoga sehat selalu dan bahagia.