Kurbağa sıçrama algoritmasının kümeleme problemlerine uygulanması
Yükleniyor...
Dosyalar
Tarih
2015
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Selçuk Üniversitesi Fen Bilimleri Enstitüsü
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Verilerin kendi aralarındaki benzerlik ve farklılık durumlarına göre gruplandırılması işlemi kümeleme olarak adlandırılabilir. Kümeleme işleminden sonra aynı kümedeki verilerin benzerliklerinin, farklı kümelerdeki verilerin benzersizliklerinin maksimum olması beklenir. Bu çalışmada UCI Machine Learning Repository veri ambarından alınan 12 adet veri seti (Balance, Breast Cancer Wisconsin Diagnostic, Breast Cancer Wisconsin Original, Credit, Dermatology, Diabetes, E. Coli, Glass, Heart Disease, Iris, Thyroid ve Wine) üzerinde Kurbağa Sıçrama Algoritması (KSA) ile hiyerarşik olmayan kümeleme yapılmıştır. KSA küme merkezlerinin belirlenmesi amacıyla kullanılmıştır. Veriler ile küme merkezleri arasındaki toplam uzaklık Öklid metodu ile hesaplanmıştır. Toplam karesel uzaklık değerinin minimize edilmesi KSA'nın amaç fonksiyonu olarak ele alınmıştır. Bunun yanı sıra KSA'nın genel yapısında herhangi bir değişikliğe gidilmeden, memetik evrim aşamasında uygunluk değeri en kötü olan kurbağanın konumunun güncellenmesi için sıçrama miktarının belirlenmesi sırasında adaptif bir seçim önerilmiştir. KSA'nın önerilen bu yeni hali Adaptif Kurbağa Sıçrama Algoritması (AKSA) olarak isimlendirilmiştir. KSA ve AKSA'nın belirlenen veri setleri üzerindeki kümeleme performansları incelenmiştir. Elde edilen deneysel sonuçlara göre AKSA'nın kümeleme problemleri için KSA'dan genel olarak daha başarılı sonuçlar elde ettiği görülmüştür.
The clustering is to group any data set according to data similarities and dissimilarities. After clustering, the similarity among data in same group and the dissimilarity among data in different groups are expected to be maximum. In this work, Shuffled Frog Leaping Algorithm (SFLA) is applied on non-hierarchical clustering by using 12 data sets (Balance, Breast Cancer Wisconsin Diagnostic, Breast Cancer Wisconsin Original, Credit, Dermatology, Diabetes, E.Coli, Glass, Heart Disease, Iris, Thyroid and Wine) taken from UCI Machine Learning Repository platform. SFLA is used to find center of clusters. Euclidean method is used to calculate the distance between data objects and their cluster center. The minimizing of the sum squared distance value is used as SFLA's fitness function. Besides, without going to any changes in the structure of SFLA, a new adaptive choice of leaping size is proposed during the updating location of the worst frog in the population. The proposed model of the SFLA is named as Adaptive Shuffled Frog Leaping Algorithm (ASFLA). The clustering performances of the SFLA and ASFLA are analyzed on using data sets from UCI and compared with each other. According to the experimental results, the clustering performance of the ASFLA is generally better than the clustering performance of the SFLA.
The clustering is to group any data set according to data similarities and dissimilarities. After clustering, the similarity among data in same group and the dissimilarity among data in different groups are expected to be maximum. In this work, Shuffled Frog Leaping Algorithm (SFLA) is applied on non-hierarchical clustering by using 12 data sets (Balance, Breast Cancer Wisconsin Diagnostic, Breast Cancer Wisconsin Original, Credit, Dermatology, Diabetes, E.Coli, Glass, Heart Disease, Iris, Thyroid and Wine) taken from UCI Machine Learning Repository platform. SFLA is used to find center of clusters. Euclidean method is used to calculate the distance between data objects and their cluster center. The minimizing of the sum squared distance value is used as SFLA's fitness function. Besides, without going to any changes in the structure of SFLA, a new adaptive choice of leaping size is proposed during the updating location of the worst frog in the population. The proposed model of the SFLA is named as Adaptive Shuffled Frog Leaping Algorithm (ASFLA). The clustering performances of the SFLA and ASFLA are analyzed on using data sets from UCI and compared with each other. According to the experimental results, the clustering performance of the ASFLA is generally better than the clustering performance of the SFLA.
Açıklama
Anahtar Kelimeler
Adaptif kurbağa sıçrama algoritması, Hiyerarşik olmayan kümeleme, Kurbağa sıçrama algoritması, Kümeleme, Adaptive shuffled frog leaping algorithm, Clustering, Non-hierarchical clustering, Shuffled frog leaping algorithm
Kaynak
WoS Q Değeri
Scopus Q Değeri
Cilt
Sayı
Künye
Karakoyun, M. (2015). Kurbağa sıçrama algoritmasının kümeleme problemlerine uygulanması. Selçuk Üniversitesi, Yayımlanmış yüksek lisans tezi, Konya.