Örüntü tanıma uygulamalarında yapay zeka ve öznitelik dönüşüm metotları kullanılarak geliştirilen öznitelik seçme algoritmaları

Yükleniyor...
Küçük Resim

Tarih

2014-07-21

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Selçuk Üniversitesi Fen Bilimleri Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Bu tez çalışmasında, örüntü tanımanın temel öğelerinden biri olan öznitelik seçimi üzerinde durulmuştur. Özellikle veri madenciliği ve örüntü tanıma uygulamalarında kullanılan öznitelik seçimi, veri boyutunun azaltılmasını ve en iyi öznitelik kümesinin seçimini sağlar. Böylelikle kullanılan sınıflandırıcıların başarısı artar ve eğitim ile test süreleri azalır. Gereksiz öznitelikler tespit edildiği için özniteliklerin elde edilmesinde kullanılacak olan donanım azalır. Bu amaçla, bu tez kapsamında üç yeni öznitelik seçim yöntemi ve bu yöntemlerin kullanımıyla geliştirilen sistemler önerilmiştir. Bu öznitelik seçim yöntemlerinden birincisi, bal arısı sürüsünün akıllı yiyecek arama davranışını taklit eden Yapay Arı Kolonisi (YAK) optimizasyon algoritmasının, kümeleme tabanlı öznitelik seçiminde kullanılmasıyla geliştirilen ve YAKÖS olarak isimlendirilen yeni bir öznitelik seçme yöntemidir. İkincisi ve üçüncüsü, Karesel Diskriminant Analizi (KDA) sınıflandırma algoritmasını kriter alarak geliştirilen Ardışık İleri Yönde Seçim (AİYS) ve Ardışık Geri Yönde Seçim (AGYS) ile Temel Bileşen Analizinin (TBA) birleştirilmesiyle oluşturulmuş ve sırasıyla AİYSP ve AGYSP olarak isimlendirilen iki tane hibrit öznitelik seçme yöntemidir. Geliştirilen yeni YAKÖS yönteminin başarısı, hem Yapay Sinir Ağları (YSA) sınıflandırıcısında hem de Destek Vektör Makinaları (DVM) sınıflandırıcısında test edilirken diğer yöntemler ise YSA sınıflandırıcısında test edilmiştir. En iyi doğru sınıflandırma oranları, Statlog kalp hastalığı veri kümesi için % 88.89, SPECT görüntüleri veri kümesi için % 88.04 ve meme kanseri veri kümesi için % 98.71 olarak YAKÖS+TBA+YSA sisteminde bulunurken Hepatit veri kümesi için % 94.92, karaciğer hastalığı veri kümesi için % 74.81, Diyabet veri kümesi için % 79.29 olarak YAKÖS+DVM sisteminde bulunmuştur. Bunlara ilave olarak, kadınlarda en sık görülen kanser türü olan meme kanserinin teşhisi için AİYSP+YSA ve AGYSP+YSA sistemleri geliştirilmiştir. Kullanılan meme kanseri veri kümesi için AİYSP+YSA sisteminin doğru sınıflandırma oranı % 97.57 ve AGYSP+YSA sisteminin doğru sınıflandırma oranı % 98.57 elde edilmiştir. Sınıflandırmanın güvenilirliğini artırmak için bütün sistemlerde çapraz doğrulama yöntemi kullanılmıştır. Geliştirilen bu yöntemler, literatürdeki aynı veri kümelerini kullanan yöntemlere göre çoğunlukla daha yüksek sınıflandırma başarılarına ulaşmaktadır.
In this thesis study, feature selection which is one of the fundamental topic of pattern recognition, is studied. Feature selection, especially used in data mining and pattern recognition applications, reduce the size of data and enable the selection of the best set of features. Thus, for used classification success increase, and training ve test time reduce. Since redundant features are determined, hardware costs of data acquisition for these features are reduced. For this purpose, three new feature selection methods and systems that improved with these methods are proposed in this thesis. First new feature selection method developed in this study is clustering-based feature selection via the Artificial Bee Colony named as ABCFS. Artificial Bee Colony (ABC) optimization algorithm simulates the intelligent foraging behavior of honey bee swarm. The second and third methods are hybrid features selection methods named as SFSP and SBSP which are composed by combining the Sequential Forward Selection (SFS) and the Sequential Backward Selection (SBS) together with the Principal Component Analysis (PCA) developed by utilizing Quadratic Discriminant Analysis (QDA) classification algorithm criteria. While the success of the ABCFS method is tested with Artificial Neural Networks (ANN) classifier and Support Vector Machines (SVM) classifier, other methods have been tested in the ANN classifier only. The highest classification accuracies for Statlog (Heart) disease, SPECT images, breast cancer dataset were obtained by ABCFS+PCA+ANN as 88.89 %, 88.04 % and 98.71 % respectively. On the other hand, the highest classification accuracies for Hepatitis, Liver Disorders, Diabetes dataset were obtained by ABCFS+SVM as 94.92%, 74.81% and 79.29% respectively. In addition, for detection of breast cancer, which is the most common cancer type seen in women, SFSP+NN and SBSP+NN have been devoloped. For used breast cancer dataset, correct classification rate of SFSP+NN system is 97.57% and correct classification rate of SBSP+NN system is 98.57%. To improve the reliability of classification, cross-validation method was used in all systems. Obtained results show that the performance of proposed methods are generally highly successful compared to other results attained.

Açıklama

Anahtar Kelimeler

Örüntü tanıma, Temel bileşen analizi, Öznitelik seçimi, Yapay arı kolonisi, Yapay sinir ağı, Pattern recognition, Principal component analysis, Feature selection, Artificial bee colony, Artificial neural network

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Uzer, M. S. (2014). Örüntü tanıma uygulamalarında yapay zeka ve öznitelik dönüşüm metotları kullanılarak geliştirilen öznitelik seçme algoritmaları. Selçuk Üniversitesi, Yayımlanmış doktora tezi, Konya.