Destek vektör makineleri çoklu sınıf problemleri için çözüm önerileri

Yükleniyor...
Küçük Resim

Tarih

2004-07-22

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Selçuk Üniversitesi Fen Bilimleri Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Veri kaynaklan, akıllı bir işlem karan vermek için kullanılabilir. Yapay zekâ; insan gibi düşünen, karar verebilen yani, insanı model alarak bu tip problemleri çözmeyi amaçlayan bir bilim dalı haline gelmiştir. Bunun için de bazı temel işlemleri yerine getirmeye çalışır. Makine öğrenmesi konusu; elde ettiği tecrübeleri otomatik olarak çalıştırabilen bilgisayar programlarının nasıl yapılandırılacağı ile ilgilenir. Son yıllarda birçok makine öğrenmesi uygulaması başarıyla geliştirildi. Kredi.kartı işlemlerinden bilgi filtreleme sistemlerine kadar çeşitli konularda uygulamalar geliştirildi. Aynı zamanda, teorik yapı ve algoritmalardaki önemli gelişmelerle birlikte bu alanlardaki ilerleme alt yapı bakımından da güçlenmiş oldu. Yukarıda değindiğimiz temel işlemlerden bahsedelim. Sınıflandırma; bizim ilgilendiğimiz problem açısından önemli olan veri sınıflarının tanınması işleminin modeller kurularak yerine getirilmesidir. Sınıflandırma tahminden farklıdır. Sınıflandırma modelleri kategorisel etiketleri tahmin ederken, tahmin modelleri sürekli değerli fonksiyonlar üzerinde gelecekteki veri eğilimlerini bulmaya çalışır. Makine öğrenmesi sınıflandırıcıları tarafından uzman sistemler, istatistiksel metotlar ve hücresel biyoloji alanlarında birçok sınıflandırma metodu önerildi. Makine öğrenmesinin etkili bir şekilde kullanılabilmesi için istatistik, yapay zekâ, filozofik, bilgi teorisi, biyoloji, kontrol teorisi gibi birçok alandan da yararlanılmalıdır. Destek vektör makineleri metodu da bu disiplinlerden istatistik alam üzerine kurulmuş bir metottur. Genel olarak istatistiksel öğrenmede 2 durumu ayırt etmeliyiz: 1- eğitme örneklerinden öğrenme/hesaplama işlemi, 2- test örnekleri (sonradan karşılaşılacak örnekler) için tahminde bulunma işlemi. İstatistik kısmında yapılan tanıma göre eğitme ve test verileri aynı istatistiksel dağılımda olmalıdır. İstatistikte öğrenme işlemleri aşağıdaki üç grupta toplanabilir;. Sınıflandırma veya örüntü tanıma,. Regresyon veya gürültülü örneklerden sürekli fonksiyonun hesaplanması,. Örneklerin kullanılarak olasılık yoğunluğunun tahmin edilmesi. Destek Vektör Makineleri-DVM (Support Vector Machines (SVM)) metodu da bu işlemleri yapabilecek alt yapıya sahiptir. DVM '1er orijinal olarak kendine has formüllerle iki ayrı sınıfı direk ayırabilir. Fakat gerçek uygulamaların çoğunda iki sınıfa ayrılan sınıflandırma işlemlerinden çok çoklu sınıf sınıflandırma problemleriyle karşılaşmaktayız. DVM 'lerdeki ilk önemli problem bu noktada ortaya çıkmıştır. Çünkü DVM '1er teorik olarak iki sınıflı sınıflandırma durumları düşünülerek tasarlanmışlardır. Daha sonra yapılan araştırmalarda DVM 'leri çoklu sınıflı sınıflandırma durumuna genişletmek için bazı yaklaşımlar önerildi. Bu yaklaşımlara daha sonraki bölümlerimizde detaylı bir şekilde değineceğiz. Bu yaklaşımlardan hangisi uygulanırsa uygulansın DVM 'lerde sınıflandırılamayan bölgeler oluşmaktadır. Çalışmamızda bu problemin çözülmesini hedefleyen yeni bir teknik geliştirmeye çalıştık.
Data sources can be used to obtain intelligent processing decisions. Artificial Intelligence techniques have been developed to establish models which run like humans. These techniques based on some basic processings. The topic of machine learning, deals with how are the computer programs which can process obtained processings automatically constructed. Recent years, many application have been developed in machine learning researching field. Applications are developed in several topics from credit cards to filtering of informations. At the same time, proceedings in these fields have been powered from the point of the view structure by proceeding of theoretical structure and algorithms. Lets mention basic processings above. Classification is constructed models to recognize data classes which is important in our problem. Classification is different from prediction. While classification models compute category effects, prediction models try to find data tends based on the functions with continuous values in the future. Many classification methods are proposed in the field of expert systems, statisticial methods and biological systems. To use machine learning effectively, we benefit from many fields such as artificial intelligence, philosophy, information theory, biology, control theory. Support vector machines based on statistic among these fields. 4 Generally in statisticial learning, we must separate two situations: 1- processing of learning from the training data, 2- processing of prediction for future (test) data. Training and test data must be in the same distribution according to statistical description. Learning processings in statistical can be combined of three groups;. Classification or pattern recognition,. Regression or computing of continuous functions from samples with noisy,. Density of probability estimation by using of samples. Support vector machines have the structure can make these processings. Support vector machines separate two classes originally. But many of real applications include multi-class classification tasks. It is one drawback of support vector machines. Because, formulas of support vector machines separates two classes from each other directly. Many approachs have been proposed to extend support vector machines into multi-class classification problems. In next sections, we explain them detailed. Unclassifiable regions consisted for all of these approachs. In this study, we try to developed a new technique to solve mentioned problem.

Açıklama

Anahtar Kelimeler

Destek vektör makineleri, Support vector machines, Çoklu sınıf problemleri, Multiclass problems

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Çomak, E. (2004). Destek vektör makineleri çoklu sınıf problemleri için çözüm önerileri. Selçuk Üniversitesi, Yayımlanmış yüksek lisans tezi, Konya.