Veri kümelerindeki eksik değerlerin yeni yaklaşımlar kullanılarak hesaplanması

Aydilek, İbrahim Berkan

Veri kümelerindeki eksik değerlerin yeni yaklaşımlar kullanılarak hesaplanması

dc.contributor.advisor	Arslan, Ahmet
dc.contributor.author	Aydilek, İbrahim Berkan
dc.date.accessioned	2015-01-12T08:52:32Z
dc.date.available	2015-01-12T08:52:32Z
dc.date.issued	2013-06-26
dc.department	Enstitüler, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı	en_US
dc.description.abstract	Veri kümeleri; veri madenciliği, makine öğrenmesi veya yapay zeka gibi disiplinlerin uygulanabilmesi için gereklidir. Veri kümelerindeki verinin kalitesi, doğru araştırma sonuçları elde edebilmek adına önemli bir konudur. Veri kümelerinde çeşitli nedenlerle veri kalitesini azaltan değeri olmayan nitelikler bulunabilmektedir. Değeri olmayan bu eksik değerler yapılmak istenen çalışmaya ait sonuçların güvenirliğini riske atabilmektedir. Bu nedenle veri kalitesini artırmaya yönelik yöntemler ile veri kümelerindeki eksik değer probleminin giderilmesi gerekmektedir. Bu tez çalışmasında eksik değer hesaplamasında kullanılan klasik yöntemlerden bahsedilerek alternatif gelişmiş yöntemler önerilmiştir. Daha önce konuyla ilgili yapılmış olan çalışmaların faydalarından bahsedilerek eksik değer hesaplamasının önemi vurgulanmıştır. Bulanık c-ortalamaları, destek vektör regresyonu ve genetik algoritmaların hibrit kullanımı ile geliştirilen bir yaklaşım ve ayrıca en yakın k-komşu ve yapay sinir ağlarının hibrit kullanımı sonucu geliştirilen bir diğer yaklaşım önerilmiştir. Bu yaklaşımlarda kullanılan temel algoritmalar olan bulanık c-ortalamaları ve en yakın k-komşu algoritmaları için en uygun parametre değerlerini bulan otomatik bir model önerilmiştir. Önerilen yaklaşımlar literatürde yaygın kullanılan veri kümeleri ile test edilmiş ve benzer diğer yaklaşımlar ile kıyaslanmıştır. Benzer yöntemlerin eksikliklerine karşı önerilen hibrit yaklaşımların literatüre kattığı yenilikler anlatılmıştır. Elde edilen araştırma sonuçlarında, önerilen hibrit yaklaşımların performanslarının benzer yöntemlere göre daha üstün ve tutarlı olduğunu görülmüştür.	en_US
dc.description.abstract	Data mining, machine learning or artificial intelligence algorithms need a dataset to produce and evaluate research results. Data quality is a significant issue to obtain accurate research results. Many datasets may contain one or more missing values in a row due to various reasons. Missing values reduce data quality and even may jeopardize research results. Therefore, before using missing values in data mining or machine learning methods, they should be handled and estimated without reduce the data quality. In this paper basic conventional and computational intelligence imputation techniques are mentioned. Advantages of closer literature researches bring out the importance of dealing with missing values in datasets. A novel hybrid approach using fuzzy c-means, support vector regression and genetic algorithms is proposed. Also another novel hybrid approach k-nearest neighbors, artificial neural networks is also proposed. Fuzzy c-means and k-nearest neighbors algorithms? parameters are automatically optimized. Approaches tested with different kinds of datasets, which are frequently used in literature and additionally proposed approaches are compared with other closer methods in literature. Disadvantages of closer methods are mentioned in order to assess the originality of the proposed approaches. Findings showed that new novel proposed hybrid approaches performances are more stable and better than the other closer methods.	en_US
dc.identifier.citation	Aydilek, İ. B. (2013). Veri kümelerindeki eksik değerlerin yeni yaklaşımlar kullanılarak hesaplanması. Selçuk Üniversitesi, Yayımlanmış yüksek lisans tezi, Konya.	en_US
dc.identifier.uri	https://hdl.handle.net/20.500.12395/1313
dc.language.iso	tr	en_US
dc.publisher	Selçuk Üniversitesi Fen Bilimleri Enstitüsü	en_US
dc.relation.publicationcategory	Tez	en_US
dc.rights	info:eu-repo/semantics/openAccess	en_US
dc.selcuk	20240510_oaig	en_US
dc.subject	Bulanık c-ortalamaları	en_US
dc.subject	Eksik değerler	en_US
dc.subject	En yakın k-komşu	en_US
dc.subject	Hibrit yaklaşımlar	en_US
dc.subject	Kayıp değerler	en_US
dc.subject	Kayıp veriler	en_US
dc.subject	Veri önişleme	en_US
dc.subject	Data preprocessing	en_US
dc.subject	Fuzzy c-means	en_US
dc.subject	Hybrid method	en_US
dc.subject	Artificial intelligence	en_US
dc.subject	Incomplete values	en_US
dc.subject	Imputation	en_US
dc.subject	K-Nearest neighbor	en_US
dc.subject	Missing data	en_US
dc.subject	Missing values	en_US
dc.title	Veri kümelerindeki eksik değerlerin yeni yaklaşımlar kullanılarak hesaplanması	en_US
dc.title.alternative	Estimating missing values in datasets using novel hybrid approaches	en_US
dc.type	Doctoral Thesis	en_US

Dosyalar

Orijinal paket

Listeleniyor 1 - 1 / 1

İsim:: İbrahim Berkan Aydilek.pdf
Boyut:: 1.41 MB
Biçim:: Adobe Portable Document Format
Açıklama:

İndir

Lisans paketi

Listeleniyor 1 - 1 / 1

İsim:: license.txt
Boyut:: 1.71 KB
Biçim:: Item-specific license agreed upon to submission
Açıklama:

İndir

Koleksiyon

Fen Bilimleri Enstitüsü Tez Koleksiyonu