Gürültü giderici oto-kodlayıcı kullanarak eksik değerlerin tamamlanması

dc.contributor.advisorKaya, Ersin
dc.contributor.authorAsghar, Maha Hussein
dc.date.accessioned2025-01-21T12:20:26Z
dc.date.available2025-01-21T12:20:26Z
dc.date.issued2020
dc.departmentEnstitüler, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı
dc.description.abstractEksik değerlerin varlığı, veri analizinde yaygın bir sorundur. Veri kaybı, eksiksiz veri gerektiren aşağı akış analizini engelleyebilmektedir. Bu eksiklik, ya verilere eksik durumları silen ya da sonradan işleme için veri atanan tamamlanmış verileri oluşturan aşağı akış veri ürünlerinin performansında bir düşüşe neden olmaktadır. Bu nedenle, verileri tam olarak kullanmak ve doğru kullanmak için kaybolan verilerin uygun şekilde işlenmesi zorunludur. Modern veri atama teknikleri genellikle iyi performanslar sağlar, ancak özellikle büyük veri kümeleri için hesaplama açısından pahalıdır. Bu çalışmada, Gürültü Giderici Oto- Kodlayıcı (GGOK) kullanarak eksik verileri atama amacıyla bir derin öğrenme çerçevesi araştırılmaktadır. Ardından, on veri setinde önerilen GGOK performansı karşılaştırılmaktadır, örn. Breast Cancer Wisconsin Diagnostic (BCWD), Discrim, Fisher İris, Reaction, Stockreturns, Titanic, Human Activity Definition using smartphones1, İonosphere, Automobile ve Ovarian Cancers (OVCA) eksik veri oranında % 5,% 15,% 20 ve % 25 ile, dört geleneksel yönteminin yanı sıra altı modern makine öğrenme yöntemiyle, örneğin Destek Vektör Makinesi, Güçlü regresyon, Ridge regresyonu, K-En Yakın Komşu, Yapay Sinir Ağı ve Olasılıksal Sinir Ağıdır. Önerilen GGOK veri atama, göreceli doğruluk açısından diğer yöntemlere kıyasla çok daha iyi sonuçlar göstermektedir.
dc.description.abstractThe presence of missing values is a common problem in data analysis. Data loss can hinder downstream analysis that requires complete data. This missingness results in data, a decrease in the performance of downstream data products that either delete incomplete cases or create imputed completed data for post-processing. It is therefore imperative that the lost data be treated appropriately in order to fully utilize and use the data properly. Modern imputation techniques usually achieve good performances, but are computationally expensive especially for large datasets. In this work, we investigate a deep learning framework for the purpose of imputation missing data by using Denoising AutoEncoder (DAE). Then, we compare the proposed DAE performance on ten datasets e.g., Breast Cancer Wisconsin Diagnostic (BCWD), Discrim, Fisher İris, Reaction, Stockreturns, Titanic, Human activity recognition using smartphones1, İonosphere, Automobile and Ovarian Cancers (OVCA) with data missingness at a rate 5%, 15%, 20% and 25%, by using four traditional methods as well as to six modern machine learning methods used in the literature, e.g., support vector machine, robust regression, ridge regression, k-nearest neighbor, artifitial neural network and probabilistic neural network. The proposed DAE based imputation shows much better results compared than other methods in terms of relative accuracy.
dc.identifier.citationAsghar, M. H. (2020). Gürültü giderici oto-kodlayıcı kullanarak eksik değerlerin tamamlanması. (Yüksek Lisans Tezi). Selçuk Üniversitesi, Fen Bilimleri Enstitüsü, Konya
dc.identifier.urihttps://hdl.handle.net/20.500.12395/53901
dc.identifier.yoktezid650042
dc.institutionauthorAsghar, Maha Hussein
dc.language.isotr
dc.publisherSelçuk Üniversitesi, Fen Bilimleri Enstitüsü
dc.relation.publicationcategoryTez
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectEksik Veri
dc.subjectVeri Atama
dc.subjectDerin Öğrenme
dc.subjectGürültü Giderici Oto-Kodlayıcı
dc.subjectSınıflandırma
dc.subjectMissing Values
dc.subjectImputation
dc.subjectDeep Learning
dc.subjectDenoising Autoencoder
dc.subjectClassification
dc.titleGürültü giderici oto-kodlayıcı kullanarak eksik değerlerin tamamlanması
dc.title.alternativeCompleting the missing values using a denoising autoencoder
dc.typeMaster Thesis

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
650042.pdf
Boyut:
3.88 MB
Biçim:
Adobe Portable Document Format
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.17 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: