Veri madenciliği yöntemleri ve bir uygulama

Yükleniyor...
Küçük Resim

Tarih

2015-08-18

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Selçuk Üniversitesi Fen Bilimleri Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Büyük hacimdeki verilerden anlamlı bilgilerin elde edilmesi karmaşık bir süreç içerisinde gerçekleşmektedir. Bu sürecin en önemli adımı ise veri madenciliğidir. Veri madenciliği, büyük hacimli veri yığınları içerisinden karar alabilmek için anlamlı bilgilerin çıkarılmasıdır. Veri madenciliğinde verileri ortak özelliklerine göre gruplamak için kümeleme analizi kullanılır. Kümeleme analizi, veri tabanındaki veriler aracılığıyla kümeler oluşturarak, benzer özelliklere sahip nesnelerin bir araya gelmesini sağlayan bir veri madenciliği tekniğidir. Çalışmada Türkiye İstatistik Kurumundan sağlanan 2012 gelir ve yaşam koşulları veri seti kullanılarak kohonen ve k-ortalamalar yöntemleri ile kümeleme tekniği kullanılmıştır. Çalışmanın sonunda ise kohonen ve k-ortalamalar yöntemleriyle elde edilen analiz sonuçları karşılaştırmalı olarak incelenmiştir. Kümelenen bireylerin etkilediği değişkenlerin önemliliğine bakılmıştır. Analiz aşamasında ORANGE ve SPSS 21.0 programları kullanılmıştır.
Obtaining significant information from data in largevolumes realizes in a complex process. The most important step of this process is data mining. Data mining is the extraction of significant information from large-volume data stacks to take decisions. In data mining cluster analysis is used in order to group data according to their common features. Cluster analysis is a data mining technique that ensures that objects with similar characteristics to get together by forming clusters via data in the database. In the study kohonen and k-means cluster techniques are applied by using 2012 income and life conditions data set obtained from Turkish Statistical Institute. At the end of the study, analysis results obtained by kohonen and k-means methods are examined comparatively. The significance of the variables that the clustered individuals affect are looked into. During the analysis stage ORANGE and SPSS 21.0 software are used.

Açıklama

Anahtar Kelimeler

Kohonen, ORANGE, Veri madenciliği, K-ortalamalar, K-means, Data mining

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Babaoğlu, A. (2015). Veri madenciliği yöntemleri ve bir uygulama. Selçuk Üniversitesi, Yayımlanmış yüksek lisans tezi, Konya.