Veri madenciliği yöntemleri ve bir uygulama
Yükleniyor...
Dosyalar
Tarih
2015-08-18
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Selçuk Üniversitesi Fen Bilimleri Enstitüsü
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Büyük hacimdeki verilerden anlamlı bilgilerin elde edilmesi karmaşık bir süreç içerisinde gerçekleşmektedir. Bu sürecin en önemli adımı ise veri madenciliğidir. Veri madenciliği, büyük hacimli veri yığınları içerisinden karar alabilmek için anlamlı bilgilerin çıkarılmasıdır. Veri madenciliğinde verileri ortak özelliklerine göre gruplamak için kümeleme analizi kullanılır. Kümeleme analizi, veri tabanındaki veriler aracılığıyla kümeler oluşturarak, benzer özelliklere sahip nesnelerin bir araya gelmesini sağlayan bir veri madenciliği tekniğidir. Çalışmada Türkiye İstatistik Kurumundan sağlanan 2012 gelir ve yaşam koşulları veri seti kullanılarak kohonen ve k-ortalamalar yöntemleri ile kümeleme tekniği kullanılmıştır. Çalışmanın sonunda ise kohonen ve k-ortalamalar yöntemleriyle elde edilen analiz sonuçları karşılaştırmalı olarak incelenmiştir. Kümelenen bireylerin etkilediği değişkenlerin önemliliğine bakılmıştır. Analiz aşamasında ORANGE ve SPSS 21.0 programları kullanılmıştır.
Obtaining significant information from data in largevolumes realizes in a complex process. The most important step of this process is data mining. Data mining is the extraction of significant information from large-volume data stacks to take decisions. In data mining cluster analysis is used in order to group data according to their common features. Cluster analysis is a data mining technique that ensures that objects with similar characteristics to get together by forming clusters via data in the database. In the study kohonen and k-means cluster techniques are applied by using 2012 income and life conditions data set obtained from Turkish Statistical Institute. At the end of the study, analysis results obtained by kohonen and k-means methods are examined comparatively. The significance of the variables that the clustered individuals affect are looked into. During the analysis stage ORANGE and SPSS 21.0 software are used.
Obtaining significant information from data in largevolumes realizes in a complex process. The most important step of this process is data mining. Data mining is the extraction of significant information from large-volume data stacks to take decisions. In data mining cluster analysis is used in order to group data according to their common features. Cluster analysis is a data mining technique that ensures that objects with similar characteristics to get together by forming clusters via data in the database. In the study kohonen and k-means cluster techniques are applied by using 2012 income and life conditions data set obtained from Turkish Statistical Institute. At the end of the study, analysis results obtained by kohonen and k-means methods are examined comparatively. The significance of the variables that the clustered individuals affect are looked into. During the analysis stage ORANGE and SPSS 21.0 software are used.
Açıklama
Anahtar Kelimeler
Kohonen, ORANGE, Veri madenciliği, K-ortalamalar, K-means, Data mining
Kaynak
WoS Q Değeri
Scopus Q Değeri
Cilt
Sayı
Künye
Babaoğlu, A. (2015). Veri madenciliği yöntemleri ve bir uygulama. Selçuk Üniversitesi, Yayımlanmış yüksek lisans tezi, Konya.