Dengesiz Bal Peteği Veri Setinde Sınıflandırma Performansının Analizi

dc.authorid0000-0001-8610-6305en_US
dc.contributor.advisorŞahman, Mehmet Akif
dc.contributor.authorÖzgün, Serkan
dc.date.accessioned2023-09-10T11:17:06Z
dc.date.available2023-09-10T11:17:06Z
dc.date.issued2022en_US
dc.date.submitted2022
dc.departmentSelçuk Üniversitesien_US
dc.description.abstractArıcılık faaliyetleri Türkiye ve Dünya için önemli bir tarımsal faaliyettir. Arıcılık, Türkiye’ deki kırsal kesimlerin kalkınmasına katkısı nedeniyle sosyo-ekonomik anlamda önem arz etmektedir. Ayrıca arıcılık faaliyetleri sonucunda üretilen ürünler insanlar için önemli besin kaynaklarıdır. Bu nedenle arıcılık faaliyetlerinde doğru yöntemlerin kullanılması arıcılık faaliyetlerinin sürdürülebilirliği için önemlidir. Üreticiler tarafından bilinçsiz ve gerekli teknikler kullanılmadan gerçekleştirilen arıcılık faaliyetleri, elde edilecek ürünlerin kalitesini ve verimini negatif yönde etkilemektedir. Bal, arıcılık faaliyetleri sonucunda elde edilen en önemli çıktılardan birisidir. Bal üretim sürecinde birçok aşama yer almaktadır. Bu aşamalardan biri de bal hasadı aşamasıdır. Bal hasadı aşamasında doğru yöntem ve tekniklerden faydalanılması üretilen bal miktarını ve kalitesini arttırmaktadır. Ayrıca bilinçli arıcılık faaliyetleri yersiz yavru arı kayıplarından kaçınılarak, arı kolonisi varlığının korunmasında da etkilidir. Bu tez çalışmasında, bal hasadındaki yavru arı kayıplarını azaltmak için bal peteği üzerinde ‘kapalı larva hücrelerinin’ tespiti bir sınıflandırma problemi olarak ele alınmıştır. Çalışmada 38 adet bal peteği görüntüsünden faydalanılarak veriseti oluşturulmuştur. Verisetinde kapalı larva hücreleri ve diğerleri olmak üzere iki sınıf için etiketle yapılmıştır. Veri setindeki etiketlenmiş iki sınıfa ait veri oranının yaklaşık 1/5 olduğu görülmüştür. Sınıflar arasındaki dengesizliğin giderilerek sınıflandırma başarısını arttırmak istenmiştir. Bunun için literatürde iyi bilinen ve güncel beş farklı veri düzeyinde aşırı örnekleme (SMOTE, Borderline-SMOTE1, Borderline SMOTE2, Safe-Level-SMOTE ve DEBOHID) yaklaşımdan faydalanılmıştır. Dengelenmiş veriler üzerindeki sınıflandırma başarısını göstermek için üç farklı sınıflandırıcıdan (K- En Yakın Komşu (kNN), Karar Ağacı(KA) ve Destek Vektör Makineleri (DVM)) faydalanmıştır. Sınıflandırma sonuçları F1-Skor, G-Ortalama ve AUC metrikleri ile değerlendirilmiştir. Sınıflandırma işlemleri sonucunda sentetik veri üretme yöntemleri ile dengeli hale getirilen veri setlerinde sınıflandırma başarısının arttığı görülmüştür.en_US
dc.description.abstractBeekeeping activities are an important agricultural activity for Turkey and the World. Beekeeping is important in socio-economic terms due to its contribution to the development of rural areas in Turkey. In addition, the products produced as a result of beekeeping activities are important food sources for humans. For this reason, using the right methods in beekeeping activities is important for the sustainability of beekeeping activities. Beekeeping activities carried out by the producers unconsciously and without using the necessary techniques negatively affect the quality and yield of the products to be obtained. Honey is one of the most important outputs obtained as a result of beekeeping activities. There are many stages in the honey production process. One of these stages is the honey harvest stage. Utilizing the right methods and techniques during honey harvesting increases the amount and quality of honey produced. In addition, conscious beekeeping activities are also effective in preserving the existence of the bee colony by avoiding unnecessary baby bee losses. In this thesis, the detection of 'closed larval cells' on the honeycomb is considered as a classification problem in order to reduce the loss of baby bees in honey harvest. In the study, a dataset was created by using 38 honeycomb images. The dataset was constructed with labels for two classes, closed larval cells and others. It was seen that the data ratio of the two labeled classes in the data set was 1/5. It was aimed to increase the classification success by eliminating the imbalance between the classes. For this, five different data-level oversampling approaches (SMOTE, Borderline-SMOTE1, Borderline-SMOTE2, Safe-Level-SMOTE and DEBOHID) that are well-known and current in the literature were used. Three different classifiers (K-Nearest Neighbor (kNN), Decision Tree and Support Vector Machines (DVM)) were used to show the classification success on balanced data. Classification results were evaluated with F1-Score, G-Mean and AUC metrics. As a result of the classification processes, it was observed that the classification success increased in the data sets that were balanced with synthetic data generation methods.en_US
dc.identifier.citationÖzgün, S., (2022). Dengesiz Bal Peteği Veri Setinde Sınıflandırma Performansının Analizi. (Yüksek Lisans Tezi). Selçuk Üniversitesi, Fen Bilimleri Enstitüsü, Konya.en_US
dc.identifier.urihttps://hdl.handle.net/20.500.12395/50714
dc.language.isotren_US
dc.publisherFen Bilimleri Enstitüsüen_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.selcuk20240510_oaigen_US
dc.subjectBal peteği sınıflandırmaen_US
dc.subjectsentetik veri üretimien_US
dc.subjectkapalı larva tespitien_US
dc.subjectsınıflandırmaen_US
dc.subjectHoneycomb classificationen_US
dc.subjectsynthetic data productionen_US
dc.subjectclosed larva detectionen_US
dc.titleDengesiz Bal Peteği Veri Setinde Sınıflandırma Performansının Analizien_US
dc.title.alternativeAnalysis of Classification Performance on Imbalanced Honeycomb Dataseten_US
dc.typeMaster Thesisen_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
Serkan Özgün.pdf
Boyut:
2.01 MB
Biçim:
Adobe Portable Document Format
Açıklama:
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.44 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: