İş İlanlarında Doğal Dil İşleme ile Duygu Analizi

dc.authorid0000-0001-7903-0787en_US
dc.contributor.advisorKöklü, Murat
dc.contributor.authorSarıgil, Şeyma
dc.date.accessioned2023-11-10T11:21:44Z
dc.date.available2023-11-10T11:21:44Z
dc.date.issued2023en_US
dc.date.submitted2023
dc.departmentSelçuk Üniversitesien_US
dc.description.abstractNatural Language Processing (NLP) is a field of artificial intelligence that aims to understand, model, and interpret human language inputs using machine-learning techniques. NLP is an essential area of artificial intelligence that requires collaboration with linguistics, lexicography, psychology, and cognitive sciences owing to the structural diversity of languages. NLP serves many purposes such as chatbots, summarization, translation, text classification, and sentiment analysis. The aim of this thesis is to use the sentiment analysis method of NLP science to automatically check the content of job advertisements on the job search and recruitment platform isinolsun.com to enable processes to be carried out more quickly and effectively in systems that combine workers and employers. Simultaneously, it aims to increase trust in platforms by reducing the workforce. For this purpose, Turkish job advertisement models were created using different machine-learning approaches, and each model approach was compared comparatively. Machine learning methods include TFIDF tokenization with character-based and word-based methods, logistic regression, support vector machines, multi-nominal naive Bayes, and random forest. Accordingly, the word-based TFIDF tokenization methods produced better models than the character-based methods. The machine learning model with the highest F1-Score value (0.66) was found to Support Vector Machines using the TFIDF Word-based tokenization. In addition to this result, a hyperparameter study was conducted using the transformation-based machine learning methods with BERT, and in experiments conducted with batch size values of 8, 16, 32 and training rates of 1e-5, 2e-5, 3e-5, 4e-5, and 5e-5, the highest F1-Score value (96.25) was found to be the hyperparameters of the BERT-based model with maximum length 100, batch size 16, and training rate 3e-5.en_US
dc.description.abstractDoğal Dil İşleme (DDİ), insan dili girdilerini yapay zekâ ve makine öğrenmesi teknikleri kullanarak anlamayı, modellemeyi ve yorumlamayı amaçlayan bir bilim dalıdır. DDİ, dilbilim, sözlük bilimi, psikoloji ve bilişsel bilimler ile uyum halinde çalışılması gereken bir yapay zekâ alanı olmasından ve dillerin yapısal çeşitliliğinden dolayı gelişimi önem arz etmektedir. DDİ, sohbet robotu, özetleme, çeviri, metin sınıflandırması, duruş ve duygu analizi gibi pek çok farklı amaca hizmet etmektedir. Bu tez çalışmasında iş arama ve bulma platformu isinolsun.com sitesindeki 15.451 ilan üzerinden otomatik ilan içeriklerinin kontrolü için DDİ biliminin duygu analizi yöntemi kullanarak işçi ile işvereni bir araya getiren sistemlerde süreçlerin daha hızlı ve efektif ilerletilebilmesi amaçlanmıştır. Aynı zamanda iş gücünü azaltarak platformlara olan güvenin artmasını sağlamaktır. Bu amaçla farklı makine öğrenmesi yaklaşımları ile Türkçe iş ilanı modelleri oluşturulmuş ve her bir model yaklaşımı karşılaştırmalı olarak incelenmiştir. Model yaklaşımlarından TFIDF tokenleştirmenin karakter tabanlı ve kelime tabanlı yöntemleri ile Lojistik Regresyon, Destek Vektör Makineleri, Multi Nominal Navie Bayes ve Rastgele Orman makine öğrenmesi yöntemleri denenmiştir. Buna göre TFIDF tokenleştirmenin kelime tabanlı yöntemleri karakter tabanlı yöntemlere göre daha iyi modeller üretmiştir. F1- Skor değeri en yüksek (0,66) makine öğrenmesi modeli TFIDF Kelime tabanlı tokenleştirme ile kullanılan destek vektör makineleri olarak bulunmuştur. Bu sonucun yanı sıra Dönüşüm tabanlı makine öğrenmesi yöntemlerinden BERT kullanılarak yapılan hiper parametre araştırmasında 8, 16, 32’li yığın boyutu değerleri ile eğitim hızı 1e-5, 2e-5, 3e-5, 4e-5 ve 5e-5 değerlerinin kombinasyonu ile yapılan denemelerde F1- Skor değeri en yüksek (96,25) BERT tabanlı modelin hiper parametreleri maksimum uzunluk 100, yığın boyutu 16, eğitim hızı 3e-5 olarak bulunmuştur.en_US
dc.identifier.citationSarıgil, Ş., (2023). İş İlanlarında Doğal Dil İşleme ile Duygu Analizi. (Yüksek Lisans Tezi). Selçuk Üniversitesi, Fen Bilimleri Enstitüsü, Konya.en_US
dc.identifier.urihttps://hdl.handle.net/20.500.12395/51091
dc.language.isotren_US
dc.publisherSelçuk Üniversitesi Fen Bilimleri Ensititüsüen_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.selcuk20240510_oaigen_US
dc.subjectDerin öğrenme algoritmalarıen_US
dc.subjectdoğal dil işlemeen_US
dc.subjectiş ilanıen_US
dc.subjectmakine öğrenmesien_US
dc.subjectDeep learning algorithmsen_US
dc.subjectjob postingen_US
dc.subjectmachine learningen_US
dc.subjectnatural language processingen_US
dc.titleİş İlanlarında Doğal Dil İşleme ile Duygu Analizien_US
dc.title.alternativeSentiment Analysis with Natural Language Processing in Job Postingsen_US
dc.typeMaster Thesisen_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
Şeyma Sarıgil.pdf
Boyut:
1.86 MB
Biçim:
Adobe Portable Document Format
Açıklama:
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.44 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: