Çağrı merkezleri için derin öğrenme tabanlı interaktif konuşma tanıma
Yükleniyor...
Tarih
2020
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Selçuk Üniversitesi Fen Bilimleri Enstitüsü
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Birçok ticari işletme müşterilerden gelen aramalarda çağrı merkezi sistemi kullanmaktadır. Bu merkezlere çoğunlukla santral görevlileri gelen çağrılara cevap vermekte ve müşterileri ilgili kişilere yönlendirmektedir. Aşırı yoğun çağrı trafiğinden dolayı müşteriler çok uzun süre bekletilmektedir. Bunun bir çözümü olarak santral görevlileri sayısının artırılması ihtiyacı doğmaktadır. Bu durum hem maliyetleri yükseltmekte hem de tam ve kesin bir çözüm olamamaktadır. Bu çalışmada Türkçe konuşma tanıma kullanılarak kişilerden gelen telefon çağrılarını otomatik olarak yönlendiren interaktif bir sistem tasarlanmış ve performans değerlendirmesi yapılmıştır. Çalışmanın ilk aşamasında ses tanıma problemlerinde özellik çıkarımı için literatürde sıkça kullanılan Mel-Frekansı Kepstral Katsayıları (MFKK) ve sesin sınıflandırılmasında kullanılan Saklı Markov Modeli (SMM) denenmiştir. Bu yaklaşımda gürültüsüz ortamda elde edilen ses dosyalarına MFKK ve ardından SMM uygulanarak sonuçlar kaydedilmiş ancak başarı oranı tatmin edici bulunmamıştır. Ardından derin öğrenme tabanlı bir yaklaşım ile Python programlama dili kullanılarak gürültülü ve gürültüsüz ortamlarda gelen çağrılarda girilen konuşmalar analiz edilmiştir. Geliştirilen yazılımın test aşamasında üniversite santral sistemi baz alınarak 10 bölüm ve 100 kişiden oluşan bir rehber veritabanı oluşturulmuştur. Yaş, cinsiyet, bölüm, süre ve ortam (gürültülü/gürültüsüz) parametreleri açısından tezde geliştirilen interaktif Türkçe konuşma tanıma sistemi değerlendirilmiştir.
Many commercial businesses use a call center system for incoming calls from customers. In these centers, mostly central personnel answer the incoming calls and direct the customers to the related persons. Due to excessive call traffic, customers are kept waiting for a very long time. As a solution, there is a need to increase the number of center personnels. This increases both costs and cannot be a complete and definitive solution. In this study, an interactive system that automatically directs phone calls from people using Turkish speech recognition is designed and performance evaluation is performed. In the first stage of the study, Mel-Frequency Cepstral Coefficients (MFCC) and Hidden Markov Model (HMM), which are used in the classification of sound, were used for feature extraction in voice recognition problems. In this approach, the results were recorded by applying MFCC and then HMM to the sound files obtained in a noiseless environment, but the success rate was not satisfactory. In this context, a deep learning based approach was used to analyze the conversations entered in incoming calls in noisy and noiseless environments by using Python programming language. During the test phase of the developed software, a database consisting of 10 departments and 100 people was created based on the university system. The interactive Turkish speech recognition system developed in the thesis was evaluated in terms of age, gender, department, duration and environment (noisy / noiseless) parameters.
Many commercial businesses use a call center system for incoming calls from customers. In these centers, mostly central personnel answer the incoming calls and direct the customers to the related persons. Due to excessive call traffic, customers are kept waiting for a very long time. As a solution, there is a need to increase the number of center personnels. This increases both costs and cannot be a complete and definitive solution. In this study, an interactive system that automatically directs phone calls from people using Turkish speech recognition is designed and performance evaluation is performed. In the first stage of the study, Mel-Frequency Cepstral Coefficients (MFCC) and Hidden Markov Model (HMM), which are used in the classification of sound, were used for feature extraction in voice recognition problems. In this approach, the results were recorded by applying MFCC and then HMM to the sound files obtained in a noiseless environment, but the success rate was not satisfactory. In this context, a deep learning based approach was used to analyze the conversations entered in incoming calls in noisy and noiseless environments by using Python programming language. During the test phase of the developed software, a database consisting of 10 departments and 100 people was created based on the university system. The interactive Turkish speech recognition system developed in the thesis was evaluated in terms of age, gender, department, duration and environment (noisy / noiseless) parameters.
Açıklama
Anahtar Kelimeler
Çağrı Merkezi Sistemi, Derin Öğrenme, Call Center System, Deep Learning
Kaynak
WoS Q Değeri
Scopus Q Değeri
Cilt
Sayı
Künye
Ahmed, M. J. A. (2020). Çağrı Merkezleri için Derin öğrenme Tabanlı İnteraktif Konuşma Tanıma. (Yüksek Lisans Tezi). Selçuk Üniversitesi, Fen Bilimleri Enstitüsü, Konya.