Yapar sinir ağını kullanarak kişiye özel komut tanıma

Yükleniyor...
Küçük Resim

Tarih

2008

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Selçuk Üniversitesi Fen Bilimleri Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Kaydedilmiş olan bir ses, herhangi bir olayın ortaya çıkarılıp aydınlatılmasında mevcut tek delil olabilir. Böylece şüpheli yada şüpheliler ortaya çıkarılarak işlenen suçun faillerinin bulunmasında kolaylık sağlayabilir. Günümüzde bu tekniğin uygulanmasıyla terör eylemleri, cinayetler, kaçırma, tehdit, şantaj, tecavüz, organize suçlar ve telefonla rahatsız etme olayları aydınlatılabilmektedir. Ses tanıma ve tanımlama işlemi, bütün işitsel veya görsel duyuların kullanıldığı çok yönlü bir işlemdir. Bu işlem, bilinmeyen bir sesin bir veya daha fazla bilinen sesle tanınması veya elenmesi amacıyla işitsel veya görsel olarak karşılaştırılması şeklinde tanımlanabilir. Seslerin, kendi başına sahip olduğu karakteristikler ve özellikler yardımıyla çeşitli analiz teknikleri ve yöntemleri uygulanarak diğer seslerden ayırt edilmesi bu tanıma temel teşkil eder. Bu çalışmada Yapay Sinir Ağları'nın Çok Katlı Perseptron ağ yapısı kullanılarak, ses tanıma problemine uygulanmıştır. Elde edilen sonuçların hata analizi yapılarak, kullanılan öğrenme algoritmalarının bu problem için uygulanabilirliliği ve herhangi bir sistem kontrolünün yapılabilirliliği hedeflenmiştir. LPC tekniği ile elde edilen ses genlik verileri Yapay Sinir Ağları Modelinin giriş katmanının oluşturmuştur. Çıkış katmanı ise her komut kelimeyi temsil eden ve karşılık gelen 1 ve 0'lardan meydana getirilmiştir. Yapay Sinir Ağları Modeli ile eğitme işlemleri, hedeflenen 1 ve 0 çıkış verileri için en iyi değer elde edilinceye kadar denenmiş ve ağ yapısı belirlenmiştir. Elde edilen sonuçların hata hesapları yapılmış ve herhangi bir sistemin kontrolünü sağlamaya yönelik değerlendirmeler yapılmıştır. Ayrıca hata hesabı kullanılmadan sadece komutlar ayrı ayrı Yapay Sinir Ağı modelinde eğitilerek konuşmacıların tanınabilmesi sağlanmıştır.
A voice recorded into a cassette might be the only evidence to reveal a event. In this way, the suspect or the suspects are found and it can be easier to find the ones who commit crimes. In today?s world actions such as terror, murders, hijacking, threat, blackmail, rape, organized crimes and disturbing on the phone can be revealed. Voice defining is a many sided process in which all auditory and visual senses are used. This process can be defined as auditory and visual comparison to define an unidentified voice by means of a more identified voice. In essence, by means of the characteristics of the voices, they are distringuished from others by using various analysis techniques and methods which forms a basis to this definition. In this study, ANN?s Multi Layer Perceptron topology has been applied to voice recognition problem. By accomplishing the error analyse of the results, the applicibility of used trainin algotithms and feasibility to any system control are intended. The voice amplitude data optained by the LPC technique have formed the entrance layer of the Artificial Neural Networks. Whereas; exit layer has been formed by 1's and 0's that represents every command word. The process of training via Artificial Neural Networks has been continued until the best data was optained out of 1's and 0's and finally the network formation was specified. The error calculations of the results were done and evaluations on providing any system control were also done. Besides, without using error calculation, only by training the commands in Artificial Neural Network model, the recognition of the speakers has been provided.

Açıklama

Anahtar Kelimeler

Ses kodlama, Voice coding, Ses tanıma sistemleri, Voice recognition systems, Yapay sinir ağları, Artificial neural networks

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Tatar, G. (2008). Yapar sinir ağını kullanarak kişiye özel komut tanıma. Selçuk Üniversitesi, Yayımlanmış yüksek lisans tezi, Konya.