Türkçe metinlerin statik Huffman algoritması kullanılarak sıkıştırılmasında sıkıştırılma oranı optimizasyonu
Dosyalar
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Bu tezde, Statik Huffman Algoritması, sıkıştırma oranı optimizasyonu sağlayacak şekilde Türkçe metinleri sıkıştırmak üzere kullanılmıştır. Çalışmalarda farklı alanlarda yazılmış 38 adet Türkçe metin kullanılmıştır. Öncelikle, Türkçe karakterleri ve diğer tüm ASCII karakterleri içeren, farklı karakter kombinezonlarına sahip 1, 2, 3, 4 ve 5 karakterli kelimelerin seçilen Türkçe metinler içindeki tekrarlama frekansları elde edilmiştir. Elde edilen karakter kombinezonları sıkıştırma oram optimizasyonu sağlamak üzere Huffman ağacına yerleştirilmiş ve 15 farklı Huffman seviyesi oluşturulmuştur. Seçilen örnek metinlerin, her bir seviyedeki sıkıştırma kazancı hesaplanmış ve seviyelere ait kazanç değerleri karşılaştırılarak yorumlanmıştır.
In this thesis, data compression optimization for Turkish text files is studied by using Static Huffman Algorithm. First of all, for all possible monogram, digram, trigram, tetragram and pentagram character sets (including Turkish characters and all other ASCII caharacters) and their recurrence frequencies are obtained by using 38 sample texts written on various subjects. First 2500 character sets with highest frequencies put in Huffman tree and fifteen different levels are composed for compression. Compression gains for each level are obtained by using selected Turkish texts. Obtained compression rate results are compared and interpreted.