Bilgisayar tabanlı metin işlemede en uzun eşleşme algoritmasının karşılaştırmalı analizi

Yükleniyor...
Küçük Resim

Tarih

2010-12-13

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Selçuk Üniversitesi Fen Bilimleri Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Günümüzde teknolojinin gelişmesi ile birlikte her geçen gün büyük miktarlarda veriler ortaya çıkmaya ve depolanmaya başlanmıştır. Bu verilerden faydalanmanın yolu ise onların verimli bir şekilde organize edilmesi ve yararlı bilgilere dönüştürülmesinden geçmektedir. Bunu amaçlayan veri madenciliğinin bir çeşidi ise metinsel veriler üzerinde çalışan metin madenciliğidir. Metinsel verilerin incelenmesi ve bu verilerin amaca uygun olarak hızlı bir şekilde kullanılması da bilgi erişim sistemleri için yeni bir problem teşkil etmiştir. Elektronik ortamlarda saklanan metinsel verilerin çoğunun doğal dille yazılmış olmaları da metin madenciliğinde doğal dil işlemenin önemini ortaya koymuş ve metin işleme çalışmalarında metnin yazıldığı dilin yapısının da bilinmesi ihtiyacını doğurmuştur. Türkçe'de köke yapım eki getirilerek oluşturulan yeni kelimeye gövde, bir kelimeye eklenmiş olan çekim eklerinin çıkarılması ile kelimenin gövdesinin bulunması işlemine ise ?Gövdeleme? denilmektedir. Anlam olarak hemen hemen aynı ifadeye sahip sözcükler, çekim eki aldıklarında yazılışları tamamen değişmektedir. Bu durumda bu sözcüklerin gövdelerinin bulunması gerekmektedir. Türkçe'nin sondan eklemeli bir dil olduğu göz önünde bulundurulduğunda, verimli bir gövdeleme işleminin metin işlemenin başarısını büyük ölçüde etkileyeceği söylenebilir. Yapılan bu tez çalışmasında ise, bilgi erişim sistemlerinde yer alan metin işleme süreçlerinden en önemlilerinden biri olan ön işleme süreci ve yine bu sürecin önemli bir parçası olan gövdeleme üzerinde durulmuştur. Tez kapsamında gerçekleştirilen gövdemele yazılımı ile farklı gövdeleme algoritmalarının bilgi erişimindeki performansları karşılaştırmalı olarak analiz edilmiştir.
Nowadays, large amount of data has started to arise and stored by development of technology. The way of benefitting these data are to organize them efficiently and convert them to useful information. A kind of data mining that aims this is text minig which works over textual data. Analysis of the textual data and use of this data quickly, according to the purpose has created a new problem for information retrieval systems. Most of the textual data stored in electronic media also be written in natural language the importance of natural language processing has revealed in text mining, and knowledge of structure of the text is written in language need, has revealed. Turkish affixes to the root of the new words are created by bringing the body, the body of the words finding process by a word that is attached to the removal of the suffixes stemming called. Have almost the same phrase as meaning words, when they have completely changed the spelling of suffixes. In this case, those words must have their body. Turkish is a language to add from the last consideration when, efficient stemming process would affect a large extent the success of text processing can be said. Contained on information retrieval systems, preprocessing process, Which one of the most important of text processing and an important part of this process was focused on the stemming in thesis. The performance in information retrieval of different stemming algorithms, comparatively analyzed by stemming software in thesis.

Açıklama

Anahtar Kelimeler

Bilgisayar tabanlı metin işleme, Computer based text processing, Eşleşme algoritması, Match algorithm

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Balcı, M. (2010). Bilgisayar tabanlı metin işlemede en uzun eşleşme algoritmasının karşılaştırmalı analizi. Selçuk Üniversitesi, Yayımlanmış yüksek lisans tezi, Konya.