Kötü Amaçlı Android Yazılımların Makine Öğrenmesi Yöntemleri ile Tespiti

Yükleniyor...
Küçük Resim

Tarih

2022

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Selçuk Üniversitesi Fen Bilimleri Ensititüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

With the developing technological structure, devices that can connect to the internet have a place in many areas of our lives. In this field, smart phones, which are used by everyone directly and become indispensable for humanity, come first. Mobile phones are used effectively in many areas from banking transactions to shopping as a part of daily life for people, and an increase is observed in transactions performed through mobile applications day by day. Following this issue, malicious software developed by malicious people leads to theft of data and material damage. If a specific person is not targeted in the field of cyber security, the aim is to reach the data of as many people as possible with the developed malware and to ensure that the most devices are infected with the malware. For this reason, researches show that smart mobile phone users in the world mostly use devices with Android operating system. For this reason, the system that attackers are most interested in is Android operating systems. For this reason, a system is needed to detect the developed malicious software. For this purpose, Android feature extraction-based classification analysis was carried out in the study. The feature-based system is trained by using the features taken from the area where the features are kept on the Android application package files of the Android operating system and Naive Bayes, Support Vector Machine, AdaBoost, Random Forest and Artificial Neural Network algorithms. Python programming language was used in the study. During the training, a data set containing 117 features and a total of 5,724 files, of which 2,854 were malicious, were used. As a result of the work done with NB, SVM, AB, RO and ANN algorithms, %92.4, %90.9, %97.8, %97.9 and %98.4 results were obtained, respectively. The selected 60 active features using Information Gain were selected and as a result of the work done with NB, SVM, AB, RO and ANN algorithms, %92.3, %76.0, %97.0, %97.1 and %97.5 results were obtained, respectively. Then, 20 active features were selected using IG and as a result of the work done with NB, SVM, AB, RO and ANN algorithms, %91.7, %54.2, %95.2, %95.6 and %95.5 results were obtained, respectively. In the last stage, 13 active features were determined using the IG algorithm. The study results of the NB, SVM, AB, RO and ANN algorithms used in the study, the determined effective features and functions, and the training times and test times obtained during the study were shared. With the obtained data and methods, it is aimed to be used for the detection of Android malware.
Gelişen teknolojik yapı ile internete bağlanabilen cihazlar hayatımız birçok alanında yer edinmektedir. Bu alanda her insanın doğrudan kullanmakta olduğu ve insanlık için vazgeçilmez bir noktaya gelen akıllı telefonlar ise en başta gelmektedir. Cep telefonları insanlar için günlük hayatın bir parçası olarak bankacılık işlemlerinden alışverişe kadar birçok alanda etkin bir şekilde kullanılmakta ve her geçen gün mobil uygulamalar üzerinden gerçekleştirilen işlemlerde artış gözlemlenmektedir. Bu hususu takiben kötü niyetli kişilerce geliştirilen zararlı yazılımlar ile verilerin çalınmasına ve maddi zararlara yol açmaktadır. Siber güvenlik alanında belli bir kişi hedef alınmıyorsa amaç geliştirilen zararlı yazılım ile mümkün olan en fazla insanın verisine ulaşmak ve en fazla cihaza zararlının bulaşmasını sağlamaktır. Bu nedenle yapılan araştırmalar göstermektedir ki dünyada akıllı cep telefonu kullanıcıları büyük oranda Android işletim sistemine sahip cihazlar kullanılmaktadır. Bu nedenle saldırganların en çok ilgilendiği sistemde Android işletim sistemleridir. Bu nedenle geliştirilen zararlı yazılımların tespit edilebilmesi için bir sisteme ihtiyaç duyulmaktadır. Bu amaçla çalışmada Android özellik çıkarma tabanlı sınıflandırma analizi gerçekleştirilmiştir. Android işletim sistemine ait Android uygulama paketi dosyaları üzerinde özelliklerin tutulduğu alandan alınan özellikler ile Naive Bayes, Destek Vektör Makineleri, AdaBoost, Rastgele Orman ve Yapay Sinir Ağları algoritmaları kullanılarak özellik tabanlı sistemin eğitilmesi sağlanmıştır. Çalışmada Python programlama dili kullanılmıştır. Eğitim sırasında 2.854 adeti kötü niyetli olmak üzere toplam 5.724 adet dosya ile 117 özellik içeren bir veri seti kullanılmıştır. NB, DVM, AB, RO ve YSA algoritmaları ile yapılan çalışma sonucunda sırasıyla %92.4, %90.9, %97.8, %97.9% ve %98.4 sonuçları elde edilmiştir. Information Gain kullanılarak 60 etkin özellik seçilmiş ve NB, DVM, AB, RO ve YSA algoritmaları ile yapılan çalışma sonucunda sırasıyla %92.3, %76.0, %97.0, %97.1 ve %97.5 sonuçları elde edilmiştir. Daha sonra IG kullanılarak 20 etkin özellik seçilmiş ve NB, DVM, AB, RO ve YSA algoritmaları ile yapılan çalışma sonucunda sırasıyla %91.7, %54.2, %95.2, %95.6 ve %95.5 sonuçları elde edilmiştir. Son aşamada ise 13 etkin özellik IG algoritması kullanılarak tespit edilmiştir. Çalışmada kullanılan NB, DVM, AB, RO ve YSA algoritmalarına ilişkin çalışma sonuçları, belirlenen etkin özellikler ve işlevleri ile çalışma sırasında elde edilen eğitim süreleri ve test süreleri paylaşılmıştır. Elde edilen veriler ve yöntemler ile Android zararlı yazılımların tespiti için kullanılabilmesi amaçlanmıştır.

Açıklama

Anahtar Kelimeler

Android zararlı analizi, Makine öğrenmesi, sınıflandırma algoritmaları, zararlı yazılım, Android malware analysis, machine learning, classification algorithms, malware

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Yılmaz, A. B., (2022). Kötü Amaçlı Android Yazılımların Makine Öğrenmesi Yöntemleri ile Tespiti. (Yüksek Lisans Tezi). Selçuk Üniversitesi, Fen Bilimleri Enstitüsü, Konya.