Abstract:
Teknoloji geliştiği sürece bununla birlikte siber saldırılar ve kullanılan yazılımlar
da gelişmektedir. Teknoloji firmaları ne kadar kendilerini geliştirse de bununla birlikte
kötü niyetli kişiler de geliştirilen her sistemde kendi saldırı yöntemlerini geliştirmekte,
günlük hayatta kullandığımız teknolojik cihazlardan gerekli/istedikleri bilgilere ulaşmak
için çalışmalar yapmaktadır. Bu sebeple koruma düzeyi doğru şekilde ve iyi olmayan tüm
cihazlar hem donanımsal hem de yazılımsal olarak saldırılara açık ortam yaratmaktadırlar.
Günümüzde hayatımıza kolaylık sağlayan teknolojik uygulamaları, internet bağlantısı
olmadan kullanabilmek ise neredeyse imkansız hale gelmiştir. Kullanmış olduğumuz
bu uygulamalar veya kullanmak zorunda olduğumuz web sitelerinin bazıları, içlerinde
kötü amaçlı yazılım (bilgi çalma, şifre öğrenme vb.) barındırabilmektedir. Bunun
önüne geçebilmek için ise cihazlarımızda kullanmış olduğumuz antivirüs programları
veya Firewall (Güvenlik Duvarı) yazılım/sistemleri, güvenlik için çok yüksek
derecede önem arz etmektedir.
Bu çalışmada İstanbul’da Uluslararası öğrencilerin de eğitim aldığı bir vakıf
üniversitesinin Firewall cihazının log dosyasından elde edilen 1000000 satır verinin
bulunduğu veri setinden makine ve derin öğrenme algoritmaları (Desicion Tree, KNN,
SVM, NN ve RNN) kullanılarak sınıflandırma çalışmaları yapılmıştır. Kullanılan veri
seti içerisindeki tüm kişisel ve önem arz edecek bilgiler kaldırılmıştır. Geriye kalan
veriler ise hedef port, NAT Port, işlem, gönderilen ve alınan byte bilgileri, paketleme
için harcanan süre ve PKTS bilgilerini içermektedir. Çalışmanın sonuçlarında tüm
algoritmalar arasında en başarılı sonuç Desicion Tree %99.95 ve K-Nearest Neighbors
%99.41 olarak saptanmıştır. Tüm algoritmaların sonuçları ve öğrenme oranları,
tablolar halinde ve grafiksel olarak gösterilmiştir.