Derin öğrenme temelli yeni nesil güvenlik duvarının tasarlanması
Özet
İnternet kullanımının yaygınlaşması ile insan hayatında kalıcı değişimler
meydana gelmiştir. Bu değişimler hem iyi hem kötü anlamda değerlendirilebilir. Web
üzerindeki sınırsız bilgi akışında faydalı içeriklerin yanı sıra, zararlı içeriklere de
isteyerek veya istemeyerek maruz kalınabilmektedir. Özellikle çocuk ve gençlerin
üzerinde zararlı içeriklerin, telafisi zor hasarlara yol açtığı bilinmektedir. İçerik yönünden
zararsız kabul edilebilecek web sayfalarının içeriğinde bile, reklam veya kişisel gönderi
olarak zararlı içeriğe rastlanabilmektedir. Bu ödev, oyun ve sosyal medya sayfalarında
sıkça görülebilen bir durumdur. Bu tür web sayfalarını tümden engellemek ise farklı
sorunlara yol açabilmektedir. Ayrıca geleneksel yöntemler ile web sayfalarının içeriğinin
düzenli olarak takip edilmesi ve değerlendirilmesi mümkün değildir.
Çalışmanın amacı, web sitelerinin bütünüyle engellenmesinden ziyade, gelen
trafik üzerindeki içeriğin tespit edilip, içeriğin zararlı veya zararsız olarak
sınıflandırılarak, sadece o içerik üzerinde engelleme yapılmasını sağlayacak bir yeni nesil
güvenlik duvarı filtreleme algoritması geliştirmektir. Web sayfalarında görsellerin
yoğunluğu ve etkisi daha fazla olduğundan, çalışma kapsamında değerlendirilen içerik
sadece görseller olarak ele alınmıştır. Görsel içeriğinin yorumlanmasında, günümüzde en
güçlü yöntem olan derin öğrenme yöntemi kullanılmıştır.
Zararlı içerik olarak değerlendirilen görseller sadece alkollü içecekler ile
sınırlandırılmıştır. Lmdb veri tabanı ile toplamda 4,6 milyon görselden oluşan bir veri seti
ile CAFFE ortamında GoogLeNet ağı kullanılarak eğitim gerçekleştirilmiştir. Eniyileyici
yöntemi olarak Adam algoritması kullanılmıştır. Eğitim sonucunda %97,6469 doğruluk
değerine ulaşılmıştır. Karışıklık matrisi hesaplamalarında F1 skoru %87,75526188 olarak
hesaplanmıştır.
Güvenlik duvarı mitmproxy vekil sunucusu ile uygulanmış ve web sayfalarında
görsellerin başarıyla filtrelenmesi sağlanmıştır. Permanent changes have occurred in human life with the widespread use of the
Internet. These changes may both be considered as good and bad. Along with useful
contents within this unlimited flow of information through the web, people may also be
willingly or unwillingly exposed to harmful contents. It is well known that these harmful
contents cause irrecoverable damages particularly on the young and the children. Harmful
contents can even be seen in websites, which may content-wise be considered harmless,
in the form of advertisements or personal posts. This can be commonly seen in homework,
gaming, or social media pages. Completely blocking these websites may cause other
problems. In addition, it is impossible to regularly track and review the contents of the
websites through traditional methods.
The purpose of this study is to develop a next-generation firewall filtering
algorithm, which would detect the contents from the inbound traffic, and categorize them
as harmless or harmful, and perform a content-wise blocking process, rather than
completely blocking the websites. Since the visual images on the websites are more
intense and have higher impact, the contents reviewed within the scope of this study were
only discussed as visual images. Today’s most powerful method, deep-learning method,
was used in interpretation of the contents of the visual images.
The visual images, which were considered as harmful, were limited to alcoholic
beverages. The training was performed by using GoogLeNet network within Caffe
environment with a data set containing 4.6 million images with Lmdb database. Adam
algorithm was used as optimization method. At the end of this training, 97.6469% of
accuracy value was reached. F1 score was calculated as 87.75526188% in confusion
matrix calculations.
The firewall was implemented through mitmproxy proxy server, and the visual
images on the websites were successfully filtered.
Koleksiyonlar
- Tez Koleksiyonu [1287]