Die vorliegende Masterarbeit zielt darauf ab, aus der Perspektive der Datenwissenschaften und IT-Sicherheit eigens entwickelte randomisierte CNN-Modelle mit insgesamt 200 Modellen sowie Standardmodelle (VGGNet, AlexNet sowie LeNet 5) experimentell zu untersuchen. Außerdem soll durch einen Vergleich mit dem weltweiten State-of-the-Art eine entsprechende Optimierung und Bewertung vorgenommen werden.
Die Masterarbeit zielt im Besonderen darauf ab, die Wirksamkeit von CNN-Technologien in der Cybersicherheit auf Basis des CIC-MalMem-2022-Datensatzes profund zu untersuchen. Zusätzlich zielt sie darauf ab, die Anwendungsgebiete dieser Technologien zu erweitern und ihre Grenzen in der aktuellen und zukünftigen Sicherheitslandschaft zu erforschen.
Die Hauptforschungsleitfrage (FF1) und die drei dazugehörigen Forschungsunterleitfragen (UFF1-UFF3) sind darauf ausgerichtet, ein tiefgehendes Verständnis für die geringfügigen Abweichungen und subtilen Differenzierungen innerhalb der einzelnen CNN-Technologien zu entwickeln. Der Hauptschwerpunkt dieser Arbeit liegt aber auf der Hauptforschungsfrage FF1. Zudem sollen sie praktische Lösungen für aktuelle Sicherheitsherausforderungen aufzeigen. Diese Forschungsfragen zielen darauf ab, die Auswirkungen von Architekturmodifikationen auf die Leistungsfähigkeit von CNNs im Bereich der Malware-Erkennung umfassend zu analysieren und ihre Anwendung aus technischer sowie ethischer Perspektive zu bewerten. Die Hauptforschungsfrage FF1 lautet:
Wie kann die Architektur von Convolutional Neural Networks effektiv modifiziert werden, um komplexe Muster in hochdimensionalen tabellarischen Daten zu erkennen und zu klassifizieren, und welche Auswirkungen haben diese Anpassungen auf die Leistungsfähigkeit des CNNs bei unterschiedlichen Klassifizierungs-Aufgaben, sowohl in multi-kategorialen als auch in binären Szenarien?
Inhaltsverzeichnis
- Exposition der Forschungssynergie
- Problemdarstellung: Bedrohung durch Malware und Ransomware
- Forschungsmotivation und Relevanz: Bedeutung von KI in der Cybersicherheit
- Perspektive, Zielintentionen und Forschungsleitfragen: Eingrenzung und Präzisierung der Forschungsziele
- Ein Meilensteinplan für die Masterarbeit
- Zentrale Begrifflichkeiten: Bausteine für Erkenntnisse
- Cybersicherheit und Parallelen zur IT-Sicherheit: Definition und Abgrenzung
- Konventionelle IDS und KI-basierte Sicherheitssysteme: Begrifflichkeiten, Gemeinsamkeiten und Unterschiede
- Datengrundlage: Der CIC-MalMem-2022-Datensatz
- Das objektbasierte Speichermodell OMM: Ein Pionieransatz zur Konstruktion des CIC-MalMem-2022-Datensatzes
- Ransomware, Spyware, Trojaner & Phishing: Schlüsselelemente zur Erkennung mittels OMM im CIC-MalMem-2022-Datensatz
- Beschreibung der Charakteristik des CIC-MalMem-2022-Datensatzes
- Grundlagen und Bestandteile der Convolutional Neural Networks
- CNN: Definition und Ursprung
- Arten der Klassifikation und Bias-Varianz-Klassifikations-Dilemma
- Trainingsprozess, Trainings-, Validations- und Testdateneinteilung
- Aufbau und Funktionalität der Pooling-Schicht
- Struktur und Aufbau von Flatten-, Fully-Connected- und Ausgabe-Schichten
- Übersicht über populäre Architekturen von CNNs
- Vertiefung der CNN-Techniken und Optimierungsstrategien mit Variationscharakteristik
- Gradienten-Abstiegs-Verfahren und Zusammenhang mit Lernverfahren
- Backpropagation und Feedforward-Mechanismus
- Verlustfunktionen
- Aktivierungsfunktionen
- Netzwerktiefe und grundlegende Hyperparameter
- Padding und Stride
- Faltungsdimensionen und Kanäle
- Regularisierungsmethoden mit Variationscharakteristik in CNN-Architekturen
- Dropout-Funktion
- Batch-Normalisierungsfunktion
- L1- und L2-Gewichtsregualisierungsmethoden
- Vertiefende Optimierungsmethoden und Hyperparameteroptimierung mit Variationscharakteristik in CNN-Architekturen
- Early-Stopping-Verfahren
- Kernelfilter und Kernelgröße
- Lernrate, Batchgröße, Epochenanzahl, Dropout-Rate und Ausblick
- Quantitative Leistungsmetriken und Bewertungskriterien in CNNs
- Standardisierte quantitative Leistungsmetriken
- Makro- & gewichteter Durchschnitt
- Die ROC-AUC-Kurve
- Ausblick: Sonstige quantitative Leistungsmetriken
- Qualitative Leistungsmetriken und Bewertungskriterien in CNNs
- Leitlinien der EU und der Internationalität in diesem Kontext
- Transparenzbeurteilung
- Ethikbewertung
- Robustheitsbewertung
- Stand der Forschung: Vertiefung der Theorien und Erkenntnisse
- Forschungsstand Teil 1: Einsatz von CNN in der Cybersicherheit und bei der Malware-Erkennung
- Forschungsstand Teil 2: Studien zum CIC-MalMem-2022-Datensatz
- Zwischenfazit des Forschungsstandes: Beitrag zur Beantwortung der Forschungsleitfragen und Entstehung der Forschungslücke
- Herausbildung der Forschungshypothesen
- Forschungsmethodik: Strukturbildung
- Forschungspositionierung und -perspektive: Entscheid über Methodenauswahl
- Empirische Darlegung und Forschungsparadigma
- Methodologische Rechtfertigung: Vertiefung
- Dokumentation und Forschungsgütekriterien
- Relevanzbegründung der Datenauswahl: Der CIC-MalMem-2022-Datensatz
- Methodenpool und Vorgangsmodelle: Dokumentation und Zieldarlegung über die angewandten Methoden
- Flussdiagramm
- UML-Diagramm
- Use-Case-Diagramm und Anwendungsszenarien
- Methoden der Datenladung und Vorverarbeitung
- Methoden der Datenaufteilung und Transformation
- Methoden der CNN-Modell-Generierung
- Methoden des CNN-Trainings und -Validation
- Dokumentation der eingesetzten Programmbibliotheken
- Zufallsauswahl von Hyperparametern
- Beschreibung der Modelle
- Ergänzende Dokumentation zu den eingesetzten Forschungswerkzeugen
- Methoden der Hypothesentests
- Ergebnisse
- Ergebnisse der Gesamtklassifikation der Standard-CNN-Modelle
- Ergebnisse der Gesamtklassifikation der randomisierten CNN-Modelle
- Ergebnisse der Binär-Klassifikation der Standard-CNN-Modelle
- Ergebnisse der Binär-Klassifikation der randomisierten CNN-Modelle
- Ergebnisse des Hypothesentests
- Diskussionsmodell der Ergebnisse und Erkenntnisse
- Vergleich der Forschungsergebnisse mit den Ergebnissen aus dem Forschungsstand
- Überprüfung und Diskussion der Forschungshypothesen
- Diskussion unter dem Kontext der Forschungsleitfragen
- Fazit und Forschungsausblick
- Gesamtzusammenfassung und praktische Implikationen
- Kritische Würdigung und Limitationen
- Forschungsausblick
Zielsetzung und Themenschwerpunkte
Die vorliegende Masterarbeit befasst sich aus der Perspektive der Datenwissenschaften und IT-Sicherheit mit der experimentellen Untersuchung von randomisierten CNN-Modellen und Standardmodellen im Bereich der Malware-Erkennung. Das Ziel ist es, diese Modelle zu optimieren und zu bewerten, indem sie mit dem globalen State-of-the-Art verglichen werden. Das Forschungsparadigma ist quantitativ und zielt darauf ab, eigene Hypothesen im Rahmen einer wissenschaftlichen Untersuchung zu überprüfen.
- Entwicklung und Evaluierung von randomisierten CNN-Modellen für die Malware-Erkennung
- Vergleich mit Standardmodellen (VGGNet, AlexNet, LeNet-5) und dem aktuellen Forschungsstand
- Analyse des CIC-MalMem-2022-Datensatzes, der auf dem objektbasierten Speichermodell OMM basiert
- Anwendung von quantitativen Leistungsmetriken wie Genauigkeit, Präzision, Recall und dem F1-Wert
- Diskussion der ethischen Aspekte und der Transparenz in der Forschung
Zusammenfassung der Kapitel
Die Arbeit beginnt mit der Exposition der Forschungssynergie, die die Bedrohung durch Malware und Ransomware, die Forschungsmotivation und -relevanz sowie die Zielintentionen und Forschungsleitfragen beleuchtet. Anschließend werden zentrale Begrifflichkeiten wie Cybersicherheit, konventionelle und KI-basierte Sicherheitssysteme, der CIC-MalMem-2022-Datensatz sowie die Grundlagen von Convolutional Neural Networks (CNNs) definiert. Kapitel 3 befasst sich mit dem Stand der Forschung, inklusive Studien zum Einsatz von CNNs in der Cybersicherheit und dem CIC-MalMem-2022-Datensatz. Hier wird auch die Forschungslücke identifiziert und die Entstehung der Forschungshypothesen dargestellt.
Kapitel 4 präsentiert die Forschungsmethodik, die sich mit der Forschungspositionierung, dem Forschungsparadigma, der methodologischen Rechtfertigung, der Datenauswahl und den angewandten Methoden beschäftigt. Die Ergebnisse der Arbeit werden in Kapitel 5 vorgestellt, inklusive der Gesamtklassifikation der Standard- und randomisierten CNN-Modelle, der Binär-Klassifikation sowie der Ergebnisse des Hypothesentests. Kapitel 6 widmet sich der Diskussion der Ergebnisse und Erkenntnisse, während Kapitel 7 das Fazit und den Forschungsausblick beinhaltet.
Schlüsselwörter
Die Arbeit konzentriert sich auf die Themengebiete der Datenwissenschaften, IT-Sicherheit, Malware-Erkennung, Convolutional Neural Networks (CNNs), randomisierte Modelle, Standardmodelle, CIC-MalMem-2022-Datensatz, quantitatives Forschungsparadigma, Hypothesentests, Leistungsmetriken (Genauigkeit, Präzision, Recall, F1-Wert), ethische Richtlinien und Transparenz in der Forschung.
- Arbeit zitieren
- Lucas Dinhof (Autor:in), 2024, Entwicklung und Laborexperiment von Convolutional Neural Networks mit Variationscharakteristik für fortschrittliche Cybersicherheitsanalysen, München, GRIN Verlag, https://www.grin.com/document/1478043