Um das Risiko eines Patienten für eine bestimmte Krankheit einzuschätzen, kann ein Klassifikationsmodell verwendet werden, das aus den Daten anderer Patienten gebaut wurde. Wenn im Gesundheitswesen Patientendaten verarbeitet werden, ist es wichtig, dabei die Privacy der Patienten zu gewährleisten. In der Vergangen-heit hat sich gezeigt, dass die Privacy der Patienten auch dann gefährdet sein kann, wenn die Trainingsdaten vor der Klassifikation anonymisiert wurden. Die meisten Methoden zur Gewährleistung der Privacy beziehen sich jedoch auf Da-ten in einer Datenbank und berücksichtigen die besonderen Anforderungen bei der Verarbeitung von Datenströmen nicht. Der DAHOT-Algorithmus ist eine Kombination aus Hoeffding-Baum, k-Anonymität und ℓ-Diversität und stellt die Privacy der Patienten bei der Klassi-fikation von Datenströmen sicher. In dieser Seminararbeit wird der DAHOT-Algorithmus und die dafür notwendigen Grundlagen vorgestellt. Außerdem wird auf die Effektivität und die Grenzen des DAHOT-Algorithmus eingegangen.
Inhaltsverzeichnis
- 1 Einleitung
- 2 Grundlagen
- 2.1 Klassifikation mit Entscheidungsbäumen
- 2.2 k-Anonymität
- 2.3 l-Diversität
- 2.4 Verarbeitung von Datenströmen
- 2.5 Hoeffding-Baum
- 3 DAHOT-Algorithmus
- 4 Zusammenfassung und Ausblick
Zielsetzung und Themenschwerpunkte
Diese Seminararbeit befasst sich mit der Klassifikation von Datenströmen unter Berücksichtigung der Privacy der Personen im Klassifikationsergebnis am Beispiel des DAHOT-Algorithmus. Der Fokus liegt auf der Untersuchung der Funktionsweise des Algorithmus und der dafür notwendigen Grundlagen. Die Arbeit analysiert die Effektivität und die Grenzen des DAHOT-Algorithmus in Bezug auf die Gewährleistung von Privacy bei der Verarbeitung von Datenströmen.
- Klassifikation von Datenströmen
- Privacy-Erhaltung bei Klassifikation
- Hoeffding-Baum-basierte Klassifikation
- k-Anonymität und l-Diversität als Privacy-Mechanismen
- DAHOT-Algorithmus als Kombination aus Hoeffding-Baum, k-Anonymität und l-Diversität
Zusammenfassung der Kapitel
Kapitel 1 führt in das Thema der Privacy-aware Klassifikation von Datenströmen ein und erläutert die Herausforderungen, die sich aus dem Schutz der Privatsphäre im Kontext von Data Mining ergeben.
Kapitel 2 stellt die grundlegenden Konzepte vor, die für das Verständnis des DAHOT-Algorithmus notwendig sind. Hierzu zählen die Klassifikation mit Entscheidungsbäumen, k-Anonymität, l-Diversität sowie die Besonderheiten der Verarbeitung von Datenströmen. Das Kapitel erklärt auch die Funktionsweise des Hoeffding-Baums als Basisalgorithmus für die Klassifikation von Datenströmen.
Kapitel 3 beschreibt den DAHOT-Algorithmus im Detail. Es wird erläutert, wie der Algorithmus die Privacy der Personen im Klassifikationsergebnis gewährleistet, indem er die Prinzipien von k-Anonymität und l-Diversität in den Hoeffding-Baum integriert.
Schlüsselwörter
Data Mining, Klassifikation, Datenströme, Privacy, k-Anonymität, l-Diversität, Hoeffding-Baum, DAHOT-Algorithmus
- Arbeit zitieren
- Anonym (Autor:in), 2018, Privacy-aware Klassifikation auf Datenströmen am Beispiel des DAHOT Algorithmus, München, GRIN Verlag, https://www.grin.com/document/1313303