Zusammenfassung
Das Ziel dieser Arbeit ist es dem Leser einen Überblick der Möglichkeiten zu geben, wie mit Hilfe der Informationsvisualisierung der Mensch leichter Informationen finden kann, um so Probleme, sei es wissenschaftlicher Natur oder nicht, besser verstehen und lösen zu können. Das erste Kapitel beschreibt die derzeitige Problemsituation, sich in der immensen Informationsflut von Datenbanken und im World Wide Web zurechtzufinden. Es werden Anforderungen formuliert, die eine Informationsvisualisierungstechnik erfüllen sollte. Im zweiten Kapitel werden die Grundbegriffe für das Verstehen der Visualisierung beleuchtet. Es wird dabei näher auf die Informationsvisualisierung und das Information Retrieval System eingegangen.
Das dritte Kapitel wird sich den Visualisierungstechniken von hierarchischen Daten widmen.
Beim vierten Kapitel werden Techniken vorgestellt, um eindimensionale Datenstrukturen darzustellen.
Das fünfte Kapitel beschäftigt sich mit den besonderen Methoden und Techniken, um multidimensionale Informationsstrukturen zu visualisieren und verstehen zu können.
Im sechsten Kapitel werden die Navigations- und Interaktionsmöglichkeiten der Visualisierungstechniken untersucht und bewertet.
Abstract
The goal of this work is to give an overview of the possibilities to the reader, as with the help of Information Visualization humans can find information more easily to understand and solve problems, is it scientific nature or not, in a better way.
The first chapter describes the present problem situation to get along in the immense flood of information of data bases and in the World Wide Web. Requirements are formulated, which an information visualization technology should fulfill.
3
In the second chapter the fundamental ideas for understanding visualization are lit up. It is entered more in greater detail thereby with Information Visualization and the Information Retrieval system. The third chapter will dedicate itself to the visualization techniques of hierarchical data.
In the fourth chapter techniques are presented, in order to visualize linear data structures.
The fifth chapter is occupied with special methods and techniques, in order to visualize and to understand multi-dimensional information structures. In the sixth chapter navigation and interaction possibilities of the visualization techniques are examined and evaluated.
4
Inhaltsverzeichnis
Zusammenfassung 3
Abstract 3
Abbildungsverzeichnis 7
Tabellenverzeichnis 8
1 Einleitung 9
1.1 Motivation 9
1.2 Problemdefinition 10
1.2.1 Visuelle Metaphern 10
1.2.2 Interaktionsmöglichkeiten 10
1.2.3 Orientierungshilfen 10
2 Grundlagen 11
2.1 Visualisierung 11
2.2 Informationsvisualisierung 12
2.2.1 Informationsressource 13
2.2.2 Data Mining 13
2.2.3 Informationsbenutzer 14
2.3 Informationsraum 14
2.3.1 Vektorraummodel 14
2.4 Visualisierungsprozess (Pipeline) 15
2.4.1 Filtering 16
2.4.2 Mapping 16
2.4.3 Rendering 16
2.5 Information Retrieval 16
2.5.1 Daten 17
2.5.2 Information 17
2.5.3 Grundelemente der Informationssuche 18
2.5.4 Information Retrieval System 18
2.6 Datentypen 19
2.6.1 Eindimensionale Daten 19
2.6.2 Zweidimensionale Daten 19
2.6.3 N-Dimensionale Daten 20
2.6.4 Hierarchien 20
2.6.5 Textdokumente und Hypertext 20
3 Visualisierung hierarchischer Daten 21
3.1 Tree 21
3.2 Venn-Diagramm und Nested Treemap 22
3.3 Tree-Map 24
3.4 Cone Trees und Cam Trees 26
3.5 Fractal Tree 28
3.6 Hyperbolic Tree 28
3.7 Information Cube 29
5
4 Visualisierung eindimensionaler Daten 31 4.1 Perspective Wall 31 4.2 Information Corridor 32 4.3 Spiral 32
5 Visualisierung n-dimensionaler Daten 34 5.1 Methoden 34 5.2 Reduction of Dimension 35 5.2.1 Focusing 35 5.2.2 Linking 36 5.2.3 Brushing 36 5.2.4 Slicing 37 5.3 Projection Pursuit 37 5.3.1 Grundlegende Methoden 37 5.3.2 Scatterplots 38 5.3.3 Hyperslice 39 5.4 Geometric Coding 40 5.4.1 Glyphs 40 5.4.2 Chernoff Faces 41 5.4.3 Hyperbox 42 5.5 Parallele Koordinaten 43
5.6 Hierarchische Koordinatensysteme 45 5.6.1 Hierarchische Achsen 45 5.6.2 Dimensional Stacking 46 5.6.3 Worlds within Worlds 47
6 Navigation und Interaktion 49 6.1 Zoom und Pan 49 6.2 Fokus und Kontext 51 6.2.1 Fisheye View 51
6.2.2 Degree of Interest (DOI) 53 6.2.3 Document Lens 53 6.2.4 Information Landscape 54 6.3 Exploration 56
6.3.1 Visual Exploration Paradigma 56
6.3.2 Incremental Exploration Technics 57 6.4 Clustering 57
6.4.1 Self-Organizing-Map (SOM) 58
6.4.2 Hierarchical Agglomerative Clustering 60 7 Ausblick 62
Literaturverzeichnis 63
6
Abbildungsverzeichnis
Abbildung 1: Das Informationsmodell
Abbildung 2: Visualisierungs-Pipeline
Abbildung 3: Einfacher 3 Stufen-Hierarchiebaum
Abbildung 4: Probleme hierarchischer Darstellung ( Kaz96 )
Abbildung 5: Venn-Diagramm Darstellung ( Shn91 )
Abbildung 6: Nested Treemap Darstellung von Abbildung 5 ( Shn91 )
Abbildung 7: Non-Nested Treemap Darstellung von Abbildung 6 ( Shn91 )
Abbildung 8: Tree-Map Visualisierung eines Dateisystems mit 1500 Dateien
und 190 Verzeichnissen ( Tur92 )
Abbildung 9: Cone Tree ( Rob91 )
Abbildung 10: Cam Tree ( Rob91 )
Abbildung 11: Darstellung eines fraktalen Baum ( Koi93 )
Abbildung 12: Hyperbolischer Baum ( Rao94 )
Abbildung 13: Visualisierung mittels Information Cube ( Rek93 )
Abbildung 14: Perspective Wall Darstellung ( Mac91 )
Abbildung 15: Information Corridor Visualisierung (Quelle:
http ://www.arch.columbia.edu/DDL/research/patent)
Abbildung 16: Visualisierung mittels Spirale (Quelle:
http ://www.rhizome.org/spiral )
Abbildung 17: Scatterplot Darstellung vierdimensionaler Daten ( War97 )
Abbildung 18: Fünfdimensionale Hyperslice Darstellung ( Won97 )
Abbildung 19: Star Glyphs ( Mar95 )
Abbildung 20: Sticky Figures ( Won97 )
Abbildung 21: Chernoff Faces Visualisierung ( Che73 )
Abbildung 22: Fünfdimensionale Hyperbox ( Won97 )
Abbildung 23: Parallele Koordinaten ( Fua99 )
Abbildung 24: Extruded Parallel Coordinates.
Abbildung 25: Three-dimensional Coordindates ( Weg97 )
Abbildung 26: Links: Orthog. Achsen Rechts: Hierarchische Achsen
( Won97 )
Abbildung 27: Histogram Plot Darstellung der hierarchischen Achsen
( Won97 )
Abbildung 28: Dimensional Stacking.
Abbildung 29: Worlds within Worlds Darstellung ( Won97 )
Abbildung 30: Space-scale Diagramm ( Fur98 )
Abbildung 31: Semantisches Zoomen ( Fur98 )
Abbildung 32: Informationsstruktur ohne Fisheye-Verzerrung ( Sar92 )
Abbildung 33: Informationsstruktur mit Fisheye-Verzerrung ( Sar92 )
Abbildung 34: Document Lens ( Rob93 )
Abbildung 35: Grafische Oberfläche der InternetMap (Quelle:
http ://www.webmap.com/maps/internetmap/index.html)
7
Abbildung 36: Erklärung der Zoom-Funktion (Quelle:
http://www.webmap.com/maps/internetmap/index.html) ...................... 56 Abbildung 37: Die 11 Kugeln sind nach ihrer Zugehörigkeit gruppiert......... 57 Abbildung 38: Schema des SOM Algorithmus ([Kas98]) ............................. 59 Abbildung 39: WEBSOM-Visualisierung von über 80 Newsgroups mit über einer Million Einträgen (Quelle:
http://websom.hut.fi/websom/milliondemo/html/root.html ) ................... 60 Abbildung 40: Hierarchical Clustering mit dem HAC-Algorithmus ([Her00]) 61
Tabellenverzeichnis
Tabelle 1: Vergleich zwischen Information Visualization und Scientific Visualization ([Ger97]) 12
8
Information Visualization Einleitung
1 Einleitung
1.1 Motivation
Aufgrund der zunehmenden Bedeutung von vernetzten Daten und der stetig steigenden Informationsmenge, die online verfügbar ist, entstehen Probleme mit der Handhabung der Ergebnismengen einer Suchabfrage und Schwierigkeiten, die richtigen Informationen zu finden. Deshalb ist es sehr wichtig, einen schnellen und effizienten Zugriff bzw. Abfrage der Informationen zu gewährleisten. Dies trifft nicht nur auf Datenbanken zu, sondern betrifft auch das World Wide Web, das mittlerweile zur einer Informationsquelle mit einer extrem komplexer Struktur und
unüberschaubarem Ausmaß geworden ist. Es ist daher nötig, Methoden zu generieren, die die Möglichkeiten heute zur Verfügung stehender Suchmaschinen bei weitem übersteigen.
Die Auswertung dieser großen Datenmengen ist ein weiteres Problem. Wenn Daten in Form von Zahlen, meist in Tabellen angeordnet, präsentiert werden, bleiben uns die Zusammenhänge oft verborgen. Diese Daten können verschiedenster Art sein, wie beispielsweise Finanzdaten, Produktionsdaten, Messwerte oder gar als Textdokumente vorliegen.
Zur Lösung dieser Probleme trägt die Informationsvisualisierung bei. Mit ihr werden abstrakte Daten durch grafische Metaphern ersetzt, die es dem Anwender erleichtern soll, aus den riesigen Datenmengen das Gesuchte zu finden. Doch nicht nur die Visualisierung der Informationen ist von großer Bedeutung, sondern die Art und Weise, wie der Computer dem Menschen hilft, verborgene Zusammenhänge und Einsichten verständlich zu machen, ist von großer Wichtigkeit.
9
Information Visualization Einleitung
1.2 Problemdefinition
Damit Informationen verständlich veranschaulicht werden können, werden der Informationsvisualisierung bestimmte Aufgabenbereiche zugeteilt, die zu erfüllen sind. Diese Anforderungen finden natürlich auch in benachbarten Forschungsbereichen Bedeutung, für die Informationsvisualisierung allerdings nehmen sie jedoch eine wichtige und zentrale Stellung ein. Die Anforderungen an die Informationsvisualisierung sind:
• Das Erfinden von geeigneten visuellen Metaphern.
• Schaffen von Interaktionsmöglichkeiten
• Orientierungshilfen für den Anwender
1.2.1 Visuelle Metaphern
Die visuelle Metapher soll dem Anwender die Möglichkeit geben, die gesuchten Informationen leicht und schnell zu finden. Dieses Ziel kann erreicht werden, indem visuelle Metaphern verwendet werden, die der Anwender aus seinem Alltagsleben her kennt. Kulturelle Einflüsse des Anwenders können für das Gestalten der visuellen Metapher eine Rolle spielen.
1.2.2 Interaktionsmöglichkeiten
Damit die dargestellten Informationen für den Anwender vollständig begreifbar werden, muss es dem Anwender möglich sein, zu interagieren. Es sollten Interfaces geschaffen werden, die dem Anwender die Möglichkeit geben, die Suchabfrage dynamisch zu gestalten, da zum Lösen von Problemen meist mehrere Fragen zu beantworten sind.
1.2.3 Orientierungshilfen
Dem Anwender soll geholfen werden, nicht den Überblick zu verlieren und sich auf das Wesentliche konzentrieren zu können. Diese Hilfen können graphischer, hierarchischer oder zeitlicher Natur sein.
10
Information Visualization Grundlagen
2 Grundlagen
In diesem Kapitel werden wichtige Begriffe erklärt, die in dieser Arbeit Verwendung finden. Der Leser erhält dadurch ein besseres Verständnis über die zu behandelnde Problematik und wie die Begriffe in dieser Arbeit verwendet werden.
2.1 Visualisierung
„to visualize“: form a mental vision, image, or picture of (something not visible or present to sight, or of an abstraction); to make visible to the mind or imagination [The Oxford English Dictionay, 1989] Im Allgemeinen wird die Visualisierung als Abbildungsprozess von Daten unter Zuhilfenahme einer Kodierungstechnik bezeichnet, der das menschliche Verständnis und die Kommunikation maximieren soll. Die Visualisierung besteht aus 3 Hauptbereichen:
• Volume Visualization
• Flow Visualization
• Information Visualization
Die Volume - und Flow Visualization gehören der wissenschaftlichtechnischen Visualisierung (Scientific Visualization) an, bei der physikalische Erscheinungen wie strömungsdynamische Untersuchungen, klimatologische Applikationen und medizinische Daten im Vordergrund stehen. Diese Daten werden als räumliche Daten bezeichnet, da sie direkt auf eine zwei- oder dreidimensionale Darstellung projiziert werden können. Die Aufgaben der Visualisierung sind ([Däs99]):
• Symbole, Diagramme oder Animationen helfen komplexe
• Visualisierung vereinfacht den Zugang zu Massendaten, z. B.
Information Visualization Grundlagen
• Visualisierung hilft bei der Analyse und Interpretation von Daten,
Dementsprechend hat die Visualisierung die Zielsetzung, Daten leicht verständlich und überschaubar darzustellen. Die Qualität der Visualisierung hängt aber nicht nur von der Visualisierungstechnik ab, viel endscheidender ist die menschliche Auffassung. Wie müssen die dargestellten Informationen beschaffen sein, damit der Anwender sie richtig interpretiert?
2.2 Informationsvisualisierung
Die Informationsvisualisierung ist ein relativ junges Forschungsgebiet der Informatik. Unter Informationsvisualisierung werden heute alle Konzepte, Methoden und Applikationen zur visuellen Darstellung von Informationen aus Datenbanken, digitalen Bibliotheken oder anderen großen
Dokumentsammlungen zusammengefasst ([Däß98]). Im Gegensatz zur wissenschaftlich-technischen Visualisierung sind bei der
Informationsvisualisierung abstrakte Daten von Bedeutung. Da die Informationsvisualisierung nicht mit räumlichen Daten korreliert, ist sie auch nicht an einen Raum gebunden. Deshalb kann man abstrakte Daten in n Dimensionen einbeschreiben.
In der Informationsvisualisierung werden Methoden der nicht interaktiven, der interaktiven und der generativen Computergrafik angewandt und mit Methoden aus den Bereichen Interface-Design und Human-Computer-Interaction kombiniert.
Tabelle 1: Vergleich zwischen Information Visualization und Scientific
Information Visualization Grundlagen
Der Informationsvisualisierung liegt ein Informationsmodell zu Grunde. Das Informationsmodell beschreibt den Weg von der Informationsressource über das Data Mining zum Informationsbenutzer (siehe Abbildung 1).
2.2.1 Informationsressource
Die Informationsressource stellt die Informationen für den Anwender bereit. Sie soll den Informationsbedarf des Informationsbenutzers decken. Für gewöhnlich stellen diese Informationsressourcen Online-Datenbanken, File-Server oder digitale Bibliotheken dar.
2.2.2 Data Mining
Das Data- oder Information Mining hilft dem Anwender genau die richtigen Informationen aus dem Datendschungel zu Tage zu fördern, die er braucht. Es umfasst den Prozess der Suche und Analyse großer Datenbanken, um nützliche Informationen zu finden. Ausgehend von den
Informationsressourcen ist beim Data Mining eine genaue Treffermenge wichtig.
13
Information Visualization Grundlagen
Data Mining geht davon aus, dass die besondere Fähigkeit des Menschen, ungewöhnliche Ereignisse sofort zu erkennen und mit der Fähigkeit des Computers, riesige Datenmengen zu speichern, interaktiv genutzt werden sollte und zu praktikablen Ergebnissen führen muss. Beim Data Mining steht der Mensch im Mittelpunkt, der mit einer großen Datenbank interagiert und Vorgangsweisen festlegt, um Teilprobleme zu lösen und die dazu nötigen Informationen findet, die ihn zu entscheidungsrelevanten Erkenntnissen führt. Dabei kann er die Informationen von der Ressource bis hin zur Visualisierung beliebig
verändern. Dies wird durch die Interaktivität der Visualisierungsapplikation unterstützt.
2.2.3 Informationsbenutzer
Der Informationsbenutzer bekommt die gesuchten Daten in verständlicher Form visualisiert. Dadurch wird der bewusste Denkvorgang durch einen intuitiven Wahrnehmungsvorgang unterstützt. Diese Synergie aus visualisierter Information und der Kreativität und Intelligenz des Menschen macht die Informationsvisualisierung zu einem mächtigen Werkzeug.
2.3 Informationsraum
Damit die Informationen visualisiert werden können, müssen sie in einen Informationsraum eingeschrieben werden. Dieser stellt den
Informationsumfang der zu visualisierenden Informationen dar. Diese Informationskollektion wird als Vektorraum aufgefasst, dessen Dimension gleich der Anzahl der verschiedenen Terme ist, die benötigt werden, um Dokumente in der Informationskollektion darzustellen. Der Vektorraum hat jedoch eine spezifische, dreidimensionale Raumstruktur, in der die Objekte und deren Objektbeziehungen dargestellt werden. Da aber maximal 3 Dimensionen auf Raumachsen abgebildet werden können, werden Attribute benutzt, um Relationen zu visualisieren.
2.3.1 Vektorraummodel
Jede Eigenschaft eines Elements der Datenstruktur wird durch eine Dimension dargestellt, der jeweils ein Wert zugeschrieben wird. Diese Werte spannen den sogenannten Vektorraum auf. Jedes Dokument wird als Vektor im Vektorraum dargestellt. Die Länge des Vektors spiegelt das Gewicht des Vektors wider. Sind zwei Dokumente inhaltlich ähnlich, so zeigen ihre Vektoren in die ähnliche Richtung. Die Suchabfrage wird ebenfalls als Vektor
14
Information Visualization Grundlagen
dargestellt. Zeigen Vektoren in dieselbe Richtung wie die Suchabfrage, so bedeutet das, dass die betreffenden Dokumente für die Suchabfrage relevant sind. So werden nicht nur exakte Übereinstimmungen von Dokumenten, sondern auch ähnliche Dokumente erfasst. Die Trefferquote wird dadurch erhöht.
Mathematisch gesehen lassen sich beliebig viele Dimensionen im Vektorraum behandeln, da jedoch der Vektorraum n-Dimensionen besitzen kann und nur drei Dimensionen dargestellt werden können, müssen die Vektoren entsprechend heruntergerechnet werden
2.4 Visualisierungsprozess (Pipeline)
Ausgehend von den räumlichen oder abstrakten Daten muss das zu visualisierende Phänomen in geeigneter Weise sichtbar gemacht werden. Dazu wird die Visualisierungs-Pipeline verwendet, die sich in den meisten Visualisierungstechniken wiederfindet ([Mar98]).
Der Visualisierungsvorgang besteht aus drei Stufen. Bei der ersten Stufe, dem Filtering, bereitet man die Rohdaten des Phänomens auf. Das geschieht beispielsweise durch Selektion oder Reduktion der Ergebnisdaten. In der zweiten und wichtigsten Phase, dem Mapping, wird eine geometrische Repräsentation gewählt, die die Zuordnung der Darstellungselemente regelt.
15
Information Visualization Grundlagen
Die letzte Stufe ist das Rendering. Hier werden die geometrischen Objekte in visuelle Informationen grafisch umgesetzt.
2.4.1 Filtering
Beim Filtering wird ein empirisches Modell generiert, welches das zu visualisierende Phänomen charakterisiert. Damit eine sinnvolle geometrische Darstellung der Informationen möglich ist, müssen die Rohdaten aufbereitet werden, da Daten unzureichend oder für die nachfolgenden Visualisierungsschritte zu umfassend sein können. Ziel ist es durch Selektion, Interpolation oder Reduktion des empirischen Modells sich den Ausgangs-oder Realdaten zu nähern.
2.4.2 Mapping
Beim Mapping-Prozess werden die gefilterten Daten auf geometrische Objekte projiziert. Die Attribute der geometrischen Objekte beinhalten geometrische oder topologische Eigenschaften wie z. B. Transparenz, Form oder Textur. Für das empirische Modell wird eine geeignete geometrische Repräsentation gewählt, die das Phänomen verdeutlicht. Solche geometrischen Repräsentationen sind üblicherweise geometrische Primitive oder Volumenelemente (Voxel).
2.4.3 Rendering
Bei diesem Prozess rechnet eine Renderengine die gesamte geometrische Repräsentation in eine zweidimensionale bildliche Darstellung um. Je nachdem wie ausgereift der Renderer ist, berücksichtigt er die Licht- und Schattenverhältnisse, sowie die optische Reduzierung des Treppeneffektes (Antialiasing).
2.5 Information Retrieval
Das Problem bei katalogbasierten Suchmaschinen ist, dass sie nur nach Schlüsselworten suchen und den Kontext des Dokumentes außer acht lassen. Dadurch werden die gemeinsamen Muster und Relationen der unterschiedlichen Dokumente nicht erkannt.
Wenn der Anwender Informationen benötigt, um ein vorliegendes Problem zu lösen, kann er in den wenigsten Fällen genau angeben welche Informationen er braucht. Das Informationsbedürfnis wird daher als „unscharf“ bezeichnet .
16
Information Visualization Grundlagen
Aufgrund der semantischen Beziehungen der Suchabfrage des Anwenders können die gesuchten Informationen mit Hilfe des Information Retrieval herausgefiltert werden.
Information Retrieval umfasst den technisch-gestützten Prozess des Wissenstransfers von der Informationsressource bis hin zum
Informationssuchenden ([Kno97]). Dabei wird Information Retrieval eingesetzt, um die Informationen zu verwalten und zu suchen. Informationen werden so aufbereitet und angeboten, dass sie bei einer Informationssuche möglichst präzise und vollständig herausgefiltert werden können. Ein Dokument, das unter hundert anderen noch gut abgrenzbar ist, kann unter Tausenden von Dokumenten bereits schwer auffindbar und unter Millionen von Dokumenten praktisch unauffindbar sein, da es einfach zu viele gibt, die diesem Dokument sehr ähnlich sind. Information Retrieval versucht aufgrund der semantischen Beziehungen der Dokumente so nah wie möglich an die Suchabfrage und deren Suchparameter zu kommen.
2.5.1 Daten
Daten beziehen sich auf Kollektionen von Nummern, Zeichen oder Bildern in einer Form, die von dem Menschen oder dem Computer bewertet werden können. Daten können gespeichert, verarbeitet und bewegt werden. Daten für sich alleine gestellt, haben keine Bedeutung, nur wenn sie von einer Art Datenbearbeitungssystem, wie der Mensch oder der Computer, interpretiert werden, erhalten sie Bedeutung und werden so zu Informationen ([Ber81]).
2.5.2 Information
Durch Zuordnung von Semantik und Pragmatik werden Daten zu Informationen, die sich in einem gewissen Kontext interpretieren lassen. Dieselben Daten können für verschiedene Formen der Information herangezogen und bearbeitet werden. Information kann auch als Antwort einer Frage über Daten angesehen werden ([Ber81]). Aus jeder Information können wieder Daten für einen anderen Prozess gewonnen werden, die wiederum neue Informationen ergeben. Informationen können als Objekte betrachtet werden, denen Attribute zugeordnet sind und zwischen denen gewisse Beziehungen definiert sind.
17
Information Visualization Grundlagen
2.5.3 Grundelemente der Informationssuche
Bei einer Informationssuche versucht der Anwender einen unbefriedigenden Wissenszustand mit Hilfe einer Suchabfrage aus einem
Informationsressource zu stillen.
Die Informationssuche wird in vier Phasen beschrieben ([Shn98]) :
• Formulierung
In dieser Phase wird die Suchanfrage beschrieben. Dies wird einerseits durch die Verwendung von geeigneten Parametern (z. B. Phrasen), andererseits durch die Eingabe von bestimmten Suchbegriffen erreicht.
• Herbeiführung der Suchaktion
In dieser Phase läuft die eigentliche Suchaktion ab. Dabei werden implizite Aktionen wie die Aktivierung einer Fortschrittsanzeige und explizite Aktionen wie die Verwendung von gesetzten Parametern ausgeführt.
• Resultatsbetrachtung
Diese Phase beschreibt die Präsentation der Suchergebnisse. Hier werden die Suchergebnisse vom Anwender analysiert, in dem er bestimmte Dokumentenattribute (Dateinamen, Alter,...) auswählt.
• Verfeinerung
Hier werden die nächsten Schritte formuliert. Dies kann durch Ändern bestimmter Parameter eine neue Suche bedeuten oder die
Weiterverarbeitung der Suchergebnisse sein.
2.5.4 Information Retrieval System
Ein Information Retrieval System informiert den Anwender nicht über seine Anfrage. Es weist ihn lediglich auf die Existenz (oder Nichtexistenz) von Dokumenten bezüglich der Anfrage des Anwenders hin. Eine gute Definition des Information Retrieval Systems liefert Professor Gerard Salton:
"Die Informationen, die mit Retrievalsystemen verarbeitet werden, bestehen aus Dokumenten. Information Retrieval beschäftigt sich demnach mit der Repräsentation und Speicherung von und dem Zugriff auf Dokumente oder Dokumentstellvertreter.
Ausgangspunkt ist der natürlichsprachige Text der Dokumente, Auszüge aus diesem Text oder Zusammenfassungen (Abstracts).
18
Information Visualization Grundlagen
Richtet man an ein Retrievalsystem eine Suchanfrage, so erhält man als Ergebnis eine Menge von Referenzen. Diese Referenzen verweisen den Nutzer des Retrievalsystems auf potentiell relevante Veröffentlichungen." ([Sal87])
2.6 Datentypen
Damit man begreifbare Formen für Daten entwickeln kann, muss man über die Daten, die zu visualisieren sind, Bescheid wissen. Ebenso muss man über die Entwicklungsziele im Klaren sein, sodass effiziente Datenstrukturen und Zugriffsmethoden geschaffen werden können. Im folgenden wird auf die Charakteristik von Daten eingegangen und wichtige Eigenschaften der Daten beleuchtet.
Die Datentypen, die visualisiert werden, sind ([Shn96]):
• Eindimensionale Daten
• Zweidimensionale Daten
• Multidimensionale bzw. n-dimensionale Daten
• Hierarchische Daten
• Text und Hypertext
2.6.1 Eindimensionale Daten
Diese Daten besitzen nur eine Dimension. Ein typisches Beispiel für diesen Datentyp wären chronologische Daten oder nach dem Alphabet geordnete Daten. Werden eindimensionale Daten visualisiert, so kann man nur vorwärts und rückwärts durch die Daten navigieren.
2.6.2 Zweidimensionale Daten
Geografische Daten sind ein typisches Beispiel für zweidimensionale Daten, die sich durch die Breite („latitude“) und die Länge („longitude“) als Dimensionen charakterisieren lassen. Obwohl es leicht erscheint, ein - und zweidimensionale Daten zu visualisieren oder darin zu navigieren, werden doch bei großen Datenbeständen Schwierigkeiten bemerkbar: Temporale oder geografische Daten werden unüberschaubar und der Anwender wird mit einem Datenüberfluss konfrontiert, was nicht zum Verständnis visualisierter Daten führt.
19
Information Visualization Grundlagen
2.6.3 N-Dimensionale Daten
Diese Daten sind von komplexer Natur und in den meisten Fällen in mehr als drei Dimensionen strukturiert. Deshalb erlauben diese Daten keine einfache Visualisierung wie zwei- oder dreidimensionale Daten. N-Dimensionale Datenmengen bestehen zumeist aus einer Menge unabhängiger Variablen oder Attributen. Für jedes dieser Attribute wird nun eine Dimension in Form einer Metapher (z. B. Farbe oder Größe des darzustellenden Elements) erstellt. Dadurch, dass kein einfaches Abbilden der Dimensionen auf eine zweidimensionale Darstellungsfläche möglich ist, müssen speziale Strategien geschaffen werden, die eine verständliche Repräsentation möglich macht. Aktienkurse oder Daten aus einer Volkszählung können als Beispiele für ndimensionale Daten betrachtet werden.
2.6.4 Hierarchien
Daten haben oft Beziehungen zueinander und Abhängigkeiten gegenüber anderen Datenbeständen. Durch diese Beziehungen und Abhängigkeiten der Daten entsteht eine komplexe Informationsstruktur, die sich leicht verständlich als hierarchische Struktur darstellen lässt. Als bekannte Metapher werden Hierarchiebäume verwendet, die sich in jedem Aufbau eines Dateisystems wiederfinden.
2.6.5 Textdokumente und Hypertext
Nicht alle Daten können mit Dimensionen beschrieben werden. Im Zeitalter des World Wide Web ist ein weiterer Datentyp wichtig geworden - Text und Hypertext. Diese Datentypen unterscheiden sich sehr stark und können so nicht einfach durch Zahlen und Formeln beschrieben werden. In den meisten Fällen werden diese Datentypen in eine vektoriale Größe umgerechnet, um sie besser visualisieren zu können.
20
Information Visualization Visualisierung hierarchischer Daten
3 Visualisierung hierarchischer Daten
3.1 Tree
Bäume oder Hierarchien sind die elementarsten Dateistrukturen in Computersystemen. Deshalb sind viele Visualisierungssysteme spezialisiert, um hierarchische Strukturen darzustellen.
Ein klassisches Tree-Layout besteht aus einer Menge von Knoten, die durch Kanten miteinander verbunden sind. Der Ausgangspunkt wird als Wurzel bezeichnet und steht im Anzeigefeld meist oben. Die Wurzel selber kann aus mehreren Teilbäumen bestehen. Jeder Knoten, der mit einem Knoten durch eine Kante verbunden ist, wird als Sohn oder Nachfahre bezeichnet. Bei Bäumen wird nach Stufen unterschieden: Die Wurzel befindet sich auf Stufe 0, während die Söhne oder Nachfahren des Knotens auf Stufe t, auf Stufe t+1 liegen ([Güt92]).
Hierarchien umfassen in Richtung der übergeordneten Stufe eine immer geringere Anzahl von Elementen pro Stufe. Die typische abstrahierte Darstellung von Hierarchien sind deshalb in zweidimensionaler Darstellung Dreiecke und in einer dreidimensionalen Darstellung Pyramiden. Abbildung 3 zeigt einen einfachen Hierarchiebaum:
Information Visualization Visualisierung hierarchischer Daten
Werden bei einer hierarchischen Dateistruktur viele Knoten verwendet, so werden einige Probleme deutlich. Die Übersichtlichkeit der einzelnen Elemente geht umso mehr verloren, je mehr Information dargestellt wird. Außerdem wird die Darstellungsfläche nur sehr gering ausgenutzt. Ein weiteres Defizit von Baumstrukturen ist die geringe Menge an Information, die ein Knoten über sich selbst liefert. Abbildung 4 verdeutlicht diesen Sachverhalt:
Abbildung 4: Probleme hierarchischer Darstellung ([Kaz96]).
3.2 Venn-Diagramm und Nested Treemap
Venn-Diagramme wurden 1880 von John Venn eingeführt. Diese Diagrammtechnik von Venn wurde ursprünglich entwickelt, um logische Zusammenhänge zu verdeutlichen. Sie repräsentiert im Allgemeinen Boole’sche Verbände und wird häufig in der Mengenlehre verwendet. Die Knoten in einem Venn-Diagramm werden entsprechend ihrer Wichtigkeit ineinander verschachtelt und als Ellipsen oder Kreise dargestellt. Die so entstehende topologische Anordnung der Ellipsen wird entsprechend der Nachfahren der Knoten rekursiv unterteilt ([Ven80]).
22
Information Visualization Visualisierung hierarchischer Daten
Werden nun anstelle der Ellipsen und Kreise, Rechtecke verwendet, wird die Darstellungsfläche dadurch besser genutzt. Werden bei dieser Darstellungsmethode die Knoten, die mindestens einen Nachfahren haben (innere Knoten), explizit dargestellt, so wird diese Methode Nested Treemap bezeichnet ([Shn91]). Sie ist gut geeignet, um kleine Hierarchien mit wenigen Hierarchieebenen darzustellen ([Joh91]).
Abbildung 6: Nested Treemap Darstellung von Abbildung 5 ([Shn91])
Die Darstellung der Zwischenräume zwischen den Elementen einer Hierarchieebene entspricht der expliziten Repräsentation der Zwischenknoten des Baumes. Sind keine Angaben zu den inneren Konten erforderlich, so
23
Information Visualization Visualisierung hierarchischer Daten
kann auf deren Darstellung gänzlich verzichtet werden. Dadurch ist eine weitere Verbesserung der Platzausnützung möglich.
Abbildung 7: Non-Nested Treemap Darstellung von Abbildung 6 ([Shn91])
Die Verschachtelung der Knoten wird dabei so vollzogen, dass keine Leerräume entstehen. Aufgrund der speziellen Platznutzung können größere Hierarchien dargestellt werden.
3.3 Tree-Map
Der Mensch hat die Fähigkeit, Bilder sehr gut erfassen und verarbeiten zu können. Das Entscheidende dabei ist, dass er in der Lage ist, Relationen von Elementen eines Bildes zu anderen Elementen zu erkennen. Auf dieser Kenntnis basiert die Idee der Tree-Maps.
Bei einer Tree-Map (Baumkarte) werden große, hierarchisch geordnete Informationsmengen visualisiert, wobei die Hierarchieebenen als ineinander geschachtelte Rechtecke dargestellt werden. Hierbei findet die gesamte zur Verfügung stehende Fläche für die Darstellung Verwendung. Diese Methode wurde von Ben Shneiderman und Brian Johnson entwickelt und erlaubt einen Überblick über die gesamte Dateistruktur eines Dateisystems. Jedes Verzeichnis und jede Datei wird als farbiges Rechteck abgebildet, wobei die Größe sich proportional zur Datei- bzw. Verzeichnisgröße verhält. Sind die Rechtecke farbig, so kann die Farbe unterschiedliche Dateitypen symbolisieren ([Shn91]).
24
Information Visualization Visualisierung hierarchischer Daten
Abbildung 8: Tree-Map Visualisierung eines Dateisystems mit 1500 Dateien
und 190 Verzeichnissen ([Tur92]).
Für die Zeichnung der Tree-Map Rechtecke hat Ben Shneiderman grundsätzliche Richtlinien festgelegt ([Shn91]):
• Die Gewichtung eines Knotens ist größer oder gleich groß der Summe der Gewichte der Kinder/Nachfolger des Knotens.
Tree-Maps können für viele Einsatzbereiche Anwendung finden. Die Tree-Map Methode ist eine gute Möglichkeit, um hierarchische Strukturen darzustellen. Der Anwender bekommt schnell einen Überblick und hat ferner einen schnellen Zugriff auf einzelne Informationen der Knoten.
25
Information Visualization Visualisierung hierarchischer Daten
3.4 Cone Trees und Cam Trees
Das Konzept der Cone Trees wurde erstmals 1991 vom XEROX PARC vorgestellt und ist Bestandteil des „Information Visualizer“, einem Programm, das Techniken zur Visualisierung von Informationen unterschiedlichster Art bündelt ([Rob93]).
Cone / Cam Trees stellen hierarchische Informationen auf einer Baumstruktur dar, die in drei Dimensionen ausgelegt ist. Liegt der Hierarchiebaum senkrecht im Darstellungsraum, so wird er Cam Tree bezeichnet. Diese Form der Darstellung ist sehr hilfreich, wenn zusätzlich Beschriftungen verwendet werden (siehe Abbildung 10).
Die räumliche Tiefe wird ausgenutzt, indem Kegelkreise teils im Vordergrund, teils im Hintergrund abgebildet werden. Die Elemente einer Hierarchieebene werden bei den Cone und Cam Trees entlang des Umfanges eines Kreises angeordnet ([Rob91]). Dadurch werden Knoten und Kanten der Kegel teilweise überlagert. Die dritte Dimension des Darstellungsraumes wird bestmöglich genutzt, indem die Kegel selbst transparent sind. Der Anwender hat außerdem noch Interaktionsmöglichkeiten, um lokale Details, sowie die gesamte Informationsstruktur zu betrachten.
26
Information Visualization Visualisierung hierarchischer Daten
Die Darstellung mittels Cone / Cam Trees ist bei steigenden Elementen einer Hierarchie begrenzt. Das Problem der Verdeckung einzelner Elemente von großen Hierarchien erschwert die Suche für den Anwender. In tieferen Schichten der Hierarchie kann der Anwender trotz der
Interaktionsmöglichkeiten leicht die Orientierung verlieren, da es so gut wie keine charakteristischen visuellen Anhaltspunkte gibt - ein Information Overload ist der Fall.
Alternative Methoden, um große Hierarchien darzustellen wurden von Jeromy Carriere und Rick Kazman entwickelt. Sie schlugen Erweiterungen zu Cone Trees mit dem Projekt fsviz vor, bei der sie allerdings von der Eigenschaft, alle Knoten und Kanten sichtbar zu lassen, abließen ([Car95]). Die Maximalzahl darstellbarer Elemente einer Hierarchie beläuft sich etwa auf 1000 Knoten. Mehr als 10 Stufen sollten nicht verwendet werden und ein Maximum des Knoten- bzw. Verzweigungsgrades von ca. 30 sollte gewährleistet sein, damit die Baumstruktur ohne Verstopfung dargestellt werden kann ([Tve93]). Mit Hilfe eines neuen Layoutalgorithmus und dem Verschmelzen von Teilbäumen zu Tetraedern, konnten nun theoretisch unendlich viele Knoten dargestellt werden.
Weitere Erweiterungen mit fsviz sind die direkte Manipulation der Position des Anwenders und automatische Animationen. Nicht nur der Anwender kann sich durch die Hierarchiestruktur hindurchbewegen, er kann auch einzelne Teilbäume rotieren, verschmelzen und wieder entfalten. fsviz ist außerdem mit semantischen Filtern versehen, die es dem Anwender erlauben, gewisse Teilbäume ein- und auszublenden.
27
Information Visualization Visualisierung hierarchischer Daten
3.5 Fractal Tree
Der Fractal Tree (Fraktale Baum) ist eine Erweiterung des Cone / Cam Tree-Konzepts. Die Besonderheit dieses Baumes liegt in der fraktalen Selbstähnlichkeit, d. h. ein Teil eines Objektes ist immer gleich wie das Objekt selbst. Dadurch lassen sich hierarchisch tiefe Informationsstrukturen visualisieren. Jedes Element wird um einen konstanten Faktor kleiner als das übergeordnete Element dargestellt. Wächst die Baumhöhe des fraktalen Baumes, so bleibt der Platzbedarf konstant. Somit ändern sich weder die Komplexität der Darstellung noch die Antwortzeit der Suchabfrage. Der Anwender muss sich während der Abfrage nicht an einen neuen Anblick gewöhnen. Er kann sich in tiefere Hierarchiestrukturen bewegen ohne dass sich die Darstellungsform ändert ([Koi93]).
Ein Vorteil gegenüber dem Cone / Cam Tree Konzept besteht darin, größere hierarchische Strukturen zu visualisieren. Abbildung 11 zeigt einen fraktalen Baum.
3.6 Hyperbolic Tree
Hyperbolische Ansichten, die in zwei- oder drei dimensionalen Informationsräumen implementiert werden können, bieten eine verzerrte Sicht der Hierarchiestruktur. Diese verzerrte Ansicht macht es möglich in sehr großen hierarchischen Strukturen zu interagieren ohne dabei den Überblick zu verlieren. Der Informationsraum wird dabei stark verdichtet.
28
Information Visualization Visualisierung hierarchischer Daten
Diese starke Verdichtung des Informationsraumes lässt sich durch eine Raumtransformation, beispielsweise den Übergang vom euklidischen zum hyperbolischen Raum erreichen ([Her00]). Werden Hierarchien im euklidischen Raum abgebildet, so wächst bei steigender Informationsmenge die Baumstruktur mit. Die Anzahl der Knoten wächst exponentiell mit der Baumhöhe. Beim hyperbolischen Baum (Hyperbolic Tree) wird die Hierarchie in einer hyperbolischen Ebene ausgebreitet und auf eine zweidimensionale, kreisförmige Fläche, dem euklidischen Einheitskreis projiziert. Wird die Projektion in einem dreidimensionalen Raum durchgeführt, erfolgt die Abbildung in den Einheitsball des euklidischen Raumes ([Mun97]). Die Wurzel des Baumes befindet sich zunächst in der Mitte des Anzeigefeldes. Der Anwender kann beliebige Zweige auswählen, die dann in den Mittelpunkt verschoben werden. Der hyperbolische Baum hat die Eigenschaft, dass die Knoten immer kleiner und verzerrter werden, je weiter sie vom Mittelpunkt entfernt sind. Außerdem wächst die Anzahl der Knoten, je größer der Abstand zum Mittelpunkt ist. Beim hyperbolischen Baum sind die Väter-, Söhne- und Nachbarknoten stets sichtbar. Somit gibt es keine Überschneidung der Kanten.
3.7 Information Cube
Mit dem Information Cube werden große hierarchische Informationsstrukturen visualisiert. Die Hierarchieebenen werden durch ineinander geschachtelte Quader dargestellt, wobei die Ebenentiefe durch die Transparenz der Quader
29
Information Visualization Visualisierung hierarchischer Daten
festgelegt wird. Die oberste Hierarchieebene wird als äußerster Quader dargestellt. Die Halbtransparenz dieser Ebene bewirkt, dass nachfolgende Ebenen noch sichtbar sind, fernliegende und tiefere Ebenen werden aber dadurch verdeckt. Jede Ebene wird durch einen Schriftzug an einer Seite des Quaders gekennzeichnet ([Rek93]).
Abbildung 13: Visualisierung mittels Information Cube ([Rek93])
Der Anwender hat die Möglichkeit die ganze Informationsstruktur interaktiv durch Rotieren des Quaders zu betrachten und einzelne Ebenen im Detail zu untersuchen und zu selektieren. Er kann frei im Raum navigieren. Durch die Verdeckung tieferer Ebenen wird verhindert, dass die Informationsdichte für den Anwender zu hoch wird.
30
Information Visualization Visualisierung eindimensionaler Daten
4 Visualisierung eindimensionaler Daten
4.1 Perspective Wall
Die Perspective Wall Visualisierung basiert auf dem Konzept, lineare Informationsstrukturen, die entweder chronologisch oder in alphabetischer Reihenfolge angeordnet sind, an einer virtuellen Wand darzustellen. Die außerhalb des Fokusbereiches liegenden Teile der Wand werden perspektivisch verzerrt und nach hinten abgebildet. Die Darstellungsfläche wird dabei effektiver genutzt als bei der klassischen flachen Darstellung. Die Wand selber ist vertikal in mehreren Flächen unterteilt, wobei die Flächen untereinander korrelieren können ([Mac91]).
Im Verlauf eines Information Retrieval Systems können die relevanten Resultate zusammenhängend und gleichzeitig dargestellt werden. Während die Länge der Wand praktisch unbeschränkt ist, ist die Höhe äußerst begrenzt. Für lineare Daten ist die Perspective Wall eine zweckmäßige Lösung.
31
Information Visualization Visualisierung eindimensionaler Daten
4.2 Information Corridor
Abbildung 15: Information Corridor Visualisierung (Quelle:
http://www.arch.columbia.edu/DDL/research/patent)
Der Information Corridor ist, ähnlich wie die Perspective Wall, für lineare, eindimensionale Informationsstrukturen geschaffen. Die zu durchsuchende Datenbank wird dabei in Form von Karteikarten in einem architektonischen Raum, dem Korridor, dargestellt. Eine Beschilderung an der Decke gibt die Titel der dargestellten Dokumente wieder. Der Anwender hat die Möglichkeit, sich durch den Korridor zu bewegen und einzelne Karteikarten näher zu betrachten, indem er das gewünschte Dokument in die Mitte zieht ([Mui97]). Je mehr Dokumente die Datenbank umfasst, desto länger wird der Korridor. Diese Visualisierungstechnik eignet sich daher nur für kleinere lineare Informationsstrukturen. Dem Anwender ist es auch nicht möglich einzelne Strukturelemente der Datenbank zu isolieren, um so sinnverwandte Dokumente zusammenzufassen.
4.3 Spiral
Diese Visualisierung wurde von dem Informationsdesigner Martin Wattenberg entwickelt. Jedes Textdokument einer Datenbank wird als Stern in einer spiralförmigen Zeitlinie dargestellt. Der Ort, an dem der Stern in der Spirale steht, bestimmt den Zeitpunkt an dem das Dokument der Datenbank hinzugefügt wurde. Je öfter das Dokument gelesen wurde, desto heller
32
Information Visualization Visualisierung eindimensionaler Daten
erscheint es in der Spirale. Mittels einer Scroll-Bar an der Seite kann der Anwender sich in der Zeit vorwärts und rückwärts bewegen.
Information Visualization Visualisierung n-dimensionaler Daten
5 Visualisierung n-dimensionaler Daten
Eine abstrakte multidimensionale Datenstruktur, kann zwar mathematisch ndimensional beschrieben, aber nur dreidimensional visualisiert werden. Dadurch ergeben sich besondere Problemstellungen und die Notwendigkeit, visuelle Metaphern zu benutzen, die der Anwender auch verstehen kann. Sind erst einmal richtige Metaphern gefunden, so müssen besondere Methoden geschaffen werden, damit der Anwender mit der visualisierten Darstellung interagieren kann. Um einen Einblick in das Gebiet der Visualisierung multidimensionaler Daten zu geben, sollen im folgenden beispielhaft einige Techniken, die für die Visualisierung von Datenbanken geeignet sind, vorgestellt werden.
5.1 Methoden
Um n-dimensionale Daten zu visualisieren, wurden mehrere Methoden entwickelt ([Weg97]):
• Reduction of Dimension
Das Problem des multidimensionalen Informationsraumes kann durch die Reduktion der Dimensionen oder durch die Reduktion der
Informationsstruktur erreicht werden. Dabei wird das Problem auf kleinere Segmente, sogenannte Unterräume, verteilt. Sind die Unterräume bestimmt, werden für sie nunmehr kleinere Informationseingaben nötig sein als bei ungeteiltem Informationsraum. Diese „divide-and-conquer“-Technik benötigt allerdings noch eine zusätzliche Verarbeitungsebene, um die Ergebnisse der Unterräume zu kombinieren.
• Projection Pursuit
Mathematisch-statistische Verfahren wurden in den letzten Jahrzehnten immer wichtiger. Zur Erforschung unbekannter Sachzusammenhänge in Daten von enorm hohen Dimensionen und immer komplexerer Abhängigkeitsstruktur sind neue Methoden entwickelt worden. Mit den Projection Pursuit Methoden wird versucht, die Daten so zu projizieren, dass eine Strukturerkennung möglich ist. Da es unzählige Möglichkeiten gibt, multidimensionale Daten auf einer zweidimensionalen Darstellungsfläche zu projizieren, zielen die Projection Pursuit Methoden auf ein automatisches Finden der interessanten und wichtigen Bereiche der Daten. Zumindest sollten sie dem Anwender helfen diese Bereiche zu finden.
34
Information Visualization Visualisierung n-dimensionaler Daten
• Attribute Mapping
Das Attribute Mapping ist eine beliebte Methode, um multidimensionale Daten zu visualisieren. Hierbei werden einfache geometrische Primitive mit Hilfe von ein- oder zweidimensionalen Gittern gebildet. Die Attribute dieser geometrischen Primitiven werden benutzt, um die Variablen darstellten zu können. Meist wird die Farbe als Attribut der Geometrien verwendet. Die Farbcodierung ist für den Menschen leicht zu verstehen, da sie im täglichen Leben oft vorkommt. Es fällt aber nicht immer leicht die Zugehörigkeit der Farbe zu den Werten des Attributs zu finden. Deshalb sollte man sich auf höchstens zwei Farben beschränken.
• Geometric Coding
Beim Geometric Coding werden auf einem Gitter Objekte angeordnet, deren geometrische Eigenschaften zur Darstellung von Variablen verwendet werden. Das Gitter kann zwei- oder dreidimensional sein.
• Parallel Coordinates
Hier werden die Dimensionen durch parallele Achsen in vertikaler und horizontaler Richtung dargestellt, die durch Punkte auf den Achsen ihre Wertigkeit bekommen.
• Hierarchische Koordinatensysteme
Ziel der hierarchischen Koordinatensysteme ist, sowohl Übersicht und Trends multidimensionaler Daten zu repräsentieren. Außerdem ist die Möglichkeit, Detailaussagen über die Daten zu machen, von besonderer Bedeutung.
5.2 Reduction of Dimension
5.2.1 Focusing
Focusing beschreibt jene Methoden, die dargestellten Daten auf einen bestimmten Bereich zu beschränken. Diese Techniken können das Selektieren von Unterräumen oder Veränderungen an der dargestellten Informationsstruktur umfassen. Das Focusing kann automatisch erfolgen, interaktiv vom Anwender verwendet oder in Kombination miteinander vorkommen. Ein Beispiel für automatisches Focusing bietet das Exploratory Projection Pursuit das von Friedman und Tukey vorgestellt wurde ([Fri74]).
35
Information Visualization Visualisierung n-dimensionaler Daten
5.2.2 Linking
Beim Focusing wird nur ein Teil der Daten dargestellt. Es fällt also schwer Zusammenhänge der Informationen zu verstehen, wenn nur eine Teilansicht möglich ist. Um dieses Problem zu lösen, werden mehrere Ansichten, Multiple Views, dargestellt. Jedoch sollten die Multiple Views nicht einzeln, sondern in Verbindung (Linking) verschiedener Ansichten betrachtet werden, da bessere Einsichten in die Struktur möglich sind. Die Informationen in den einzelnen Ansichten können dem Anwender ein verständliches Bild von der Informationsstruktur als Ganzes geben.
Wie nun die Ansichten verbunden werden hängt von der Art und Weise ab, wie sie dargestellt werden. Sie können zeitlich versetzt oder gleichzeitig und parallel erscheinen.
Eine zeitliche Verbindung der Ansichten wird durch eine weiche Überblendung von einer Position zur nächsten Position der Elemente verdeutlicht. Die einzelnen Ansichten werden überblendet, damit der Anwender den Sprung zur nächsten Ansicht leichter versteht. Beispiele dieser Art des Linking sind rotierende dreidimensionale Punktwolken. Allgemein gesehen, kann jede Animation als eine Anzahl von überblendeten multiple views betrachtet werden, die sich auf einen zeitlichen Rahmen verteilen. Ansichten, die gleichzeitig und parallel dargestellt werden, heißen Simultaneous Multiple Views. Diese Ansichten werden durch Linien verbunden. Die Linien selbst stellen die Verbindung von Punkten dar, die in den anderen Ansichten den gleichen Punkte entsprechen. Beispiele dafür sind Parallele Koordinaten, die in Kapitel 5.5 näher erläutert werden.
5.2.3 Brushing
Mit Hilfe des Brushing hat der Anwender eine Vielzahl von Manipulations- und Interaktionsmöglichkeiten um n-dimensionale Informationsstrukturen zu erkunden. Das Selektieren eines Unterraumes geschieht durch Hervorheben der Daten oder durch Löschen nicht benötigter Unterräume. Man kann bestimmte Bereiche maskieren und das Brushing enthält eine Speicherfunktion für vorherige Tätigkeiten des Anwenders (History). Eine Form des Linking findet sich auch hier: werden Brushing-Parameter von einer Ansicht zur anderen übertragen, so spricht man von einem Linked Brushing ([War97]).
Das Prinzip des Brushing wurde erstmals von Becker und Cleveland entdeckt ([Bec87]). Sie implementierten es in ein n-dimensionalen System, bei dem der Anwender eine rechteckige Region aus einer zweidimensionalen Darstellung markieren und sie entsprechend bearbeiten konnte. Die direkte Manipulation, also die Möglichkeit des Anwenders, eine interaktive Kontrolle über das Brushing zu haben während das System ein sofortiges Feedback über die
36
Information Visualization Visualisierung n-dimensionaler Daten
Handlungen des Anwenders wiedergibt, ist eine essentielle Komponente des Brushing. Das Brushing wurde soweit überarbeitet, dass die Interaktionsmöglichkeiten dieselbe Dimension besitzen können wie die Daten ([Mar95], [War94]).
5.2.4 Slicing
Slicing ist eine Technik, bei der Schnitte der Informationsstruktur dargestellt werden. Die Schnitte können achsen-parallel auf reguläre Gitter erfolgen, also horizontal und vertikal.
5.3 Projection Pursuit
Für die Projection Pursuit Technik (Projektionstechniken) werden verschiedene Methoden definiert ((Buc95], [Kei95], [Bis93]).
5.3.1 Grundlegende Methoden
• Principal Component Analysis Die zentrale Idee der Principal Component Analysis
(Hauptkomponentenanalyse) ist eine Reduktion der Dimension einer Menge an Mustern, die aus einer großen Anzahl von untereinander unabhängigen Punkten im hochdimensionalen Raum besteht. Dabei soll möglichst wenig der durch die Muster gegebenen Varianz verloren gehen. Dies wird durch eine lineare Transformation auf eine neue Menge von Mustern erreicht. Zudem sind sie so geordnet, dass die ersten Variablen die größte Varianz aller ursprünglichen Variablen repräsentieren; diese werden dann als Hauptkomponenten bezeichnet.
• Faktorenanalyse
Die Faktorenanalyse ist eigentlich in der mathematischen Statistik beheimatet, findet jedoch in vielen anderen Bereichen und Disziplinen Verwendung. Ziel dieses Verfahrens ist die Strukturierung umfangreicher Datenmengen und die Herleitung von Faktoren oder Dimensionen, welche die vorgegebenen Daten hinsichtlich ihrer Variation erklären können. Wichtiges Ziel ist es dabei, mit möglichst wenig Faktoren den Hauptanteil an Variation der Merkmale zu erklären.
37
Information Visualization Visualisierung n-dimensionaler Daten
• Clusteranalyse
Auch die Clusteranalyse soll wie die Hauptkomponentenanalyse zur Mustererkennung beitragen. Das Ziel es, mit Hilfe der Clusteranalyse Strukturen in Daten zu erkennen. Im Bereich der Information Visualization wird die Clusteranalyse insbesondere für Methoden zur Vor- und Nachverarbeitung aus dem Kontext des Data Mining verwendet. Bei der Clusteranalyse werden zwischen Supervised und Unsupervised Learning Algorithmen unterschieden. Bei Supervised Learning Algorithmen hat man Kenntnis über die Ausprägungen der erzeugenden Variablen, das bedeutet der Algorithmus steht in stetiger Interaktion mit seiner Umgebung. Ein Unsupervised Learning Algorithmmus dagegen kann ohne oder mit Kenntnis über die Ausprägungen der zu erzeugenden Variablen arbeiten. Beispiele zur Clusteranalyse finden sich im Kapitel 6.4. ff.
• Multidimensionales Skalieren
Multidimensionales Skalieren (Multidimensional Scaling, MDS) basiert auf einer Matrix von Distanzen. Anhand dieser Distanzen wird eine Graphik konstruiert, welche die Relation der Daten zueinander darstellt. Das Ziel des Multidimensionalen Skalieren ist die Beziehungen zwischen Algorithmen und Ähnlichkeiten in Datenkollektionen aufzuzeigen. Erreicht wird das durch das Skalieren der Variablen. Man versucht, die Datenstruktur auf gleichgewichtige Datenkollektionen zu reduzieren.
5.3.2 Scatterplots
Bei der Scatterplot Visualisierung werden die Datenelemente als Punkte in einem zwei- oder dreidimensionalen Koordinatensystem dargestellt. Es werden n-te Tupel (Datensätze) generiert und in das Koordinatensystem übertragen. Zusammenhänge zwischen metrischen Variablen können so leicht erfasst werden. Wenn keinerlei Beziehung zwischen den dargestellten Variablen vorhanden ist, ergibt sich eine undifferenzierte Punktwolke. Diese Punktwolken weisen im Allgemeinen unterschiedliche „Steigungen“ und „Streuungen“ auf. Sind beide jedoch korreliert, so kann eine bestimmte Richtung, in die die Punktwolke geformt ist, ausgemacht werden. Bei perfekter Korrelation wären alle Punkte auf einer Geraden angeordnet. Da Daten mit mehr als drei Dimensionen nicht direkt visualisiert werden können, muss man sich auf die Verwendung von Projektionen beschränken. Die Datenelemente werden mit einer Orthogonalprojektion auf eine aus jeweils zwei Koordinatenachsen gebildete Fläche dargestellt und diese so erzeugten Flächen in einer Matrixanordnung projiziert ([Cle93]).
38
Information Visualization Visualisierung n-dimensionaler Daten
Abbildung 17: Scatterplot Darstellung vierdimensionaler Daten ([War97])
Jede Reihe und jede Spalte der Matrix entspricht genau einer Dimension der Daten, so dass alle Tupel von Dimensionen in Matrixform angeordnet visualisiert werden können. Der Aufbau der Matrix entspricht dem Aufbau einer Korrelationsmatrix, allerdings sind die einzelnen Datenelemente Grafiken.
5.3.3 Hyperslice
Das zentrale Konzept von Hyperslice ist die Darstellung einer multidimensionaler Funktion als eine Matrix von orthogonalen
zweidimensionalen Feldern. Da der Anwender auf einen einzelnen ndimensionalen Punkt fokussiert wird bei der Hyperslice Darstellung ein Point Of Interest c= (c 1 , c 2 ,..., c n ) definiert. Die Weite dieses Fokus besteht aus skalaren Variablen. Es werden nur die Daten innerhalb des Fokus in der Matrix dargestellt. Daten außerhalb der Fokuspunktes werden nur gezeigt, wenn sich der Fokuspunkt zu den Daten hin verschiebt. Genauso wie bei der Scatterplot Darstellung, wird ein Feld im Koordinatensystem durch die horizontale und vertikale Achse bestimmt.
39
Information Visualization Visualisierung n-dimensionaler Daten
Abbildung 18: Fünfdimensionale Hyperslice Darstellung ([Won97])
Ein großer Vorteil der Hyperslice Darstellung gegenüber der Scatterplott Darstellung ist die Möglichkeit, um einen voher definierten Fokuspunkt interaktiv navigieren zu können. Der Anwender kann den Fokuspunkt beliebig neu definieren, indem er den Fokuspunkt auf ein anderes Feld zuweist ([Won97]).
5.4 Geometric Coding
5.4.1 Glyphs
Glyphs gehören zur Familie der Iconography. Sie werden eingesetzt um Datenwerte auf graphische Attribute abzubilden. Jedes multidimensionale Datenelement wird durch ein Glyph dargestellt.
Bei Star Glyphs werden die Datenwerte von jeder Dimension auf die Längen von Linien aufgespannt. Jede Linie hat den gleichen Ursprung und breitet sich radial von der Mitte aus. Die Endpunkte der Linien werden verbunden, um ein Polygon zu bilden.
40
Information Visualization Visualisierung n-dimensionaler Daten
Eine andere Art Glyphs sind Sticky Figures (Strichmännchen). Entwickelt wurden sie von Picket und Grinstein ([Pic95]). Diese Sticky Figures bestehen aus einer Basislinie an deren Enden weitere Linien angefügt werden. Die Winkel der Basislinie zur Vertikalen und die Winkel der angefügten Linien zur Basislinie stellen die Variablen dar. Andere Variablen können die Länge, Dicke und Farbe der Linien darstellen.
5.4.2 Chernoff Faces
Bei dieser geometrischen Kodierung werden Gesichter benutzt, um Trends in multidimensionalen Daten zu illustrieren. Da der Mensch sehr gut in der Lage ist, Gesichter zu interpretieren und es ihm leicht fällt, Gesichtsausdrücke und deren Emotionen wahrzunehmen, ist diese Metapher ein simpler aber
41
Information Visualization Visualisierung n-dimensionaler Daten
effektiver Weg, um aus den Daten Trends herauszulesen. Diese Methode wurde von Chernoff entwickelt ([Che73]). Die Größe, Form und Abstände zwischen den Teilen des Gesichtes repräsentieren die Ausmaße der einzelnen Variablen (siehe Abbildung 21).
5.4.3 Hyperbox
Eine Hyperbox ist eine zweidimensionale Darstellung einer n-dimensionalen Box. Eine n-dimensionale Hyperbox besteht aus n² Linien und n*(n-1)/2 Flächen. Jede Linie einer Hyperbox besitzt n-1 Linien mit der gleichen Länge und Orientierung. Ausgehend von einem Punkt werden die Achsen für die Koordinaten in einem maximalen Winkel von weniger als 180 Grad angeordnet ([Alp91]). Die Länge und Winkel der Linien sind frei wählbar. Linien mit der gleichen Länge und Orientierung bilden ein Direction Set (Richtungsreihe). Die Linien 1 - 5 und I - V in Abbildung 22 zeigen jeweils ein Direction Set. Es werden fünf Variablen x, y, z, w und u in jeweils eine Richtung dargestellt (siehe rechte Seite von Abbildung 22). Jede Fläche der Hyperbox kann nun als Vergleichselement für zwei Variablen gesehen werden (siehe graue Flächen in Abbildung 22).
42
Information Visualization Visualisierung n-dimensionaler Daten
5.5 Parallele Koordinaten
Parallele-Koordinaten Visualisierung wurde von Inselberg zur Darstellung multidimensionaler Datensätze entwickelt. Ein n-dimensionaler Raum wird mit n Achsen, die parallel zur Bildschirmachse liegen, dargestellt. Jede Achse repräsentiert ein Merkmal und ist linear skaliert; vom Minimum- bis zum Maximumwert der Dimension. Der Datensatz wird durch einen Polygonenzug abgebildet der jede Achse in dem Punkt schneidet, dessen Wert der jeweiligen Dimension entspricht ([Ins95]).
Die Parallele-Koordinaten-Visualisierung erlaubt die Abfragung spezieller Eigenschaften der Daten, indem man Muster vergleicht, die durch die Polylinien erzeugt werden. Obwohl die Grundidee der Parallelen Koordinaten-Technik einfach ist, ermöglicht sie das Erkennen eines weiten Spektrums von Datencharakteristika, wie z.B. verschiedene Datenverteilungen und funktionale Abhängigkeiten. Wegen der Überlappungen der Linien ist jedoch die Anzahl der Datensätze, die gleichzeitig visuell darstellbar ist, stark begrenzt.
43
Information Visualization Visualisierung n-dimensionaler Daten
Die Extruded Parallel Coordinates sind eine Erweiterung der Parallelen Koordinaten. Bei dieser Methode werden die Punkte nicht nur auf der horizontalen und vertikalen Achse platziert. Das ganze parallele Koordinatensystem wird entlang der dritten Raumachse verschoben. Werden die Polylinien mit jeweils zwei aufeinanderfolgenden Achsen-Sets verbunden, entstehen Polygone zwischen den Achsen. Abbildung 24 veranschaulicht diesen Sachverhalt ([Ins90]).
Information Visualization Visualisierung n-dimensionaler Daten
Eine andere Art der Parallelen Koordinaten beschreibt die Three-dimensional Coordindates. Im Unterschied zu den Parallelen Koordinaten liegen nicht alle n Dimensionen in einer Ebene, sondern können auf verschiedene Ebenen aufgeteilt werden. Auf jeder dieser Ebenen werden wieder zweidimensionale Polylinien erzeugt und durch die Kombination aller Ebenen und der Darstellung der Verbindungsflächen entsteht das Gesamtbild ([Ins90]).
Abbildung 25: Three-dimensional Coordindates ([Weg97])
Die Ebenen können frei im Raum positioniert werden. Für die Darstellung weiterer Dimensionen können weitere Ebenen hinzugefügt werden. Sind jedoch zu viele Ebenen im Raum wird die Oberfläche der Verbindungsflächen sehr komplex und unübersichtlich.
5.6 Hierarchische Koordinatensysteme
5.6.1 Hierarchische Achsen
Um einen dreidimensionalen euklidischen Raum zu beschreiben, werden gewöhnlich drei orthogonale Achsen benutzt. Hierarchische Achsen dagegen bleiben auf die x-Koordinatenachse beschränkt. Jedoch werden sie mehrfach belegt, um dadurch mehrere Skalen hierarchisch ineinander verschachtelt darstellen zu können. Sind die Achsen erst einmal definiert, wird die Darstellungsart der Achsen gewählt ([Mih91]).
45
Information Visualization Visualisierung n-dimensionaler Daten
Abbildung 26: Links: Orthog. Achsen Rechts: Hierarchische Achsen
([Won97])
Die grafische Zuordnung der einzelnen Variablen zu den jeweiligen hierarchischen Achsen kann mittels der Histogram Plot Darstellung erreicht werden. Die Höhe der Histogram Plot Darstellung resultiert aus der Summe aller z Variablen, während die Variablen x und y durch die horizontale Achse, sprich die Breite, beschrieben werden. Die Summierung der Variablen ist jedoch nur eine von vielen Möglichkeiten, um die hierarchische Achsen darzustellen.
Abbildung 27: Histogram Plot Darstellung der hierarchischen Achsen
([Won97])
5.6.2 Dimensional Stacking
Die Dimensional Stacking Methode ist in gewissem Maße eine Verallgemeinerung der Hierarchischen Achsen. Ein n-dimensionaler Datenraum wird in jeweils zweidimensionale Unterräume geteilt, die ineinander geschachtelt dargestellt werden ([LeB09]).
46
Information Visualization Visualisierung n-dimensionaler Daten
Es werden zwei Variablen auf der horizontalen und vertikalen Achse dargestellt, die ein Gitter bilden. Die Koordinatenachsen werden in Bereiche gleicher Größe unterteilt. Innerhalb jeder Zelle des Gitters werden die nächsten zwei Variablen wieder den Koordinatenachsen zugeordnet. Dieses Prinzip ist auf die beschriebene Art und Weise beliebig rekursiv wiederholbar. Allerdings wird bei einer hohen Anzahl von Rekursionsstufen die interpretierbare Darstellung schwierig. So sollten die wichtigen Variablen auf die äußeren Rekursionsstufen dargestellt werden.
Ein wichtiger Vorteil des Dimensional Stacking gegenüber der hierarchischen Achsen Methode besteht darin, dass keine weitere Funktion, wie beispielsweise die Summierung, benötigt wird, um die Daten darzustellen ([Won97]).
5.6.3 Worlds within Worlds
Um Daten mit mehr als drei Dimensionen darstellen zu können, werden bei dieser Methode verschiedene Koordinatensysteme ineinander platziert. Die Koordinatensysteme können ein-, zwei- oder dreidimensional sein. Besitzt es drei Achsen, so bekommt das äußerste Koordinatensystem drei Variablen zugewiesen. Die nächsten drei Variablen werden dem nachfolgendem inneren Koordinatensystem zugeteilt. Dieser Vorgang ist beliebig oft wiederholbar. Innerhalb des innersten Koordinatensystems wird ein Höhenfeld dargestellt.
47
Information Visualization Visualisierung n-dimensionaler Daten
Die Werte für einen bestimmten Punkt des Höhenfelds ergeben sich durch seine Position innerhalb des inneren Koordinatensystems, in dem er sich befindet. Durch die Position des Ursprung des inneren Koordinatensystems, in dem sich der Punkt befindet, werden die restlichen Variablen des Punktes bestimmt. Eine beliebte Methode, um die Komplexität einer
multidimensionalen Informationsstruktur zu reduzieren, ist eine oder mehrere unabhängige Variablen konstant zu halten. Die geschieht auch bei der Worlds within Worlds Methode: Die Variablen des äußeren Systems bleiben innerhalb des inneren Koordinatensystems konstant. Dadurch wird die Komplexität des ganzen Systems reduziert, da alle Variablen des äußeren
Koordinatensystems konstant gehalten werden. Innerhalb des inneren Systems werden demnach nur Ausschnitte der Datenstruktur in dreidimensionaler Darstellung gezeigt. Durch Verschiebung des Ursprungs des inneren Koordinatensystems können die Ausschnitte verändert werden. Der Anwender hat bei der Worlds within Worlds Methode direkte dreidimensionale Interaktionsmöglichkeiten. Die Inneren Systeme können beliebig skaliert, rotiert und verschoben werden, ohne jedoch auf die Daten Einfluss zu nehmen. Dadurch wird dem Anwender das Betrachten und Untersuchen der Daten erleichtert ([Fei90]).
Abbildung 29: Worlds within Worlds Darstellung ([Won97])
48
Information Visualization Navigation und Interaktion
6 Navigation und Interaktion
Damit der Anwender alle dargestellten Informationen sinngemäß verstehen kann, muss er die Möglichkeiten zur Navigation und Interaktion durch die visualisierte Datenstrukturen haben.
6.1 Zoom und Pan
Zoom und Pan sind traditionelle Werkzeuge der Visualisation. Sie sind unabdingbar bei der Erkundung großer grafischer Strukturen. Beim Pan wird die Darstellungsfläche durch Drag and Drop in verschiedene Richtungen bewegt. Beschrieben wird Pan durch das einfache Justieren der Darstellungsfläche und dem Wiederaufbau des Inhalts mittels einer internen Repräsentation der gesamten Darstellung ([Her00]). Zoomen kann drei Formen haben: geometrische Zoomen, semantisches Zoomen und das Fisheye Zoomen. Während bei geometrischem Zoomen einfach ein Teil der grafischen Darstellungsfläche vergrößert wird, erfährt der Anwender beim semantischen Zoomen mehr Informationen und Details über das Zoomobjekt. Das geometrische Zoomen erlaubt dem Anwender eine bestimmte Region zu fokussieren, alle Informationen außerhalb der gezoomten Region werden ausgeblendet. Das Fisheye Zoomen ist ähnlich aufgebaut wie geometrisches Zoomen mit der Ausnahme, dass neben der zu untersuchenden Region alle Informationen für den Anwender sichtbar bleiben. Diese Technik wird beispielsweise bei den hyperbolischen Bäumen verwendet.
Obwohl das Konzept der Zoom- und Panwerkzeuge relativ einfach zu handhaben ist, treten Probleme bei interaktiven Visualisierungsumgebungen auf. Konzentriert sich beispielsweise der Anwender auf eine Region der Visualisierung und möchte nun auf eine andere Region springen, wird dies ohne Auszoomen, die Region mittels Pan auswählen und dann wieder Einzoomen nicht funktionieren, da bei großen Strukturen der Überblick fehlt ([Her00]).
George W. Furnas und Benjamin B. Bederson ([Fur98]) haben sich zu diesem Problem eine Lösung ausgedacht. Die Idee ist, einen abstrakten Raum zu definieren und viele Kopien des zwei dimensionalen Bildes zu generieren: das Space-scale Diagramm. Jede Kopie zeigt eine mögliche Vergrößerung des Ursprungsbildes und wird in eine invertierte Pyramide eingeschrieben (siehe Abbildung 30). Während die horizontalen Achsen die originalen Raumdimensionen beschreiben, steht die vertikale Achse für den Skalierungsfaktor. Wird ein Punkt vom Originalbild betrachtet, so entsteht
49
Information Visualization Navigation und Interaktion
durch die Vergrößerung ein Strahl. Der Strahl beginnt am Ursprung und wandert zum entsprechenden Punkt durch alle möglichen Vergrößerungen des Bildes. Der Anwender hat also immer einen Bezug zur vergrößerten Region und des entsprechenden Punktes des Originalbildes. Wird von einer gezoomten Region in eine andere gesprungen, so sollte dies automatisch geschehen. Es wird daher ein Anfangspunkt und ein Endpunkt definiert. Da der Zoom logarithmisch aufgebaut ist, ist der „kürzere“ Weg erst das Auszoomen und dann in die gewünschte Regionen hineinzoomen. Der alleinige Einsatz des Pan-Werkzeugs würde nicht ausreichend genug sein, um schnell zum Endpunkt zu gelangen.
Das oben angesprochene Problem wird von Furnas und Benderson nicht nur gelöst, das Prinzip der Space-scale Diagramme findet auch beim semantischen Zoomen Anwendung ([Fur98]). Anstelle der Vergrößerungen des Originalbildes werden beim semantischen Zoomen einzelne Details des jeweiligen Informationsobjektes sichtbar. Abbildung 31 verdeutlicht diesen Sachverhalt.
50
Information Visualization Navigation und Interaktion
6.2 Fokus und Kontext
Andere Wege, dem oben angesprochenen Problem des Zoomens entgegenzuwirken, bieten verschiedenste Techniken für den Fokus und Kontext einer Visualisierung.
Bei der Fokus-und-Kontext-Technik wird dem Anwender die Möglichkeit gegeben, von einer Informationsebene gewisse Teile vergrößert darzustellen ohne, dass dabei wichtige Informationen ausgeblendet werden. Der Fokusder Bereich, der besonders wichtig für die Fragestellung ist - wird in einer Umgebung, dem Kontext, visualisiert. Dieses Konzept dient dazu, sich besser auf relevantes konzentrieren zu können.
6.2.1 Fisheye View
Das Konzept der Fisheye-Ansicht wurde erstmals von George W. Furnas eingeführt ([Fur86]). Er untersuchte, ob Denkvorgänge und geistige Repräsentationen großer Strukturen in unseren Köpfen dieselben Vorgangsweisen haben, wie sie bei den Fokus-und-Kontext-Techniken zu finden sind. Ausgehend von der Erfahrung, dass viele Ansichten von Strukturen diesen Fokus- und Kontext-Charakter besitzen, folgerte Furnas, dass dieses Prinzip auch für Visualisierungen mit hoher Informationsdichte von Vorteil sein könnte. Er führte den Begriff fisheye view (Fisheye-Ansicht) ein.
51
Information Visualization Navigation und Interaktion
Die Fisheye-Ansicht imitiert den Linseneffekt von Fischaugen. Die Region, die der Anwender näher untersuchen möchte, wird größer dargestellt während der Rest der Informationen verkleinert am Rand abgebildet und verzerrt wird. Je größer die darzustellende Informationsstruktur ist, desto mehr Aufwand ist zu ihrer Erschließung notwendig. Bereiche, die von vergleichsweise geringem Interesse sind, werden daher weggelassen oder auf ihre wesentlichen Bestandteile reduziert.
Abbildung 32: Informationsstruktur ohne Fisheye-Verzerrung ([Sar92])
Abbildung 33: Informationsstruktur mit Fisheye-Verzerrung ([Sar92])
52
Information Visualization Navigation und Interaktion
6.2.2 Degree of Interest (DOI)
George W. Furnas ging davon aus, dass die visualisierten Informationsstrukturen aus Einheiten oder Knoten bestehen. Diese Einheiten bekommen durch eine Degree-of-Interest-Funktion (DOI) einen
dimensionslosen Wert zugeordnet. Dadurch lässt sich entscheiden, welche Einheit wichtig in der Darstellung ist und welche nicht. Die DOI-Funktion besteht aus zwei Komponenten:
• API: Jedem Element wird eine Wichtigkeit, die a priori importance (API), zugeordnet. Der API-Wert einer Einheit wird einmalig festgelegt. Er bildet den statischen Teil der DOI-Funktion.
• Distanzwert: Eine Funktion D(x,y), die den Abstand zwischen Fokuspunkt y und der Einheit x beschreibt.
Die Wichtigkeit einer Einheit berechnet sich laut Furnas folgendermaßen:
Eine einfache Methode, um mit der DOI-Funktion eine geeignete Darstellung zu gewinnen, ist die Verwendung eines Schwellwertes ([Fur86]). Der zu Verfügung stehenden Darstellungsfläche werden die nach Wichtigkeit geordneten Einheiten, der Menge der darzustellenden Einheiten hinzugefügt, bis die gesamte Darstellungsfläche vollständig belegt ist. Einheiten, die unterhalb des Schwellwertes liegen, werden nicht dargestellt. Mit zunehmender Distanz zum Fokuspunkt einer Einheit nimmt die Wichtigkeit der Einheit ab. Diese Wichtigkeit ist aber nur von einem Fokuspunkt abhängig. Gibt es mehrere Fokuspunkte, so können diese unterschiedliche Wichtungen besitzen. Außerdem sollte man zwischen semantischer und visueller Distanz unterscheiden ([Noi93]).
6.2.3 Document Lens
Bei dieser Fokus-und-Kontext-Technik wird die Metapher des
Vergrößerungsglases verwendet. In einem rechteckigen Ausschnitt in der Mitte der Darstellungsfläche wird der Inhalt eines Dokumentes vergrößert dargestellt. Anstelle eines Dokumentes kann hier ebenso ein zweidimensionales Schaubild wie beispielsweise Landkarten vorliegen. Der Kontext außerhalb des Ausschnitts erstreckt sich kontinuierlich in die
53
Information Visualization Navigation und Interaktion
räumliche Tiefe und wird verzerrt. Das gesamte Dokument kann interaktiv durch die Linse geschoben werden ([Rob93]).
Je größer das Dokument jedoch ist, desto schwieriger fällt es dem Anwender das Gesuchte zu finden. Weder gibt diese Art der Visualisierung einen Überblick über den gesamten Inhalt des Dokumentes, noch hat der Anwender Orientierungshilfen, in welcher Region er sich gerade befindet.
6.2.4 Information Landscape
Bei Information Landscape (Informationslandschaft) werden geometrische Repräsentationen der Informationsstruktur verwendet. Jedes Element wird als Punkt im Vektorraum dargestellt. Elemente mit inhaltlicher Ähnlichkeit werden im Vektorraum gleich gewichtet bzw. gleich positioniert. So entsteht eine Ergebnislandschaft, in der sich Regionen mit ähnlichen Elementen und Höhen befinden. Der Anwender kann somit verschiedene Regionen leicht vergleichen. Der Vorteil von Information Landscapes ist die vereinfachte Visualisierung beispielsweise gegenüber Cone Trees ([And95]).
54
Information Visualization Navigation und Interaktion
Beispiel: InternetMap von WebMap
Bei dieser Visualisierungstechnik wird die geographische Karte als Metapher verwendet. In dieser Karte werden nahezu zwei Millionen Internetseiten dargestellt. Innerhalb der Karte sind Regionen zu verschiedensten Themengebieten sichtbar. Sind zu einer bestimmten Rubrik viele Internetseiten verfügbar, so werden diese Rubriken als Inseln visualisiert. Werden bestimmte Seiten gesucht so werden die Suchbegriffe in der jeweiligen Rubrik durch rote kleine Quadrate in der Karte gekennzeichnet. Oft besuchte und bekannte Internetseiten werden durch eigene Icons dargestellt.
Abbildung 35: Grafische Oberfläche der InternetMap (Quelle:
http://www.webmap.com/maps/internetmap/index.html)
Der Anwender hat die Möglichkeit sich in eine bestimmte Rubrik hineinzuzoomen. Wird eine Rubrik näher betrachtet, so werden neue Unterrubriken angezeigt. Ist die gesuchte Internetseite in der Rubrik gefunden, so kann sie durch einen einfachen Mausklick geöffnet werden. Die InternetMap wird in den Internetbrowser implementiert und kann jederzeit an- und ausgeschaltet werden. Sie bietet eine angemessene Alternative zum herkömmlichen Surfen durch das Internet. Durch die interaktive Navigation findet der Anwender schnell das Gesuchte ohne den Überblick zu verlieren oder sich durch dem Informationsüberfluss überfordert zu fühlen.
55
Information Visualization Navigation und Interaktion
http://www.webmap.com/maps/internetmap/index.html)
6.3 Exploration
Der Hauptzweck der Erforschung (exploration) von Datenstrukturen ist es dem Anwender durch interaktive Eingriffe Informationen der Dateistruktur zu übermitteln. Beim Entdecken und Untersuchen der Informationselemente und deren Attribute fallen dem Anwender Übereinstimmungen und Unterschiede der Attribute auf. Die Vorgehensweise dabei ist eine stark interaktive und ungerichtete Suche innerhalb der Informationsstruktur. Jedoch wird das ungerichtete Suchen bei fortgeschrittenen Anwendern erst angewendet, wenn das Suchergebnis nicht auf das Gesuchte hoffen lässt, während der unerfahrene Anwender sich mit der Exploration durch die dargestellte Informationsstruktur einen Überblick verschaffen möchte ([Her00]).
6.3.1 Visual Exploration Paradigma
Nach B. Shneiderman verläuft die Erkundung von Datenstrukturen gewöhnlich in drei Stufen ab ([Shn96]):
„Overview first, zoom and filter, and then details-on-demand”
Als erstes sollte der Anwender einen Überblick über die Datenmenge bekommen. Ausgehend vom Überblick der Daten, identifiziert der Anwender interessante Regionen und fokussiert auf eine oder mehrere dieser Regionen. Um diese Regionen analysieren zu können, braucht der Anwender genauere Informationen und Details dieser Region.
56
Information Visualization Navigation und Interaktion
6.3.2 Incremental Exploration Technics
Ein wichtiges Problem der Informationsvisualisierung ist die Größe der Informationsstruktur. In riesigen Informationsstrukturen ist es fast nicht möglich sich zu orientieren oder einen Überblick zu bekommen. Um dieses Problem zu lösen sind Methoden entwickelt worden, die dem Anwender das Erforschen und Untersuchen großer Informationsstrukturen erleichtern. Diese Methoden werden Incremental Exploration Technics genannt. Dabei werden immer nur bestimmte Teile der gesamten Struktur für den Anwender sichtbar, sogenannte Logical Frames, während der Rest der Struktur stark verkleinert am Rand der Darstellungsfläche projiziert oder ganz ausgeblendet wird. Die Vorteile dabei werden durch die limitierte Größe der Struktur und die verbesserte Interaktion deutlich. Durch die Implementierung einer Incremental Exploration Technik werden zwei Aspekte deutlich ([Her00]):
• Entwickeln einer Strategie, um neue Logical Frames zu generieren
• Der Anwender kann den Inhalt der Logical Frames nach jeder Änderung neu bestimmen.
6.4 Clustering
Abbildung 37: Die 11 Kugeln sind nach ihrer Zugehörigkeit gruppiert
Um den Überblick über die visualisierte Informationsstruktur nicht zu verlieren, ist es vorteilhaft, die Anzahl der sichtbaren Elemente zu reduzieren. Wird die Anzahl der dargestellten Elemente limitiert, kann der Anwender leichter klare Strukturen erkennen und gleichzeitig wird die Rendering- und Layoutperformance erhöht ([Kim94]). Verschiedene Techniken wurden
57
Information Visualization Navigation und Interaktion
entwickelt, um die visuelle Komplexität der Informationsstruktur zu vereinfachen. Einen Weg dazu bietet das Clustering. Ziel des Clustering ist es aus großen Informationsstrukturen semantisch oder grafisch gleiche Elemente zusammenzufassen. Ähnliche Elemente werden in eine Gruppe oder Kollektion, das Cluster, eingeschrieben. Innerhalb des Clusters sollten die Elemente möglichst gleich sein, während die Cluster selber große Unterschiede aufweisen sollten. Werden semantisch gleiche Elemente zusammengefasst, so spricht man von einem Content-Based Clustering, sind dagegen strukturelle Informationen von Wichtigkeit, so spricht man von Structure-Based Clustering. Obwohl das Content-Based Clustering Elemente gruppiert, die für einzelne Applikationen sehr vorteilhaft und sogar mit einem Structure-Based Clustering kombinierbar sind, wird Clustering in der Informationsvisualisierung hauptsächlich durch strukturelle Gruppierung bestimmt. Der Grund dafür liegt in der Tatsache, dass jede Applikation, die ein Content-Based Clustering implementiert hat, sich auf ein bestimmtes Themengebiet konzentriert, da so die semantischen Beziehungen leichter zu bestimmen sind. Durch diese Spezialisierung auf ein einzelnes Gebiet verliert jedoch die Applikation ihre Möglichkeit in anderen Wissensgebieten Einsatz zu finden ([Mir96]).
Ein anderes bekanntes Problem beim Clustering ist die richtige Zuweisung eines Begriffes. Ein einzelner Begriff kann verschiedenste Bedeutungen haben und ein Gedanke kann auf verschiedenste Art und Weise ausgedrückt werden. Dieses Problem kann einerseits als redundantes
Informationsmaterial, andererseits als Mangel an richtiger Information angesehen werden. Um dieses Problem lösen zu können sollte versucht werden redundantes und fehlendes Informationsmaterial so gering wie möglich zu halten.
6.4.1 Self-Organizing-Map (SOM)
Die SOMs, selbstorganisierende Karten, wurden von Kohonen entwickelt ([Koh89]) und erkennen mittels eines unüberwachten (unsupervised) Lernalgorithmus Strukturen in Daten. Bei einem unüberwachten Lernalgorithmus wird kein Feedback vom Anwender bzw. der Umgebung benötigt. Der SOM Algorithmus decodiert die Dokumente in numerische Vektoren und stellt sie in einer Karte aus Dokumentenkollektionen dar (siehe Abbildung 38).
58
Information Visualization Navigation und Interaktion
Es können zweidimensionale oder dreidimensionale Karten erstellt werden, die die semantische Nähe von Elementen aufgrund der räumlichen Distanz darstellen. Dabei werden n-dimensionale Informationsstrukturen auf ein zwei-oder dreidimensionales Kartengitter projiziert. Bei diesen Karten spielt die Gravitationsmetapher eine große Rolle. Besitzt ein Element eine hohe Ähnlichkeit zur Anfrage des Anwenders so wird es stark gewichtet. Einzelne Elemente der Informationsstruktur werden als Neuronen bezeichnet. Xia Lin hat auf diesem Gebiet Pionierarbeit geleistet ([Lin97], [Lin91]). Er klassifiziert eine Gruppe von Elementen und verteilt sie in verschiedene Regionen in einer Karte, die mehrere Ebenen für eine Klassifikation beinhalten. Jede Region wiederum beinhaltet eine Gruppe von Elementen, die untereinander Ähnlichkeiten aufweisen. Ein Ähnlichkeitsmaß vergleicht die Anfrage mit den Gewichten der Neuronen. Das Neuron mit der niedrigsten Distanz oder der höchsten Ähnlichkeit zur Anfrage wird dem Anwender als Ergebnis präsentiert - es wird aktiviert. Um eine topologische Struktur zu erzeugen, verändern sich die Gewichte der Nachbarneuronen des aktivierten Neurons. Je näher ein Neuron dem aktivierten Neuron ist, desto stärker wird sein Gewicht adaptiert. Dadurch entstehen Cluster, in die ähnliche Muster abgebildet werden.
59
Information Visualization Navigation und Interaktion
Abbildung 39: WEBSOM-Visualisierung von über 80 Newsgroups mit über
einer Million Einträgen (Quelle:
http://websom.hut.fi/websom/milliondemo/html/root.html )
Die SOM Visualisierung findet bei der Darstellung großer
Informationsstrukturen Anwendung. Dadurch wird effektives Analysieren großer Informationsmengen möglich, da der Anwender eine kompakte visuelle Repräsentation der Informationsstruktur hat und jederzeit einzelne Punkte rasch identifizieren kann.
6.4.2 Hierarchical Agglomerative Clustering
Document Clustering wird hauptsächlich eingesetzt, um die Suche und Retrieval von Dokumenten zu verbessern. Hierarchical Agglomerative Clustering (HAC) Algorithmen sind allgemeine Methoden für das Document Clustering ([Wil88]).
Der HAC Algorithmus produziert eine Hierarchie von Clustern. Er schafft einen Baum, wobei jeder Knoten als Cluster von Elementen dargestellt wird. Dem Anwender werden Dokumentenkollektionen visualisiert, die das Suchergebnis in Gruppen von ähnlichen Dokumenten teilt. Der Algorithmus benötigt für seine Berechnungen eine Gruppe von Elementen und eine Matrix von Distanzen der Zwischenelemente ([Mir96]). Durch den Algorithmus wird
60
Information Visualization Navigation und Interaktion
jedem Element seinen eigenen Cluster. Er beginnt jedes Dokument in einem Cluster auf bestimmte Ähnlichkeiten zu untersuchen, wiederholt diesen Vorgang mit anderen Clustern und stoppt, wenn bestimmte Kriterien erfüllt sind. Diese Prozedur wird solange wiederholt, bis alle Elemente innerhalb eines Clusters eingeschrieben werden, welches die Wurzel des Hierarchieaumes darstellt.
Jedes Dokument wird als gewichteter Attributvektor im Vektorraum dargestellt, wobei jedes Wort in der Dokumentenkollektion ein Attribut in diesem Vektor ist.
Abbildung 40: Hierarchical Clustering mit dem HAC-Algorithmus ([Her00])
61
Information Visualization Ausblick
7 Ausblick
Das Forschungsfeld der Information Visualization hat sich in den vergangenen Jahren enorm erweitert. Es wurden verschiedenste Methoden und Techniken entwickelt, die uns Zusammenhänge von Daten näher bringen können.
Aber nicht nur die Visualisierungen seitens des Computers ändern sich, sondern der Anwender selbst beginnt in anderen Bahnen bzw. „Dimensionen“ zu denken. Information Visualization verhilft dem Anwender zu abstrakten und vernetzten Denkweisen, da er selbst mit abstrakten Metaphern konfrontiert wird. Mit den Fokus- und Kontexttechniken wird es dem Anwender ermöglicht einen intuitiven Zugang zu dem Dargestellten zu bekommen.
Dennoch erscheinen die Visualisierungstechniken besonders in der ndimensionalen Visualisierung für den ungeübten Anwender nicht leicht verständlich. Hierfür müssten Metaphern gefunden werden, die für den Anwender besser zu verstehen sind.
Mit Hilfe die Computerindustrie werden sich die Rechenleistungen und die Speicher- bzw. Datenbankkapazitäten erhöhen, was allerdings nicht automatisch eine Verbesserung bedeutet, da die Applikationen für die Visualisierungstechniken immer größere Anforderungen haben. Genauso wichtig, wie die Trends der Computerindustrie ist das wachsende Bewußtsein der Informationsdesigner, dass für viele Informationstypen, die grafische Variante „präziser und aufschlussreicher“ ist als eine traditionelle textbasierte Präsentation ([Tuf83]).
Die hier vorgestellten Techniken und Methoden zur Informationsvisualisierung enthalten spezielle und pragmatische Ansätze. Das Ziel besteht also nicht nur in der Darstellung von Informationsstrukturen in einer visuell erfassbaren bedeutungstragenden Form, sondern in einem System, das dem Anwender offene Schnittstellen nach außen hin bietet, leicht erweiterbar und plattformunabhängig ist. Aufgrund der Erweiterbarkeit kann das System jedem Anwender eine Visualisierung anbieten, die seinem persönlichen Preferenzen entspricht.
62
Information Visualization Literaturverzeichnis
Literaturverzeichnis
[Alp91] Alpern Bowen and Larry Carter. Hyperbox. In Gregory M. Nielson and Larry Rosenblum, editors, In: Proceedings of IEEE Visualization ’91, pages 133-139, San Diego, California, October 1991.
[And95] Andrews, K.; Kappe, F.; Maurer, H.: Hyper-G and Harmony: Towards the Next Generation of Networked Information Technology. In: CHI´95 Conf. Companion, Denver, Mai 1995.
[Bec87] Becker, A. and S. Cleveland. Brushing scatterplots. In: Technometrics, Vol 29(2), p. 127-142, 1987.
[Ber81] Bertin, J.: Graphics and Graphic Information Processing. Walter de Gruyter and Co., Berlin, 1981.
[Bis93] Bissantz, N.; Hagedorn, J.: Data Mining (Datenmustererkennung). In: Wirtschaftsinformatik, 35/5, Springer-V., S. 481-487, 1993. [Buc95] Buchner, R.; Wolz, M.: Eignung graphischer Verfahren zur Darstellung betriebswirtschaftlicher Sachverhalte. In: Zeitschrift für betriebswirtschaftliche Forschung (ZfbF), Vol. 47, S. 633 - 658, Juli 1995. [Car95] Carrière, Jeromy; R. Kazman: Interacting with huge hierarchies: Beyond Cone Trees, In: Proceedings of Information Visualization ‘95 Symposium, IEEE, 1995, p. 3-5.
[Che73] Using faces to represent points in k-dimensional space graphically. Journal of American Statistical Association, 68, 361-368. [Cle93] Cleveland, W. S.: Visualizing Data, In: AT&T Bell Laboratories, Hobart Press, 1993.
[Däs98] Dässler, Rolf: Virtuelle Informationsräume mit VRML. dpunkt Verlag
Heidelberg, 1998.
[Däs99] Dässler, Rolf: Informationsviusalisierung: Stand, Kritik, Perspektiven in Methoden/Strategien der Visualisierung in Medien, Wissenschaft und Kunst, Wissenschaftlicher Verlag Trier (WVT), 1999. [Fei90] Steven Feiner and Clifford Beschers. Worlds within worlds: Metaphors for exploring n-dimensional virtual worlds. In Proc. UIST ’90, ACM Symposium on User Interface Software and Technology, pages 76-83, Snowbird, UT, October 1990.
63
Information Visualization Literaturverzeichnis
[Fri74] Friedman, Jerome H. and John W. Tukey. A projection pursuit algorithm for exploratory data analysis. IEEE Transactions on Computers, c-23(9):881--889, September 1974.
[Fua99] Fua, Y. H.; M. O. Ward, and E. A. Rundensteiner. Hierarchical parallel coordinates for exploration of large datasets. IEEE Proc. of Visualization, pages 43-50, Oct. 1999.
[Fur86] Furnas, G. W.: Generalized Fisheye Views, In: Proceedings of Human
Factors in Computing Systems (CHI 86), ACM Press, 1986, pp. 16-23. [Fur98] Furnas, G.W., X. Zhang: "MuSE: A Multi-Scale Editor", In: Proceedings of the UIST' 98 Symposium, ACM Press, 1998. [Ger97] Gershon, Nahum; Stephen S. Eick: Information Visualization; In: IEEE Computer Graphics and Applications, 1997, Vol. 17, No. 4, p. 29-31. [Güt92] Güting, R. H.: Datenstrukturen und Algorithmen, Teubner, Stuttgart, 1992.
[Her00] Herman Ivan, Melançon Guy, M. Scott Marshall: Graph Visualization and Navigation in Information Visualization: a Survey, In: IEEE CS Society, IEEE, 2000, p. 10-12.
[Ins90] Inselberg Alfred, Dimsdale B.: ‘Parallel Coordinates: A Tool for Visualizing Multi-Dimensional Geometry’, Visualization ‘90, San Francisco, CA, 1990, pp. 361-370.
[Ins95] Inselberg, Alfred: Visualizing Multidimensional (Multivariate) Data and Relations - Perception vs. Geometry. In: Panel Discussion, Visualization 95, 1995.
[Joh91] Johnson Brian, Ben Shneiderman: Tree Maps: A Space-Filling
Approach to the Visualization of Hierarchical Information Structures, In:
proceedings Visualization 91, 1991, p. 284-291.
[Kas98] Kaski Samuel: Dimensionality Reduction by Random Mapping: Fast
Similarity Computation for Clustering, In: Proceedings of International Joint
Conference on Neural Networks, 1998.
[Kaz96] Kazman Rick; Jeromy Carrière: Rapid Prototyping of Information Visualizations using VANISH.- Proceedins Information Visualization 96, San Francisco, 1996, p. 38 -45.
[Kei95] Keim, D.: Datenbanksysteme und Visualisierung, Vorlesungsskriptum, SS 1995, LMU München, Institut für Informatik, Juli 1995
64
Information Visualization Literaturverzeichnis
[Kim94] Kimelman D.; Leban B.; T. Roth and D. Zernik: “Reduction of Visual Complexity in Dynamic Graphs”, In: Proceedings of the Symposium on Graph Drawing GD ` 93, Springer-Verlag, 1994.
[Kno97] Knorz, Gerhard: Indexieren, Klassieren, Extrahieren. - In: Grundlagen der praktischen Information und Dokumentation : ein Handbuch zur Einführung in die fachliche Informationsarbeit, Saur, 1997. [Koh89] Kohonen, T.: Self-Organization and Associative Memory, Springer 1989.
[Koi93] Koike, Hideki; Hirotaka Yoshihara: Fractal Approaches for Visualizing Huge Hierarchies, In: Proceedings IEEE Symposium, 1993. [LeB90] LeBlanc, J.; M. O. Ward, N. Wittels: Exploring N-Dimensional Databases, In: Proceedings Visualization 90, San Francisco, 1990, p. 230-239.
[Lin91] Lin Xia, Soergel D., Marchionini G.: "A self-organizing semantic map for information retrieval.", In: Proceedings of SIGIR 91, ACM Press, pp. 262-269.
[Lin97] Lin Xia: Map displays for information retrieval, In: Journal of the American Society for Information Science, pp. 40-54. [Mac91] Mackinlay, Jock D.; Georg G. Robertson, Stuart K. Card: The Perspective Wall: Detail and Context Smoothly Integrated, In: Proceedings CHI 91, New Orleans, 1991, p. 173-197.
[Mar95] Martin A. and M.Ward. High dimensional brushing for interactive exploration of multivariate data. In: Proc. of Visualization ’95, p. 271-278, 1995.
[Mar98] Martha Barberena N. Graphische Darstellung von Informationen, MIK98 4., In: Workshop Multimediale Informations-und
Kommunikationssysteme 8.10 und 9.10.1998, Ilmenau. [Mih91] Ted Mihalisin, John Timlin, and John Schwegler. Visualization and analysis of multi-variate data: A technique for all fields. In Gregory M. Nielson and Larry Rosenblum, editors, Proceedings of IEEE Visualization ’91, pages 171-178, San Diego, California, October 1991.
[Mir96] Mirkin Boris: Mathematical Classification and Clustering, Kluwer, 1996.
65
Information Visualization Literaturverzeichnis
[Mui97] Muir, E.; O' Neill, R.: Perspective-based Interface using an extended Masthead, 1997, U.S.-Patent 5621906.
[Mun97] Munzner Tamara: H3: Laying Out Large Directed Graphs in 3D Hyperbolic Space, In: Proceedings of the 1997 IEEE Symposium on Information Visualization, IEEE, 1997, p. 2-10. [Noi93] E. G. Noik: Exploring Large Hyperdocuments: Fisheye Views of Nested Networks, In: Proceedings of the ACM Conference on Hypertext and Hypermedia, ACM, 1993m, pp. 192-195.
[Pic95] Picket Ronald M.; Georges Grinstein, Haim Levkowitz, Stuart Smith: Harnessing Preattentive Perceptual Processes in Visualization, In: Proceedings Perceptual Issues in Visualization, 1995. [Rao94] Rao Ramana, Lamping John: Laying Out and Visualizing Large Trees Using a Hyperbolic Space, In: Proceedings of the ACM Symposium on User Interface Software and Technology,1994. ACM Press, p. 13-14. [Rek93] Rekimoto, Jun and Mark Green; "The Information Cube: Using Transparency in 3D Information Visualization" , Proceedings of the Third Annual Workshop on Information Technologies & Systems (WITS' 93), pp. 125-132, 1993
[Rob91] Robertson, Georg G.; Jock D. Mackinlay, Stuart K. Card: Cone Trees: Animated 3D Visualizations of Hierarchical Information.- Proceedings SIGCHI 91, New Orleans, 1991, p. 112-114.
[Rob93] Robertson, Georg G.; Jock D. Mackinlay, Stuart K. Card: Information visualization using 3D interactive animation, In: Communications of the ACM, 1993, p. 57-71.
[Sar93] Manojit Sarkar, Marc H. Brown: Graphical Fisheye Views of Graphs,
In: Communications of the ACM, 1992.
[Sal87] Salton, Gerard; McGill, Michael: Information Retrieval : Grundlegendes für Informationswissenschaftler. - Hamburg [u.a.] : McGraw Hill, 1987, p. 8.
[Shn91] Shneiderman, Ben: Tree visualization with tree-maps: A 2-d spacefilling approach, Department of Computer Science & Human-Computer Interaction Laboratory, University of Maryland, College Park, MD 20742 , June 18, 1991.
[Shn96] Shneiderman, Ben: „The eyes have it: A task by data type taxonomie for information visualizations”, In: Visual Languages, 1996.
66
Information Visualization Literaturverzeichnis
[Shn98] Shneiderman, Ben: Designing the user interface: strategies for effective human-computer-interaction Reading, Harlow, Menlo, 1998. [Tuf83] Tufte, E. R.: The Visual Display of Quantitative Information. Cheshire, Connecticut: Graphics Press, 1983.
[Tur92] Turo, Daivd; Brian Johnson: Improving the Visualization of Hierarchies with TreeMaps: Design Issues and Experimentation.- Proceedings Visualization 92, 1992.
[Tve93] Tversky O.; S. Snibbe; R. Zeleznik: Cone Trees in the UGA Graphics System: Suggestions of a more Robust Visualization Tool, In: Technical Report CS-93-07, Department of Computer Science Brown University, February 1993.
[Ven80] Venn John.: On the diagrammatic and mechanical representation of propositions and reasonings, The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 9 (1880) 1-18. [War94] Ward, Matthew O.: Xmdvtool: Integrating multiple methods for visualizing multivariate data. Proc. Of Visualization ’94, p. 326-33, 1994.
[War97] Ward, Matthew O.: Creating And Manipulating N-dimensional
Brushes, In: Joint Statistical Meeting, 1997. [Weg97] Wegenkittl Rainer, Helwig Löffelmann and Eduard Groller: Visualizing the Behavior of Higher Dimensional Dynamical Systems, In: Technical Report, Vienna, 1997.
[Wil88] Willet P.; Recent Trends in hierarchical document clustering: a critical review, In: Information Processing and Management, 1988, pp. 577-597.
[Won97] Wong, Pak Chung; R. Daniel Bergeron: 30 Years of
Multidimensional Multivariate Visualization, In: Scientific Visualization --Overview, Methodologies, Techniques. IEEE Computer Society Press, 1997.
67
Arbeit zitieren:
DI Christian Grlica, 2002, Visualisierung im Information Retrieval System, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Ein Fuzzy Approach im Information Retrieval
Informatik - Wirtschaftsinformatik
Diplomarbeit, 153 Seiten
Visualisierungstechniken zur Unterstützung eines Knowledge Discovery i...
Informatik - Wirtschaftsinformatik
Seminararbeit, 30 Seiten
Psychologie - Lernpsychologie, Intelligenzforschung
Seminararbeit, 15 Seiten
Christian Grlica's Text Visualisierung im Information Retrieval System ist nun auf dem Buchmarkt erhältlich
Christian Grlica hat den Text Visualisierung im Information Retrieval System veröffentlicht
Christian Grlica hat einen neuen Text hochgeladen
Comparative Evaluation of XML Information Retrieval Systems
5th International Workshop of ...
Norbert Fuhr, Mounia Lalmas, Andrew Trotman
Social Information Retrieval Systems: Emerging Technologies and Applic...
Dion Goh, Schubert Foo
Evaluation of Cross-Language Information Retrieval Systems
Second Workshop of the Cross-L...
Michael Kluck, Julio Gonzalo, Martin Braschler
Effektive Information Retrieval Verfahren in Theorie und Praxis
Ausgewählte und erweiterte Bei...
Christa Mandl. Thomas; Womser-Hacker
Information Retrieval Technology
4th Asia Information Retrieval...
Hang Li, Ting Liu, Wei-Ying Ma, Tetsuya Sakai, Kam-Fai Wong, Guodong Zhou
0 Kommentare