Zusammenfassung
Dieses Buch liefert einen Beitrag zur Steigerung der Effizienz von Eye-Tracking als Methodik für die Usability-Evaluation durch die Entwicklung empirisch validierter Eye-Tracking-Parameter. Die statistische Analyse in dieser Studie wird durch das Mapping von objektiven Performanzdaten (Blickmuster) und subjektiven Nutzerdaten (aus Fragenbögen und Interviews) einer Testgruppe während der Interaktion mit einer Webapplikation realisiert. Insgesamt werden sechs Blickbewegungsparamter mit vier konkreten Nutzungsproblemen verknüpft und auf ihre Indikatorstärke hin überprüft. Die Ergebnisse zeigen, dass Eye-Tracking-Parameter prinzipiell das Potential haben, spezifische, subjektiv erlebte Nutzungsprobleme zu identifizieren. Für weiterführende Studien stellt dieses Buch eine Übersicht wichtiger Modelle von Nutzungsproblemen sowie einen Pool aus interpretierten Eye-Tracking-Parametern bereit. Darüber hinaus beschreibt dieses Buch ausführlich die Besonderheiten der Mensch-Computer-Interaktion, die Bedeutung und Durchführung der Evaluation von Usability sowie ein modernes, integratives Usability-Qualitätsmodell und charakterisiert die Besonderheiten der visuellen Wahrnehmung ebenso wie technische Aspekte der Erfassung von Blickbewegungen.
Schlagwörter: Usability-Evaluation, Eye-Tracking, Nutzungsproblem, Mensch-Computer-Interaktion, Kommunikationspsychologie
Abstract
This book contributes to making eye tracking as a method for usability-evaluation more efficient by developing empirically validated eye-tracking-parameters. The statistical analysis in this study is based on mapping a test group´s subjective user data (via questionaires and interviews) on objective performance data (gaze-patterns) while interacting with a webapplication. Four specific problems which users face during computer interaction are mapped on six eye-tracking-parameters and tested for quality of problem indication. The findings of this study point out that eye-tracking-parameters do generally have the potential to indicate specific usage problems. This book also paves the way for future studies by giving both an overview of important models of usage problems and providing a pool of interpreted eyetracking-parameters. Furthermore, this study provides a detailed description of the features of Human-Computer-Interaction, outlines the importance and procedure of evaluating usability and gives insight into a modern quality-model of usability, the features of visual perception and current eye-tracking-technology.
Keywords: Usability-Evaluation, Eye-Tracking, Usage Problem, Human-Computer- Interaction, Communication-Psychology
Inhalt
Inhaltsverzeichnis
1. Einleitung 5
1.1 Motivation Problemstellung 5
1.2 Zielstellung 6
1.3 Inhalt 8
Teil - A Theoretische Grundlagen 9
2. Evaluation der Mensch-Computer Interaktion 9
2.1 Interaktion zwischen Mensch Computer (MCI) 9
2.1.1 Menschliche Kommunikation/Interaktion 9
2.1.2 MCI als ergonomische Disziplin 12
2.1.3 Aufgabe-Benutzer Computer-Relation in der MCI 13
2.2 Usability 15
2.2.1 Begriff und Qualitätsmodell 15
2.2.2 Usability-Evaluation 21
2.2.3 Usability-Engineering 35
3. Nutzungsprobleme in der MCI 42
3.1 Nutzungsprobleme als Handlungsfehler 42
3.2 Nutzungsprobleme als Transformationsprobleme 47
3.3 Nutzungsprobleme als Syntheseprobleme 49
4. Charakteristika von Blickbewegungen 56
4.1 Typen von Augenbewegungen 56
4.2 Registrierung von Augenbewegungen 61
4.3 Blickbewegungen und kognitive Prozesse 63
4.3.1 Visuelle Aufmerksamkeit 63
4.3.2 Blickbewegungen und visuelle Aufmerksamkeit 66
4.3.3 Fixationen/Sakkaden und kognitive Prozesse 67
5. Gaze-Tracking Parameter Nutzungsprobleme 73
5.1 Parameter-Pool 73
5.2 Gaze-Tracking Parameter zur Identifizierung von Nutzungsproblemen 73
5.2.1 Erwartungsabweichung 73
5.2.2 Nicht-Erkennen 76
5.2.3 Nicht-Verstehen 79
5.2.4 Schlechte Orientierung 79
Teil B - Empirische Bearbeitung 84
6. Methodik 84
Inhalt
7. Messinstrumente 85
7.1 Eye-Tracking System 85
7.2 Videokonfrontation 86
7.3 Fragebögen 86
8. Datenerhebung 88
8.1 Testsetting 88
8.2 Testapplikation 88
8.3 Testpersonen (Stichprobe) 89
8.4 Vortests 90
8.5 Versuchsablauf 91
8.5.1 Instruktion Wiederholung 91
8.5.2 Übung zur Kennzeichnung von Nutzungsproblemen 92
8.5.3 Kalibrierung der Technik 92
8.5.4 Aufgabenbearbeitung und Eye-Tracker 93
8.5.5 Videokonfrontation 94
8.5.6 Fragebogen 97
9. Hypothesen 98
10. Ergebnisdarstellung 101
10.1 Problemphase vs. Nicht-Problemphase 101
10.1.1 PA Backtracks 101
10.1.2 PA Suchzeit 103
10.1.3 PA Durchschn. Sakkadenweite 103
10.1.4 PA Wiederkehrende semantische Fixationen 105
10.1.5 PA Pfadlänge 105
10.1.6 PA Übergangshäufigkeiten 107
10.2 Zusammenhangsanalyse 108
10.2.1 PA Backtracks / NP Erwartungsabweichung 108
10.2.2 PA Suchzeit PA Sakkadenweite / NP Nicht-Erkennen 109
10.2.3 PA Wiederk. semantische Fixationen / NP Nicht-Verstehen 109
10.2.4 PA Blickpfadlänge - Übergangshäufigkeit / NP Schl. Orientierung. 109
11. Diskussion 111
11.1 Ergebnisse 111
11.2 Methodische Aspekte 114
11.2.1 Subjektive Daten aus Videokonfrontation 114
11.2.2 Statistische Verfahren 114
12. Schlussbetrachtung 116
13. Glossar 119
Inhalt
14. Abkürzungsverzeichnis 122
15. Abbildungsverzeichnis 123
16. Tabellenverzeichnis 125
17. Literaturverzeichnis 126
18. Anhang 132
1. Einleitung
1.1 Motivation & Problemstellung
Usability steht für eine konsequente Ausrichtung und Anpassung von Softwareprodukten auf die Bedürfnisse, Probleme und Wünsche ihrer Zielanwender. Das Usability-Labor ermöglicht eine Überprüfung der Softwarequalität und bietet einen Einblick in den Praxisfall. In Nutzertests bearbeiten Testanwender prototypische Aufgaben der zu evaluierenden Software. Dabei können durch die Messtechnik im Labor objektive Verhaltensdaten der Testanwender aufgezeichnet, sowie deren subjektive Erfahrungen im Umgang mit der Testsoftware über verschiedene Befragungstechniken (Fragebögen, Interviews etc.) erfasst werden. Das erhobene Datenmaterial dient als Grundlage der Usability-Evaluation zur schrittweisen Optimierung der Software.
Durch den Fortschritt bei Mess- und Informationstechnik verfügen heutzutage immer mehr Usability-Labore über die Möglichkeit, eine große Menge objektiver Daten unterschiedlichen Typs aus Nutzertests zu erfassen. Mit einer entsprechenden Laborausstattung können z.B. Blickbewegungen, Klickverhalten, Mausverhalten, Tastaturevents und psychophysiologische Daten einer Nutzergruppe aufgezeichnet werden. Damit kann das Nutzerverhalten während eines Tests objektiviert werden, d.h. dieses kann direkt, ohne die Gefahr subjektiver Verzerrungen aufgezeichnet werden (Schiessl, Duda et al., 2003).
Die Laborpraxis zeigt jedoch, dass der Fülle objektiver Nutzerdaten eine verhältnismäßig kleine Menge an Interpretationsansätzen zur Auswertung gegenüber steht (Dzida 2004, zitiert nach Riebeck, 2006; S. 108). Einem Großteil der Daten fehlt es so an Bedeutungsgehalt und kann nicht effektiv für die Usability-Evaluation genutzt werden. Denn: Neben der aktuellen Gebrauchsqualität eines Produktes ist der Auftraggeber einer Usability-Evaluation meist noch stärker an konkreten Optimierungsmöglichkeiten interessiert. Schließlich soll eine Verbesserung der Usability die Kundenzufriedenheit und damit den Absatz des Produktes entscheidend verstärken. Demzufolge muss eine Software-Evaluation über die reine Datenbeschreibung, auf welche man beim Fehlen geeigneter Interpretationsansätze beschränkt wäre, hinausgehen, um konkrete Optimierungsmöglichkeiten eines Testsystems aufzuzeigen. Der Mangel fehlender Auswertungsstandards wiegt umso schwerer, wenn man in Betracht zieht, welch hoher Aufwand an Technik betrieben und wie viel Laborzeit investiert wird, um relativ wenige Usability-Probleme aus dem gewonnenen Datenmaterial zu extrahieren. In der Verwertung und Analyse von Messergebnissen scheint daher noch viel Potential zu liegen.
Diesen Mangel objektiver Messdaten zur Nutzung für die Usability-Evaluation bestätigt auch die Laborpraxis im Fraunhofer-Institut für Graphische Datenverarbeitung in Rostock (IGD-R). Das RealEYES-Testsystem, welches seit Ende der 90er Jahre am Fraunhofer IGD-R aufgebaut wird, ermöglicht insbesondere die Analyse objektiver Daten im Usability-Test. Das RealEYES-Testsystem ist Teil eines Konzeptes zur computerunterstützten Usa-
5
bility-Evaluation im Rahmen eines nutzerzentrierten Software-Entwicklungsprozesses. Das System stellt Werkzeuge zur Erhebung, Verarbeitung und Präsentation verschiedener Interaktionsdaten zur Verfügung (Oertel & Schultz, 2003). Damit können Resultate subjektiver Daten sinnvoll ergänzt und verifiziert werden. Testeraussagen können z.B. konkret überprüft und Indikatoren für bestimmte Usability-Probleme gefunden werden. So leistet das RealEYES-Testsystem auch einen wichtigen Beitrag zur Teil-Automatisierung von Evaluierungsprozessen. Wie die Systembezeichnung nahe legt, ist eine Hauptfunktion des RealEYES-Testsystems die Erfassung und Auswertung von Blickbewegungsdaten (Oertel & Schultz, 2003).
Blickbewegungsdaten scheinen generell geeignet zu sein, um das Interaktionverhalten eines Nutzers abzubilden. Nach Rötting (2001; S. 2) sind Augen- und Blickbewegungen Zeugen der menschlichen Aktivität; dies sowohl auf bewusster Ebene (bewusst regulierte Handlungen) sowie auf unbewusster Ebene (sensumotorische Automatismen). Für eine effiziente Nutzung dieser Verhaltensmuster zur Bestimmung der Gebrauchsqualität muss jedoch he-rausgefunden werden, wie das Datenmaterial mit Nutzungsproblemen, die der Nutzer während der Interaktion mit dem System erfährt (z.B. Verständnisprobleme bzgl. der Bedienelemente oder schlechte Orientierung), in Verbindung gebracht werden kann. Daraus können Interpretationsansätze abgeleitet werden, die es ermöglichen, konkrete Nutzungsprobleme mittels Blickbewegungsdaten zu identifizieren, Hinweise für deren Ursache zu erhalten und entsprechende Lösungsansätze zu entwickeln.
1.2 Zielstellung
Seit Anfang der 90er Jahre ist eine verstärkte Publikation - vor allem aus dem englischsprachigen Raum - von Eye-Tracking-Studien festzustellen, die sich auf die Suche nach aussagekräftigen Blickbewegungsparametern konzentrieren, die zur Überprüfung der Usability einer Software eingesetzt werden können (z.B. Yamamoto & Kuto, 1992; Goldberg & Kotval, 1998; 1999; Crowe & Narayanan, 2000; Cowen, 2001; Goldberg, Stimson et al., 2002). Einen wichtigen Baustein zum praktischen Einsatz der Blickbewegungsregistrierung liefert besonders Rötting (2001), indem er in Form einer ausführlichen Systematik eine Vielzahl von Eye-Tracking-Parameter definiert, operationalisiert sowie deren üblichen Wertebereiche angibt.
Beim Großteil der Studien zum Einsatz von Blickbewegungen für die Usability-Evaluation ist allerdings eines sehr auffällig: Es werden keine Aussagen über den Zusammenhang zwischen den in den Blickdaten zu findenden Interaktionsmustern und der subjektiv (durch die Nutzer selbst) erlebten Gebrauchsqualität getroffen. Diese Tatsache erscheint ein geeigneter Angriffspunkt dieser Arbeit zu sein, ausgehend von folgenden Überlegungen:
Usability als ergonomisches Konzept betont das Ziel, Computersysteme den menschlichen Fähigkeiten, Schwächen und Bedürfnissen einer bestimmten Nutzergruppe anzupassen (Bräutigam, 1998). Aus dieser Perspektive kann Usability als subjektives Qualitätsmaß begriffen werden. So sei die Zufriedenstellung der Benutzer letztlich darüber entscheidend, ob
6
die Abweichung von einem spezifischen Usability-Kriterium (z.B. die ISO-Norm 9241-12 zur ergonomischen Darstellung von Informationen, siehe Abschnitt 2.2) innerhalb eines zu evaluierenden Systems als Usability-Problem zu werten ist oder nicht (DATech, 2004; S. 18). Über eine direkte Befragung von Nutzern lassen sich hauptsächlich Schlussfolgerungen über die Akzeptanz des Systems, den Grad der Zufriedenstellung und Problembereiche der Schnittstelle ziehen (Oppermann, 1988). Aus diesem Grund erscheint es zunächst sinnvoll, zur Identifizierung von Usability-Problemen die subjektiven Erfahrungen von Nutzern (subjektive Methoden) gegenüber mittels Messtechnik erfassten Verhaltensdaten zu bevorzugen (objektive Methoden).
Der in der modernen Usability-Forschung eingeschlagene Weg ist allerdings ein anderer. Objektive und subjektive Evaluationsmethoden stehen sich nicht konkurrierend gegenüber, sondern ergänzen sich gegenseitig. Durch diese als Mapping (Kawalek, 2003) bezeichnete Vorgehensweise der Verknüpfung subjektiver und objektiver Nutzerdaten, können die Nachteile beider Datenerhebungsmethoden kompensiert werden. In dieser Hinsicht machen Schweibenz und Thissen (2003) deutlich, dass „(…) zwischen dem, was Testpersonen sagen, und dem, wie sie sich tatsächlich verhalten, ein gravierender Unterschied bestehen kann“ (S. 77).
Diese Beobachtung zeigt, dass es sehr schwer ist, allein von Testeraussagen auf tatsächliche Nutzungsprobleme zu schließen. Das grundsätzliche Problem subjektiver Daten setzt sich aus zwei Teilen zusammen. Zum einen kann ein Teil des Verhaltens, das eine Person während der Interaktion mit einem Computersystem vollzieht, von dieser nicht bewusst verarbeitet und damit nicht verbalisiert werden, was vor allem für Augen- und Blickbewegungen gilt (Rötting, 2001; S. 4). Zum anderen muss immer damit gerechnet werden, dass Testeraussagen Verzerrungseffekte beinhalten. So sind z.B. die Antworten eines Testers von seinen Vermutungen über das Untersuchungsziel geleitet und entsprechen nicht seinen eigentlichen Erfahrungen (Sponsorship-Bias) (Bortz & Döring, 2002).
Im Gegensatz dazu schließen objektive Daten wie Blickbewegungen oder Logfiles (Maus-und Tastaturevents) subjektive Einflüsse aus und bilden das Interaktionsverhalten des Nutzers direkt ab. Der bereits erwähnte Nachteil besteht nun darin, dass der Bedeutungsinhalt der Daten nicht erfasst wird. Dieser gravierende Mangel kann allerdings durch die Kombination mit dazugehörigen subjektiven Daten ausgeglichen werden (Witt, 2001). Schon 1994 forderten Oppermann und Reiterer daher die Kombination software-ergonomischer Evaluierungsmethoden, um ganzheitliche Qualitätsurteile über eine Benutzungsschnittstelle zu erhalten. Diese Forderung motiviert besonders die Verknüpfung von subjektiven und objektiven Daten zur Evaluation einer Benutzungsschnittstelle.
Als Konsequenz der vorausgegangenen Überlegungen ergibt sich für die vorliegende Arbeit die Aufgabe, den Zusammenhang zwischen Eye-Tracking-Daten und subjektiv erlebten Nutzungsproblemen einer Testergruppe zu untersuchen, um auf diesem Weg einen Beitrag zur Validierung von Eye-Tracking-Daten zum effizienteren Einsatz in der Usability-Evaluation zu leisten.
7
1.3 Inhalt
Die Arbeit untereilt sich in einen Theorieteil A (Kap. 2-5) und einen empirischen Teil B (Kap. 6-11). Im theoretischen Teil werden die wichtigsten wissenschaftlichen Aspekte zur Mensch-Computer-Interaktion, zur Usability-Evaluation, zur Konzeptualisierung von Nutzungsproblemen und zur Anwendung von Eye-Tracking (-Parametern) umfassend erörtert. Diese münden im empirischen Teil in eine statistische Analyse des Zusammenhangs zwischen objektiven Blickbewegungsdaten und subjektiv erlebten Nutzungsproblemen.
Ausgehend von der Charakterisierung menschlicher Kommunikation werden im Kapitel 2 zum einen die Besonderheiten und Beziehungen in der Interaktion zwischen Mensch und Computer dargestellt. Zum anderen soll die Bedeutung und Durchführung von Usability-Evaluationsprozessen für die Softwareentwicklung aufgezeigt werden. Dabei wird im Besonderen ein spezielles Usability-Qualitätsmodell vorgestellt, welches die Grundlage eines modularen Vorgehens zur Überprüfung und Sicherung von Usability bildet. Hier wird auch die Nutzung von Eye-Tracking für die Usability-Evaluation anderen wichtigen Methoden gegenübergestellt. Das dritte Kapitel stellt drei unterschiedliche Konzepte zur Beschreibung von Nutzungsproblemen vor, wovon sich eines speziell auf Eye-Tracking-Parameter bezieht. Kapitel 4 beschreibt die wichtigsten Eigenschaften von Blickbewegungen und der visuellen Wahrnehmung im Hinblick auf deren Nutzen für die Identifizierung von Nutzungsproblemen. Im fünften und letzten Kapitel wird der erstellte Pool an Eye-Tracking-Parametern vorgestellt, woraus ausgewählte Parameter konkreten Nutzungsproblemen zu-geordnet werden.
Im Empirie-Teil werden das methodische Vorgehen und die Ergebnisse der statistischen Überprüfung des Zusammenhangs zwischen sechs ausgewählten Parametern und vier konkreten Nutzungsproblemen ausführlich erörtert.
8
Teil A - Theoretische Grundlagen
2. Evaluation der Mensch-Computer-Interaktion
2.1 Interaktion zwischen Mensch & Computer (MCI)
Die Interaktion zwischen Mensch und Computer kann in erster Linie durch den Austausch von Informationen charakterisiert werden. Auf diesen Informationsaustausch ist ein Computernutzer angewiesen, will er seine intendierten Ziele (bestimmte Aufgaben) im Computersystem erreichen. So werden Mensch und Computer als informationsverarbeitende Systeme betrachtet, die sich aber in grundlegenden Aspekten der Informationsverarbeitung unterscheiden. Die Interaktion zwischen Mensch und Computer wird über eine entsprechende Schnittstelle realisiert, welche unter Berücksichtigung zentraler System-, Aufgaben-und Benutzermerkmale gestaltet ist (User Interface Design) (Cooper & Robert, 2003).
Eine derartige Beschreibung der Mensch-Computer-Interaktion (MCI) referiert vornehmlich auf ihre Funktion zur Unterstützung von zweckbestimmten Arbeitstätigkeiten. Daneben finden sich auch zweckfreie Tätigkeiten wie Computerspiele als weitere Haupt-Kategorie der MCI. Diese Studie konzentriert sich ausschließlich auf erstere Funktion.
2.1.1 Menschliche Kommunikation/Interaktion
Generell gilt die Kommunikation zwischen Menschen als Vorbild und Orientierung für die Mensch-Computer-Interaktion (Hüwel, 2001). Die Erforschung der zwischenmenschlichen Kommunikation 1 stellt eine Reihe unterschiedlicher Kommunikationsmodelle zur Verfügung, welche geeignet sind, zur Charakterisierung der Mensch-Computer-Interaktion beizutragen.
Einer der frühesten Beiträge stammt von Shannon & Weaver (1949). Das Informations-Transformationsmodell stellt den technischen Aspekt der Kommunikation in den Vorder-grund und legte auch den Grundstein für die heute geläufige sprachliche Orientierung, bei der Betrachtung kommunikativer Prozesse von Kommunikationskanälen zu sprechen (Ka- 1 Zwischenund innerhalb verschiedener Fachdisziplinen (Informatik, Psychologie etc.) fällt die Definition von Interaktion und Kommunikation äußerst durchaus gegensätzlich aus. So setzt z.B. der Kommunikationspsychologe Paul Watzlawick mit seinem berühmten Axiom Man kann nicht nicht kommunizieren (2000) Kommunikation und Verhalten gleich. Auf dieser psychologischen Ebene wird Kommunikation demnach seiner Beschränkung auf den Austausch verbaler Codes enthoben. Für diese Arbeit soll allerdings die Mensch-Computer-Interaktion von der Kommunikation zwischen Mensch und Computer abgegrenzt werden. Interaktion meint hier den Informationsaustausch mit einem Computersystem mittels Eingabegeräten (Maus, Tastatur) und einer graphischen Benutzungsoberfläche. Kommunikation meint die Arbeit mit einem Computer über gegenseitige Spracheingabe und Sprachausgabe. Letztere soll nicht Gegenstand dieser Studie sein.
9
nalmetapher). Über einen Kanal 2 würden verschiedenartige Informationen (z.B. verbal vs. non-verbal oder verschiedene Sinnesmodalitäten wie Sehen, Hören etc.) ausgetauscht.
Das Informations-Transfomationsmodell von Shannon & Weaver erweist sich nun allerdings zur Erklärung menschlicher Kommunikation als denkbar ungeeignet. Dies liegt im Wesentlichen in der Tatsache begründet, dass das Modell gemäß der zugrunde liegenden Informationstheorie Bedeutungsinhalte als Bestandteile einer Information ausklammert. So werden semantische Differenzen (Bedeutungsunterschiede) zwischen Sender und Empfänger im Modell nicht erfasst. Das Phänomen der Kommunikation hängt jedoch nicht von dem ab, was an Informationen übermittelt wird, sondern von dem, was im Empfänger geschieht. Die Frage ist, ob der Empfänger etwas mit der empfangenen Information anfangen kann, ob er über die notwendigen Kompetenzen verfügt, die Information zu dekodieren, zu entschlüsseln. Neben der syntaktischen Ebene, die im Transformationsmodell betrachtet wird, muss demnach auch die semantische Ebene der Kommunikation als potentiell störanfällig erachtet werden (Sperka, 1996). Die Beachtung der semantischen Ebene fordert die Erweiterung des bisherigen Kommunikationsmodells durch ein Kompetenzmodell, welches die Kodierung und Dekodierung von Bedeutungssequenzen ins Zentrum stellt.
Im so genannten klassischen Kommunikationsmodell (Herrmann, 1994) wird das Trans-formationsmodell durch ein semantisches Code-Konzept erweitert (siehe Abb. 2-1). Sender und Empfänger verfügen über einen Vorrat an Bedeutungen und Zeichen, durch deren geregelte Verknüpfung eine Verständigung möglich wird. Dabei läuft eine versendete Nachricht auch immer Gefahr, auf ihrem Weg vom Sender zum Empfänger durch (technische) Störquellen verfälscht zu werden. Viel wesentlicher ist aber die Tatsache, dass für eine erfolgreiche Kommunikation beide am Signalaustausch beteiligten Personen über denselben Bedeutungs- bzw. Zeichenvorrat verfügen müssen. Das klassische Kommunikationsmodell postuliert also einen spiegelbildlichen Prozesscharakter der Kommunikation. Kommunikationsstörungen sind in diesem Modell als Kompetenzdefizite in der Kodierung bzw. Dekodierung von Sender und Empfänger definiert.
2 Durch den rein technischen Charakter des Modells von Shannon & Weaver (1949) steht „Kanal“ noch für die rein physikalischen Gegebenheiten wie die Atmosphäre oder ein Kabel.
10
Abb. 2-1: Das klassische Kommunikationsmodell (Herrmann, 1992; S. 317)
In der Mensch-Computer-Interaktion kann es ebenfalls zu Störungen auf der Bedeutungsebene (Verständnisprobleme) z.B. bei der Verwendung von bildlichen Zeichen kommen (Icons, Piktogramme). Für den Benutzer ist es wichtig, dass er die Bedeutung des Icons allein aus dem Bild heraus versteht (Prinzip Function Follows Form). Kann er die vom System in Form einer Grafik enkodierte (verschlüsselte) Information nicht dekodieren, so ergibt diese für ihn keinen Sinn und die Kommunikation ist gestört (Dahm, 2006).
Eine Verknüpfung der beiden bisher angesprochenen Ebenen (syntaktisch vs. semantisch) gelingt für die MCI nun unter der Betrachtung des linguistischen Modells von Marcus & van Dam (1991). Gleichzeitig liefert das Modell eine Unterscheidung zwischen Interaktion und Kommunikation. In Bezug auf die graphische Benutzungsoberfläche eines Computerprogramms definiert die Syntax die Art der Gestaltung von Daten, z.B. deren Farbe oder Größe, das Informationsdesign des User-Interface. Die Kommunikation zwischen Benutzer und System auf der reinen Formebene entspricht nach dem linguistischen Modell der Interaktion. Auf Basis der Syntax kann der Benutzer die Daten zu Informationen trans-formieren, den Daten also eine Bedeutung geben. Die Kommunikation zwischen Benutzer und System auf der Bedeutungsebene wird als Dialog bezeichnet Aus diesen Definitionen geht hervor, dass die Interaktion immer implizit im Dialog vorhanden ist. Ohne Syntax ist auch keine semantische Verarbeitung möglich (Schimpfky, 2003; S. 7).
Neben der syntaktischen (Zeichen und Regeln) und semantischen Ebene (Bedeutung der Zeichen) spielt in der menschlichen Kommunikation noch eine dritte, die pragmatische Ebene eine Rolle. Die Pragmatik ist die Ebene des sprachlichen Handelns, welche unverzichtbar für eine erfolgreiche Kommunikation ist. Auf ihr können Fehler und Probleme, die in der syntaktischen oder semantischen Ebene entstehen, behoben werden. Einfach gesagt: Wenn man seinen Gesprächspartner nicht verstanden hat, fragt man nach. Auch hier lässt sich eine Brücke zur MCI schlagen. Anwendungsprogramme müssen auf das mensch-
11
liche Verhalten des Nachfragens hin angelegt und programmiert sein, um die Lösung von Kommunikationsproblemen zu ermöglichen. Aufgrund des hohen Aufwands zur Klärung von Missverständnissen ist es optimal, Probleme durch geeignete Software-Dialoge erst gar nicht entstehen zu lassen. Damit sind software-ergonomische Anforderungen 3 wie Feedback oder die Selbstbeschreibungsfähigkeit seitens des Systems angesprochen. Wie beim so genannten Paraphrasieren in der zwischenmenschlichen Kommunikation, wo ein Partner dem anderen zur Absicherung dessen Äußerungen in einer Frage zusammengefasst wiedergibt, fragt das System über ein Dialogfenster ab, ob der Nutzer die angestoßene Aktion, etwa das Löschen einer Datei, wirklich ausführen will. Durch diese Systemnachfrage können eventuelle Verluste wichtiger Daten verhindert werden (Dahm, 2006).
2.1.2 MCI als ergonomische Disziplin
Die Mensch-Computer-Interaktion lässt sich als eine ergonomische Disziplin verstehen. So dominierte im deutschen Sprachgebrauch bis in die 80er Jahre hinein der Begriff Software-Ergonomie gegenüber dem umfassenderen Begriff Mensch-Computer-Interaktion (Hüwel, 2001). Die Mensch-Computer-Interaktion ist wie die Ergonomie 4 einem allgemeineren Ziel untergeordnet: Die Gestaltung menschlicher Tätigkeiten und die Anpassung der Arbeitsbedingungen an die Bedürfnisse und Fähigkeiten des Menschen.
Zu den Arbeitsbedingungen gehören die Arbeitsmittel einschließlich der Werkzeuge, die Aufgaben, die Qualifikationen der Benutzer, insbesondere Benutzerwissen, organi-satorische und andere Rahmenbedingungen wie Unterstützung der Benutzer, Möglichkeiten der Kooperation, Selbständigkeit oder Entscheidungsfreiheit bei der Aufgabenbearbeitung sowie Qualifikationsmöglichkeiten (Wandmacher, 1993).
In der Mensch-Computer-Interaktion als wissenschaftliche Disziplin geht es im Speziellen um die Optimierung des Zusammenspiels aller Komponenten, die die Arbeitssituation von Computernutzern ausmachen: Mensch, Aufgabe, Technik und organisatorischer Rahmen. Damit erfüllt die MCI die Forderung nach einer ganzheitlichen Betrachtung menschlicher Interaktion. Sie ist keineswegs - wie oft fälschlich angenommen - auf die Analyse graphischer Benutzungsoberflächen beschränkt. Ziel ist es vielmehr, die Eigenschaften z.B. einer Software an die psychischen Dispositionen (z.B. Persönlichkeit) und physischen Vorlieben und Gewohnheiten einer speziellen Benutzergruppe (=Zielgruppe) anzupassen.
Im Mittelpunkt stehen demnach zum einen deren kognitive und sensumotorische Fähigkeiten, d.h. die Stärken und Schwächen menschlicher Informationsverarbeitung (z.B. hoch entwickelte Wahrnehmungsfähigkeiten vs. Eingeschränktheit des menschlichen Bewusstseins). Zum anderen müssen als Einflussgrößen auf die Interaktionsqualität mit einem Computer kognitive, soziale und emotionale Bedürfnisse der Benutzer berücksichtigt wer-
3 ZumBeispiel definiert die internationale Norm ISO 9241 im Teil 10 sieben Gründsätze der Dialoggestaltung (siehe Abschnitt 2.2.1).
4 Ergonomie (gr. Ergo = Arbeit; nomos = Gesetz) meint im übertragenen Sinn „Die Wissenschaft von der Arbeit“(Duden).
12
den; z.B. das Bedürfnis, effektiv und effizient arbeiten zu wollen, erworbenes Wissen und Fertigkeiten einzusetzen sowie das Bedürfnis nach Kooperation und nach Austausch mit anderen Personen in belastenden Situationen (Bräutigam, 1998).
2.1.3 Aufgabe-Benutzer-Computer-Relation in der MCI
Zur Charakterisierung der Beziehungen zwischen den Variablen der MCI eignet sich das A-B-C-Modell von Oppermann und Reiterer (1994). 5 Das Modell (siehe Abb. 2-2) wird als ganzheitlich bezeichnet, da es alle für software-ergonomische Fragestellungen relevanten Elemente und Beziehungen umfasst. Mit dem Verhältnis Benutzer-Aufgabe (1) werden human- und arbeitswissenschaftliche Aspekte der Aufgabengestaltung 6 thematisiert.
Abb. 2-2: A-B-C-Modell von Oppermann & Reiterer (in Anlehnung an Oppermann & Reiterer, 1994; S. 337). Das Modell bildet alle für software-ergonomische Fragestellungen relevanten Elemente und Beziehungen ab und ist Grundlage einer ganzheitlichen Betrachtungsweise der MCI.
Die Benutzer-Computer-Relation (2) bezieht sich auf die Qualität der Benutzerunterstützung des Anwenders durch den Computer (Benutzbarkeit), während die Beziehung zwischen Computer und Aufgabe (3) Fragen der Unterstützung des Nutzers durch den Computer bei der Aufgabenbewältigung (Funktionalität) behandelt. Diese Relationen sind von Kontextfaktoren beeinflusst. Diese sind sowohl physischer (Zeit, Ort, Raum) als auch psychosozialer (Organisationsstruktur, Einzel vs. Gruppenarbeit) Natur (Oppermann & Reiterer, 1994). Zwischen den Elementen Aufgabe, Benutzer und Computer können folgende Beziehungen näher beschrieben werden:
5 Entgegen der Begriffsverwendung der Autoren Oppermann & Reiterer sei in diesem Abschnitt auch der Begriff Mensch-Computer-Interaktion als Synonym für Software-Ergonomie verwandt.
6 Siehe Glossar
13
Aufgaben-Benutzer-Relation
Durch die Art, wie die Beziehung zwischen Benutzer und Aufgabe 7 gestaltet ist, entscheidet sich, inwieweit der Benutzer in der Lage ist, die ihm übertragenen Aufgaben zu erfüllen und ob er diese als belastend erlebt. Vor allem die Arbeits- und Humanwissenschaften haben für diesen Bereich eine Reihe von Kriterien festgelegt, die die ergonomische Qualität der Aufgabenbewältigung bestimmt. Als wichtigste Faktoren sind zu nennen: Persönlichkeitsförderlichkeit, Selbstkontrolle, Kommunikationsförderlichkeit, Transparenz der Aufgabenstruktur, Rückmeldung über Aufgabenerfüllung und Ganzheitlichkeit der Aufgabe (ausführlicher siehe z.B. Ulich, 1998). Die Gestaltung des physischen und psychosozialen Kontextes wird durch die Aufgaben-Benutzer-Beziehung ebenfalls erfasst (Oppermann & Reiterer, 1994).
Benutzer-Computer-Relation
Die Beziehung zwischen Benutzer und Computer ist der unmittelbare Gegenstand der Mensch-Computer-Interaktion. Prinzipien menschlicher Aktivitäten und Informationsverarbeitung (Wahrnehmung, Gedächtnis, Emotionen, Motivation und Handeln) werden mit Aspekten der technologischen Informationsverarbeitung (Algorithmen, formale Logik) konfrontiert. Aus dieser Konfrontation lässt sich die ergonomische Gebrauchsqualität (Usability) ableiten. Diese ist - vereinfacht ausgedrückt - umso höher, je geringer der Inter-aktionsaufwand für den Nutzer bei der Bedienung des Computersystems ist 8 . Der Interak-tionsaufwand bestimmt sich etwa darin, welchen Anpassungsgrad das System dem Nutzer abverlangt oder welchen Lernaufwand der Nutzer zur Bedienung des Systems aufbringen muss. In der Benutzer-Computer-Relation kommt also zum Ausdruck, inwiefern der Benutzer durch die Schnittstelle (User Interface) in seinem Ziel, eine bestimmte Aufgabe auszuführen, unterstützt wird, oder ob die periphere Aufgabe (Computerbenutzung), in der Interaktion überwiegt (Oppermann & Reiterer, 1994). Der damit angesprochene Konflikt zwischen der Usability eines Computersystems und dessen durch den Funktionsumfang bedingte Komplexität stellt die Herausforderung für User Interface Designer dar (Cooper, 2004). Dabei geht es um die Frage, welche Anzahl an Einzelfunktionen für eine Aufgabe im Hinblick auf die davon beeinflusste Benutzungsqualität noch angemessen ist.
7 Cooper (2003) unterscheidet in Bezug auf die Computerbenutzung zwischen Ziel und Aufgabe. Ein Ziel wird hier z.B. als erfolgreiches Ausdrucken eines Dokumentes konzeptualisiert, wohingegen eine Aufgabe als Aufwand zum Erreichen dieses Ziels gilt. Demnach können den Nutzer irrelevante Aufgaben belasten, die durch eine ungeeignete Interaktionsgestaltung entstehen. Der von Oppermann verwandte Begriff der Aufgabe ist eher arbeitswissenschaftlicher Natur. Er meint die Arbeitsanweisung (Dokumentenausdruck), die der Computernutzer von Extern erhält.
8 Dieser Zusammenhang behält nur in Bezug auf Business-Anwendungen (z.B. Microsoft Excel) seine Richtigkeit. Auf Computer-Spiele lässt er sich indes nicht übertragen.
14
Computer-Aufgaben-Relation
In dieser Dimension wird ein sehr wichtiger Aspekt deutlich. Jenseits ergonomischer Überlegungen zur Qualität eines Computersystems, kommt diesem ein grundsätzlicher Auftrag zu: Funktionalität. Es gilt immer zu prüfen, inwieweit das System die vorgegebenen Aufgaben tatsächlich mit hinreichender Genauigkeit und Vollständigkeit unter Verwendung der bereitgestellten Funktionen lösen kann (Oppermann & Reiterer, 1994). Die Funktionalität (functionality) ist damit eine zentrale Einflussgröße auf die Gebrauchstauglichkeit (Usability) einer Computerapplikation (Schweibenz & Thissen, 2003). Daher muss im Vorfeld einer Usability-Evaluation geprüft werden, inwieweit das System die spezifischen Funktions-anforderungen überhaupt erfüllt.
2.2 Usability
In den vorherigen Abschnitten wurde deutlich gemacht, welche Prozessebenen in der Interaktion zwischen Mensch und Computer grundsätzlich betrachtet werden können und welche Elemente (Aufgabe, Benutzer, Computer) dabei in Beziehung zu setzen sind.
Um die Benutzungsschnittstelle in Bezug auf die Bedürfnisse und Fähigkeiten des Menschen optimieren zu können, was erklärtes Ziel einer ergonomischen Interaktionsgestaltung ist, müssen die Produkte der Interaktion zwischen Mensch und Computer als messbare Größen erfasst werden. In den folgenden Abschnitten sollen daher die Begriffe Usability, Usability-Evaluation und Usability-Engineering erörtert werden.
2.2.1 Begriff und Qualitätsmodell
Begriffsbestimmung
Der Begriff Usability kennzeichnet die Nutzungsqualität von Software. Neben softwareergonomischen Merkmalen sind in dieser Bewertung auch rein software-technische Merkmale (Funktionalität) eingeschlossen, vorausgesetzt diese haben Auswirkungen auf die Softwarenutzung. Es steht folglich nicht die technische Güte im Vordergrund, sondern die Nutzungsqualität ergibt sich daraus, wie gut das Softwareprodukt den Nutzer beim Erreichen seiner Ziele unterstützt (DATech, 2004).
Die Bezeichnung Usability geht auf die internationale Norm ISO 9241 9 zurück, die in einem 17-teiligen Katalog ergonomische Anforderungen für Bürotätigkeiten mit Bild-
9 DieNorm ist sowohl nationaler (DIN), europäischer (CEN) als auch internationaler Standard (ISO), weshalb man in der Literatur oft uneinheitliche Bezeichnungen findet, die allerdings identische Inhalte bezeichnen: ISO 9241, DIN EN 29241 oder DIN EN ISO 9241.
Bei der Verwendung der ISO 9241 und anderer software-ergonomischer Normen muss beachtet werden, dass diese keine rechtlichen Vorschriften enthalten, sondern vielmehr Richtliniencharakter haben. Dadurch wird berücksichtigt, dass Usability keine objektive Produkteigenschaft ist, sondern sich eng am konkreten Nutzungskontext abbildet. So sei z.B. eine Festlegung auf Forderungen des mittleren Benutzers nicht erwünscht und unzweckmäßig (Dzida, 1994).
15
schirmgeräten festlegt. Die Teile 2, 3, 8 sowie 10-17 können dabei für softwareergonomische Belange verwendet werden (siehe Abb. 2-3). Teil 11 der ISO 9241 Anforderungen an die Gebrauchstauglichkeit definiert Usability (in der deutschen Übersetzung Gebrauchstauglichkeit genannt) als Qualitätsfaktor von Software-Produkten:
Effektivität meint dabei die Genauigkeit und Vollständigkeit, mit der ein Computerbenutzer sein Ziel erreichen kann. Der damit ins Verhältnis gesetzte Aufwand bestimmt die Effizienz. Zufriedenheit definiert sich über das Fehlen von Beeinträchtigungen und einer positiven Einstellung gegenüber der Produktnutzung. Dabei werden diese Faktoren der Gebrauchstauglichkeit an den Eigenschaften der Benutzer, deren Zielen, Aufgaben, Ausrüstung (Hardware, Software und Materialien) sowie an der psychischen und sozialen Umgebung relativiert (DIN EN ISO 9241-11, 1998). Entscheidend für das Verständnis von Usability ist der Bezug auf einen Nutzer, der in einem spezifischen Nutzungskontext mit dem System interagiert. Denn „the usability of a product is not an attribute of the product alone, it is an attribute of interaction with a product in a context of use” (Karat, 1997; S. 692).
Abb. 2-3: Software-ergonomische Teile der Norm ISO 9241. Prinzipielle Anforderungen: Teile 10-12, spezielle Anforderungen: Teile 13 -17. Zusätzliche Anforderungen: Teile 2, 3 und 8 (in Anlehnung an Dzida, 1994; S. 381).
10 vgl. Glossar
16
Die Effektivität der Computernutzung kann in einem Usability-Test auf Basis objektiver Nutzugsdaten (z.B. Zeit zur Aufgabenbearbeitung) erfasst werden. Dagegen sind Maße für Effizienz zusätzlich und Zufriedenstellung ausschließlich über subjektive Daten zu erreichen, z.B. über Testerkommentare während oder nach der System-Interaktion in Form von Interviews oder Fragebögen.
Im Umgang mit Fragestellungen zur Usability eines Computer-Interfaces wird mehrheitlich auf obige Minimaldefinition verwiesen. Dies auch im Kontext neuerer Bereiche der MCI wie etwa die Usability von Intnet-Applikationen:
Ein Web-Angebot mit einer hohen Usability erlaubt dem Besucher einen erwar-tungskonformen und transparenten Informationszugang, so dass eine effektive, effiziente und subjektiv zufriedenstellende Suche nach Informationen und Produkten, sowie ggf. die Durchführung von Transaktionen möglich ist (Yom & Wilhelm, 2004a; S. 19).
Neben den allgemeinen Usability-Maßen Effizienz, Effektivität und Zufriedenstellung werden im Teil 10 (Dialoggrundsätze) und 12 (Informationsdarstellung) grundsätzliche Gestaltungsprinzipien für ein gebrauchstaugliches User Interface spezifiziert. In den Teilen 13 -17 werden vertiefend Kriterien für spezielle Dialogtechniken definiert. Zusätzlich können aus den Teilen 3 (visuelle Anzeigen) und 8 (Farbdarstellungen) weitere Anforderungen einer graphischen Benutzungsschnittstelle abgeleitet werden. Teil 2 (Anforderung an die Aufgabe) der ISO 9241 liefert Qualitätskriterien für die Aufgaben-Benutzer-Relation (siehe Abschnitt 2.1.3), indem Aufgabencharakteristika wie Anforderungsvielfalt und Rückmeldungen über die Aufgabenerfüllung gefordert werden. Die Berücksichtigung der ISO 9241-Teil 2 wird einer ganzheitlichen Betrachtungsweise der MCI gerecht (siehe Abb. 2-2).
Neben Gebrauchstauglichkeit findet man in der Literatur häufig auch den Begriff Benutzbarkeit. Dieser geht auf die internationale Norm ISO 9126 11 zurück. Die Norm definiert Qualitätskriterien von Software-Produkten und stellt dem Software-Entwickler einen entsprechenden Anwendungsleitfaden zur Verfügung. Nach ISO 9126/DIN 66272 ist Benutzbarkeit wie folgt definiert:
Benutzbarkeit ist dabei eine von sechs gleichwertigen Software-Qualitätseigenschaften. Zusätzlich werden in der Norm benannt: Funktionalität (functionality), Zuverlässigkeit (reliability), Effizienz (efficiency), Änderbarkeit (maintainability) und Übertragbarkeit (portability). Im Gegensatz zur ISO 9241 werden diese Gestaltungsanforderungen nicht auf der
11 Die internationale Norm ISO 9126 enthält in großen Teilen die deutsche Norm DIN 66272
17
Ebene konkreter Kenngrößen vertiefend beschrieben, so dass ein Einsatz zur praktischen Umsetzung software-ergonomischer Belange schwierig ist. Das gebrauchsbezogene Qualitätsverständnis, welches sich in den sechs Kriterien der ISO 9126 wiederfindet, motiviert die Bezeichnung Gebrauchsqualität (quality in use) (Bevan, 1997, zitiert nach Oertel, 2003) 12 .
Dzida (2001) schlägt eine begriffliche Differenzierung zwischen Gebrauchstauglichkeit und Benutzbarkeit vor. Letztere definiert sich dabei eher über eine Merkmalssicht. Benutzbarkeit umfasst danach die Produktmerkmale, welche zu einer einfacheren Benutzung führen. Jene Produktattribute sind weniger kontextabhängig und können vom Software-Hersteller mit Blick auf eine Benutzerzielgruppe entwickelt werden. Im Sinne der ISO 9241-11 definiert sich Gebrauchstauglichkeit über eine Nutzungssicht: der effektive, effiziente und zufrieden stellende Gebrauch einer Software gemäß den Erfordernissen des Nutzungskontexts.
In vielen meist journalistischen Beiträgen zum Thema Usability findet sich der Begriff Be-nutzerfreundlichkeit wieder. Aufgrund einer fehlenden konzeptionellen Verankerung und einer doch inflationären Verwendung dieses Begriffs, scheint es nicht angemessen zu sein, Usability mit Benutzerfreundlichkeit zu „übersetzen“.
Normen, Styleguides und Heuristiken
Neben den bisher genannten Usability-Normen existieren noch weitere Regelwerke, die software-ergonomische Anforderungen beinhalten (siehe Abb. 2-4). Unter dem Begriff Regelwerk sollen dabei Normen (international und national) sowie herstellerspezifische und produktspezifische Richtlinien, so genannte Styleguides zusammengefasst sein. Styleguides stellen eine Ergänzung der eher allgemein gehaltenen Normen dar und beinhalten meist konkrete Gestaltungsvorschriften (operationale Hinweise).
Styleguides regeln z.B.:
≡ Design und Anordnung einzelner Interaktionselemente
≡ Verwendung von Begriffen und bildhaften Beschreibungen
≡ Ablauf einzelner Dialogschritte
≡ Aufteilung von Inhalt, Gestaltung und Funktionalität (z.B. bei Websites)
Es ist festzustellen, dass es teils große Überschneidungen zwischen einschlägigen Normen und herstellerspezifischen Styleguides gibt. Dies unterstreicht die Bedeutung der Normentexte für die Praxis. Oberstes Ziel bei der Erstellung eines Styleguides ist, mit dessen Verwendung die Konsistenz einer zu entwickelnden komplexen Anwendung oder Website zu
12 In der vorliegenden Arbeit sollen die Begriffe Usability, Gebrauchstauglichkeit und Gebrauchsqualität synonym verwendet werden.
18
sichern. Um dies zu erreichen, müssen alle Beteiligten (Designer, Programmierer, Marketing etc.) des Softwareentwicklungsprozesses den festgelegten Styleguide kennen und anwenden. Die bekanntesten Styleguides stammen von großen Software-Anbietern wie Apple, Microsoft, SAP oder Sun. Daneben finden sich als Reaktion auf die rasanten Entwicklungen im Internetsektor vermehrt Styleguides für Webapplikationen und Internetpräsenzen (Dahm, 2006).
Unter einer Usability-Heuristik 13 ist eine Sammlung an Gestaltungsprinzipien zu verstehen, die weniger theoretisch begründet als vielmehr auf langjähriger Erfahrung bekannter Fachleute gegründet ist. Heuristiken beinhalten im Wesentlichen operationale Anfor-derungen, d.h. die in einer Heuristik aufgestellten Prinzipien können direkt bei der Gestaltung ange-wandt oder bei einer Bewertung abgeprüft werden. Die beiden bekanntesten Usability-Heuristiken stammen von Ben Shneiderman und Jakob Nielsen.
Abb. 2-4: Auswahl an wichtigen software-ergonomischen Regelwerken, unterteilt in nationale/internationale Normen, hersteller- und produktspezifische Styleguides sowie Heuristiken bekannter Usability-Fachleute (in Anlehnung an Dahm, 2006; Kap. 7 &
8).
Usability-Qualitäts-Modell
Durch die zahlreichen Zugänge zum Verständnis des Usability-Begriffs und dessen unterschiedlicher Operationalisierung ergibt sich ein Problem. Es mangelt an verständlichen und
13 Heuristik : methodische Anleitung, Anweisung zur Gewinnung neuer Erkenntnisse (Duden)
19
hinreichend spezifizierten Komponenten von Usability. Dies hat zur Folge, dass die Zielgrößen für den Entwicklungs- und Bewertungsprozess von Usability nicht eindeutig gegeben sind (Zuordnungsproblem). Zudem wird dadurch die Kommunikation unter den Beteiligten eines Softwareentwicklungsprozesses (z.B. UI-Designer und Programmierer) erschwert (Verständnisproblem) (Oertel, 2004).
Einen Lösungsansatz hierfür bietet das Modulare Vorgehensmodell für die Usability Evaluation (MOVE) nach Oertel (2003; 2004). Durch das darin enthaltene Usability-Qualitätsmodell wird zum einen das Verständnisproblem gelöst, indem in einer Sicht alle Usability-Aspekte untergebracht sind, wodurch diese auf ihre Schnittmengen hin überprüft werden können, und zum anderen das Zuordnungsproblem, indem aufgezeigt wird, durch welche Indikatoren welche Usability-Merkmale bestimmt sind. Das Modell schlägt auf Grundlage einer Analyse zahlreicher Regelwerke folgende Hauptmerkmale der Usability-Qualität für interaktive Systeme vor (Oertel, 2004; S. 303):
≡ Anwenderunterstützung: Qualität der Auswirkung des Systemverhaltens auf den Zielanwender bzw. die Ausführung dessen Zielaufgaben.
≡ Dialogverhalten: Qualität des Systemverhaltens, das sich im Dialog mit einem Anwender bei der Ausübung von Zielaufgaben zeigt.
≡ Interfacegestaltung: Qualität des Designs der Benutzungsschnittstelle (User Interface), über die der Anwender mit dem System interagiert.
Diese drei Qualitätsmerkmale werden entsprechend dem Modularen Vorgehensmodell in Form von Teilmerkmalen und Indikatoren spezifiziert, welche sich anhand ausgewählter Regelwerke ableiten lassen (siehe Abb. 2-5).
20
Abb. 2-5: Usability-Qualitätsmodell nach Oertel (2004; S. 304). Die drei Hauptmerkmale der Usability-Qualität werden durch Teilmerkmale und Indikatoren spezifiziert, welche sich anhand ausgewählter Usability-Regelwerke ableiten lassen. Das Modell bietet einen integrativen Lösungsansatz für den Mangel an verständlichen und hinreichend spezifizierten Merkmalen von Usability.
2.2.2 Usability-Evaluation
Evaluationsprozess
Wie in Abschnitt 2.2.1 dargestellt, sind die ergonomischen Anforderungen an Software bzw. an die Gestaltung der MCI in Form von Qualitätseigenschaften festgehalten, die in Normen, Styleguides und anderen Regelwerken definiert sind und eine mehr oder weniger verbindliche Grundlage für den Entwicklungs- und Bewertungsprozess von Softwareprodukten darstellen.
Eine Evaluation ist grundlegend dadurch charakterisiert, dass „there are an object being evaluated (...) and a process through which one or more attributes are judged or given a value (...) finally, we should consider that evaluations have a purpose” (Karat, 1997; S. 689). Der Bewertungsprozess eines Objekts kann dabei subjektiv oder objektiv erfolgen. Im ersten Fall gründet die Evaluation auf der Erfahrung einer Person im Umgang mit dem Objekt. Bei einer objektiven Evaluation werden die Objektattribute direkt gemessen, ohne auf den Erfahrungsschatz einer Person zurückzugreifen (Karat, 1997). Wottawa & Thierau (1998) kennzeichnen eine Evaluation weiterhin wie folgt:
21
≡ E. ist Planungs- und Entscheidungshilfe auf Basis von Bewertungsprozessen.
≡ E. ist orientiert an einem bestimmten Ziel und einem bestimmten Zweck. Primärziel ist die Überprüfung und Verbesserung.
≡ E. dient zur Kontrolle der Zielerreichung.
In Berücksichtigung der allgemeinen Kennzeichen einer Evaluation kann die Usability-Evaluation als der Prozess zur Prüfung und Bewertung der Usability von Softwareprodukten bezeichnet werden. Softwareentwicklern soll eine Evaluation Ergebnisse liefern, auf deren Basis es sich überprüfen lässt, ob das entwickelte Produkt festgelegte Qualitätsanforderungen erfüllt. Zur Usability-Evaluation werden verschiedenartige Methoden angewandt, die ein gemeinsames Kennzeichen aufweisen. Es soll festgestellt werden, ob ein System adäquat auf die Nutzerbedürfnisse abgestimmt ist. Der Einsatz verschiedener Techniken im Usability-Evaluationsprozess erklärt sich aus der Tatsache, dass Usability eine komplexe Qualitätseigenschaft ist (Karat, 1997).
Die Auswahl der Evaluationsmethode ist von der Zielstellung abhängig. Nach Hilbert & Redmiles (2000; S. 389) sind folgende Ziele einer Usability-Evaluation zu unterscheiden:
≡ Understanding user behavior and performance
≡ Understanding user thoughts and experience
≡ Comparing design alternatives
≡ Computing usability metrics 14
≡ Certifying conformance with standards
Die Auswahl der Usability-Methoden wird weiterhin von folgenden Fragestellungen beeinflusst (Karat, 1997; S. 693):
≡ Wer führt die Evaluation aus? - Ist es besser, das zu untersuchende System von einem Usability-Experten oder einem potentiellen Nutzer bewerten zu lassen?
≡ Welche Informationen sollen gesammelt werden? - Sollen eher Problemstellen identifiziert oder die Interaktionsqualität gemessen werden (Nutzer-Performanz).
≡ Wer ist der Auftraggeber? - Zielt die Evaluation darauf ab, Softwareentwickler zu beeinflussen oder werden die Ergebnisse zu Marketingzwecken verwendet?
≡ Wie viele Ressourcen stehen zur Verfügung? - Wie hoch ist das Zeit- und Finanzbudget zur Durchführung der Evaluation?
14 vgl. Glossar
22
Mit Blick auf diese Einflussdimension wird deutlich, dass der Kern einer Software-Evaluation, die durch eine spezifische Zielstellung initiiert wird, darin besteht, die in einem Bewertungsprozess erzielten Ergebnisse (Ist-Zustand) mit einem gewünschten Ergebnisprofil (Soll-Zustand) zu vergleichen. Der Bewertungsprozess erfordert demnach das Aggregieren und Analysieren zahlreicher Informationen, anhand derer die relevanten Systemkomponenten verglichen werden können. Die Vorgehensweise hierbei beschreibt z.B. das Vorgehensschema zur Software-Evaluation von Holz auf der Heide (1993) (siehe Abb. 2-6). Danach bildet die Zielformulierung den ersten Handlungsschritt. Erst wenn festgelegt ist, wozu evaluiert werden soll, können die Evaluationskriterien (Systemmerkmale) und Evaluationsmittel (Methoden und Verfahren) definiert werden.
Abb. 2-7: Vorgehensschema zur Software-Evaluation in Anlehnung an Holz auf der Heide (1993).
Unter Rückgriff auf das in Abschnitt 2.2.1 vorgestellte Usability-Qualitätsmodell (siehe Abb. 2-5) lässt sich am Beispiel des Modularen Vorgehensmodells für die Usability Evaluation (MOVE) nach Oertel (2003) verdeutlichen, wie sich im Evaluationsprozess Ziele, Kriterien und Mittel ausprägen und gegenseitig bedingen.
Modulares Vorgehensmodell zur Usability Evaluation (MOVE)
In Berücksichtigung verschiedenartiger Einflüsse auf die Durchführung einer Evaluation, wie sie z.B. von Holz auf der Heide und Karat beschrieben sind 15 , geht das Modell zusammenfassend von folgenden Fragestellungen bzw. Evaluationszielen aus (Oertel, 2003):
A
Ist das Design anforderungsgemäß?
Das Untersuchungsziel ist die Überprüfung der Qualität der Benutzungsschnittstelle anhand
B Verhält sich das Produkt anforderungsgemäß? Der Fokus
15 MOVE gründet hier auf Paterno (2000): Engineering twoards a target: Is the design good enough?/Comparing alternative designs: Which is best?/Unterstanding the real world: How well does the design work in real world?/Checking conformance to a standard: Does this product conform to the standard?
23
C
Können die Anwender erfolgreich interagieren?
Hier gilt es zu überprüfen, inwieweit die zu untersuchende Applikation poten-
Abb.2-8: MOVE: Übersicht über die Modellstruktur (Oertel, 2003; S. 64)
Die aus den jeweiligen Fragestellungen resultierenden Untersuchungsziele A, B und C beziehen sich auf unterschiedliche Teilqualitäten von Usability: Interfacegestaltung, Dialogverhalten und Anwenderunterstützung 16 (vgl. Abb. 2-5). In Orientierung an das Vorgehensschema nach Holz auf der Heide (siehe Abb. 2-7) werden den drei Untersuchungszielen jeweils ein Modul zugeordnet, das seinerseits die Evaluationskriterien undmittel je nach zu untersuchender Teilqualität spezifiziert (siehe Abb. 2-8). Das Evaluationsmodell ist so anzuwenden, dass je nach Zielformulierung das entsprechende Modul aktiviert wird, welches konkrete Methoden und Verfahren zur Qualitätserfassung definierter Produktmerkmale bereitstellt. Die Module können unabhängig voneinander angewandt werden und führen zu eigenständigen Ergebnissen. Ist eine Auswahl auf Basis des Evaluationsauftrags nicht möglich, empfiehlt sich aus inhaltlichen und wirtschaftlichen Gründen eine Abfolge von A nach C (Oertel, 2003). Als Output eines jeden Moduls steht ein Usability-Bericht, der die Ergebnisse interpretierend zusammenfasst und gegebenenfalls einen Maßnahmenkatalog zur Optimierung der Usability beinhaltet.
16 In Anlehnung an die Norm ISO 9241 (siehe Abb. 2-3) wird davon ausgegangen, dass die Anwenderunterstützung - im Modell als Gebrauchstauglichkeit im engeren Sinne konzeptualisiert - wesentlich von der Qualität der Interfacegestaltung und der Qualität des Dialogverhaltens abhängig ist.
24
Usability-Methoden in Bezug auf die Module nach MOVE
Mit der Beschreibung der für die Module A, B und C nach MOVE empfohlenen Evaluationsmitteln kann ein Einblick in die aktuelle Bandbreite an Methoden und Verfahren für die Usability-Evaluation gegeben werden.
A Interfacegestaltung: Das Modul A ist auf eine Analyse der Benutzungsschnittstelle ausgerichtet, die feststellt, ob die zur Herstellung der Gebrauchstauglichkeit notwendigen Designelemente des Graphical User Interface (GUI) ausgewählten Anforderungen entsprechen. Eine Operationalisierung erhalten diese Anforderungen etwa durch die Teile 3, 8 und 12 der ISO 9241 oder durch Styleguides (siehe Abschnitt 2.2.1). Für den analytischen Vergleich zwischen Ist-Zustand der Interfacegestaltung und den Anforderungen werden gewöhnlich ein oder mehrere Experten 17 eingesetzt (Oertel, 2003). Der Usability-Experte tritt dabei als Ersatz für den Zielanwender auf und versucht potentielle Usability-Probleme zu identifizieren. Das hierbei benötigte Wissen gründet auf die Erfahrung des Experten bzgl. anderer Systeme und dazugehöriger Nutzer. Der Experte führt die Bewertung des Systems häufig auf Grundlage gegebener Regelwerke (guidelines) und einer Beschreibung der prototypischen Interaktion zwischen Nutzer und System (use szenario) aus (Virzi, 1997). Die für die Evaluation der Interfacegestaltung relevanten Zielkriterien (Systemmerkmale) sind z.B. die Qualität der Informationsdarstellung (Komposition von Inhalt, Form und Farbe), die Art des Medieneinsatzes sowie die Gestaltung von Navigation und Seitenstruktur speziell bei Web-Anwendungen. Im Rahmen des Moduls A kommen zur Generierung von Indika-toren der genannten Systemmerkmale nur expertenbasierte Methoden in Frage. Exemplarisch können hier folgende Methoden mit dazugehörigen Verfahren genannt werden:
Heuristische Analyse. Die heuristische Analyse zählt zu den so genannten Inspektionsmethoden, welche sich im Allgemeinen dadurch auszeichnen, dass ein System auf Grundlage einer Liste genereller Prinzipien (Heuristiken) oder einer Theorie Schritt für Schritt „durchwandert“ wird (walking-through), um Abweichungen zur Vergleichs-grundlage festzustellen. Als Werkzeug zur Erhebung der notwendigen Daten kommen häufig so genannte Checklisten zum Einsatz. Checklisten bestehen aus einer Liste konkreter Produktmerkmalen (z.B. Suchfunktion bei Web-Applikationen), deren Implementierung im System meist durch eine Gruppe aus Usability-Experten überprüft wird. Bekannte Verfahren für heuristische Analysen sind z.B. die Checkliste nach Ravden & Johnson, die auf Checklisten basierenden Evaluationsverfahren EVADIS II und MEDA oder die 10 Usability-Heuristicts von Nielsen. Letztere umfassen zehn einfach definierte Dialogprinzipien und stellen im Vergleich zu Usability-Checklisten geringere Anforderungen an die Vorerfahrung des Evaluators. Mit heuristischen Analysen lassen sich hauptsächlich allgemeine Aussagen über die Vollständigkeit zentraler Systemmerkmale treffen (Karat, 1997; Oertel, 2003).
17 Nach Nielsen (1993) sind bereits sechs Experten ausreichend, um etwa 80% der Usability-Probleme zu identifizieren.
25
Cognitive Walkthrough (Kognitiver Durchlauf). Ausschließlich Usability-Experten durchlaufen bei dieser Methode meist in einem Gruppensetting unabhängig voneinander eine zu bewertende Anwendung und schätzen dabei ein, ob eine zuvor spezifizierte Nutzergruppe in einem vorgegebenen Nutzungskontext bestimmte Arbeitsaufgaben mit dem System erfolgreich ausführen kann. Dazu ist es notwendig, die Anwendung anhand vordefinierter Arbeitsaufgaben (use szenarios) zu durchlaufen. Die Methode des Cognitive Walkthrough zielt hauptsächlich darauf ab, den Grad des Lernaufwandes einzuschätzen, den potentielle Nutzer für das Kennenlernen der (neuen) Systemfunktionen und damit für die erfolgreiche Arbeit mit der Anwendung betreiben müssen. Das effiziente Explorieren neuer Systemstrukturen hängt zuvorderst von der Qualität der Interfacegestaltung ab. Die Methode eignet sich prinzipiell für die Evaluation von Softwaresystemen aller Entwicklungsstufen, besonders aber für einfache Prototypen 18 (Low-Fidelity-Prototypes) (Virzi, 1997; Oertel, 2003).
Rankings Erweiterte Checklisten bieten dem Usability-Experten hier die Möglichkeit zu freitextlichen Angaben über Problemstellen einer Anwendung, welche durch ein mehrstufiges Ranking 19 gewichtet werden, womit sich der Verbesserungsbedarf quantifizieren lässt (Oertel, 2003).
Zur Qualitätsbestimmung der Interfacegestaltung stellt Modul A expertenbasierte Verfahren zur Auswahl, die (bewertete) Merkmalslisten liefern, auf deren Basis Optimierungsmaßnahmen von Design und Struktur der Benutzungsoberfläche abgeleitet werden und Interpretationshilfen für aufgetretene Probleme auf anderen Qualitätsebenen (Dialogverhalten und Anwenderunterstützung) liefern können (Oertel, 2003).
B Dialogverhalten: Das Modul B beinhaltet die Analyse des Dialogverhaltens eines Systems auf Grundlage vorgeschriebener Dialoggrundsätzen, welche zum Großteil innerhalb verschiedener software-ergonomischer Industrienormen (siehe Abb. 2-4) beschrieben sind. Eine sehr geläufige Bewertungsgrundlage ist etwa die in Abschnitt 2.2.1 beschriebene Norm 9241-Teil 10, die Dialogkriterien wie Aufgabenangemessenheit, Fehlertoleranz, Steuerbarkeit etc. operationalisiert. Aufgrund der an Normen abgeleiteten Zielkriterien verfolgt Modul B das Ziel, Ergebnisse zur Konformität des Systems mit ausgewählten Normen zu liefern. Im Vergleich zu Modul A ist Modul B damit im stärkeren Maße kontextabhängig, denn die in den Normen enthaltenen Systemanforderungen sind definitionsgemäß im Zusammenhang mit den Erfordernissen eines konkreten Nutzungskontextes
18 vgl. Glossar; Eine sehr einfache, aber dennoch effektive Form eines Software-Prototypen ist der so genannte Paper-Prototype. Dabei werden die zu evaluierenden Bildschirminhalte einer Anwendung auf Papier aufgezeichnet bzw. mit unterschiedlichen Materialien (Folie, Pappe, Post-Its etc.) dargestellt. Ein großer Vorteil der Arbeit mit Paper-Prototypen ist, dass Wünsche und Ideen von Zielanwendern bzgl. Design und Interaktionsstruktur der Anwendung direkt umgesetzt und auf ihren Effekt auf die Usability hin überprüft werden können.
19 Nielsen schlägt z.B. eine 5-stufige Bewertungsskala vor: 1 = Kein Usability-Problem, 2 = kosmetisches Problem, 3 = Kleines Usability-Problem, 4 = Großes Usability-Problem, 5 = Usability-Katastrophe (Details siehe Nielsen, 2001).
26
(Besonderheiten von Nutzer und Aufgaben) zu interpretieren (Oertel, 2003). Zur Evaluation des Dialogverhaltens sind neben rein expertenbasierten Methoden auch Tests mit Zielanwendern relevant. In einem Usability-Test bearbeiten potentielle Nutzer in der Interaktion mit dem zu überprüfenden Computersystem typische Aufgaben unter kontrollierten Bedingungen 20 (Oertel, 2003). Tests mit Nutzern finden daher häufig in speziell eingerichteten Usability-Laboren statt (siehe Modul C). Usability-Tests gelten als wichtigste Informationsquelle zur Usability-Evaluation, weil „only if we study real workers doing real jobs in real environments, can we be sure that what we learn is truly relevant to design (Nickerson & Landauer, 1997; S. 17). Zur Evaluation des Dialogverhaltens einer Computeranwendung können hier exemplarisch folgende Methoden und Verfahren genannt werden.
Fragebogen Generell gilt die schriftliche Befragung mittels Fragebogen als die bekannteste Technik zur Erhebung personenbezogener Daten (z.B. Einstellung einer Person zu einer Sache). Im Modul B ist der Fragebogen die dominante Datenerhebungsmethode. Zur Abfrage der Erfahrungen von potentiellen Anwendern kommt ein Fragebogen direkt im Anschluss an die Bearbeitung typischer Systemaufgaben zum Einsatz. Eine Prüfung des Dialogverhaltens leistet z.B. der Fragebogen ISONORM, mit welchem die Möglichkeit besteht über die Befragung von Anwendern ein System auf die Normkonformität mit ISO 9241-Teil 10 zu prüfen. Der Hauptteil des Fragebogens umfasst 35 Fragen zu den sieben Dialogprinzipien der Norm, die von einem Anwender anhand einer 7-stufigen Skala beantwortet werden können (siehe Abb. 2-9).
Abb. 2-9: Items zur Erwartungskonformität (Auszug) aus dem Benutzer-Fragebogen ISONORM 9241/10 zur Evaluation des Dialogverhaltens eines interaktiven Systems (modifiziert übernommen aus Prümper, 1997).
20 Um z.B. das Verhalten verschiedener Nutzer einer Anwendung vergleichen zu können, müssen störende externe Einflüsse auf die Untersuchungsvariable „Nutzerverhalten“ kontrolliert, sprich ausgeschaltet werden. Zu solchen so genannten Störvariablen zählen etwa ablenkende Geräusche, der Einsatz verschiedener Testleiter oder Unterschiede im Instruktionsmaterial. Kontrollierte Bedingungen können am besten in laborähnlichen Räumen hergestellt werden, in denen ein Untersuchungsleiter praktisch jede Veränderung des Umfelds kontrollieren kann (Bortz & Döring, 2002).
27
Der Benutzerfragebogen ErgoNorm referiert ebenfalls auf den Teil 10 der ISO 9241, wobei er im Vergleich zum vorherigen Fragebogen weniger auf die Konformitätsprüfung angelegt ist als vielmehr auf das Auffinden von Problembereichen, welche Nutzern einer häufig verwendeten Anwendung bekannt sind und von diesen als störend empfunden werden. Dabei sind die Fragen nach den Dialogprinzipien der ISO 9241-10 kategorisiert. In dieser Funktion ist ErgoNorm eine Ergänzung zum expertenbasierten Prüfverfahren zur Normen-konformität interaktiver Systeme von DATech 21 (DATech, 2004).
Prüfverfahren Das DATech Prüfhandbuch Gebrauchstauglichkeit beinhaltet einen umfangreichen Leitfaden zur Durchführung von Konformitätsprüfungen mit der Norm ISO 9241-
10. Das Prüfverfahren ist für die Ausführung von Usability-Experten entwickelt worden und ist anwendbar für jede interaktive Software, insbesondere für interaktive Systeme an Büroarbeitsplätzen. Es dient zur Identifikation von Abweichungen eines Produktmerkmals oder einer Benutzertätigkeit von aus der Norm abgeleiteten Mindestanforderungen (Prüfkriterien) (DATech, 2004). Damit schließt es sowohl die Prüfung der Interfacegestaltung (Produktmerkmale) als auch das Dialogverhalten sowie die Anwenderunterstützung ein und ist damit zum Teil auch für Modul A und C relevant. Zur Konformitätsprüfung wird das Leistungsvermögen zahlreicher Evaluationsmethoden und -verfahren genutzt, die in einem klar strukturierten Ablauf arrangiert sind (siehe Abb. 2-10). 22
Abb. 2-10: Komponenten des Prüfverfahrens für die ergonomische Evaluierung von interaktiven Softwaresystemen auf Grundlage der ISO 9241, Teile 10 und 11 nach DATech (2004; S. 12).
C Anwenderunterstützung: Modul C verfolgt das Ziel, die Qualität der Anwenderunterstützung als einen wesentlichen Teilaspekt der Usability zu bestimmen. Die Zielkriterien der Evaluation sind hier in Anlehnung an Teil 11 der ISO 9241 (siehe Abschnitt 2.2.1) die Effizienz und Effektivität der Systemanwendung sowie die Zufriedenstellung des Anwenders. Diese drei Faktoren geben im Wesentlichen darüber Auskunft, ob die Mensch-Computer-Interaktion erfolgreich verläuft und erfordern für eine Quantifizierung der Fakt-koren verschiedene Methoden zur Handlungsregistrierung und Anwenderbefragung. Zur
21 DATech: Deutsche Akkreditierungsstelle Technik e.V.
22 Details zur Durchführung der Konformitätsprüfung und Erläuterung der Verfahren siehe DATech (2004).
28
Erhebung entsprechender Performanz- und Präferenzdaten 23 ist die Ausführung eines Usability-Tests notwendig. Wie bereits erwähnt, bearbeiten in einem Usability-Test (auch Nutzertest) potentielle Nutzer in der Interaktion mit dem zu überprüfenden Computersystem typische Aufgaben unter kontrollierten Bedingungen (Oertel, 2003). Die Arbeitsumgebung zur Durchführung von Nutzertests ist das Usability-Labor (auch Usability-Lab).
Usability-Labor Generell kann das Usability-Lab(or) als die Umgebung beschrieben werden, in der mit einer bestimmten Laborausstattung ein optimales Setting (Umgebungsstruktur) geschaffen wird, um ein möglichst authentisches Nutzerverhalten beobachten und entsprechende Daten für eine tiefer gehende Analyse aufzeichnen zu können. Die Ausstattung eines Usability-Labs ist von konkreten Anforderungen abhängig. Beispielsweise stellt sich die Frage, ob das Lab hauptsächlich funktional sein oder es auch repräsentativ sprich geeignet für Kundenverkehr sein soll, wie häufig oder welche Art von Softwaresystemen hauptsächlich getestet wird etc. Hieraus ergeben sich unterschiedlichste Ausstattungsvarianten. Die Minimalanforderung ist das Vorhandensein eines ungestörten Arbeitsplatzes in einem abgetrennten Raum, um eine Verfälschung der Testergebnisse zu verhindern. Großer technischer Aufwand ist per se für ein Usability-Lab aber nicht notwendig, denn für die Evaluation eines Paper-Prototpyen 24 beispielsweise sind als Arbeitsmittel lediglich Papier und Schreibutensilien notwendig (Sommer, 2003).
Dennoch zeichnet sich ein Usability-Lab vor allem durch die technische Möglichkeit aus, Performanzdaten von Nutzern direkt zu erfassen und für eine Analyse aufzubereiten. Mit einer entsprechenden Laborausstattung können im Speziellen Blickbewegungen, Klickverhalten, Mausverhalten, Tastaturevents und psychophysiologische Daten einer Nutzergruppe aufgezeichnet werden.
23 vgl. Glossar
24 vgl. Glossar
29
Abb. 2-11: Beispiel für ein Setting im Usability-Labor mit Vollausstattung (in Anlehnung an Sommer, 2003; S. 211). Das Labor ist zweigeteilt. Im Testbereich können Tester (Endnutzer) mit Unterstützung eines Untersuchungsleiters an einem Computer-Testplatz Aufgaben mit einem zu evaluierenden Softwareprodukt bearbeiten. Das Nutzerverhalten wird dabei auf verschiedene Weise getrackt (aufgezeichnet). Kameras und Mikrofone ermöglichen Video- und Tonaufzeichnungen. Über einen Datenhandschuh, welchen ein Nutzer während der Interaktion mit der Anwendung trägt, können Puls und Hautleitwiderstand als Indikator für Stress gemessen werden. Ein Eye-Tracking-System nimmt die Bewegungen der Augen auf und visualisiert die Blickverläufe auf einem Beobachtungsmonitor. Zusätzlich steht ein Auswertungsplatz zur Verfügung, welcher für die Durchführung von Tester-Befragungen (Interview und/oder Fragebogen) geeignet ist und zudem die Möglichkeit bietet, gemeinsam mit dem Tester diverses Videomaterial (z.B. Bildschirmvideo, Mimik u. Gestik des Testers während der Interaktion etc.) auszuwerten. Vom zweiten Raum aus kann das Geschehen im Testbereich indirekt über Monitore oder direkt über einen so genannten Einwegspiegel, welcher die Durchsicht in nur eine Richtung zulässt, beobachtet werden, ohne dass der Tester gestört wird. Je nach eingesetzter Methode befindet sich der Testleiter zusammen in einem Raum mit dem Tester oder beobachtet das Nutzerverhalten vom Beobachtungsraum aus.
Zur Datengewinnung für die im Rahmen des Moduls C zu evaluierenden Usability-merkmale Effizienz, Effektivität und Zufriedenstellung, können im Usability-Labor ver-
schiedene Methoden und Verfahren zum Einsatz kommen, welche bestimmte Anforde-
rungen an das Laborsetting stellen (siehe Abb. 2-11). Folgende Methoden und Verfahren
können exemplarisch beschrieben werden:
30
Lautes Denken Das Laute Denken (thinking aloud) ist die populärste Datenerhebungsmethode zur Verwendung im Usability-Test (Nielsen, Clemmensen et al., 2002). Die Methode dient der Erfassung bewusster handlungsbegleitender Kognitionen und Emotionen, die Nutzer während der Benutzung einer Software verbal äußern. Tester verbalisieren während der aufgabenbasierten Nutzung eines Computersystems ihre Gedanken laut, welche vom Testleiter entweder handschriftlich oder per Tonaufzeichnung erfasst werden. Auf Basis des verbalen Datenmaterials kann auf Problembereiche der Software geschlossen werden (Hamborg, 2002). Zudem vermittelt das Laute Denken einen Einblick in den Praxisfall und lässt Aussagen über die Zufriedenstellung der Tester zu (Oertel, 2003).
Videokonfrontation Wie das Laute Denken ist die so genannte Videokonfrontation den Verbalisationsverfahren zuzuordnen. Die Methode der Videokonfrontation sieht vor, dass zunächst das Nutzungsverhalten eines Testers im Umgang mit dem zu evaluierenden System per Videotechnik aufgezeichnet wird, wobei meist die auf der Benutzungsoberfläche sichtbar werdende Interaktion als auch Mimik, Gestik und Kommentare des Testers erfasst werden. Im Anschluss wertet der Untersuchungsleiter in einem (halb-) standardisierten Interview 25 mit dem Tester das audiovisuelle Datenmaterial aus, um Probleme bei der Interaktion mit der Software zu identifizieren und festzuhalten (Hamborg, 2002). Mittels Videokonfrontation erhält man so zu interpretationsbedürftigen Interaktionssituationen umfassende und aufschlussreiche Kommentare seitens der Tester (Oertel, 2003). Die Methode der Videokonfrontation scheint gerade bei anspruchsvollen Testaufgaben gegenüber dem Lauten Denken im Vorteil zu sein, da bei Synchronizität von Aufgabenbearbeitung und Verbalisierungsleistung die kognitive Belastung des Testers (cognitive load) so groß sein könnte, dass die Konzentration auf die Aufgabenbearbeitung eingeschränkt würde (Nielsen et al., 2002). Auf der anderen Seite birgt eine Videoauswertung im Nachgang des Tests, wie alle so genannten Post-Test-Befragungen, die Gefahr, dass die Tester dazu tendieren, ihr Verhalten zu rationalisieren, was die Reliabilität 26 der Ergebnisse erheblich schmälern kann (Cowen, 2001).
Logfile Recording Die Nutzung moderner auf Dialogfenstertechnik basierenden Benutzungsschnittstellen (window-based user interfaces), erzeugt verschiedene Arten so genannter User Interface Events, die durch Rechnerunterstützung automatisch erfasst werden können. Systemereignisse wie etwa Mausklicks, Mausbewegungen, Tastatureingaben etc. spiegeln das Verhalten des Nutzers auf der Benutzungsoberfläche der Applikation wider (Hilbert & Redmiles, 2000). Als Logfile wird das automatisch generierte Protokoll zur Registrierung von User Interface Events bezeichnet. Somit ist die Aufzeichnung eines Logfiles eine spezielle Methode der Verhaltensbeobachtung in einem Usability-Test. Zum Logfile-Recording im Usability-Labor wird am Testrechner ein spezielles Programm installiert, welches festgelegte Events in einer Liste chronologisch abspeichert (Hom, 1998). Mittels Log-
25 sieheGlossar
26 siehe Glossar
31
file Recording können unter Ausschluss menschlicher Beobachtungsfehler objektive In-formationen über das Nutzerverhalten gesammelt werden.
Eye Tracking Augen- und Blickbewegungen 27 stellen die schnellsten Events in der Mensch-Computer-Interaktion dar und können daher nur mit speziellen Apparaturen, so genannten Eye-Trackern zu Zwecken einer weiterführenden Analyse aufgezeichnet werden (Hilbert & Redmiles, 2000). In einem Usability-Test werden mittels Eye-Tracking Performanzdaten registriert, welche sowohl bewusste als auch unbewusste Aktivitäten des Testers beschreiben können. Dafür werden hauptsächlich die Blickverläufe und Blickfixationen des Testers auf dem GUI eines Testsystems erfasst. Das mittels Eye-Tracking erzeugte Datenmaterial bietet im Allgemeinen ein großes Potential für die Extrahierung von Usability-Qualitätsmerkmalen. Aus den Blickdaten abgeleitete Eye-Tracking-Parameter erlauben besonders Rückschlüsse auf die örtlich-räumliche Gestaltung der Mensch-Computer-Interaktion (Design und Struktur der Informationselemente), die Effektivität von Suchprozessen auf der Benutzungsoberfläche und etwaige Probleme bei der visuellen Informationsverarbeitung während der Systembenutzung (Rötting, 2001). Die Nutzung von Eye-Tracking als Methode zur Evaluation von interaktiven Systemen ist in der Usability-Forschung noch relativ jung. Neben technischen Hürden (reliable Messtechnik) und finanziellen Faktoren (Anschaffungskosten) ist als Grund für die schleichende Etablierung von Eye-Tracking vor allem das Fehlen von Standards in der Interpretation des Datenmaterials zu nennen (Jacob & Karn, 2003).
Zur Prüfung der im Modul C fokussierten Zielkriterien kann z.B. wie folgt vorgegangen werden:
Über einen Vergleich der Anzahl der erfüllten Aufgaben mit der Gesamtanzahl der Aufgaben ließe sich ein Quotient berechnen, der eine Aussage zur Effektivität der Anwenderunterstützung liefert. Adäquat kann ein Effizienzquotient aus Problem- und Gesamtzeit gebildet werden. Die durch Experteninspektion erstellten Problemlisten (Checklisten) aus Modul A lassen erste Eingrenzungen von Problembereichen zu. Vertiefend lassen sich mit Methoden wie dem Lauten Denken oder der Videokonfrontation Probleme bei der Nutzung einer Anwendung quantifizieren und gewichten, um Aussagen über die Effizienz der Benutzungsschnittstelle zu erhalten (Oertel, 2003). Logfile Recording und Eye Tracking bieten ebenso die Möglichkeit zur Ermittlung von Problemphasen in der Interaktion des Nutzers mit dem Computersystem. So kann in einem Logfile z.B. die überhäufige Nutzung von „Rückgängig-Befehlen“ (Cancel, Undo etc.) als allgemeiner Problemindikator erfasst oder durch Eye-Tracking Blickbewegungsdaten als Indikatoren für ineffiziente visuelle Suchprozesse beim Nutzer generiert werden (Hilbert & Redmiles, 2000).
27 Augenbewegungen finden relativ zum Kopf statt und sind für sich interpretierbar. Dagegen muss bei Blickbewegungen das Blickobjekt in die Analyse miteinbezogen werden. Blickbewegungen sind als Bewegungen relativ zum Blickobjekt definiert.
32
Allerdings gestaltet sich eine eindeutige Lokalisierung und Interpretation von objektiv gemessenen Usability-Daten wie Logfiles und Blickbewegungsdaten schwierig, da „for many interesting objects the relationship between the properties of the object we can measure objectively and the human experience of the object are not known” (Karat, 1997; S. 690).
Zur Erhebung der Zufriedenstellung kann auf einige speziell entwickelte Fragebögen zurückgegriffen werden, die dem Nutzer im Usability-Test meist nach der Systembenutzung zur Beantwortung vorgelegt werden. Beispielhaft seien hier das Befragungsinstrument WAMMI 28 zur Evaluation von Webseiten und der - auch in dieser Studie verwendete - Fragebogen SUS (System Usability Scale) genannt. Letzterer misst eine kontextunabhängige allgemeine Usability, was eine Verwendung als Messinstrument der Zufriedenstellung eines Testers im Umgang mit einer Softwareanwendung motiviert. Schließlich kann zur Erfassung der Zufriedenstellung auch auf Testerkommentare zurückgegriffen werden, die mittels der Methoden Lautes Denken und Videokonfrontation generiert werden (Oertel, 2003).
Zusammenfassung: Systematik der Usability-Methoden
Unabhängig von dem hier vorgestellten modularen Modell zur Usability-Evaluation MO-VE lassen sich die bisher benannten Methoden und Verfahren in einer Systematik zusammenstellen. Zu beachten gilt, dass sich aufgrund der Vorteile und Beschränkungen der unterschiedlichen Methoden in der Usability-Praxis im Allgemeinen und im Usability-Test im Besonderen die Kombination einzelner Methoden etabliert hat: „There is an understanding within the field [of usability, d. Verf.] that testing, using only one technique, is insufficient. Therefore many of the techniques (…) are combinded” (Nielsen et al., 2002; S. 101).
28 Website Analysis and MeasureMent Inventory (www.wammi.com).
33
Quote paper:
Dipl.-Komm.Psych. (FH) Hermann Schmidts, 2007, Usability Evaluation - Identifizierung von Nutzungsproblemen mittels Eye-Tracking-Parametern, Munich, GRIN Publishing GmbH
This text can be quoted and accessed from this url:
Embed
DOI
Die Digitalisierung der deutschen Wohnzimmer
Entwicklungstand und Vor- und ...
Communications - Media Economics, Media Management
Scholarly Paper (Advanced Seminar), 26 Pages
Eine medienökonomische Analyse der Auswirkungen von IPTV
Communications - Media Economics, Media Management
Diploma Thesis, 93 Pages
Balanced Scorecards als Steuerungsinstrument im Medienbereich
Communications - Media Economics, Media Management
Scholary Paper (Seminar), 25 Pages
Die Übertragung von Sportveranstaltungen im Internet zur Schaffung von...
Sport - Media and Communication
Diploma Thesis, 97 Pages
Bewertung von AJAX Steuerelementen anhand von Usability-Tests
Ein Vergleich von aktuellen So...
Diploma Thesis, 109 Pages
Beschwerdemanagement in Dienstleistungsunternehmen
Business economics - Personnel and Organisation
Diploma Thesis, 67 Pages
Technische Fiaskos und andere Katastrophen
Eine soziologische Betrachtung
Sociology - Culture, Technology, Peoples / Nations
Termpaper, 24 Pages
Hermann Schmidts has published the text Usability Evaluation - Identifizierung von Nutzungsproblemen mittels Eye-Tracking-Parametern
Hermann Schmidts has uploaded a new text
Advances in Ergonomics Modeling and Usability Evaluation
Waldemar Karwowski, Halimahtun Khalid, Alan Hedge
Usability Evaluation and Interface Design, Volume 1: Cognitive Enginee...
Michael J. Smith, Gavriel Salvendy, Don Harris
LTM (Low-Tech Music) : Molecular Informatics, morphogenic substance vi...
Óscar Abril Ascaso, CEDMA, Seiko Mikami
0 comments