Testpsychologische Erfassung von Aufmerksamkeit und Intelligenz im Rahmen der ADHS-Diagnostik bei Kindern zwischen Standard und Anpassung

Eine Analyse klinischer Testdurchführungspraxis bei KiTAP und HAWIK IV


Masterarbeit, 2016
159 Seiten, Note: 1,3

Leseprobe

Inhalt

1 Einführung und theoretischer Hintergrund
1.1 Einleitung
1.2 Forschungsstand zur klinischen Testdiagnostik im Spannungsfeld von Standard und Anpassung
1.3 Testpsychologie in der ADHS-Diagnostik von Kindern
1.3.1 Klinisches Störungsbild der ADHS im Kindesalter
1.3.2 Komplexität der Diagnostik
1.3.3 Anforderungen der klinisch-psychologischen Diagnostik bei Kindern
1.3.4 Neuropsychologische Testung von Aufmerksamkeit mit KiTAP
1.3.5 Erfassung von Intelligenz mit HAWIK IV bei der ADHS-Diagnostik von Kindern
1.3.6 Zusammenfassende Ableitung der Fragestellung

2 Methode
2.1 Beschreibung der Stichprobe
2.2 Erhebungsinstrumente
2.2.1 Untersuchungsvariablen
2.2.2 Qualitativ-induktive Kategorienbildung
2.2.3 Beschreibung der Erhebungsinstrumente
2.3 „Mixed Methodes“ in der Analyse von Durchführungsstilen und -typen: Ergänzung der qualitativen Analyse durch quantitative Schritte

3 Ergebnisse
3.1 Individuelle Durchführungsstile
3.2 Typen von Durchführungsstilen

4 Zusammenfassung und Diskussion

Literaturverzeichnis

Tabellen- und Abbildungsverzeichnis

Tabelle Beobachtungs- und Interviewwerte U4

Tabelle Beobachtungs- und Interviewwerte U9

Tabelle Beobachtungs- und Interviewwerte U5

Tabelle Beobachtungs- und Interviewwerte U11

Tabelle Beobachtungs- und Interviewwerte U7

Tabelle Beobachtungs- und Interviewwerte U8

Tabelle Beobachtungs- und Interviewwerte U1

Tabelle Beobachtungs- und Interviewwerte U6

Tabelle Beobachtungs- und Interviewwerte U3

Tabelle Beobachtungs- und Interviewwerte U2

Tabelle Beobachtungs- und Interviewwerte U10

Diagramm Typenbildung mittels Indikatoren

Komponentendiagramm Faktorenanalyse

Dendrogramm Clusteranalyse

Anhangverzeichnis

Detailergebnisse Testleiter U1 bis U11

Mittelwerte Testleiter

Standardabweichungen Testleiter

Mittelwerte Testleiter aus Kategorien Dimension C

Korrelationen

Komponentendiagramme Faktorenanalyse

Faktorenanalyse Mittelwert-, Rohdatenpool

Ähnlichkeitsmatrix der Clusteranalyse

ANOVA Clusterung

ANOVA Clusterung Mehrfachvergleiche

Zusätzliche Beobachtungsregeln

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Einführung und theoretischer Hintergrund

1.1 Einleitung

Die Aufmerksamkeitsdefizit-/Hyperaktivitätsstörung (ADHS)[1] gehört zu den häufigsten psychischen Störungen des Kindes- und Jugendalters – mit steigender Tendenz. Die internationalen Prävalenzzahlen schwanken, je nachdem, ob auf der Grundlage des strengeren ICD-10 oder des DSM-IV diagnostiziert wurde, zwischen 1 und 7 %[2]. Die in den unterschiedlichen Prävalenzzahlen liegende Unsicherheit der Datenlage wird noch dadurch erhöht, dass Evaluationen von ADHS-Diagnosen eine hohe Zahl von Fehldiagnosen ergeben haben, die auf beträchtliche Variabilität in der Diagnostik zurückgeführt werden[3]. Nachforschungen im angelsächsischen Raum ergaben, dass eine Mehrzahl der untersuchten Diagnostiker sich in ihrem diagnostischen Verfahren nicht an die best-practice-Leitlinien hielten[4] und viele nicht standardisierte Diagnostik-Instrumente benutzten[5]. Diese Befunde wie auch der Anstieg der Diagnose ADHS und damit der Pharmakotherapie gaben Anstoß für eine kontrovers geführte Diskussion, in welchem Ausmaß denn dabei „durch verbesserte diagnostische Instrumente mehr „richtig“ betroffene Kinder erkannt wurden“[6].

Kommen in der ADHS-Diagnostik subtile testpsychologische Verfahren zum Einsatz, so stellt sich weiterhin die Frage, inwieweit sich diese Tests bei Kindern mit ADHS überhaupt standardgemäß durchführen lassen und ob sie die schwierige wie komplexe Diagnostik der ADHS tatsächlich zu objektivieren helfen.

Zu solchen diagnostischen Instrumenten zählen in Deutschland psychometrische Testverfahren zur Überprüfung von Aufmerksamkeit und von Intelligenz - erstere nach den DGKJP-Leitlinien allerdings verzichtbar[7]. Dabei werden in der ADHS-Diagnostik von Kindern häufig der HAWIK IV[8] zur Erfassung der Intelligenz und zur neuropsychologischen Abklärung der Aufmerksamkeit der computerbasierte KiTAP[9] angewandt. Es wird hinsichtlich der Verwendung dieser Testverfahren unterstellt, dass ihre Durchführung im klinischen Bereich, eben auch in der ADHS-Diagnostik mit Kindern, ebenso erfolgt wie außerklinisch, also uneingeschränkt entsprechend der Durchführungsstandards und der Gebote der Testtheorie nach Durchführungsobjektivität.

Indes gehören Kinder mit starken Symptomen, die mitten im Test plötzlich einem neuen Verhaltensimpuls nachgeben und aus dem Setting aussteigen wollen, zum klinischen Alltag, so dass sich der klinische Diagnostiker bei ADHS-Kindern oft besonderen Herausforderungen bei der Testdurchführung gegenübersieht und sich dann in einem Spannungsfeld von Psychometrie und durchführungstechnischer Zumutbar- wie Machbarkeit, also von Testtheorie und psychosozial-diagnostischer Fachlichkeit bewegt. Beide Spannungspole stellen an die Testdurchführung spezifische Anforderungen. Während von der Seite der Testtheorie/-konstruktion eine idealtypische Durchführung ohne Abweichung von dem standardisierten Testdurchlauf, ohne beeinflussende „Störungen“, ohne Testleitereffekte und ohne „Fehler“ gefordert wird, sind die Testleiter in der klinischen Durchführungspraxis mit besonderen situativen und interaktionellen Bedingungen konfrontiert, auf die sie kindgerecht und zumutbar zu reagieren haben. Dadurch bedingt ist mit Unterschieden in den Arbeitsweisen verschiedener Untersucher zu rechnen, wie auch die Durchführungs- und Instruktions-Standards in der Testdurchführungsrealität einige Anpassungen erfahren können. Um was für Durchführungs-Besonderheiten handelt es sich und wie sind diese zu bewerten, insbesondere wenn es um Testdiagnostik bei Kindern mit Verdacht auf psychische Störungen geht?

Bei dieser Frage setzt die vorliegende Studie an. Sie möchte anhand einer Analyse der klinischen Testdurchführung von KiTAP und HAWIK IV in einer großstädtischen Gemeinschaftspraxis von Kinder- und Jugendpsychiatern prüfen, ob und inwieweit sich die testpsychologische Erfassung von Aufmerksamkeit und Intelligenz im Rahmen der ADHS-Diagnostik bei Kindern in einem Spannungsfeld zwischen Standardgewährleistung und kindgerechter Anpassung bewegt, ob es bei den Testleitern in dem Zuge stabile persönliche Durchführungsstile gibt und ob sie sich zudem bestimmbaren Durchführungstypen zuordnen lassen.

1.2 Forschungsstand zur klinischen Testdiagnostik im Spannungsfeld von Standard und Anpassung

Die Diskussion um die Möglichkeiten und Grenzen des Testens und der testgeleiteten Psychodiagnostik wurde besonders kontrovers in der Zeit der 1970er und 1980er Jahre, also noch vor der massenhaften Verbreitung und Anwendung von parametrischen Tests in pädagogischen und klinischen Einrichtungen, geführt. Dabei hatte eine kritische Psychologie in der Sorge um aufkommende „Testgläubigkeit“, „Schein-Objektivität“ und „seelenlosen Computerdiagnostik“ die äußeren und inneren Störbedingungen von Testverfahren in den Blick genommen, die die Testdaten aus ihrer Sicht so stark verzerrten, dass an der Objektivität und am wissenschaftlichen Aussagewert von Tests insgesamt und von der Testdiagnostik insbesondere gezweifelt werden müsse[10]. Die psychologische Diagnostik war aus dieser damaligen Perspektive durch einen deutlich verstärkten Handlungsbezug und einen Mangel an tragfähigen wissenschaftlichen Voraussetzungen in eine „Krise“ geraten. Abgesehen von testologie-ablehnenden Tendenzen suchten zwei Richtungen nach neuen Wegen in der Testdiagnostik: Eine Richtung setzte auf eine verfeinerte Psychometrie und eine vorangetriebene Standardisierung, um dem ausgemachten „Validitäts- und Machtdilemma“ zu entgehen[11]. Eine andere Richtung plädierte aus einem z.T. psychodynamischen Blickwinkel dafür, stattdessen die Subjektivität als Grundbedingung auch des testenden Diagnostizierens anzuerkennen und beleuchtend und hinterfragend zu validieren[12]. Während die erste Richtung mit dem sich festigenden Mainstream der naturwissenschaftlich orientierten Testpsychologie verschmolz und in engem Rekurs auf Messtheorie und Testtheorie auf eine weitgehende Ausschaltung von Störvariablen und von Subjektivität fokusssierte[13], gingen aus der zweiten Richtung in den 1990er Jahren zusammenfassende Beiträge zum Verhältnis Theorie und Praxis der Testpsychologie und –diagnostik hervor, die die kritischen Punkte des Testens und testpsychologischen Diagnostizierens - auch bei der Testdurchführung - betonten und damit „Impulse für eine Fortentwicklung von Theorie und Praxis des Tests“ geben wollten[14]. Hinsichtlich der Testdurchführung wurden dabei insbesondere die „Imponderabilien“ der äußeren Testbedingungen, des Verhaltens, der Einstellung und Wahrnehmungsgewohnheit des Testleiters, der Interaktion von Testleiter und Testperson, der Vorerfahrungen, Einstellungen und Befindlichkeiten der Testperson einer eingehenden Betrachtung unterzogen. Sowohl Grubitzsch als auch Rauchfleisch stützten sich in dem Zuge aber auf keine neuen empirischen Befunde, sondern griffen auf ältere Forschungsergebnisse der 50er bis 80er Jahre zurück[15]. Bezogen auf die äußeren und inneren Störbedingungen von Testdaten sind dies in erster Linie die empirischen Befunde zu Verzerrungen bei Rorschach-Tests, zu Wahrnehmungs- und Urteilsfehlern und zum Kommunikations-prozess. Vielleicht liegt es auch an diesem Empirie-Problem, dass die kritische Linie der Testpsychologie und Psychodiagnostik nach der Jahrtausendwende auslief und der Grundsatz-Diskurs über das schwierige Verhältnis von Testtheorie und Testpraxis zum Erliegen kam[16]. Schon 1991 resümiert Grubitzsch eher resignativ: „Von vielen werden die Fehler bedingenden Einflüsse ignoriert, manche bestreiten sie schlichtweg, und wieder andere führen sie als Argument an, Testdaten nicht überzubewerten bzw. sie im Feld der Befundliste zu relativieren“[17].

Doch auch wenn obige Diskussion weitestgehend abgeflaut ist, so darf nicht im Umkehrschluss auf diesbezügliche Ignoranz einer insgesamt kaum angefochtenen naturwissenschaftlichen Testtheorie geschlossen werden, eher auf eine Fokusverschiebung hin zu den subtilen Fragen verfeinerter Testkonstruktion, Testqualität und Evaluation. Diese um naturwissenschaftliche Objektivität bemühte Testdiagnostik und Psychodiagnostik fordert auf fast kanonische Weise für den Bereich der Durchführungsobjektivität bestmögliche Beachtung von Testleiter- und Testsituationsunabhängigkeit bei Testkonstruktion und Testanwendung, ohne aber die praktischen Probleme im Umgang mit entsprechend hochregulierten Durchführungsstandards und die Eigenheiten von Testsituationen tiefergehend zu ventilieren[18]. Ein weiterer Grund für das Auslaufen des kritischen Diskurses dürfte auch in dem einschlägigen Qualitätsprozess nationaler und internationaler psychologischer Organisationen liegen, der in den 90er Jahren endgültig zur erfolgreichen Etablierung von international gültigen Standards für psychologisches Testen geführt hat und bei diesen Standards ausdrücklich gerade auch den Bereich der Testdurchführung miteinschloss[19]. Seither werden Praxisaspekte des Testens in der wissenschaftlichen Testpsychologie nur selten mehr in grundsätzlicher Weise diskutiert, und wenn, dann eher bezogen auf einzelne Testbereiche[20]. Für den Bereich des klinischen Testens haben etwa Gunzelmann & Oswald (2005) die Besonderheiten der psychometrischen Diagnostik von gerontologischen Patienten herausgestellt und dabei das Nebengütekriterium der Testfairness als besonders zu beachtenden Aspekt bei der Testdurchführung mit älteren Menschen hervorgehoben. Mit gleicher Berechtigung lässt sich diese Mahnung auch auf die klinische Test-Population der Kinder mit ADHS-Verdachtsdiagnose übertragen, die innerhalb ihrer Diagnostik an Teststandards gemessen werden, die zunächst auf die Besonderheiten und Beeinträchtigungen des in Frage stehenden Störungsbildes keine Rücksicht nehmen. Die hier untersuchte Testpraxis von HAWIK IV und KiTAP misst psychische Leistungen auf der Basis von Normen, die aus dem nicht-klinischen Bereich stammen[21].

Soll in dieser Studie nun die Durchführungspraxis der Tests HAWIK IV und KiTAP im Rahmen der ADHS-Diagnostik von Kindern analysiert und auf das Spannungsfeld von Standardwahrung und kindgerechter Anpassung hin beleuchtet werden, so kann neben den gültigen Standards des psychologischen Testens und den standardorientierten Deduktionen der naturwissenschaftlichen Testtheorie nur auf jene Forschungsliteratur und Forschungsansätze zurückgegriffen werden, die zuletzt vor zwei bis drei Jahrzehnten sich in aller Grundsätzlichkeit und Tiefe mit Problemen der Testdurchführung beschäftigt und dabei der Situativität, Dynamik und Prozesshaftigkeit der Testdurchführung Rechnung getragen haben. Doch auch wenn diese Literatur in den zeitabhängigen diskursiven Kontext der kritischen Psychologie eingebettet ist und angesichts des heute hohen Stellenwerts der Testdiagnostik aus scheinbar ferner Vergangenheit hinüberragt, so haben viele der darin beleuchteten Gesichtspunkte doch nichts von ihrer Gültigkeit verloren. Die insoweit relevanten Aspekte des Spannungsfeldes Standard und kindgerechte Anpassung bei der klinischen Testdiagnostik von Kindern sind aus dieser eigentümlichen Forschungslage zusammenfassend Folgende:

- Durchführungsobjektivität: Objektivität ist in erster Linie ein Test-Ideal, nicht Diagnostik-Ideal[22]. Der Test soll personenunabhängig, neutral, verlässlich und reproduzierbar psychische Merkmale messen. Gemäß dem Gütekriterium der Durchführungsobjektivität dürfen weder das Verhalten des Testleiters noch die Rahmenbedingungen des Tests die Testergebnisse beeinflussen[23]. Kommt es doch zu Einflüssen oder Messfehlern, so handelt es sich um Störfaktoren. Hingegen sind Merkmale sowie Situationen nicht statisch, sondern veränderlich und dynamisch[24]. Zudem genügen viele Tests nicht den Anforderungen an die Standardisierung. Der KiTAP beispielsweise sieht in seinem kindgerechten Zuschnitt eine „freie Instruktion“ vor. Außerdem sind die standardisierten Untersuchungsbedingungen für klinische Zielgruppen wie ADHS-Kinder mitunter eine enorme Herausforderung, so dass ein Vergleich an Normen aus nicht-klinischen Stichproben dem Messideal der Testtheorie zuwiderläuft. - Wie stellen Testleiter bei Tests von ADHS-Kindern, die eine hohe Variabilität der Symptomausprägung aufweisen, das Gütekriterium der Durchführungsobjektivität sicher? Wie gehen sie in der Praxis mit „freier Instruktion“ einerseits und nicht-klinischen Durchführungsstandards um?

- Testfairness: Lang hat 1978 die ethische Frage aufgeworfen, ob Psychodiagnostik, insbesondere auch Testdiagnostik, verantwortbar ist und inwieweit sich das Ideal des Messens und des autonom handelnden Menschen vertragen[25]. Auch wenn Zihlmann später die These des antagonistischen Verhältnisses relativiert und die Verantwortung des „wissenden Psychologen“ in Bezug zum Autonomiegrad der Testperson, zur Situativität des Testens und zum Verhältnis Objektivität versus Subjektivität gesetzt hat, so bleibt die ethische Frage bei klinischen Zielgruppen aktuell und eminent. Zihlmann hat zu der Lösung einer „verantworteten Subjektivität“ gefunden, die „die Spannungfelder Subjektivität vs. Objektivität einerseits Autonomie der Person vs. Verantwortung des Psychologen andererseits miteinander verschränkt“[26] und die so der Verantwortung wie der testologisch nicht eleminierbaren Subjektivität des Testleiters eine fachliche und ethische Qualität geben soll. Es komme dabei neben dem Autonomiegrad der Testperson auch auf die Funktion der Diagnostik, den Auftrag an den Testleiter und sein Rollenverständnis an. Wenn die nicht auflösbare Subjektivität verantwortete Qualität habe, sei sie für die Testdiagnostik eine Chance. Die Standards für psychologisches Testen haben dafür den Ausweg im Begriff der Testfairness gefunden[27]. Diese gebiete es dem Testleiter grundsätzlich, für Beginn und Verlauf der Testung „mit ihrem Verhalten zur Verbesserung der Motivation des Probanden und zur Reduktion der Testängstlichkeit bei(zu)tragen“[28]. Ferner gelte es, mit Testpersonen fair umzugehen, die „aufgrund spezifischer Besonderheiten nicht mit der Probandenpopulation übereinstimmen“. Auch die Testtheorie kennt in ethischer Hinsicht den Begriff der Testökonomie und Zumutbarkeit als Gütekriterien, um diagnostische Grenzen aufzuzeigen[29]. - Wie setzen Testleiter diese ethischen Gesichtspunkte um, wenn sie klinisch einschlägige Kinder mit Aufmerksamkeits- und Selbstregulationsproblemen via KiTAP und HAWIK IV nicht-klinisch standardisierten Testleistungsbedingungen unterziehen? Wie verantworten sie Grenz-testungen? Wie regulieren sie im Spannungsfeld zwischen Standard und Fairness, zwischen Durchführungsobjektivität und klinischer Verantwortung, zwischen testtheoretischer und psychosozial-diagnostischer Fachlichkeit?

- Testsituation und äußere Testbedingung: Die Durchführungsbedingungen des einzelnen Tests dürfen nach der Testtheorie keinen Einfluss auf das Testergebnis haben, sie sollten denen entsprechen, unter denen der Test geeicht wurde. Die Testkonstruktion hat mit genauen Vorgaben für die Instruktion, den Ablauf und das Material eine weitgehende Standardisierung sicherzustellen. Doch in der Praxis variieren allein schon Tageszeit, Temperatur, Raum, Arbeitsplatz, Material, Tastatur etc.[30]. Zudem gibt es angesichts der Situativität des Testens den Faktor Zufall, etwa ein klingendes Telefon. Schon Grubitzsch konstatiert, dass insgesamt in der Praxis aufgrund verschiedener situativer Gegebenheiten „die Einhaltung der Durchführungsbestimmungen eines Tests nur selten möglich“ ist[31]. Angesichts dieser Varianzen in der Testdurchführung stellt sich die Frage, ob es sich bei den Besonderheiten der Durchführung im klinischen (ADHS-)Bereich nicht nur um Zuspitzungen der auch sonst üblichen graduellen Abweichungen vom Standard handelt und wie denn die entsprechenden klinisch-spezifischen Durchführungen aussehen.

- Diagnostische Situation: Nach Rauchfleisch (2008) ist die „diagnostische Situation“ stets gekennzeichnet von Asymmetrie bezüglich Selbstenthüllung, Vertraulichkeit, dem Wissen um das Beobachtet-werden und die Einbindung in ein weiteres soziales Netz. Die Asymmetrie steht im Gegensatz zu üblichen sozialen Regeln und sorgt insbesondere bei Menschen mit kommunikativen und psychischen Beeinträchtigungen für große Kommunikationsbarrieren. Inwieweit lassen sich diese Auswirkungen bei Kindern mit ADHS-Diagnose in der diagnostischen Situation berücksichtigen, ohne dass der Standard der Testnorm gänzlich verlassen wird? Wie gehen die Testleiter mit dieser Gratwanderung um? Auch der Umstand, dass die Testperson in der diagnostischen Situation nicht die Freiheit hat, sich einer Person nur ihres vollen Vertrauens zu öffnen (Vertraulichkeit), dass sie um ihr Beobachtet-werden in einer Prüfsituation durch fremde Fachleute weiß, dass sie, aber auch der Testleiter darauf in Form von Übertragung und Gegenübertragung reagiert[32] und dass beide vorgeprägte Vorannahmen und Erwartungen bezüglich der diagnostischen Situation haben (Einbettung soziales Feld), beeinflusst das Verhalten von Testperson und Testleiter. Diese verdeckten interaktionellen Aspekte sind nach Spitznagel mehr als nur unkontrollierbare Störvariablen der Standardbedingungen, die es in der Logik einer perfektionistischen Psychometrie möglichst nicht geben darf, sondern sie sind auch für die Diagnostik nutzbare Faktoren, derer sich der Testleiter zur explorativen Nutzung jedoch bewusst sein muss[33]. - Verhalten sich Testleiter bei der klinischen Testung von ADHS-Kindern hinreichend „kommunikativ sensibel“[34] und berücksichtigen diese Faktoren reflektiert und systematisch?

- Besonderheiten von Testleiter und Interaktion: Nach älteren Untersuchungen zur Objektivität von Testergebnissen beeinflussen auch die Merkmale des Testleiters wie Geschlecht, Alter, Körperbau, Hautfarbe, beruflicher Status, Erfahrung, Persönlichkeit und Erscheinung die Testergebnisse[35]. Ebenso hat das „warme oder kalte“ wie auch „streng-distanzierte oder natürliche“ Verhalten des Testleiters Auswirkungen z.B. auf die Intelligenzleistung[36]. Darüber hinaus spielen die Einstellung des Testleiters gegenüber Testdiagnostik, seine Erwartungen und nicht zuletzt auch seine Gestik, Mimik und Haltung als „Diagnostikereffekt“ eine Rolle, der für die Testperson einen „vielseitigen, verschieden und selektiv interpretierbaren Stimulus“ darstellt[37]. Unbewusste Formen der Zuwendung des Testleiters wie ein Kopfnicken, eine signalisierte Ermutigung, ein geäußertes Lob, aber auch eine unterbrochene Interaktion können zu signifikant verbesserten Testergebnissen führen. Auf der Seite der Testperson wirken sich die situative Motivation, emotionale Betroffenheit, die subjektive Befindlichkeit, die Ängstlichkeit, die durch den Test induzierte Testangst, die Empfindlichkeit auf Zeitdruck u.a. auf die Testleistung aus[38]. Aus dem Zusammenwirken der situativen Gegebenheiten entwickelt sich dann stets ein besonderer Interaktionsprozess zwischen Testleiter und Testperson, da sich der Mensch nicht automatenhaft verhält, sondern in seinem Sozialverhalten ein „offenes System“ ist, das von der Standardisierung eines statisch-objektiven Messideals nie vollständig eingefangen werden kann[39]. Je nach Ausgangslage, Grad der Freiwilligkeit und Materialbeschaffenheit befindet sich der Testleiter interaktionell in verschiedenen Rollen: z.B. als Prüfer, als Coach, als Lotse, als Spielleiter etc. Jedenfalls soll er die Testperson zur Befolgung der Instruktionen motivieren. Wie individuell er sie dabei behandelt – ob mit einer kleinen zärtlichen Geste für das entmutigte Kind oder mit einem Kurzhalten des enthemmten Kindes -, bleibt letztlich seinem Ermessen überlassen[40]. - Wie gehen dabei Testleiter bei einer klinischen Zielgruppe wie Kindern mit ADHS-Verdachtsdiagnose vor? Wie bringen sich Testleiter mit ihren Besonderheiten in den Testprozess und in die Interaktion mit den Testpersonen ein? Haben sie bei aller kurzfristigen Reaktion auf die Situativität auch stabile persönliche Durchführungsstile?

- Einsatz von computergestützter Testdiagnostik: Mit dem KiTAP ist ein in der ADHS-Diagnostik oft angewandter Computertest Gegenstand der Betrachtung. Das computerbasierte Testen bewirkt bei der Testperson ein subjektives Gefühl des unbeobachteten und unkontrollierten Arbeitens[41]. Das kann die Akzeptanz des Testens erhöhen. Bei Beachtung von Transparenz führt die dementsprechend geringere Befangenheit wie auch der motivationsförderliche Eindruck des Spielerischen zu einer höheren Untersuchungsqualität, zumal auch Analysen vom Testverlauf und unmittelbaren Testverhalten ermöglicht werden, statt dass nur auf Normvergleiche und Klassifikationen fokussiert wird. Vorteilhaft ist nach Grubitzsch auch, dass individualisierende Testleitereffekte und Anwenderabhängigkeiten reduziert werden und so Objektivität erhöht wird, andererseits sich durch den Zeitgewinn des stark standardisierten Verfahrens intensivere menschliche Kontakte in der Phase des Warm-Ups und in Pausen bieten. - Führt der Einsatz von PC-Tests bei Kindern mit fraglicher ADHS-Diagnose per se zu einer gänzlich anderen Testsituation und einem anderen Durchführungsverhalten der Testleiter? Es ist anzunehmen, dass die KiTAP-Autoren mit der „freien Instruktion“ und uneingeschränkten Kombinierbarkeit der Untertests symptomgeprägten Testverhaltensweisen (allerdings nicht ADHS-spezifisch) Rechnung tragen wollten, vielleicht gerade bei jüngeren Grundschulkindern[42]. Inwieweit kann der Testleiter mit einem solchen Verfahren den Anforderungen der testtheoretischen Gütekriterien einerseits und denen des klinischen Test-Kontextes andererseits auch in herausfordernden Testsituationen gerecht werden?

1.3 Testpsychologie in der ADHS-Diagnostik von Kindern

Das klinische Störungsbild wie auch der Diagnose-Prozess der ADHS stellen Diagnostiker grundsätzlich vor große Herausforderungen. Dazu gehören die starke Bedeutung der Differenzialdiagnostik angesichts des Ausschlussdiagnose-Prinzips, Einordnungsprobleme von Komorbiditäten und Sekundärsymptomen, die Entwicklungs- und Situationsabhängigkeit der Symptomatik und die sich insgesamt ergebende Komplexität des Diagnosevorgangs. Zudem verlangt die klinisch-psychologische Diagnostik bei Kindern allgemein ein hohes Maß an Kind- und Entwicklungsgerechtigkeit des Diagnose-Verfahrens, an Objektivität der Diagnose-stellung und an Spezifität und Sensibilität der Diagnostikinstrumente. Das sind die besonderen Kontextbedingungen von Tests in der ADHS-Diagnostik.

1.3.1 Klinisches Störungsbild der ADHS im Kindesalter

Kaum eine psychische Störung des Kindes- und Jugendalters wird häufiger diagnostiziert wie die Aufmerksamkeitsdefizit-/Hyperaktivitätsstörung (ADHS). Nach den strengeren Kriterien der ICD-10 liegt die Prävalenz bei Kindern im Schulalter zwischen 1 – 3 %, gemäß den weiter gefassten DSM-IV-Kriterien bei etwa 3 – 7 %, was auf Deutschland gerechnet eine Zahl von 300.000 bis 700.00 betroffenen Kindern und Jugendlichen ergibt[43]. Jungen sind dabei zwei- bis viermal häufiger betroffen[44]. Die ADHS besteht aus einem Muster von Verhaltensauffälligkeiten, das sich in den Kernsymptomen der Aufmerksamkeitsstörung, Hyperaktivität und Impulsivität äußert. Die beiden international verbreiteten Klassifikationsschemata[45] unterscheiden sich kaum in der Definition dieser Kernsymptome, die sich kurz folgendermaßen zusammenfassen lassen: Hinsichtlich der Aufmerksamkeit sind vor allem die selektive Aufmerksamkeit und Daueraufmerksamkeit eingeschränkt, es besteht erhöhte Ablenkbarkeit. Die Hyperaktivität bedingt allgemeine grob- und feinmotorische Unruhe. Und die Impulsivität besteht aus einer mangelnden kognitiven und emotionalen Impulskontrolle. Die entsprechenden Auffälligkeiten müssen nach beiden Klassifikationen über das hinausgehen, was durch Alter und Entwicklungsstand des Betroffenen zu erwarten wäre. Sie rufen dadurch eine bedeutsame psychosoziale Beeinträchtigung in mehr als einem Lebensbereich hervor, waren schon im Vorschulalter zu beobachten gewesen und bestehen seit mehr als 6 Monaten[46].

Beide Klassifikationssysteme unterscheiden sich darin, wie sie die Diagnose auf der Grundlage der genannten Kernsymptome in ihren klinischen Kriterien definieren: Das ICD-10 sieht für die Diagnose einer einfachen Aktivitäts- und Aufmerksamkeitsstörung (F 90.0) eine Beeinträchtigung von Aufmerksamkeit, Hyperaktivität sowie Impulsivität vor. Eine Aufmerksamkeitsstörung ohne Hyperaktivität fällt unter die Restkategorie F 98.8. Weiterhin gibt es nach ICD-10 die hyperkinetische Störung des Sozialverhaltens (F 90.1), die bei zusätzlichen oppositionellen und aggressiven Verhaltensweisen klassifiziert wird, und die „sonstige“ und „nicht näher bezeichnete“ Restkategorie der hyperkinetischen Störung F 90.8 und F 90.9. Das DSM-IV-TR fasst die Kernsymptome Impulsivität und Hyperaktivität zu einer festen Symptomkombination zusammen und definiert drei Subgruppen der ADHS, nämlich den Mischtypus, bei dem sowohl die Symptome Unaufmerksamkeit sowie Impulsivität/Hyperaktivität vorliegen, den vorwiegend unaufmerksamen Typus, bei dem die Kriterien für Impulsivität/Hyperaktivität nicht voll erfüllt sind, und den vorwiegend hyperaktiv-impulsiven Typus, bei dem die Kriterien für Unaufmerksamkeit unvollständig vorliegen[47]. Diese Einteilung wird kontrovers bewertet[48]. Das gilt insbesondere für das Störungskonzept des Unaufmerksamkeitssubtypus, der als ADS wenig spezifisch ist, zumal Aufmerksamkeitsstörungen bei vielen psychischen Störungen auftreten (Depression, Essstörung, Zwangsstörung etc.). Die Problematik der Subtypen wirkt sich - wie oben an den unterschiedlichen Prävalenzratenzahlen gesehen - auch auf erhöhte Zahlen bei der Prävalenzschätzung aus[49].

Für die Diagnostik der ADHS ist die Situations- und Entwicklungsabhängigkeit ihrer Symptomatik wichtig. Die aufmerksamkeitsbezogene Symptomatik tritt meist in Situationen auf, die strukturiertes Arbeiten, eine längere Aufmerksamkeit und die Orientierung in einer Gruppe erfordern. Das betrifft im Alltag vor allem Schulstunden, Hausaufgabenanfertigung oder Morgenkreis im Kindergarten. Die Impulsivität kommt in Situationen mit regelhafter Abfolge zum Tragen wie im Spiel, im Unterrichts-gespräch oder beim Sport. Oft lassen sich dann auch Wutausbrüche und aufbrausende Reaktionen beobachten, die sich nachhaltig beeinträchtigend auf das Verhältnis zu den Gleichaltrigen auswirken. Die Hyperaktivität zeigt sich vor allem in Situationen, die stilles Sitzen erfordern, und äußert sich im häufigen Bewegen von Armen und Füßen, z.B. bei Hausaufgaben, am Essenstisch. Die Symptomatik des ADHS ist grundsätzlich entwicklungsabhängig[50], was durch Entwicklungsprozesse zentraler Hirnfunktionen erklärt werden kann. Während im Vorschulalter eher Hyperaktivitätssymptome im Vordergrund stehen und sich dann typischerweise im Kindergarten zeigen, sind die ADHS-Symptome spätestens mit der Einschulung deutlicher erkennbar und betreffen mit jeweils unterschiedlicher Ausprägung alle Dimensionen der Kernsymptom-Trias. Dem Kind misslingt es vor allem in weniger strukturierten Unterrichtsphasen, angefangene Aufgaben zu Ende zu bringen. Es wird durch äußere Reize leicht abgelenkt, ist über längere Unterrichtsphasen nicht bei der Sache und verharrt zumeist in einer passiven Off-Task-Haltung[51]. Bei 40-80 % der betroffen Kinder setzt sich die Störung ins Jugendalter fort, allerdings mit reduzierter Hyperaktivität. Bei ca. einem Drittel der Patienten hält sich die Diagnose bis ins Erwachsenenalter. Günstigere Verläufe ergeben sich gemäß Langzeitstudien nach Einsatz von verhaltenstherapeutischen und/oder pharmakotherapeutischen Interventionen.

1.3.2 Komplexität der Diagnostik

Eine eindeutige Diagnosestellung der ADHS gestaltet sich schwierig und verlangt ein komplexes Vorgehen[52]. In zahlreichen Basisverfahren wie subjektiver Eltern-, Lehrer-, Selbstbeurteilung sowie Interview oder Fragebogen und Verhaltensbeurteilungsskalen werden die Auffälligkeiten in Verhalten und Emotionalität des Kindes erhoben. Daneben werden Verhalten, Empfinden und kognitive Fähigkeiten in einer objektiven störungsspezifischen Diagnostik mittels spezieller Diagnosechecklisten, systematischer Verhaltensbeobachtung und psychometrischer Verfahren erfasst. Dabei sind die Intelligenz- und Leistungsmessung zur Differentialdiagnostik, etwa zum Ausschluss von geistiger Behinderung, und zur Abklärung des Entwicklungsstandes und möglicher Teilleistungsstörungen erforderlich, während Aufmerksamkeits-, Reaktions- und Konzentrationstests Informationen über die Ausprägung der Kernsymptome geben. Gemäß der Leitlinien der DGKJP sind jedoch spezifische Aufmerksamkeitstests bei der Diagnosestellung verzichtbar, da die Zusammenhänge zwischen unterdurchschnittlichen Testleistungen und einer möglichen ADHS-Störung für nicht aussagekräftig genug im Sinne einer Einzelfalldiagnose gehalten werden[53]. Die Tests können aber optional eingesetzt werden, um eine Diagnose zu erhärten. In der Diagnostik-Literatur wird verstärkt der Einsatz von standardisierten Aufmerksamkeitstests empfohlen - zur differenzierten, neuropsychologischen Beschreibung von Aufmerksamkeitsfunktionen[54], weniger zur kategorialen Diagnose. Dies hängt auch damit zusammen, dass ADHS überwiegend als neurobiologisch bedingte Störung mit psychophysiologischen, hirnanatomischen und biochemischen Besonderheiten wie auch mit deutlicher genetischer Komponente gesehen wird, wobei psychosoziale Faktoren die Prognose und den Verlauf mit bestimmen[55].

Ziel der Diagnostik ist die Beurteilung des Kindes auf der Basis eines multiaxialen Klassifikationsschemas. Eine ADHS liegt erst dann vor, wenn die Ausprägung der Symptome das alters- und entwicklungstypische Maß deutlich überschreitet und weder durch exogene Faktoren oder Intelligenzminderung erklärbar ist. Es gilt neben Körper- und Sinnesstörungen vor allem Medikamentenwirkungen, Intelligenzminderungen und Teilleistungsstörungen als Störungsursachen auszuschließen. ADHS wird somit als Ausschlussdiagnose mit Übergängen von der Normvariation zur Pathologie diagnostiziert, nicht als eine diskrete, klar abgrenzbare Störung. Darin liegt die Schwierigkeit und Komplexität der Diagnosestellung begründet.

Die Differenzialdiagnostik spielt bei ADHS dementsprechend eine große Rolle und gestaltet sich vor allem deshalb schwierig, weil zahlreiche Differenzialdiagnosen auch komorbid auftreten, ADHS sekundär weitere psychische Störungen bedingen kann und einige Differenzialdiagnosen bei jüngeren Kindern nicht zuverlässig gestellt werden können[56]. Bei fast Zweidrittel der Kinder mit ADHS liegt eine komorbide Störung vor wie Ängste, Emotionalstörungen, depressive Symptome und Störungen des Sozialverhaltens. Diese werden oft von der Hyperaktivität überlagert und dadurch übersehen. Teilweise handelt es sich dabei um sekundäre Symptome, z.B. Selbstwertprobleme oder Ängste durch häufig erlebtes Schulversagen.

Da das Vorhandensein komorbider Störungen und sekundärer Symptome das Behandlungskonzept maßgeblich bestimmt, ist es wichtig, diese Störungen frühzeitig zu erkennen und nachhaltig zu behandeln. Doch gerade im Vorschulalter ist die Spezifität der Symptome gering. Die Grenze zwischen alterstypischen und pathologischen Symptomausprägungen lässt sich in dem Alter nur schwer ziehen. Es gibt auch keine exakt definierten alterspezifischen Diagnosekriterien, weshalb nach ICD-10 die Diagnosestellung bei Vorschulkindern von einer extremen Symptomausprägung abhängig gemacht wird[57]. Eine fälschliche Diagnosestellung könnte schließlich pathologisierende und stigmatisierende Folgen für das Kind haben. Dennoch wird vielfach eine frühe Diagnosestellung empfohlen[58], da in der Gesamtschau die Vorteile für betroffene Kinder überwiegen und durch eine erfahrene, akkurate und an Leitlinien orientierte Diagnostik, die die verschiedenen diagnostischen Informationsquellen nach strengen Kriterien integriert, eine valide Diagnosestellung gelingen kann. In dieser Blickrichtung kommt einer Objektivierung durch den mindestens ergänzenden Einsatz von standardisierten Testverfahren große Bedeutung zu.

1.3.3 Anforderungen der klinisch-psychologischen Diagnostik bei Kindern

Die psychologische Diagnostik hat einige Punkte herausgearbeitet, in denen sich die klinisch-psychologische Diagnostik bei Kindern von der bei Erwachsenen unterscheidet und die im diagnostischen Prozess zu beachten sind. Das gilt insbesondere, wenn Testverfahren zum Einsatz bei Kindern kommen, die eine klinische Störung ausweisen[59]. Bezogen auf die ADHS-Diagnostik bei Kindern sollte ein diagnostisches Testverfahren grundsätzlich der kindlichen Entwicklung gemäß sein, also mit Blick auf die Individualität von Entwicklung, auf die Grundbedürfnisse wie Fähigkeiten des konkreten Testkinds hin möglichst angepasst und damit kindgerecht sein, und es sollte auf der Grundlage der Testgüte-Kriterien sensitiv und spezifisch einen hohen Anteil von ADHS-Kindern sicher identifizieren können.

1.3.4 Neuropsychologische Testung von Aufmerksamkeit mit KiTAP

Aufmerksamkeit dient dazu, relevante Umweltreize aufzunehmen, sie gezielt zu verarbeiten und effektiv darauf zu reagieren. Aufmerksamkeit reguliert, was mit welchem Ziel und in welcher Reihenfolge getan wird[60]. Eine voll funktionale Aufmerksamkeit ist für erfolgreiches Lernen und die psychosoziale Entwicklung bedeutsam.

Aus neuropsychologischer Sicht ist Aufmerksamkeit ein komplexes System, das auf der Aktivität neuronaler Netzwerke fußt und von dem Zusammenwirken von frontalen wie parietalen Cortexarealen und subkortikalen Strukturen getragen wird. Taxonomien unterscheiden verschiedene Komponenten der Aufmerksamkeit: Die selektive Aufmerksamkeit beschreibt die Fähigkeit, selektiv auf relevante Reize zu reagieren und Störreize auszublenden. Die geteilte Aufmerksamkeit ermöglicht es, zwei oder mehr Aufgaben gleichzeitig zu bewältigen, indem die Aufmerksamkeit als Ganzes aufgespalten wird. Sie ist die Fähigkeit mittels Übung, konkurrierende Handlungen störungsfrei auszuführen. Die Daueraufmerksamkeit bzw. Vigilanz ist die Fähigkeit, einen ausreichenden Aktivierungsgrad aufrechtzuerhalten. Die Alertness beschreibt die kurzfristige Aufmerksamkeitsaktivierung. In der Kinderpsychologie, Psychiatrie und Neurologie wird im Fall der Dysfunktionalität von „Aufmerksamkeitsstörungen“ gesprochen, was bei ganz unterschiedlichen körperlichen und psychischen Störungen von klinischer Relevanz sein kann. Die Konzentrationsfähigkeit wird darin meist als eingeschlossen betrachtet, mit der Betonung des Aspekts der willentlichen Anstrengung[61]. Als Exekutivfunktionen werden die Planung, Regulation und Be-wertung nicht automatisierter zielgerichteter Handlungen bezeichnet.

Aufmerksamkeitsfunktionen entwickeln sich ab den ersten Lebensmonaten. Bereits im ersten Lebensjahr sind räumliche Orientierungsreaktionen aufgrund eines posterioren Aufmerksamkeitssystem möglich. Im frontalen Kortex bildet sich gegen Ende des ersten Lebensjahres ein anteriores Aufmerksamkeitssystem aus, das die Hemmung angebahnter Reaktionen und die Ausführung gezielter Handlung ermöglicht. Die Aufmerksamkeitspanne verlängert sich. Im dritten Lebensjahr beginnt ein Kind sich zur Zielerreichung selbst zu regulieren und dabei Aufmerksamkeit zu fokussieren. Für das vierte Lebensjahr wird die erfolgreiche Hemmung von angebahnten Reaktionen beschrieben. Im fünften Lebensjahr lassen sich Kinder nicht mehr leicht ablenken und können Handlungsimpulse zunehmend selbstinstruktiv aufschieben. Für die exekutiven Funktionen lassen sich größere Entwicklungsfortschritte nachweisen, insbesondere auch im Bereich der Daueraufmerksamkeit. Die Aufmerksamkeits-leistungen verbessern sich im 6. Lebensjahr weiter, was vor allem in der zunehmenden Impulskontrolle und dem Durchhaltevermögen deutlich wird[62].

Dennoch sind die Variabilität und die Situationsabhängigkeit des Verhaltens eines frühen Grundschulkindes noch hoch. Das ist bei der ADHS-Diagnostik von Kindern zu berücksichtigen[63]. Sollen dabei die Aufmerksamkeits- und Exekutivfunktionen eines Kindes differenziert durch einen Test beschrieben werden, ist zu bedenken, dass die Testleistungen und das Verhalten in natürlichen Situationen eher gering miteinander korrelieren[64]. Dennoch lassen sich mit neuropsychologischen Testverfahren ADHS-Diagnosen erhärten[65]. Sie geben differenziert einen Einblick in kognitive Funktionen, die für die Handlungssteuerung und –planung sowie Gedächtnisfunktionen von Bedeutung sind. Die am häufigsten untersuchten exekutiven Komponenten sind Arbeitsgedächtnis, kognitive Flexibilität, Planungs- und Problemlösefähigkeit und die Aufmerksamkeits- und Inhibitionskontrolle. Aufmerksamkeit lässt sich umfassend testen, indem die Leistungen bei Anforderungen, die unterschiedliche Modalitäten (visuell/auditiv) und verschiedene Aufmerksamkeitsarten (selektiv/geteilt, kurzfristig/langfristig) betreffen, verglichen und im Verlauf der Testzeit, insbesondere bei längeren selbstgesteuerten Arbeitsphasen, betrachtet werden. Zu den neuropsychologischen Tests, die zur Aufmerksamkeitsdiagnostik im Kinderbereich eingesetzt werden, gehören sowohl Paper-and-Pencil-Tests wie auch computergestütze Tests. Bei allen Tests sollte gewährleistet sein, dass weder der kognitive und sprachliche Entwicklungsstand noch motorische und sensorische Beeinträchtigungen noch spezifische Fähigkeiten wie z.B. Merkfähigkeit die Testergebnisse beeinflussen.

Ein in der klinischen Praxis häufig eingesetztes PC-basiertes neuropsychologisches Testverfahren in der ADHS-Diagnostik ist die „Testbatterie zur Aufmerksamkeits-prüfung für Kinder“[66]. Es erlaubt eine differenzierte, mehrdimensionale Testung von wesentlichen Aufmerksamkeitsfunktionen bei Kindern im Altersbereich 6;0 bis 10;11 Jahren, nämlich in den Bereichen Reaktionsgeschwindigkeit, Sorgfalt der Reaktionen und Kontinuität bzw. Schwankung der Aufmerksamkeit. Das zu diagnostizierende Kind hat in den Testaufgaben auf leicht diskriminierbare, sprachfreie Reize zu reagieren. KiTAP basiert auf der „Testbatterie zur Aufmerksamkeitsprüfung“ (TAP)[67], einem neuropsychologischen Diagnostikinstrument für meist multipel geschädigte erwachsene Patienten mit spezifischen Aufmerksamkeitsausfällen, das umschriebene Teilleistungen der Aufmerksamkeit ohne Beeinflussung durch sensorische, motorische Ausfälle, Gedächtnis- und Sprachstörungen mittels Reaktionsaufgaben prüft. KiTAP wurde davon ausgehend speziell für den Einsatz im Kinderbereich entwickelt: Um die Motivation von Kindern zur Testdurchführung zu steigern, wurden die TAP-Aufgaben in eine kindgerechte Geschichte zum Thema „Geisterschloss“ eingekleidet. Die einzelnen Untertests sind als hoch ansprechendes Material in eine über den Computer grafisch und z.T. akustisch präsentierte Geisterschloss-Szenerie integriert. Um das Kind jedoch auf die Aufgabe vorzubereiten, bedarf es einer ergänzenden Rahmen-erzählung als mündliche Einführung durch den Testleiter. Der genaue Wortlaut dieser Einführungsgeschichte ist nicht vorgegeben.

Von den 8 solchermaßen kindgerecht aufbereiteten Untertests kommen in der ADHS-Diagnostik vor allem folgende TAP-basierte Tests zum Einsatz: Alertness („Die Hexe“), Go/Nogo („Die Fledermaus“), Geteilte Aufgabe („Die Eulen“), Daueraufmerksamkeit („Der Tanz der Geister“), Visuelles Scanning („Der Ausflug der Hexen“), Flexibilität („Das Haus der Drachen“). Beispielweise bei dem Untertest Alertness erscheint eine Hexe im Fenster des Geisterschlosses, die das zu diagnostizierende Kind mit einem Tastendruck vertreiben soll, wodurch die allgemeine Wachheit gemessen wird. Die Testleistung eines Kindes lässt sich dann über die Leistungsgüte und -geschwindigkeit bestimmen. Kennwerte der Leistungsgüte sind die Anzahl der richtigen Reaktionen, die Anzahl der falschen Reaktionen, was als mangelhafte Reaktionshemmung bewertet wird, sowie die Anzahl der Auslassungen als Indikator von gestörter selektiver Aufmerksamkeit. Als Kennwerte für die Leistungsgeschwindigkeit fungieren der Median der Reaktionszeiten als mittlere Reaktionszeit und die Standardabweichung der Reaktionszeiten als Maß für die Regelmäßigkeit. Ein Vorteil des KiTAP ist hier die Messung der Reaktionen im Millisekundenbereich. Defizite in den Aufmerksamkeits-funktionen manifestieren sich nach der Konzeption des KiTAP also in verzögerten Reaktionszeiten, Schwierigkeiten bei der Reaktionshemmung, Daueraufmerksamkeit, Motoriksteuerung und voreiligen Reaktionen.

Der KiTAP versteht sich als ein Testverfahren der „kindgerechten Diagnostik“ und sieht deshalb nur eine „freie Instruktion“ ohne detaillierte Angaben zur Testdurchführung vor. Die Untertests bedürfen weiterhin einer mündlich kurz vorgetragenen Einführungsgeschichte durch den Testleiter. Wichtige Durchführungsfragen wie die Reihenfolge der Untertests oder der Umgang mit instruktionswidrigem Verhalten bleiben offen. Der KiTAP erweist sich somit in seiner Durchführungsobjektivität als eingeschränkt, es besteht die Gefahr von Testleitereffekten[68]. Zudem gibt es Kritikpunkte aus psychometrischer Sicht: kleine Normstichproben, niedrige Splithalf-Reliabilitätskoeffizienten, die unsystematische Normierung, fehlende Cut-off-Werte[69]. Weiterhin kritisieren Dreisörner und Geordiadis, dass die Kinder ihrer Studie entgegen den Angaben der Testautoren nicht 32 Minuten für den Test benötigen, sondern im Mittel 50 bis 60 Minuten[70]. Konzeptionell geben beide Autoren zudem folgenden wichtigen Aspekt zu bedenken: ADHS-Kinder erweisen sich in ihrem Verhalten als besonders abhängig von sofortiger und positiver Verstärkung und benötigen höhere Anreize, wodurch bei Aufgaben der Aufgabenmessung zwischen Performanz und Fähigkeit zu unterscheiden ist. Für die Testergebnisse könnten neben Defiziten in exekutiven Prozessen besonders auch motivationale Zustände ausschlaggebend sein. Davon ausgehend stelle sich auch die Frage, ob die Attraktivität der kindgerechten Rahmenerzählung wie auch die Attraktivität von Computern überhaupt beim Einsatz in der ADHS-Diagnostik nicht sogar ein Nachteil ist. Beide Autoren beziehen sich auf Studien[71], die gezeigt haben, dass bei Aufmerksamkeit beanspruchenden Tätigkeiten wie Computerspielen die Anzeichen einer Störung ausbleiben können, wenn es sich dabei um beliebte Beschäftigungen des Kindes handelt. Bei Computerspielen werden die Faktoren Interesse, Motivation und Anstrengung aktiviert und somit bei bestimmten Reizanforderungen die Leistungsunterschiede eingeebnet. Insofern gehen Dreisörner und Georgiadis davon aus, dass das Design von KiTAP mit seiner Einbettung in eine Geisterschloss-Szenerie zwar kindgerecht ist, aber gerade wegen der bewirkten starken Motivierung eine Entdeckung von Aufmerksamkeitsproblemen erschwert.

Trotz dieser kritischen Punkte konnten Dreisörner und Georgiadis jedoch die Sensitivität und Spezifität von KiTAP im Einsatz der ADHS-Diagnostik nachweisen. 72,9 % der Testkinder ihrer Studie konnten durch KiTAP korrekt klassifiziert werden, und 21,6 % der Varianz ließen sich in der Regressionsrechnung bei KiTAP aufklären. Besonders die Untertests Flexibilität, Daueraufmerksamkeit und Alertness besitzen demgemäß einen diagnostischen Informationswert und können zur Absicherung diagnostischer Entscheidungen genutzt werden[72].

1.3.5 Erfassung von Intelligenz mit HAWIK IV bei der ADHS-Diagnostik von Kindern

Der HAWIK IV kommt als einer der am weitesten verbreiteten und akzeptierten Intelligenztests[73] sehr häufig in der ADHS-Diagnostik von Kindern zum Einsatz. Da ADHS gehäuft mit Leistungs- und Entwicklungsdefiziten einhergeht, soll der Test über den Stand des Kindes in Intelligenz, Leistung und Entwicklung aufklären[74]. Die Verhaltensbeobachtung während der Testung kann zudem Hinweise über das Auftreten und den Schweregrad der Symptomatik liefern. Im Folgenden wird vor allem auf die Möglichkeiten des HAWIK IV hinsichtlich einer entsprechend orientierenden Intelligenzdiagnostik sowie auf die Herausforderungen bei der Testanwendung in der ADHS-Diagnostik bezüglich der Durchführungsobjektivität eingegangen.

Der HAWIK IV fußt auf den Wechsler-Skalen des WISC-IV und erfasst die kognitive Leistungsfähigkeit bei Kindern und Jugendlichen im Alter von 6;0 bis 16;11 Jahren[75]. Ihm liegt implizit das CHC-Modell von Alfonso, Flanagan & Radwan 2005 zugrunde, nach dem Intelligenz zwar einerseits ein globales, das Verhalten eines Individuums insgesamt bestimmendes Konstrukt ist, sich andererseits aus vielen verschiedenen basalen Fähigkeiten zusammensetzt, in denen sich Individuen unterscheiden. Der HAWIK IV liefert Ergebnisse über den Leistungsstand einer wichtigen Auswahl von kognitiven Aspekten, wenngleich das Testergebnis auch durch nichtkognitive motivationale, metakognitive und affektive Faktoren beeinflusst wird. Der Test besteht aus vier Indizes - Sprachverständnis, wahrnehmungsgebundenes logisches Denken, Arbeitsgedächtnis, Verarbeitungsgeschwindigkeit -, aus dem Gesamt-IQ und verschiedenen Prozesswerten[76]. Zusätzliche Analysen wie Diskrepanzanalyse, Bestimmung von Stärken und Schwächen oder Prozessanalysen liefern Profilinformationen, die neben statistisch begründeten Aussagen über ein Leistungsprofil auch fundierte Hinweise auf klinische Störungen geben, auch wenn daraus keine klinische Diagnose wie ADHS abgeleitet werden kann[77]. Der HAWIK IV wurde an einer querschnitthaften Stichprobe von n=1650 Kindern und Jugendlichen aus Deutschland, Österreich und der Schweiz normiert, zudem geben klinische Validierungsstudien, z.B. diejenige basierend auf n=31 ADHS-Kindern, Informationen zur Beurteilung von Sondergruppen[78].

Zehn obligatorische Kerntests und fünf optionale Untertests erfassen im Einzeltest-Setting die Daten zu den Intelligenzleistungen, wozu für den Kerntest eine Durchführungsdauer von 65-90 Minuten zu veranschlagen ist, bei den optionalen Subtests weitere 15-20 Minuten. Die Reihenfolge und Durchführung dieser Subtests werden in teils sehr detailgenauen Durchführungsstandards vorgegeben. Das Manual enthält selbst Hinweise für Fälle, in denen die Testsituation von den Durchführungsstandards abzuweichen droht, wie etwa bei Kindern mit Behinderung. Petermann & Petermann fordern für eine korrekten Testdurchführung, dass der Testleiter für angemessene räumliche Verhältnisse sorgt und zur Objektivität der Ergebnisse so weit wie möglich den Durchführungsstandards folgt, aber zugleich auch maximal auf die individuellen Bedürfnisse des Kindes eingeht und eine gute Beziehung zum Kind herstellt. Insgesamt sind negative Auswirkungen der Testsituation zu vermeiden. Die Testautoren räumen damit für den Einzelfall ein, dass Einschränkungen der standardisierten Durchführung notwendig sein können und dann das Leistungsniveau des Kindes so gut wie möglich erfasst werden muss. Dabei komme es auf die hohe Kompetenz des Testleiters an. F. Petermann hat deshalb zur Objektivierung und Qualitätssicherung der Testanwendung Praxishilfen herausgegeben, einmal zur Vermeidung von Testleitereffekten[79], zum anderen zur Ausschöpfung der Anwendungsbereiche des Tests, etwa auch im klinischen Bereich der ADHS-Diagnostik[80].

Gestützt auf Aiken[81] wird in Petermanns Praxishilfe zur Vermeidung von Testleitereffekten darauf verwiesen, dass Intelligenztestbatterien zu den komplexesten und fehleranfälligsten Testverfahren gehören und dass insbesondere die Durchführungsobjektivität davon betroffen ist. Das kann, wie einschlägige Studien zur Durchführung der Wechsler-Skalen des HAWIK zeigen[82], zu starken Verzerrungen und Verfälschungen der Testergebnisse führen, weshalb auch aus ethischen Gründen ein Einsatz ausschließlich von qualifizierten und trainierten Testleitern gefordert wird[83]. Doch gerade die Wechsler-Skalen werden am häufigsten von ungeübten Testleitern angewandt, und das wirkt sich den Studien zufolge am meisten auf die Bewertbarkeit der sprachlichen Subtests aus. Hier liege beim WISC-IV neben dem unangemessenen Nachfragen das größte Fehlerrisiko, gefolgt vom fehlerhaften Mitschreiben der wörtlichen Antworten. Insgesamt wurden in der Studie von Loe et alt. von 2007 in 98% der Testprotokolle Fehler festgestellt. Daher hatten sich Petermann & Petermann entschieden, im Manual zum HAWIK IV die typischen Fehler aufzuführen.

In der obigen Praxishilfe bezüglich Testleitereffekte werden als gravierendste Durchführungsfehler u.a. genannt: Vorgabe von unerlaubten Hilfestellungen, Rückmeldung über die Antwortrichtigkeit, fehlerhafte Hinweise, Abbrüche, Zeitnahmen, Nachfragen und Subtest-Versionsvorgaben, Wiederholung von Aufgabenstellungen zum Arbeitsgedächtnis, unkorrektes Vorlesen und Mitschreiben sowie die Nichtbeachtung der altersspezifischen Startpunkte[84]. Lipsius et alt. zeigen anhand von Praxisbeispielen auf, wie stark sich die Fehler und Abweichungen in der Testdurchführung auf die Validität der Testergebnisse auswirken und Fehldiagnosen bedingen können. „Ein häufiger Fehler in der Praxis ist zu stark unterstützendes Testen, das dem Kind vermeintlich helfen soll, in dem die Antworten des Kindes quasi erahnt werden und somit durch zu viel Hilfestellung vom standardisierten Vorgehen abgewichen wird“, resümieren die Autoren[85]. Der WISC-IV bzw. HAWIK IV gehöre aber trotz seiner Fehleranfälligkeit zu den aussagekräftigsten psychologischen Verfahren überhaupt.

In einem Fallbuch haben Petermann et alt. die Anwendungsbereiche des HAWIK IV auch im klinischen Bereich beleuchtet. Wolff Metternich fokussiert dabei auf den Einsatz in der ADHS-Diagnostik anhand der Kasuistik von zwei Fallbespielen[86]. Nach ihren Auswertungen deutet sich an, dass bei Testungen von Kindern mit fraglicher ADHS bestimmte Profile häufiger auftreten, so schwächere Werte auf den Skalen Verarbeitungsgeschwindigkeit und teilweise auch Arbeitsgedächtnis. Zudem ist bei Kindern in jüngerem Alter sowie mit starkem Störungsbild mit einem Auftreten von Symptomen, vor allem motorischer Unruhe zu rechnen. Doch gilt das nicht für jede Testsituation, und es ergibt sich selbst bei eindeutig betroffenen Kindern kein spezielles Profil. Auch wenn es demnach das typische ADHS-Profil nicht gibt, so können die Testergebnisse des HAWIK zumindest hilfreiche Hinweise für die Diagnostik wie für die Interventionsplanung liefern. In den beiden Fallbeispielen ließen sich von Metternich jedenfalls typische Verhaltensweisen von Kindern mit ADHS beobachten. Neben einer erhöhten motorischen Unruhe betraf das vor allem ihre große Mühe, die Aufmerksamkeit für die Dauer der HAWIK-Testung aufrechtzuhalten. Die Testdurchführung war dadurch erschwert und stellte für beide 7-jährige Jungen eine Belastung dar. Für solche herausfordernden, klinischen Einsätze gibt es beim HAWIK IV die Möglichkeit, eine kürzere Testvariante zu wählen[87].

Dennoch verlangt diese Art klinischer Einsätze angesichts der ausgeprägten Symptome dem Testleiter einige Erfahrungen im Umgang mit den betroffenen Kindern und ein feines Regulieren zwischen den Durchführungsanforderungen des Tests und elementaren kindlichen Bedürfnissen ab.

1.3.6 Zusammenfassende Ableitung der Fragestellung

Der Einsatz von HAWIK IV und KiTAP in der ADHS-Diagnostik von Kindern steht also von vornherein unter besonderen Verwendungsbedingungen, die sich von Standardeinsätzen im pädagogisch-psychologischen, nicht-klinischen Bereich grundlegend unterscheiden: Der Vorgang der ADHS-Diagnostik ist insgesamt komplex. Insbesondere das Ausschlussdiagnose-Prinzip, die Einordnungsprobleme von Komorbiditäten wie Sekundärsymptomen, die Entwicklungs- und Situationsabhängigkeit der Symptome, die hohe Variabilität der Symptomausprägung bei jüngeren Kindern und nicht zuletzt die klinisch-psychologischen Anforderungen an die Kind- und Entwicklungsgerechtigkeit stellen die Psychodiagnostik vor große Herausforderungen. Um die Diagnostik angesichts sehr schwankender Prävalenzzahlen testpsychologisch untermauern zu können, bedarf es einer kritisch hinterfragten, jedenfalls hinreichenden Durchführungsobjektivität der Testinstrumente unter klinischen Verwendungsbedingungen.

Auf der Ebene der Testkonstruktion kann für den HAWIK IV ein Maximum an Objektivierbarkeit über möglichst weitgehend standardisierte Testverfahren sichergestellt werden. Für den KiTAP gilt das wegen seiner „freien Instruktion“ eingeschränkt. Auf der Ebene der Durchführungspraxis hingegen ist Objektivität deutlich relativer: In jedem konkreten Einzelfall gibt es situative, interaktionelle und subjektive Implikationen. In der ADHS-Testdiagnostik befinden sich die Testleiter zudem in einem Spannungsfeld von testtheoretischen und klinischen Anforderungen. Beide Gesichtspunkte stellen wichtige Anforderungen dar. Der Ausgleich der Anforderungen kann nur in einem eng begrenzten Spielraum stattfinden, der durch Sensibilität, Berufserfahrung, Selbsterfahrung und kritische Reflexion im Umgang mit den Implikationen zu kontrollieren ist.

Vor dem Hintergrund des Forschungsstandes zur psychodiagnostischen Objektivität im Allgemeinen, zur Diagnostik von Aufmerksamkeitsfunktionen und ADHS im Besonderen wie auch zur Konstruktion und Praxis von KiTAP und HAWIK IV stellen sich zusammenfassend folgende Fragen:

Wie regulieren Testleiter ihr Test-Durchführungsverhalten bei der ADHS-Diagnostik von Kindern im Spannungsfeld von Testtheorie und psychosozial-diagnostischer Fachlichkeit? Wie tun sie das in einem sehr komplexen, strukturierten Testsetting wie dem HAWIK IV, wie in einem stark animierten, wenig standardisierten Computertest wie dem KiTAP? Wie stellen sie sich dabei auf die situativen und interaktionellen Anforderungen bei Kindern mit bisweilen starken Aufmerksamkeits- und Selbstregulationsproblemen ein? Wie wahren sie das Gebot der Testfairness bei Kindern mit klinischen Besonderheiten, wo weder KiTAP noch HAWIK an dieser Zielgruppe normiert wurde? Wie gehen sie dabei mit den anderen oben angeschnittenen Herausforderungen, Gesichtspunkten und Besonderheiten von Kindern mit ADHS-Verdachtsdiagnose um? Gibt es bei den Testleitern jenseits der situativ bedingten Regulation stabile persönliche Durchführungsstile, mit denen sich ihr Durchführungsverhalten im Spektrum zwischen psychosozial-diagnostischen Gesichtspunkten und solchen des testtheoretisch fundierten Messens verorten lassen? Sind diese den Testleitern in einem methodisch-reflektierten Sinne bewusst? Ähneln sich die persönlichen Durchführungsstile, so dass von übergreifenden professionellen Stilen zumindest bezogen auf KiTAP und HAWIK in der ADHS-Diagnostik gesprochen werden kann? Gibt es bestimmbare professionelle Typen von Durchführungsstilen? Wie grenzen sich diese voneinander ab?

Das sind die Fragen, die sich die vorliegende Studie für den Bereich der Testpsychologie via KiTAP und HAWIK IV in der ADHS-Diagnostik von Kindern stellt, und zwar mittels eines primär qualitativen, aber auch quantitativ ergänzten Zugangs.

Die Studie geht dabei von folgenden Hypothesen aus:

- Die Testleiter lassen sich hinsichtlich ihres Testdurchführungsverhaltens mindestens zwei Gruppen zuordnen, nämlich einer Gruppe, die in Testungen den Akzent auf Prozess- und Beziehungsorientierung legt, einer anderen, die sich mehr von Ergebnisorientierung und Abstinenzbemühen leiten lässt. Eine dritte Gruppe könnte sich aus einer Orientierung an der mittleren Position ergeben.
- Die entsprechende Zuordnung fällt deutlich aus. Von dieser aus Beobachtung gewonnenen Gruppeneinordnung werden die Selbsteinschätzungen der Testleiter leicht abweichen. Dennoch zeigen sich klar erkennbar entsprechende Stile und Typen im Durchführungsverhalten.
- Auf der Ebene einzelner Verhaltenskategorien werden Beobachtungsbefunde mitunter deutlich streuen, da das Testdurchführungsverhalten unterschiedliche Testphasen betrifft und die Testleiter sich auf situative und interaktionelle Anforderungen regulativ einstellen.
- Diese Regulation im Durchführungsverhalten erfolgt als professionelle Anpassungsleistung im Spannungsfeld von Testtheorie und psychosozial-diagnostischer Fachlichkeit. Dies ist den Testleitern größtenteils bewusst, sie handeln reflektiert: Je nach situativen und interaktionellen Anforderungen nehmen sie gezielte Anpassungen oder Standardsicherungen vor.

2 Methode

Bei der Studie handelt es sich um eine qualitativ-empirische Untersuchung im Beobachtungs- und Interviewdesign ergänzt um eine quantitative Beschreibung der entsprechenden Befunde. Das Durchführungsverhalten von Testleitern in der KiTAP- und HAWIK-IV-Testung im Rahmen der ADHS-Diagnostik wird anhand von induktiv aus dem Feld gebildeten Kategorien systematisch beobachtet. Weiterhin werden die Testleiter zu denselben Kategorien nach ihrer Selbsteinschätzung befragt, um durch eine Gegenüberstellung der Ergebnisse Bewusstheit und Reflexion des Durchführungsverhaltens einzuschätzen und Hinweise auf die wissenschaftliche Güte der Beobachtung zu erhalten. Außerdem werden die aus Beobachtung und Interview erhobenen Daten einer deskriptiven Statistik unterzogen, anschließend per Faktoren- und Clusteranalyse bearbeitet[88]. Damit sollen die qualitativen Befunde genauer beschrieben, insbesondere die Typenbildung methodisch kontrolliert werden.

2.1 Beschreibung der Stichprobe

Vorerhebung und Erhebung erfolgten in einer Augsburger Gemeinschaftspraxis von drei niedergelassenen Kinder- und Jugendpsychiatern. Die Praxis ist seit 5 Jahren etabliert, wird stark angefragt und hat einen Einzugsraum, der weit über die Grenzen der Großstadt hinausgeht und die benachbarten teils urbanisierten teils ländlichen Landkreise miteinschließt. Sie wird auch oft von Eltern mit Kindern aufgesucht, die Hyperaktivitäts- und/oder Aufmerksamkeitsprobleme zeigen. Der Verdachtsdiagnose wird nach Konsultierung einer Ärztin bzw. eines Arztes durch verschiedene diagnostische Instrumente nachgegangen, darunter regelmäßig auch dem KiTAP und dem HAWIK IV. In der Praxis arbeiten 11 aktive Testleiter mit unterschiedlichem Beschäftigungsumfang und verschiedenem beruflichen Hintergrund: drei Diplom-Psychologinnen, eine Diplom-Pädagogin, drei Diplom-Sozialpädagoginnen, eine Sonderpädagogin (am Ende eines einjährigen Praktikums), zwei Heilpädagoginnen und eine Logopädin. Alle 11 Testleiter haben sich nach einer ausführlichen Vorstellung des Untersuchungsprojekts im Team entschlossen, an der Studie als Probanden teilzunehmen, nachdem bereits ein halbes Jahr zuvor eine achtwöchige Vorerhebung zur Untersuchung durchgeführt worden war. Die drei Ärzte hatten einer Mitwirkung der Praxis im Grundsatz zugestimmt, die Entscheidung der Teilnahme jedoch ihren Testleitern einzeln und abschließend überlassen. Eine wichtige Motivation zur Teilnahme war für alle der Gesichtspunkt der Qualitätssicherung. Auf eine diskrete, aber transparente Erhebung im Hintergrund wurde Wert gelegt, der Einsatz von Video-Aufzeichnung fand keine Akzeptanz. Die Vorstellung und Diskussion des Untersuchungsprojekts im Kreise der Testleiter und Ärzte erfolgte im Stil einer „kommunikativen Validierung“[89].

Dabei wurden auch Details der Stichprobe abschließend geklärt: Jeder der 11 aktiven Testleiter wird je einmal in einer KiTAP- und HAWIK-Ersttestung von Grundschulkindern mit Verdacht auf AD(H)S teilnehmend wie offen beobachtet[90], und zwar in der Reihenfolge, wie die Testungen ab Mitte Juni 2015 routinegemäß in der Praxis terminiert und an die Testleiter vergeben werden. Das Höchstalter für den KiTAP beträgt entsprechend der Altersnormierung 10 Jahre, das für den HAWIK 11 Jahre, das Mindestalter für beide Tests 6 Jahre. Die Fall-Verteilung von Alter, Geschlecht wie auch Symptom-Ausprägungsgrad der Kinder richtet sich also allein nach der bestehenden Zuteilungslogik und -routine der Praxis. Mit dem KiTAP wird das Durchführungsverhalten in einem computerbasierten, für ADHS einschlägigen Test erhoben, mit dem HAWIK-IV das Durchführungsverhalten in einem komplexen, vielseitigen, als robust geltenden Intelligenztest. Die Eltern werden vor der Teilnahme ihres Kindes an der beobachteten Sitzung per Informationsblatt benachrichtigt und um Zustimmung gebeten. Über die Beobachtung hinaus werden alle 11 Testleiter, sofern sie bereits in beiden Tests beobachtet wurden, in einem 30 minütigen standardisierten, fokussierten Interview[91] nach ihrer Selbsteinschätzung ihres Durchführungsverhaltens bezogen auf obige Kategorien befragt, worauf sie im Anschluss mit den Bobachtungsergebnissen konfrontiert und zu einer validierenden Rückmeldung veranlasst werden[92]. Die nach diesen Regeln vorgenommene systematische Beobachtung und Interview-Befragung erstreckte sich auf einen Zeitraum von 15 Wochen von Juni bis Oktober 2015.

2.2 Erhebungsinstrumente

2.2.1 Untersuchungsvariablen

Als Betrachtungsgegenstand dient der Studie das Konstrukt einer „subsidiär-restriktiven Standardanpassung“ im Durchführungsverhalten der Testleiter, und zwar als abwägend-regulierender Durchführungsstil im Spannungsfeld zwischen Testtheorie und psychosozial-diagnostischer Fachlichkeit im klinischen Testeinsatz. Die Regulation des Testleiters erfolgt danach im klinischen Kontext der ADHS-Diagnostik als kontrollierte Anpassungsleistung auf besondere situative und interaktionelle Implikationen.

Dieser latenten Variable des beziehungs- und prozessbezogenen Regulationsstils der jeweiligen Testleiter stehen als manifeste Variablen Kategorien zur Beobachtung und Selbsteinschätzung des Durchführungsverhaltens in KiTAP- und HAWIK-IV-Testungen gegenüber, die zuvor über eine Vorerhebung induktiv-qualitativ aus dem Feld der Testleiter dieser Gemeinschaftspraxis erschlossen wurden.

Als konfundierender Faktor könnten sich in der Untersuchung der Ausprägungsgrad wie die Variabilität der Symptome und Auffälligkeiten der Kinder in der Testsituation erweisen. Zwar wird die Unterschiedlichkeit dieser Durchführungsbedingung dadurch eingeebnet, dass a) sich die Testung nur auf Grundschulkinder von 6 bis 11 Jahren bezieht, b) die Kinder eine Verdachtsdiagnose AD(H)S haben und c) die Zuordnung der Kinder auf Testleiter und Testart der testleiterunabhängigen Zuteilungsroutine und –logik der Praxis folgt[93]. Andererseits bleibt trotz dieser Eingrenzung der Variable für die Testleiter immer noch ein Spektrum verschiedener Durchführungsbedingungen, je nachdem wie das zu diagnostizierende Kind mit seinen besonderen Ausgangslagen und Symptomen auf die jeweilige Testsituation reagiert. Zum einen ist – wie oben ausgeführt – die Variabilität und Situationsabhängigkeit der Symptomausprägung gerade bei jüngeren Kindern noch hoch, zum anderen führt die Verdachtsdiagnose zu keiner einheitlichen Gruppe von Kindern mit später gesicherter Diagnose, wobei zusätzlich noch die Variabilität der komplexen Diagnosestellung eine Rolle spielt. Unter den Kindern finden sich ebenfalls solche im Grenzbereich von ADHS und solche mit unspezifischen Auffälligkeiten.

Allerdings können sich auch Kinder mit unspezifischen Auffälligkeiten situativ oder durchgehend als herausfordernd für die Testdurchführung erweisen. Zudem beabsichtigt die Erhebung des Testdurchführungsverhaltens im Kontext der ADHS-Diagnostik gerade eine Erfassung von nicht vorhersehbaren, situationsabhängigen Testsituationen, um die latente Variable des abwägend-regulativen Durchführungsstils mit ihrer subsidiär-restriktive Standardanpassung einzufangen. Damit der potentiell konfundierende Faktor sich dennoch kontrollieren lässt, erfolgt die Beobachtung der jeweiligen Testdurchführung systematisch rotierend und erfasst damit pro Kategorie alle Phasen eines Tests. Zusätzlich werden auffällige Verhaltensweisen der Testperson und die entsprechende Reaktion des Testleiters dokumentiert. Andererseits wird den testpersonabhängigen Beobachtungsergebnissen von KiTAP und HAWIK IV die Selbsteinschätzung des betreffenden Testleiters vergleichend gegenübergestellt.

2.2.2 Qualitativ-induktive Kategorienbildung

In einer achtwöchigen Vorerhebung im Oktober und November 2014 wurden 28 Testsitzungen von sieben Testleitern der Gemeinschaftspraxis systematisch nach offen formulierten Gesichtspunkten selektiv protokolliert[94]. Entsprechend dem Grundsatz der feldnahen Kategorienbildung in der qualitativen Sozialforschung, nach dem „auf eine systematische Ableitung von Auswertungsgesichtspunkten aus dem Material, also eine induktive Kategorienbildung, großer Wert gelegt“ wird[95], wurden die Protokolle einer qualitativen Inhaltsanalyse unterzogen[96]. Ziel der induktiven Kategorienbildung ist es, dass dem Untersuchungsfeld nicht fremde, unpassende Kategorien übergestülpt werden, sondern dass möglichst nah an der Testwirklichkeit und dem Testalltag der Testleiter angeknüpft wird, zumal für diese Fragestellung auf keine bestehenden, direkt einschlägigen Forschungen zurückgegriffen werden kann. Insofern bedarf es der Herleitung passender Auswertungsgesichtspunkte aus dem Feld der Testleiter und ihrer Testdurchführungen selbst[97]. Im anderen Fall würde die Untersuchung das Risiko einer fehlgeleiteten oder zerrenden Erhebung eingehen und schlimmstenfalls falsche Schlüsse ziehen. Mayering beschreibt das Vorgehen der induktiven Kategorienbildung folgendermaßen: „Wenn das erste Mal eine zur (allgemeinen) Kategoriendefinition passende Textstelle gefunden wird, wird dafür eine Kategorie konstruiert…Wird im weiteren Analyseverlauf wieder dazu eine passende Textstelle gefunden, so wird sie ebenfalls zugeordnet…Wenn die neue Textstelle…aber zu der/den bereits induktiv gebildete/n Kategorie/n nicht passt, so wird eine neue Kategorie induktiv, aus dem spezifischen Material heraus formuliert.[98] “ Auf diese Weise wurden 13 bipolare und 8 unipolare Kategorien aus dem Material extrahiert. Die 13 bipolaren Kategorien wurden im Zuge eines zweiten Suchlaufs durch das Protokollmaterial nach Ankerbeispielen in dreistufige Kategorien umgewandelt, denen jeweils mehrere Ankerbeispiele als künftige Deskriptoren zugeordnet wurden[99]. Die 13 Kategorien wurden anschließend inhaltlich in zwei Dimensionen aufgeteilt:

Dimension A: Regulation Nähe - Distanz

Abbildung in dieser Leseprobe nicht enthalten

Dimension B: Regulation Prozess - Ergebnis

Abbildung in dieser Leseprobe nicht enthalten

Die unipolaren Kategorien ergaben zwei weitere Dimensionen, wobei die testgütebezogenen Kategorien nach Intensität dreistufig angelegt wurden[100]:

Dimension C: Streben nach Testgüte

- Nähe zum Instruktionswortlaut
- Routinegrad: Sicherheit und Stringenz des Durchführungsverhaltens
- Bemühen um Messgenauigkeit
- Bemühen um valide Testergebnisse

Dimension D: Reflexionsgrad bezüglich Durchführungspraxis

- Bewusstsein für durchführungspraktische Herausforderungen
- Berücksichtigung von fachlichen Impulsen
- Bewusstsein fachlicher und testtheoretischer Spannungsfelder
- fachlich reflektierte Position zur diagnostischen Bedeutung von Tests (bei ADHS)

2.2.3 Beschreibung der Erhebungsinstrumente

2.2.3.1 Beobachtungsbogen und Beobachtungsdesign

Die Dimensionen A und B mit ihren 13 bipolaren Kategorien sowie die testgütebezogene unipolare Dimension C mit ihren vier dreistufigen Kategorien wurden zu einem Beobachtungsbogen mit Schätzskalen, Ankerbeispielen, Kodier- und Beobachtungsregeln[101], Angaben zur Itemdynamik und Dokumentationsfeldern für interaktionelle und situative Besonderheiten montiert[102]. Der Bogen besteht in dieser Ausstattung aus acht Seiten, wobei die letzte Seite zwei Kategorien der testgütebezogenen Dimension C beinhaltet. Die Kategorien wurden so auf die Seiten des Bogens verteilt, dass auf einer Seite zwei möglichst weit auseinanderliegende A-B-Kategorien stehen. Die entsprechende Verteilung erfolgt dabei nach logischen Gesichtspunkten. Das Beobachtungsdesign sieht nun vor, dass für jede Seite zwei Minuten Beobachtungszeit angesetzt sind, für die achte Seite mit ihrem Dimension-C-Bezug wird eine Minute veranschlagt. Damit ergeben sich pro achtseitigem Bogen 15 Minuten, was bei einem KiTAP mit einer Dauer von 45 Minuten einen Durchlauf von drei Bögen ergibt, bei einem HAWIK IV mit einer Dauer von 90 Minuten einen Durchgang von sechs Bögen. Dieses rollierende Beobachtungsdesign gewährleistet zum einen, dass das Durchführungsverhalten eines Testleiters pro Kategorie in verschiedenen Testphasen erfasst wird, zum anderen, dass für jede Kategorie mehrere Ergebnisse gegenübergestellt werden können. Die Befunde lassen sich so für jeden Testleiter pro Test und testübergreifend mitteln.

Um die daraus sich ergebenden Möglichkeiten voll zu nutzen, wurden die Kategorien so montiert, dass sich für jede Kategorie eine Intervallskala ergibt, die statt einer bloßen Zuordnung des Durchführungsverhaltens zu einer der drei Kategorie-Stufen nun auch eine Taxierung auf einer Schätzskala zulässt. Für jede Stufe sieht die Skala neun Graduierungen vor, die kontinuierlich von Kleiner nach Größer aufeinander aufbauen. Das setzt entsprechende Ordinalität und Äquidistanz der Graduierungen voraus[103], die zunächst aus logischen Gesichtspunkten heraus unterstellt, im späteren Verlauf durch die hohe Deckung der Werte mit den Ergebnissen der qualitativen Beschreibung wie auch der Selbsteinschätzungen der Testleiter validiert wurden. Die Montage der drei Stufen der Kategorien zu einer Skala brachte diese Unterkategorien in eine inhaltlich ordinale Beziehung zueinander, bei der einerseits mit der Anordnung auf eine stimmige Itemdynamik zu achten[104], andererseits eine Wertung im Sinne von Falsch–Richtig oder Gut–Schlecht zu vermeiden war. Vielmehr mussten nach der Idee des qualitativen Ansatzes die Durchführungsweisen und -gesichtspunkte des Feldes grundsätzlich anerkannt werden und eine beobachtend zuordnende und dabei möglichst wertungsneutral einschätzende Erfassung angestrebt werden. Die Montage der dreistufigen Kategorie zur intervallskalierten Skala dreier aufeinander aufbauender Unterkategorien darf nicht durch ihre Anlage und Formulierung einer wertenden Voreingenommenheit und einseitigen Perspektivität Vorschub leisten, sonst wäre die qualitativ-induktive Kategorienbildung um ihren Wert gebracht und eine Typenbildung präjudiziert. Grundsätzlich wird - nach den Erfahrungen in den Vorerhebungen - allen 11 Testleitern in ihrer jeweiligen Diversität reflektierte Professionalität und Stilbildung unterstellt, so dass der Fokus der Erhebung auf dem Wie der Testdurchführung liegt, nicht auf einem Ranking von Besser-Schlechter. Dieser Grundsatz bedingt eine entsprechend um Differenzierung bemühte, mitunter diffizil abwägende Formulierung der Unterkategorien einer Kategorie.

Im Folgenden werden die 13 Kategorien der Dimensionen A und B, die die Grundlage sowohl von Beobachtungs- wie auch Interviewbogen bilden, im Einzelnen gemäß ihrer Reihenfolge auf den Bögen vorgestellt:

- Setting: Über die Kategorie soll erfasst werden, wie der Testleiter sein Setting gestaltet. Geht er flexibel und klientenzentriert auf die Bedürfnisse der Testperson ein oder geht es ihm im Setting um funktionale Aspekte? Die Unterkategorien sind 1. Vorsicht mit flexiblem klientenzentrierten Setting, 2. Vorgabe eines klientenzentrierten Settings mit hohem Funktionsbezug, 3. Vorgabe eines funktionszentrierten Settings. Die Itemdynamik ist ein zunehmender Funktions-bezug in der Setting-Gestaltung.
- Beziehungsregulierung: Die Kategorie erfasst, in welcher Weise für den Testleiter der Beziehungsaspekt in der Durchführung eine Rolle spielt. Beziehung wird hier definiert als eine von Nähe, Hinwendung und Aufeinander-Bezogenheit geprägte Interaktion. Baut der Testleiter aktiv Beziehung auf und gestaltet diese im Testprozess? Oder geht es ihm in Selbst-Zurückhaltung um eine reine Test-Arbeitsbeziehung? Oder ist er in einer standardisierten Testleiter-Rolle um weitgehende Selbst-Abstinenz bemüht? Die Unterkategorien sind 1. Dosieren bzgl. Beziehungsgestaltender Interaktion, 2. Selbst-Zurückhaltung, 3. Selbst-Abstinenz. Die Itemdynamik ist eine zunehmende Selbst-Zurückhaltung.
- Leistungs- und Belastungsgrenzen: Die Kategorie fragt danach, wie der Testleiter mit deutlich werdenden Leistungs- und Belastungsgrenzen umgeht. Verhält er sich diesbezüglich sehr sensitiv-präventiv oder testet er die Grenzen voll bis zur Zumutbarkeitsgrenze aus? Der Fokus liegt in Abgrenzung zu den Items Intervention, Überforderung und Leistungsforderung auf der Empfindlichkeit des Testleiters für Grenzen. Die Unterkategorien sind 1. Beachten von Leistungs- und Bewältigungsgrenzen, 2. Reaktion auf Leistungs- und Belastungsgrenzen, 3. Sensitivität für Leistungs- und Belastungsgrenzen. Die Itemdynamik ist ein zunehmendes Eingehen auf Leistung- und Belastungsgrenzen.
- Standardnähe: Die Kategorie fokussiert darauf, wie eng sich der Testleiter an die Durchführungsstandards und Instruktionsvorgaben hält. Geht er in vollem Umfang in die standardisierte Testleiter-Rolle oder passt er tendenziell die Durchführung kindgerecht an die Testperson an? Inwieweit strebt er Nähe zu den standardisierten Durchführungsbedingungen an? Die Unterkategorien sind 1. Vorsicht mit kindgerechten Anpassungen der Instruktionsbedingung, 2. Affinitätsbemühen bzgl. standardisierter Instruktionsbedingung, 3. Durchsetzen der standardisierten Instruktionsbedingung. Die Itemdynamik ist ein zunehmendes Bemühen um Standardnähe.
- Leistungsbedingungen: Die Kategorie erfasst, wie der Testleiter die Leistungs-bedingungen gestaltet. Geht es ihm um optimale Leistungsbedingungen für die Testperson oder um Leistungsbedingungen, die er nach eigenen Erfahrungen für schulische Prüfungsrealität hält? Die Unterkategorien sind 1. Vorsicht mit der Ermöglichung von optimalen Leistungsbedingungen, 2. Dosieren bzgl. Anpassung von Leistungsbedingungen schulischer Prüfungsrealität, 3. Eintreten für prüfungsrealitätsabbildende Leistungsbedingungen. Die Itemdynamik ist eine zunehmende Orientierung an schulischer Prüfungsrealität.
- Testleiter-Klient-Verhältnis: Die Kategorie fängt ein, wie der Testleiter im Setting Nähe-Distanz zur Testperson reguliert – eher tendenziell hin zur Nähe oder eher tendenziell zur Distanz? Die Unterkategorien sind 1. Dosieren bzgl. Distanz zum Klienten, 2. mäßige Nähe zum Klienten, 3. Nähe zum Klienten. Die Itemdynamik ist eine zunehmende Nähe zum Klienten.
- Leistungsforderung: Mit der Kategorie soll erfasst werden, bis zu welchem Maß der Testleiter die sich aus der Testsituation ergebende Leistung einfordert. Inwieweit beachtet er deutlich werdende Leistungs- und Bewältigungsgrenzen der Testperson? Passt er aktiv seine Leistungsforderung an, wenn eine testaussage-verzerrende Überforderung droht oder fordert er die Leistung bis an die Grenze der Zumutbarkeit ein? Der Fokus der Kategorie liegt in Abgrenzung zu den Items Intervention, Überforderung und Leistungs-/Belastungsgrenzen auf dem Forderverhalten des Testleiters und seinem Umgang mit der leistungsfordernden Rolle. Die Unterkategorien sind 1. Vorsichtiges Dosieren von Präventionen gegen Überforderung, 2. Fordern unter Berücksichtigung von Leistungsgrenzen, 3. Ungehindertes Fordern von Leistung. Die Itemdynamik ist ein zunehmendes Fordern von Leistung.
- Intervention: Die Kategorie fokussiert darauf, inwieweit der Testleiter aktiv im Testgeschehen interveniert, um die Durchführung des Tests als ganzen zu gewährleisten und explorative Befunde zu sichern. Inwieweit verhält er sich in seiner standardisierten Rolle bezüglich Interventionen zurückhaltend oder abstinent? Die Unterkategorien sind 1. Dosieren bzgl. Interventionsabstinenz, 2. Zurückhaltung bzgl. Interventionen, 3. aktiv intervenierende Durchführungs-gewährleistung. Die Itemdynamik ist eine zunehmende Interventionstendenz.
- Leistungsselbstbild: Die Kategorie erhebt, inwieweit der Testleiter berücksichtigt, dass die kindliche Testperson die Testerfahrung in die Entwicklung ihres Leistungs-Selbstbildes einbaut und in ihrem Selbstwertgefühl berührt wird. Verhält er sich diesbezüglich pädagogisch und ist um positive Effekte bemüht oder geht es ihm eher in Ausübung einer standardisierten Testleitungs-Rolle um ein Minimum an solchen Effekten. Die Unterkategorien sind 1. Begrenzung von möglichen (negativen) Selbstbild-Effekten, 2. Vermeiden von Selbstbild-Effekten, 3. Bemühen um möglichst positive Effekte auf das Leistungs-Selbstbild. Die Itemdynamik ist eine zunehmende Selbstwert-Rücksicht.
- Explorationsstil: Die Kategorie fokussiert darauf, ob in der diagnostischen Situation (über die reine Testerhebung hinaus) eher klientenzentriert oder sachzentriert exploriert wird. Begegnet der Testleiter der Testperson eher kongruent und empathisch im Sinne einer einmaligen Begegnungssituation oder handelt er eher als funktionell austauschbarer Anwender eines standardisierten Tests in einer normorientierten Testsituation? Die Unterkategorien sind 1. Dosieren bzgl. sachlicher Exploration, 2. individualisierende Exploration, 3. kongruente und empathische Exploration. Die Itemdynamik ist ein zunehmendes Eingehen auf den Klienten.
- Überforderung: Die Kategorie erfasst, wie der Testleiter mit einer möglichen oder tatsächlichen Überforderung umgeht, insbesondere wenn sie sich schädigend für die Testperson auswirken könnte ? Wann bricht er ab, um keine Schädigung eintreten zu lassen? Verhält er sich eher präventiv oder geht er bis an die Grenze der Zumutbarkeit? Zumutbarkeit wird dabei im Sinne der Nebengütekriterien der Testtheorie verstanden. Unterkategorien sind 1. Vorsicht mit Inkaufnahme des Gesamt-Abbruchs im Fordern, 2. Vorsicht vor schädigender Überforderung, 3. Schutz vor schädigender Überforderung. Die Itemdynamik ist ein zunehmendes Schutzverhalten des Testleiters.

[...]


[1] Zur Vereinheitlichung der vielen gebräuchlichen Begriffe wie ADHS, ADS, Aufmerksamkeitsstörungen, Hyperkinetische Störungen etc. wird in der vorliegenden Arbeit der häufig benutzte Begriff ADHS verwendet.

[2] Döpfner, Banaschewski & Sonuga-Barke 2008; Remschmidt & Heiser 2004

[3] Sciutto & Eisenberg 2007

[4] Desgranges, Desgranges & Karsky 1995

[5] Handler & DuPaul 2005

[6] Die Diskussion um die ADHS-Diagnostik überschauend Schulte-Körne 2008, S. 740; eine zweite kontroverse Diskussion dreht sich diesbezüglich um die Frage, ob durch die Ausweitung der diagnostischen Kriterien nicht fälschlicherweise zu viele Kinder und Jugendliche als ADHS-Patienten diagnostiziert werden.

[7] DGKJP 2007

[8] Petermann & Petermann 2007

[9] Zimmermann, Gondan & Fimm 2002

[10] rückblickend Grubitzsch 1991, Rauchfleisch 2008, Zihlmann 1998, Schulz 1997, Westmeyer 2004; der damalige Diskurs spitzte sich zu in der Schweizerischen Zeitschrift für Psychologie und ihre Anwendungen Band 34 und 35: Lang 1975, Landolf 1976, Spörli 1976, Schmid 1975

[11] auf den Diskurs in der Schweizerischen Zeitschrift für Psychologie bezogen Lang 1975, Pulver 1975,

Pulver 1978

[12] Schmid 1975, Spörli 1976, Landolf 1976

[13] Westmeyer 1972, Klauer 1978, Krauth 1995, Lienert & Raatz 1998

[14] Grubitzsch 1991, Einleitung; mit dieser Zielsetzung auch Rauchfleisch 2008, Zihlmann 1998

[15] bezüglich der 1970er und 1980er Jahre vor allem auf Anastasi 1976, Hartmann 1970, Schenk-Danzinger 1971, Breuer 1979, Spitznagel 1982

[16] Nach Kubingers „moderner Testtheorie“ (1989) klingt in Kubinger 2009 die kritische Sicht noch nach.

[17] Grubitzsch 1991, S. 211

[18] Rost 2004, Pospeschill & Spinath 2009; Kubinger 2009 problematisiert zumindest einige Aspekte von Testleitereffekten: „So bleibt es fraglich, inwieweit selbst eine Testanweisung an den Tl (Testleiter) nützt, die sein Vorgehen ganz genau festlegt und alle situativen Möglichkeiten anspricht“ (S. 41).

[19] Richtlinien T. D. F. D. Psychologenvereinigungen 1986; Standards des Committee to Develop Standards for Educational and Psychological Testing 1998; Standards der AERA, APA & NCME 1999; Richtlinien der International Test Commission (ITC) 2000 und 2001; Moosbrugger & Höfling 2008

[20] So bei Zihlmann 1998 vor allem ausgehend von Testungen im Bereich der Berufsberatung

[21] Der KiTAP wurde in der Erwachsenen-Neuropsychologie konzipiert und dann auf die klinische Kinder-Psychologie übertragen. Die KiTAP-Normen stammen aber nicht aus dem ADHS-Bereich, siehe unten; zur Konzeption kritisch Dreisörner &Georgiadis 2011. Der HAWIK wurde an einer in den 3 deutschsprachigen Ländern querschnitthaften Stichprobe normiert, später aber auch anhand einer klinischen Validierungsstudie von n = 31 Kindern mit AD(H)S über die komplette Altersspanne geprüft, Petermann & Petermann 2008.

[22] Zihlmann 1998

[23] Klauer 1978, Krauth 1995, Lienert & Raatz 1998, Rost 2004, Pospeschill & Spinath 2009, Kubinger 2009

[24] kritisch zum Objektivitätsideal der Testtheorie etwa Zihlmann 1998, Rauchfleisch 2008, Grubitzsch 1991

[25] Lang 1978

[26] Zihlmann 1998, S. 84/85

[27] Der Aspekt Fairness wurde 1986 vom Testkuratorium der Föderation Deutscher Psychologenvereinigungen eingeführt, Psychologenvereinigungen 1986.

[28] Moosbrugger & Höfling 2008, S. 207

[29] Lienert & Raatz 1998, Rost 2004, Kubinger 2009

[30] Nach Hänsgen 1998, S. 32, ist die Reaktionseingabe die „Achillesferse der comupterbasierten Psychodiagnostik“. Zu Auswirkungen von verschiedenen Antwortbögen Anastasi 1976.

[31] Grubitzsch 1991, S. 202; so auch Zihlmann 1998, S. 80

[32] Diesen psychodynamischen Zugang auf die Testsituation haben Schmid 1975, Spörli 1976, Rauchfleisch 2008.

[33] Spitznagel 1982

[34] Spörli 1976, Landolf 1976

[35] Anastasi 1976

[36] Zusammenfassend zu den einschlägigen Untersuchungen aus den 50er bis 70er Jahren Grubitzsch 1991

[37] Hartmann 1970, S. 63

[38] Spörli 1978, Anastasi 1976, Hartmann 1970, Grubitzsch 1991

[39] Ziehlmann 1998, S. 80, Grubitzsch 1991, S. 204

[40] Grubitzsch 1991, S. 209, Anastasi 1976, Schenk-Danzinger 1971

[41] Grubitzsch 1991, Hänsgen 1998

[42] siehe unten; auf das resultierende Defizit an Standard weisen insbesondere Dreisörner & Georgiadis 2011 hin.

[43] Döpfner, Banaschewski & Sonuga-Barke 2008; Remschmidt & Heiser 2004

[44] Barkley 2006

[45] ICD: Weltgesundheitsorganisation 2011; DSM: Saß 2003

[46] Schulte-Körne 2008; Barkley 2006; Döpfner, Banaschewski & Sonuga-Barke 2008; Döpfner, Frölich & Lehmkuhl 2000

[47] Döpfner, Banaschewski & Sonuga-Barke 2008

[48] Desman & Petermann 2005

[49] Schulte-Körne 2008

[50] Schmidt & Petermann 2008; Barkley 2006; Drechsler, Brandeis, Földény, Imhof & Steinhausen 2005

[51] Lauth & Mackowiak 2004

[52] Irblich & Renner 2009; Schulte-Körne 2008; Kamphaus & Frick 2005

[53] DGKJP 2007

[54] Irblich & Renner 2009; Schulte-Körne 2008

[55] Zur Diagnostik gehört weiterhin die körperliche, einschließlich neurologische Untersuchung zur Erhebung von sturzbedingten Verletzungen, zum Ausschluss von neurologischen Erkrankungen und zur Diagnostik von gehäuft auftretenden motorischen Entwicklungsstörungen, Schulte-Körne 2008.

[56] Irblich & Renner 2009

[57] Irblich & Renner 2009

[58] ibidem; eine Effektivität von Interventionen wurde bei Vorschulkindern nachgewiesen, Sonuga-Barke, Thompson, Abikoff, Klein & Brotman 2006

[59] Kothgassner & Felnhofer 2011

[60] Sturm 2005

[61] Schmidt-Atzert, Krumm & Bühner 2008

[62] ibidem

[63] Irblich & Renner 2009

[64] Dreisörner & Georgiadis 2011

[65] Schulte-Körne 2008; Irblich & Renner 2009; Schmidt-Atzert, Krumm & Bühner 2008

[66] Zimmermann, Gondan & Fimm 2002; über KiTAP: Földényi 1999; Dreisörner & Georgiadis 2011; Jacobs & Petermann 2007; Drechsler, Rizzo & Steinhausen 2009; Renner & Irblich 2007; Irblich & Renner 2009

[67] Zimmermann & Fimm 1993

[68] Dreisörner & Georgiadis 2011

[69] ibidem; Irblich & Renner 2009; Schulte-Körne 2008

[70] Daraus könne sich ein Problem der Testökonomie ergeben, wenn z.B. alle Untertests des KiTAP durchgeführt werden. Dann wird gerade für Kinder, die aufgrund ihrer Aufmerksamkeitsschwierigkeiten sich kaum selbstregulieren können, eine Durchführung des Tests zur enormen Belastung. Ein Testleiter dürfte sich deshalb auf eine gezielte Auswahl von wenigen Untertests beschränken, die entsprechenden Daten erheben, diese mit den Normen der Normalpopulation vergleichen und die Testsituation insbesondere zu einer möglichst systematischen Verhaltensbeobachtung nutzen, ibidem; zu den Möglichkeiten der Beobachtung während der Testung, Kastner-Koller & Deimann 2009

[71] Shaw, Grayson & Lewis 2007; Döpfner, Frölich &Lehmkuhl 2000; Stadler & Döpfner 2004

[72] Dreisörner & Georgiadis 2011 haben die Sensitivität und Spezifität von KiTAP bei der ADHS-Diagnostik von Kindern im Alter von 8-10 Jahren untersucht, nachdem zuvor schon Földényi, Imhof & Steinhausen 2000 die klinische Validität an kleinen klinischen Stichproben überprüft hatten. Jeweils 24 Kinder einer ADHS-Stichprobe (Altersschnitt 9,52) und einer Kontrollgruppe (Altersschnitt 9,68) wurden sowohl mit TAP als auch KiTAP getestet - genau eine solche Evaluation hatten Kamphaus & Frick 2005, S. 42 für computerbasierte ADHS-Tests gefordert. Auch Jacobs & Petermann 2007 betonen, dass sich derzeit kein vergleichbar nützliches Verfahren auf dem Markt befindet; demgemäß eignet sich KiTAP ergänzend als psychometrisches Instrument in der ADHS-Diagnostik von Kindern und leistet einen Beitrag zur Objektivierung von ADHS-Diagnosen.

[73] Die Verwendungshäufigkeit des HAWIK III und IV hat Neubauer 2014 jüngst stichprobenhaft für österreichische Praxen in einer Diplomarbeit ermittelt, für die deutsche Kinder- und Jugendpsychiatrie Bölte, Adam-Schwebe, Englert, Schmeck & Poustka 2000.

[74] Wolff Metternich 2009

[75] Petermann & Petermann 2008

[76] zum HAWIK-IV Daseking, Petermann & Petermann 2007; Petermann & Petermann 2008; Flanagan & Kaufmann 2004; Renner 2008; Deimann & Kastner-Koller 2008

[77] Peterrmann & Daseking 2009

[78] Zu den Intelligenzleistungen von ADHS-Kindern Schmidtendorf, Christmann & Heinrichs 2012; bezogen auf HAWIK III Geißler 2008

[79] Lipsius, Petermann & Daseking 2008

[80] Petermann & Dasking 2009; Wolff Metternich 2009

[81] Aiken 2003

[82] Alfonso, Johnson, Patinella & Rader 1998; Loe, Kadlubek & Marks 2007

[83] Hall, Howerton & Bolin 2005; Anastasi & Urbina 1997

[84] Lipsius, Petermann & Daseking 2008

[85] ibidem, S. 115

[86] Wolff Metternich 2009

[87] Waldmann 2008

[88] zur Chance von mehreren Analysegängen im Sinne einer „Triangulation“ und den „mixed methods“ Köckeis-Stangl 1980, Jick 1983, Denzin & Lincoln 1998, Mayering 2002, Mayering 2010, Mayering 2012

[89] Die Vorgehensweise des Projekts (inklusive der Vorerhebung) und die Gültigkeit der induktiven Kategorienbildung wurden durch die Reflexion im Kreis der Beforschten einer zusätzlichen Überprüfung unterzogen. Damit wurde dem Umstand Rechnung getragen, dass gemäß der Qualitativen Sozialforschung die Beforschten keine „Datenlieferanten, sondern denkende Subjekte wie die Forscher“ sind, Mayering 2002, S. 147; zur kommunikativen Validierung insbesondere Klüver 1979, Heinze & Thiemann 1982.

[90] Die teilnehmende Beobachtung beschränkt sich auf die physische Präsenz bei der Beobachtung. Der Beobachter sitzt ca. 3 Meter abgesetzt vom Test-Tisch, also im Hintergrund außerhalb des regulären Blickfeldes von Testleiter und Testperson. Die Kinder wissen um die Beobachtung der Sitzung; zur teilnehmenden Beobachtung Hauser-Schäublin 2003, Mayering 2002.

[91] zu qualitativen Interviewtechniken Lamnek 1989

[92] im Sinne einer kommunikativen Validierung, dazu Klüver 1979, Heinze & Thiemann 1982.

[93] Ein Sonderfall ist Testleiter 10: U10 kommt routinegemäß bei schweren klinischen Fällen zum Einsatz, was aber bei der Interpretation besonders berücksichtigt wird.

[94] Angesichts des Umfangs der Interaktionen und situativen Elemente im Testprozess wurde nach vorher festgelegten Kriterien selektiv das Testdurchführungsgeschehen erfasst, zum selektiven Protokoll Mayring 2002, 2010.

[95] Mayering 2002, S. 115

[96] zum Verfahren der qualitativen Inhaltsanalyse Mayering 2010

[97] zum Grundsatz der Feldnähe bzw. Nähe zum Gegenstand Mayering 2002, Denzin & Lincoln 1998

[98] Mayering 2002, S. 116, 117

[99] zur Ankerbildung und prototypischen Funktion der Ankerbeispiele für die Kategorie Eckes & Six 1983

[100] siehe Beobachtungsbogen, S. 7 und 8, im Anhang

[101] Für übergreifende Beobachtungsregeln gibt es ein gesondertes Papier, siehe Anhang.

[102] siehe im Anhang hinten

[103] Steyer & Eid 2012; Rasch, Friese, Hofmann & Neumann 2010

[104] Siehe Formulierungen wie „ Dosieren bzgl. “ oder „ Vorsicht mit “ … einer Kategorie, die die Grade des Zutreffens der Kategorie invertieren: U dosiert bzw. geht vorsichtig mit der Kategorie in der Durchführung um.

Ende der Leseprobe aus 159 Seiten

Details

Titel
Testpsychologische Erfassung von Aufmerksamkeit und Intelligenz im Rahmen der ADHS-Diagnostik bei Kindern zwischen Standard und Anpassung
Untertitel
Eine Analyse klinischer Testdurchführungspraxis bei KiTAP und HAWIK IV
Hochschule
Technische Universität Kaiserslautern  (Psychologie)
Veranstaltung
Psychologie kindlicher Lern- und Entwicklungsauffälligkeiten
Note
1,3
Autor
Jahr
2016
Seiten
159
Katalognummer
V343768
ISBN (eBook)
9783668338999
ISBN (Buch)
9783668339002
Dateigröße
1302 KB
Sprache
Deutsch
Schlagworte
testpsychologische, erfassung, aufmerksamkeit, intelligenz, rahmen, adhs-diagnostik, kindern, standard, anpassung, eine, analyse, testdurchführungspraxis, kitap, hawik
Arbeit zitieren
Christian Keck (Autor), 2016, Testpsychologische Erfassung von Aufmerksamkeit und Intelligenz im Rahmen der ADHS-Diagnostik bei Kindern zwischen Standard und Anpassung, München, GRIN Verlag, https://www.grin.com/document/343768

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Testpsychologische Erfassung von Aufmerksamkeit und Intelligenz im Rahmen der ADHS-Diagnostik bei Kindern zwischen Standard und Anpassung


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden