Anwendung neuronaler Netzwerke und
Matrixspeicher
zur Erklärung von Umlernvorgängen
während des Tragens einer Umkehrbrille
D I P L O M A R B E I T
eingereicht von
Hartmut Häfele
an der Naturwissenschaftlichen Fakultät
der L
EOPOLD
F
RANZENS
U
NIVERSITÄT
I
NNSBRUCK
Institut für Psychologie
1993
I
I
NHALTSVERZEICHNIS
Einleitung
1
1. Die Kohler´schen Versuche mit Umkehrbrillen
3
1.1. Einführung
3
1.2. Zusammenfassung der Untersuchungsergebnisse
4
1.3. Bedeutung der Kohler´schen Brillenversuche für die moderne
Wahrnehmungsforschung
7
2. Aufbau und Funktionsweise des visuellen Systems
8
2.1. Die Stationen der visuellen Verarbeitung
8
2.1.1. Die funktionelle Organisation retinaler Ganglienzellen
8
2.1.2. Die Sehbahn und ihre Projektionen
10
2.1.3. Die Signalverarbeitung im Corpus Geniculatum Laterale
10
2.1.4. Die Signalverarbeitung im visuellen Kortex
11
2.1.5. Die Verarbeitung in den höheren visuellen Arealen
13
2.2. Ontogenetische Entwicklung und Plastizität im visuellen System
14
2.3. Objektrepräsentationen und Objekterkennung im visuellen System
16
2.3.1. Moderne Theorien des Sehens
19
2.3.1.1. Eine Arbeitshypothese: »Sehen als Zuordnen von internen
Repräsentationen zu Objekten der Außenwelt«
21
3. Computersimulierte neuronale Netzwerke
22
3.1. Einleitung
22
3.2. Vergleich zwischen natürlichen und künstlichen neuronalen
Netzwerken
24
3.3. Geschichtlicher Überblick der Entwicklung neuronaler Netzwerke
28
3.4. Struktur und Funktionsweise mehrschichtiger neuronaler Netze
32
3.4.1. Allgemeiner Aufbau
32
3.4.2. Der Lernvorgang in einem neuronalen Netzwerk
33
3.4.3. Der Informationsverarbeitungsvorgang in einem Prozessorelement
34
II
3.5. Das Backpropagation-Netzwerk
40
3.5.1. Aufbau eines Backpropagation-Netzwerks
40
3.5.2. Die generalisierte Delta - Lernregel
41
3.5.3. Backpropagation-Netzwerke als vereinfachte Modelle für
menschliche Wahrnehmungssysteme
44
3.6. Interne Repräsentationen in neuronalen Netzwerken und
Matrixspeichern
45
3.6.1. Interne Repräsentationen in neuronalen Netzwerken
45
3.6.2. Interne Repräsentationen in Matrixspeichern
47
3.6.2.1. Mathematischer Formalismus und Funktionsweise von
Matrixspeichern
49
3.6.2.2. Entwicklung eines musterassoziierenden Matrixspeichers
52
3.6.2.3. Matrixspeicher als Modelle für die Großhirnrinde
65
3.6.2.3.1. Das Assoziativ-Speichermodell der Hirnrinde von Günther Palm
65
3.6.2.3.2. Anwendung des Palm´schen Assoziativspeichermodells
67
3.6.3. Zusammenfassung
69
4. Die Computer-Simulation des neuronalen Umlernvorgangs
während des Tragens einer Umkehrbrille
70
4.1. Einleitung
70
4.2. Beschreibung des Seh- und Umlernvorgangs durch einen
musterassoziierenden Matrixspeicher
72
4.2.1. Der musterassoziierende Matrixspeicher M.A.M.
72
4.2.2. Durchführung der Simulation
74
4.2.2.1. Zuordnung interner Repräsentationen zu aufrechten Objekten
74
4.2.2.2. Zuordnung interner Repräsentationen zu verkehrten Objekten
78
4.3. Zusammenfassung und Diskussion der Assoziativspeicher-
Simulationsergebnisse
79
4.4. Simulation des neuronalen Umlernvorgangs durch ein
Backpropagation-Netzwerk
80
4.4.1. Erzeugung des Backpropagation-Netzwerks
80
III
4.4.2. Training des Netzwerks durch die Lernmusterdateien für aufrechte
und verkehrte Muster
85
4.4.3. Analyse der synaptischen Gewichtungen
86
4.4.3.1. Untersuchungsfrage
86
4.4.3.2. Erhebung der Gewichte
86
4.4.3.3. Statistische Auswertung
87
4.4.3.3.1. Testauswahl
87
4.4.3.3.2. Durchführung des T-Tests für unabhängige Stichproben
90
4.4.4. Simulation des Überlernens von Assoziationen
93
4.5. Zusammenfassung und Diskussion der Netzwerk-
Simulationsergebnisse
94
4.6. Annahme eines »Neuronalen Erklärungsmodells« zum
Umlernvorgang während des Tragens einer Umkehrbrille
95
Literaturliste
96
Bildnachweise
101
Anhang
104
Quellcode des Programms M.A.M.
104
Lernmusterdateien der Muster: »Buchstaben, Symbole, Ziffern«
142
Gewichtungen der synaptischen Verbindungen nach erfolgreichem
Training
147
1
E
INLEITUNG
Die Brillenversuche haben eine lange Tradition und demzufolge gibt es ei-
ne Fülle von Abhandlungen zu diesem Thema. Diese Arbeiten befassen
sich jedoch hauptsächlich mit der Beschreibung der kontinuierlichen Ad-
aption des Menschen an den - durch Prismen- und Spiegelbrillen - verän-
derten Input an das visuelle System auf rein verhaltensbeobachtender E-
bene (siehe das Kapitel 1.2).
Der Frage, wie sich diese Adaption auf neuronaler Ebene vollzieht, wurde
bisher noch nicht nachgegangen.
Zu diesem Zweck müßten visuelle Systeme von Individuen, die sich erfolg-
reich an die veränderten Umweltbedingungen angepaßt haben, mit sol-
chen verglichen werden, bei denen ein Umlernen nicht stattgefunden hat.
Nun sind solche Untersuchungen aber mit erheblichem methodischen
Aufwand verbunden, da man ja die Veränderungen in der zellulären Struk-
tur des visuellen Systems in erster Linie mit Hilfe
1
histologischer Methoden
beschreiben müßte.
Als Alternative bietet sich nun eine Technologie an, die in den letzten Jah-
ren stark an Bedeutung gewonnen hat und sich in ihrer vergleichsweise
einfachen Handhabung möglicherweise für diese Art von Untersuchungen
eignet: Die Nachbildung menschlicher Wahrnehmungssysteme mit Hilfe
computersimulierter neuronaler Netzwerke (Hinton, 1992; Kohonen, 1984).
Obwohl die simulierten Netzwerke im Vergleich zu ihren natürlichen Vorbil-
dern meist drastisch vereinfacht sind (Schweizer, 1986), so lassen sich in be-
zug auf Aufbau, Funktionsweise und Verhalten gewisse Parallelen nicht
leugnen (siehe das Kapitel 3.2). Diese Ähnlichkeiten gehen so weit, daß
einige der führenden Netzwerk-Forscher der Meinung sind, daß solche Si-
mulationen durchaus eine hohe explikative Potenz aufweisen (Hinton,
1992).
Zumindest stellen die Erkenntnisse aus Netzwerk-Simulationen eine sinnvolle
Ergänzung zu den traditionellen Untersuchungsmethoden dar.
1Sämtliche nichtinvasive Methoden, wie beispielsweise EEG-Ableitungen (evozierte Potentiale,
Brainmapping, usw.) oder moderne bildgebende Verfahren (CT, NMR, PET, usw.), verfügen (noch)
nicht über das nötige Auflösungsvermögen, um neuronale Veränderungen auf zellulärer oder sogar
synaptischer Ebene sichtbar zu machen.
2
In diesem Sinne wurde Im Rahmen dieser Diplomarbeit ansatzweise ver-
sucht, bestimmte Teilaspekte des neuronalen Umlernvorgangs während
des Tragens einer Umkehrbrille, mit einem computersimulierten neuronalen
Netzwerk nachzubilden und die entstandenen neuronalen Strukturen auf
Unterschiede zu untersuchen (Kap.4.4).
3
1.
D
IE
K
OHLER
´
SCHEN
V
ERSUCHE MIT
U
MKEHRBRILLEN
1.1.
E
INFÜHRUNG
Die Versuche mit Umkehrbrillen haben eine fast hundertjährige Tradition.
Schon 1896 experimentierte G
EORGE
S
TRATTON
mit einem Linsensystem, das
ein seitenverkehrtes und auf dem Kopf stehendes Bild erzeugte (Rock,
1985). Obwohl S
TRATTON
seine mehrtägigen Selbstversuche nur einäugig
durchführte, und obwohl ein Linsensystem neben der Bildumkehr noch an-
dere, unkontrollierbare Effekte erzeugt (chromatische Aberration, Verzer-
rungen, usw.), konnte er trotzdem eine allmähliche Anpassung an diese
veränderten Umweltbedingungen beobachten. Er kam zu dem Schluß,
daß im Laufe der Zeit ein vollständiges Aufrechtsehen wieder gelernt wer-
den kann, wenn man das Linsensystem nur lange genug trägt. Stratton
wies außerdem auf die Wichtigkeit des Tastsinnes für das Wiedererlernen
des Aufrechtsehens hin.
E
WERT
experimentierte schon mit beidäugigen Linsensystemen und konnte
ebenfalls den Nachweis erbringen, daß durch eine Anpassung des äuße-
ren Verhaltens ein Zurechtfinden in der durch das Linsensystem veränder-
ten Umwelt möglich ist. Die Frage des Erlernens des aufrechten Sehens
wurde von E
WERT
aber vernachlässigt (Kohler, 1951).
W
ILLIAM
S
TERN
benutzte 1927 Prismenbrillen zur Bildumkehr. Da aber Prismen
in noch viel stärkerem Maße als die beschriebenen Linsensysteme Bildver-
fälschungen erzeugen, wurde deutlich, daß für weiterführende Untersu-
chungen bessere Techniken der Bildumkehr entwickelt werden müssen.
T
HEODOR
E
RISMANN
benutzte erstmalig im Jahre
1928 eine Spiegelbrille für die Bildumkehr, die den
Vorteil hatte, das auf dem Kopf stehende Bild un-
verfälscht und seitengetreu darzustellen. Da die-
se Umkehrbrille aber die Sicht auf den Boden und
die Füße der Probanden verdeckte, wurden
noch keine mehrtägigen Dauerversuche durch-
geführt.
Am I
NSTITUT FÜR
P
SYCHOLOGIE DER
U
NIVERSITÄT
I
NNSBRUCK
wurde im Jahre 1947 diese sogenannte E
RIS
-
Abb.1.1
4
MANN
´
SCHE
U
MKEHRBRILLE
dahingehend verbessert, daß nun der Blick des Bril-
lenträgers auf die eigenen Füße und auf körpernahe Objekte frei war
(Abb.1.1).
Die Umkehrbrille war nun »straßenfähig« (Kohler, 1951), und somit in idealer
Weise für mehrtägige Dauerversuche geeignet.
K
OHLER
unterzog sich und andere Versuchspersonen in weiterer Folge im-
mer wieder mehrtägigen Dauerbrillenversuchen mit dieser Umkehrbrille
und konnte dadurch den Nachweis erbringen, daß das menschliche vi-
suelle System - trotz der durch die Umkehrbrille veränderten Umweltbedin-
gungen - in der Lage ist, das Aufrechtsehen wieder zu erlernen.
Es bleibt noch zu erwähnen, daß die Versuche mit Umkehrbrillen nur einen
kleinen Teil der umfangreichen und originellen Forschungsarbeit K
OHLER
´
S
und E
RISMANN
´
S
auf dem Gebiet der visuellen Wahrnehmungsmodifikation
durch optische Vorsatzgeräte ausmachten. Neben diesen Umkehrbrillen-
versuchen wurden weit aufwendigere Versuche mit Farbhalbbrillen, Pris-
men- und Halbprismenbrillen durchgeführt, wobei Kohler selbst einmal eine
Prismenbrille 124 Tage ununterbrochen trug.
1.2.
Z
USAMMENFASSUNG DER
U
NTERSUCHUNGSERGEBNISSE
Während des Tragens der Umkehrbrille führten die Versuchspersonen Tage-
buch über ihre Erlebnisse und Veränderungen der visuellen Wahrnehmun-
g; parallel dazu wurde ihr äußeres Verhalten aufgezeichnet. Die Ergeb-
nisse dieser Untersuchungen sind in der folgenden Gliederung zusammen-
gefaßt:
Während der ersten Tage des Tragens der Umkehrbrille sahen die Vpn.
die Umwelt auf dem Kopf stehend. Die Vpn. waren in dieser Phase
noch höchst unsicher und mußten begleitet werden, um Unfälle zu ver-
meiden.
Nach ca. drei Tagen waren die Vpn. in der Lage, sich in ihrer noch ver-
kehrt gesehenen Umwelt zurechtzufinden. Die Vpn. hatten gelernt, ihr
»äußeres Verhalten« (Kohler, 1951) den verändert wahrgenommenen
Umweltbedingungen anzupassen. Die Gesichtseindrücke erschienen
aber nur dann aufrecht, wenn die gesehenen Gegenstände gleichzei-
5
tig abgetastet werden konnten, oder wenn diese sich in nächster Nähe
des eigenen Körpers der Brillenträger befanden.
Nach ungefähr neun Tagen sahen die Vpn. wieder eindeutig aufrecht.
Nach dem Abnehmen der Umkehrbrille wurde der vorher beschriebene
Umlernprozeß quasi im »Zeitraffertempo« durchlaufen:
In den ersten Minuten sahen viele Vpn. die nun richtig orientierte Um-
welt noch minutenlang eindeutig verkehrt.
Das äußere Verhalten konnte sehr schnell den veränderten Umweltbe-
dingungen angepaßt werden.
Noch einige Tage nach der Abnahme der Umkehrbrille konnten Augen-
blicke des Verkehrtsehens oder der Desorientierung beobachtet wer-
den.
Es wurde bereits erwähnt, daß unter bestimmten Bedingungen schon nach
dreitägigem Tragen einer Umkehrbrille ein zeitweiliges Aufrechtsehen
möglich ist; diese Bedingungen sind in der folgenden Gliederung zusam-
mengefaßt:
A
BTASTEN DES GESEHENEN
G
EGENSTANDES
: Wenn die Vpn. verkehrt gesehene
Gegenstände abtasten konnten, dann wurden diese Gegenstände
plötzlich als aufrecht wahrgenommen. Auch das indirekte Abtasten
über einen verlängerten Taststock hatte diesen Effekt. Wichtig ist hier zu
erwähnen, daß die eigenen Hände immer zuallererst als aufrecht wahr-
genommen wurden.
Diese Beobachtungen K
OHLER
´
S
decken sich mit den Ergebnissen aus
den späteren Untersuchungen von H
ELD
, der nachweisen konnte, daß
eine Anpassung an durch eine Prismenbrille veränderte Umwelt nur
dann möglich ist, wenn sich die Vpn. aktiv motorisch mit dieser ausein-
andersetzen können (Held, 1986).
S
CHWEREEMPFINDUNGEN
: Die Vpn. sahen immer dann aufrecht, wenn vi-
suelle Eindrücke mit Schwereempfindungen einzelner Körperteile oder
des gesamten Körpers einhergingen. Dazu schreibt K
OHLER
:
6
Ein weiterer Faktor waren Schwereempfindungen, welche
das verkehrte Bild aufzurichten vermochten; ein Gewicht an
einer Schnur wurde ´unten´ gesehen, sobald die Vp. das En-
de selbst in die Hand nahm; auch Gegenstände, die dahin-
ter lagen, erschienen sofort aufrecht, wenn das Pendel ´in
Ordnung´ war. Betonte Schwereempfindungen des ganzen
Körpers, wie z.B. beim Aufwärtsfahren im Auto, ´kehrten die
Landschaft um´ und stellten das Bild richtig.
(Kohler,1951)
A
KTIVIERUNG VON INTERNEN
W
ISSENSREPRÄSENTATIONEN
: Für K
OHLER
ist die Aktivie-
rung von Wissensrepräsentationen, die er unter dem Begriff der »ge-
wohnt aufrechten Bilder« subsumiert, eine weitere Ursache für das zeit-
weilige Aufrechtsehen; er schreibt dazu:
Als sehr wirksamer Anlaß für das aufrechte Sehen erwies sich
weiters das ´gewohnt-aufrechte´ Bild: eine Kerze, die zu-
nächst verkehrt gesehen wurde, mit dem Docht nach unten,
war plötzlich aufrecht, wenn man sie anzündete. Auch der
Rauch einer brennenden Zigarette vermochte die Situation
auf der Stelle umzukehren; plötzlich war für die Vp. dort
´oben´, wo der Rauch hinging u. dgl. m.
(Kohler, 1951)
Verallgemeinernd kann man zusammenfassen, daß immer dann aufrecht
gesehen wurde, wenn neben dem visuellen Input zusätzliche Informatio-
nen über das Gesehene in die Wahrnehmung miteinbezogen werden
konnten.
7
1.3.
B
EDEUTUNG DER
K
OHLER
´
SCHEN
B
RILLENVERSUCHE FÜR DIE MODERNE
W
AHRNEHMUNGSFORSCHUNG
Nach R
ITTER
konnten aus den Kohler´schen Brillenversuchen hauptsächlich
drei Erkenntnisse gewonnen werden, die von entscheidender Bedeutung
für die moderne Wahrnehmungsforschung waren:
Das visuelle Wahrnehmungssystem besitzt entgegen aller bis dahin gülti-
gen Lehrmeinungen eine große Plastizität und Lernfähigkeit.
Im visuellen Wahrnehmungssystem existieren offenbar »intelligente« Ver-
arbeitungsmechanismen, die selbst bei Störungen der Informationsauf-
nahme in der Lage sind, Eigenschaften und Merkmale der Umwelt rich-
tig zu entschlüsseln.
Das motorische System ist für eine erfolgreiche Adaption an veränderte
Umweltbedingungen von entscheidender Bedeutung:
Damit Lernvorgänge in Gang kommen, die eine umge-
bungsrichtige Wahrnehmung entstehen lassen, muß eine ak-
tive, motorische Auseinandersetzung mit der Umwelt statt-
finden. ... Offenbar sind die Rückmeldungen über das eige-
ne motorische Handeln entscheidend dafür, daß Adaption
und Lernen im Wahrnehmungssystem zustande kommen.
(Ritter, 1986)
8
2.
A
UFBAU UND
F
UNKTIONSWEISE DES VISUELLEN
S
YSTEMS
2.1.
D
IE
S
TATIONEN DER VISUELLEN
V
ERARBEITUNG
2.1.1.
D
IE FUNKTIONELLE
O
RGANISATION RETINALER
G
ANGLIENZELLEN
Bereits auf der Netzhaut erfolgt eine einfache Ver-
rechnung der visuellen Information. So
2
konvergie-
ren 108 Stäbchen und Zäpfchen der Netzhaut auf
nur 106 retinale Ganglienzellen (Abb.2.1). Das be-
deutet, daß jeweils 100 Sinneszellen mit einer
Ganglienzelle verschaltet sind. Diese 100 Stäbchen
und Zäpfchen bilden nun auf der Netzhaut ein so-
genanntes R
EZEPTIVES
F
ELD
(Hubel, 1989). Dieses Re-
zeptive Feld (RF) ist rund und besteht aus einem RF-
Z
ENTRUM
und aus einer RF-P
ERIPHERIE
(Abb.2.2).
Nachdem immer jeweils eine Ganglienzelle für ein RF zuständig ist, spricht
man vom Rezeptiven Feld einer Ganglienzelle. Da in der Netzhaut 106
Ganglienzellen existieren, kann man annehmen, daß ebensoviele RF vor-
handen sein müssen. Die RF der einzelnen Gangli-
enzellen liegen nun aber nicht fliesenartig neben-
einander, sondern sie weisen eine starke Überlap-
pung auf (Abb. 2.6). So erregt ein Lichtreiz von nur
0,1 mm Größe noch eine Vielzahl von in der Netz-
haut nebeneinanderliegenden Ganglienzellen.
Somit sammeln benachbarte Ganglienzellen In-
formation von ähnlichen, aber nicht völlig identi-
schen Retinabereichen (Bliem et al., 1981).
Die Aktivität einer Ganglienzelle ist abhängig vom Ort der Reizung ihres re-
zeptiven Feldes; man unterscheidet hierbei:
2K
ONVERGENZ
bedeutet »Zusammenfließen« bzw. Sammeln von Information; dies wird durch die Pro-
jektion vieler Neurone auf eine geringere Anzahl Neurone realisiert. Analog dazu bedeutet D
IVERGENZ
»Auseinanderfließen« bzw. Verteilen von Information. Das konvergente und das divergente Ver-
schaltungsprinzip läßt sich im gesamten Nervensystem aller Arten beobachten und stellt ein Grund-
prinzip der neuronalen Informationsverarbeitung dar (nach Bliem et al., 1981).
Abb.2.1
Licht
Stäbchen u.
Zäpfchen
Ganglien-
zellen
On-Zentrum-Neuron
Off-Zentrum-Neuron
+ -
+
-
Lichtreiz
Abb.2.2
9
O
N
-Z
ENTRUM
-N
EURONE
(On-Zentrum-Ganglienzellen), die mit erhöhter Akti-
vität auf die Reizung ihres RF-Zentrums, und mit erniedrigter Aktivität auf
die Reizung ihrer RF-Peripherie reagieren,
und
3
O
FF
-Z
ENTRUM
-N
EURONE
, die mit erniedrigter Aktivität auf die Reizung ihres
RF-Zentrums, und mit erhöhter Aktivität auf die Reizung ihrer RF-Periphe-
rie reagieren.
3Diese Beschreibung bezieht sich auf die RF der Neurone für das S
CHWARZ
-W
EIß
-S
EHEN
. Die RF der
Neurone für das F
ARBENSEHEN
sind sehr ähnlich aufgebaut. Man unterscheidet Neurone des Rot-
Grün-Systems von Neuronen des Gelb-Blau-Systems (Hubel, 1989). Zentrum und Peripherie der RF
dieser Neurone sind dabei Farb-antagonistisch organisiert: so reagiert z.B. ein Neuron des Rot-Grün-
Systems nur dann maximal, wenn ein roter Lichtreiz in sein RF-Zentrum, bzw. wenn ein grüner Lichtreiz
in seine RF-Peripherie trifft. Neurone des Gelb-Blau-Systems haben analog dazu ein »gelbes RF-Zen-
trum« und eine »blaue RF-Peripherie« (Birbaumer, 1989).
10
2.1.2.
D
IE
S
EHBAHN UND IHRE
P
ROJEKTIONEN
Die Axone der retinalen Ganglienzellen treten gebündelt aus den Augen
aus und bilden die beiden Sehnerven. Diese laufen an der Schädelbasis
aufeinander zu und tauschen in der Sehkreuzung etwa die Hälfte ihrer Ner-
venfasern aus (Abb.2.3). Das linke Gesichtsfeld
beider Augen wird dadurch in die rechte Sehrin-
de projiziert und umgekehrt (Birbaumer, 1990).
Nach der Sehkreuzung verlaufen die Gangliena-
xone zum C
ORPUS GENICULATUM LATERALE
(CGL), ei-
nem Kerngebiet des
4
T
HALAMUS
, an dessen Neu-
ronen sie synaptisch enden. Das CGL stellt somit
die erste und einzige Schaltstelle auf direktem
Weg zwischen Netzhaut und Hirnrinde dar.
Der »Ausgang« des CGL führt als S
EHSTRAHLUNG
zur
A
REA
17 der Sehrinde, von wo aus Projekti-
onsbahnen zu den A
REAE
18 und 19 ihren Aus-
gang nehmen.
2.1.3.
D
IE
S
IGNALVERARBEITUNG IM
C
ORPUS
G
ENICULATUM
L
ATERALE
Das CGL ist aus sechs Neuronenschichten aufgebaut, wobei die Schichten
1, 4 und 6 dem rechten, und 2, 3 und 5 dem linken Auge zugeordnet sind.
Dies bedeutet, daß die Signalverarbeitung jeweils dreier Schichten im we-
sentlichen von einem Auge bestimmt wird. Daraus kann man schließen,
daß auf dieser Ebene noch keine binokulare Verarbeitung der visuellen Si-
gnale zum Zwecke des stereoskopischen Sehens erfolgt; dies geschieht erst
im visuellen Kortex.
Die Rezeptiven Felder der Ganglienzellen des CGL sind jenen der retinalen
Ganglienzellen sehr ähnlich. Man unterscheidet hier ebenfalls zwischen
On- und Off-Zentrum-Neuronen.
4Der Thalamus ist die größte graue Kernsubstanz des Zwischenhirns. Er ist die übergeordnete Schalt-
station für die folgenden zur Großhirnrinde ziehenden sensorischen Systeme: Seh-, Hör- und somato-
sensorisches System. Überdies steht der Thalamus durch entsprechende Fasersysteme mit dem
Kleinhirn, dem extrapyramidalen System und dem Rückenmark in Verbindung (nach Thompson,
1990).
Abb.2.3
CGL
Sehstrahlung
Sehkreuzung
Area 17
18
19
R
L
11
2.1.4.
D
IE
S
IGNALVERARBEITUNG IM VISUELLEN
K
ORTEX
Die Sehrinde ist - wie der übrige Kortex - aus sechs Zellschichten (I...VI) auf-
gebaut. Die Nervenfasern der Sehstrahlung enden vor allem in den Seh-
arealen der Zellschicht IVc, von wo aus die Informationsverarbeitung im
Kortex ihren Ausgang nimmt.
Die Neurone des visuellen Kortex sind funktionell in sogenannte
5
Z
ELLSÄULEN
oder -
PLATTEN
unterteilt.
Es wechseln sich nämlich
Säulen von Neuronen, die
vorwiegend Informationen
aus dem linken Auge ver-
arbeiten (L in Abb.2.4), re-
gelmäßig mit solchen ab,
bei denen die Verarbei-
tung aus dem rechten Au-
ge (R) dominiert. Diese pa-
rallel zur Kortexoberfläche
verlaufenden Säulen wer-
den deshalb O
KULÄRE
D
OMINANZSÄULEN
genannt.
Innerhalb dieser Säulen las-
sen sich weitere »Untersäu-
len« nachweisen, die senk-
recht zur Kortexoberfläche
orientiert sind. Die Neu-
rone innerhalb einer sol-
chen »Untersäule« reagie-
ren nur auf retinale Reize
derselben
6
Orientierung
(z.B. auf einen um 10 Grad geneigten Lichtbalken). Man nennt deshalb
5Die im folgenden beschriebenen Erkenntnisse über den Aufbau und die Funktionsweise der neuro-
nalen Strukturen im visuellen Kortex sind der langjährigen Forschungsarbeit der Neurobiologen D
AVID
H
UBEL
und T
ORSTEN
W
IESEL
zu verdanken, die dafür 1981 mit dem Nobelpreis für Medizin ausgezeichnet
wurden.
6Von dieser Regel ausgenommen sind jedoch die Neurone der Zellschichten IVc; diese Neurone
besitzen nämlich Rezeptive Felder, die jenen des CGL und der Retina ähnlich sind, und reagieren
deshalb auch nicht orientierungsspezifisch (in der Abbildung 2.4 wird dies durch den kleinen Kreis
angedeutet) (Birbaumer, 1989).
I
II
III
IVa
IVb
IVc
V
VI
6
5
4
3
2
1
CGL
Orientierungspräferenzsäulen
L
R
L
Kortex-Oberfläche
Axone der Sehstrahlung
Abb.2.4
12
eine solche Säule auch O
RIENTIERUNGSPRÄFERENZSÄULE
. Jede Orientierungsprä-
ferenzsäule innerhalb einer Okulären Dominanzsäule ist nun auf eine etwas
andere Reizorientierung spezialisiert.
Die bevorzugten Reizorientierungen ändern sich dabei von Säule zu Säule
um jeweils 10 bis 20 Grad (In der Abb.2.4 wird dies durch die verschieden
orientierten kleinen Striche innerhalb der Orientierungspräferenzsäulen an-
gedeutet).
In 15 bis 20 Orientierungspräferenzsäulen innerhalb einer okulären Domin-
anzsäule für das linke (L) oder das rechte (R) Auge, sind somit alle mögli-
chen Reizorientierungen eines Retinabereiches enthalten. Die Orientie-
rungspräferenzsäulen zweier nebeneinanderliegender okulären Dominanz-
säulen zusammengenommen, ergibt eine sogenannte H
YPERKOLUMNE
(dick
ausgezogener Bereich in Abb.2.4). Eine solche Hyperkolumne stellt damit
einen Analysemechanismus für alle möglichen Reizorientierungen für korre-
spondierende Netzhautbereiche beider Augen dar. Nebeneinanderlie-
gende Hyperkolumnen versorgen auch nebeneinanderliegende Netz-
hautbereiche.
Innerhalb einer Orientierungspräferenzsäule kann man aufgrund der Struk-
tur ihrer Rezeptiven Felder und der damit verbundenen Verhaltensweisen
folgende Einteilung zwischen den Neuronen aller Zellschichten treffen (Hu-
bel, 1989):
E
INFACHE
Z
ELLEN
: Diese Neurone liegen hauptsächlich in den Schichten
IVb und IVa und besitzen ellipsoide RF mit On- und Off-Arealen. Die
einfachen Zellen reagieren nur dann, wenn eine Hell-Dunkel-Kontur
(Kante) mit einer bestimmten Orientierung auf einen genau definierten
Ort der Retina fällt.
K
OMPLEXE
Z
ELLEN
: Diese reagieren - wie die Einfachen Zellen - am besten
auf eine Kante mit einer bestimmten Orientierung. Innerhalb des RF ei-
nes Komplexen Neurons ist die Reizposition - aufgrund des Fehlens von
On- und Off-Arealen - im Gegensatz zur Einfachen Zelle jedoch unwich-
tig. Eine Komplexe Zelle reagiert also dann maximal, wenn sich eine
Kante mit einer bestimmten Orientierung irgendwo innerhalb einer be-
stimmten Netzhautregion (dem RF des Komplexen Neurons) befindet.
Komplexe Zellen finden sich hauptsächlich in den Schichten II, III, V und
VI des visuellen Kortex.
13
H
YPERKOMPLEXE
Z
ELLEN
: Hyperkomplexe Zellen reagieren maximal auf be-
wegte Ecken oder rechte Winkel einer bestimmten Orientierung inner-
halb ihrer RF. Diese Zellart ist besonders zahlreich in den Schichten II
und III anzutreffen.
2.1.5.
D
IE
V
ERARBEITUNG IN DEN HÖHEREN VISUELLEN
A
REALEN
Die bisher besprochene visuelle Verarbeitung findet in der Area 17, der so-
genannten primären Sehrinde statt. Neben dieser primären Sehrinde exi-
stieren aber noch eine Vielzahl weiterer
7
visueller Felder, die in der Fachlite-
ratur mit dem Buchstaben V (für visuel-
les Feld) und einem Laufindex bezeich-
net werden. In der Sehrinde des Affen
(Abb.2.5) werden bis zu 15 visuelle Fel-
der vermutet (Thompson, 1990), und
wahrscheinlich besitzt der Mensch min-
destens ebensoviele. Das Feld V1 ent-
spricht der primären Sehrinde, also der Area 17. Alle übrigen visuellen Fel-
der sind dieser primären Sehrinde übergeordnet; so bezieht das Feld V2 sei-
nen Input aus V1, V3 aus V2 und V1, usw. Die Felder des visuellen Kortex
sind damit sowohl seriell (z.B. V1 V2 V3) als auch parallel (z.B. V1 V2,
V1 V3) miteinander verschaltet.
In den höheren visuellen Feldern werden die Informationen aus V1 hin-
sichtlich solcher Parameter wie Orientierung, Form, Größe, Farbe, Bewe-
gung, Lage auf der Netzhaut in beiden Augen, weiter analysiert. Diese
Analyse erfolgt stufenweise über die serielle Verschaltung zwischen den
einzelnen visuellen Feldern. Gleichzeitig aber erfolgt über die parallele
Verschaltung eine Integration der einzelnen Verarbeitungsprozesse.
Einige höhere visuelle Areale scheinen auf die Analyse komplexerer For-
men als Ecken oder rechte Winkel spezialisiert zu sein; so konnten
G
ROSSBERG
u. Mitarb. eine Zelle im VTE-Feld (Abb.2.5) eines Affen identifizie-
ren, die immer dann maximal reagierte, wenn ihrem Rezeptiven Feld ein
Reiz in Form einer erhobenen Affenhand präsentiert wurde (Thompson,
1990).
7Ein visuelles Feld ist als eine vollständige Kartierung der Netzhaut auf einem Kortexareal definiert
(Thompson, 1990).
Abb.2.5
V1
V2 V3
V4 V5 V6
VTE
Schläfen-
lappen
Frontal-
lappen
14
Daß solche Ergebnisse jedoch mit Vorsicht zu interpretieren sind, wird im
Kapitel 2.3 aufzuzeigen versucht.
2.2.
O
NTOGENETISCHE
E
NTWICKLUNG UND
P
LASTIZITÄT IM VISUELLEN
S
YSTEM
Die Sehbahnen und Sehareale sind zum Zeitpunkt der Geburt bei allen hö-
heren Säugern bereits ausgebildet, doch die Feindifferenzierung (Aufbau
der Dominanz- und Orientierungssäulen) erfolgt erst postnatal innerhalb ei-
ner genau definierten Zeitspanne (
8
K
RITISCHE
P
ERIODE
). Diese Selbstorganisa-
tion des visuellen Kortex ist dabei in starkem Maße umweltabhängig und
somit äußerst empfindlich gegenüber Störungen.
So können Katzen, denen während der vierten und der fünften Lebenswo-
che ein Auge chirurgisch verschlossen wurde, später nicht mehr beidäugig
sehen; das zeitweilig verschlossene Auge bleibt lebenslänglich funktionslos.
Anatomisch läßt sich bei diesen Katzen eine deutliche Schrumpfung der
okulären Dominanzsäulen des einstmalig verschlossenen Auges, sowie eine
Verbreiterung der okulären Dominanzsäulen des anderen Auges feststellen
(Hubel & Wiesel, 1963).
Auch die Entwicklung des Konturensehens ist auf entsprechende visuelle
Reize angewiesen, wie H
UBEL
u. Mitarb. wiederum durch Versuche mit neu-
geborenen Katzen nachweisen konnten:
Einige Kätzchen wurden dabei in einer Umgebung aufgezogen, die nur
senkrechte Streifenmuster aufwies. Bei diesen Kätzchen konnte später ein
deutliches Überwiegen von Neuronen mit einer Präferenz für senkrechte
Orientierungen, sowie ein schwerer Mangel an Neuronen mit anderen Ori-
entierungspräferenzen festgestellt werden. Diese Tiere zeigten dement-
sprechend auch ein Verhalten, das auf eine verminderte visuelle Wahr-
nehmungsfähigkeit schließen ließ.
Analog dazu, konnten Menschen, die durch Hornhauttrübung in frühester
Jugend erblindeten, später - nach erfolgreicher Operation - das richtige
Sehen nicht wieder erlernen. Nur einige wenige Patienten erlernten unter
größter Anstrengung, einfache Muster zu erkennen und sich - mit Hilfe ihres
Gesichtssinnes - grob zu orientieren. Viele der Patienten brachen die Re-
8Die Dauer der sog. K
RITISCHEN
P
ERIODE
unterscheidet sich dabei von Art zu Art: bei Katzen wird sie als
die Zeitspanne zwischen der 3. und der 12. Lebenswoche angegeben (Hubel, 1989); bei Menschen-
affen dauert sie vom Zeitpunkt der Geburt bis zum 12. Lebensmonat (Reichert, 1990). Beim Men-
schen selbst reicht die kritische Phase bis zum Schulalter (Singer, 1990).
15
habilitationsversuche ab und lebten lieber weiterhin als Blinde (Singer,
1990).
Diese Versuchsergebnisse veranlassen zu der Annahme, daß das fertig
entwickelte visuelle System wenig lernfähig ist. Wenn die sensible Phase für
die Differenzierung der okulären Dominanz- und der Orientierungszell-
säulen abgelaufen ist, bleiben die innerhalb dieser Zeit angelegten neu-
ronalen Strukturen lebenslänglich bestehen. Es war Kohler´s Verdienst,
durch seine Brillenversuche aufzuzeigen, daß auch das adulte visuelle Sys-
tem noch von einer erstaunlichen Plastizität ist.
Für die normale Entwicklung des visuellen Systems spielt offenbar auch das
motorische System eine wichtige Rolle, wie die Untersuchungen H
ELD
´
S
zei-
gen: H
ELD
zog zwei wenige Tage alte Kätzchen so auf, daß in einem ent-
sprechend konstruierten Apparat, sich das eine Kätzchen relativ frei be-
wegen konnte, während das andere dieselbe Umgebung nur passiv aus
einer »Gondel« miterlebte. Entließ man die so aufgezogenen Jungtiere in
ihre gewohnte Umgebung, dann zeigte sich, daß die »aktiven« Kätzchen
sich schneller und effektiver in einer neuen Umgebung zurechtfanden, als
die »passiven« Kätzchen (Held, 1963).
Held´s Untersuchungsergebnisse machen deutlich, daß nur durch die akti-
ve motorische Auseinandersetzung mit der Umwelt eine normale Entwick-
lung des visuellen Systems möglich ist.
Schon K
OHLER
machte - wie bereits erwähnt - die Beobachtung, daß das
Abtasten eines - aufgrund einer Umkehrbrille - verkehrt gesehenen Ge-
genstandes, ein plötzliches Aufrechtsehen desselben bewirkte. Später
konnte H
ELD
nachweisen, daß für die erfolgreiche Adaption an durch Um-
kehr- und Prismenbrillen veränderte Umweltbedingungen, die motorische
Interaktion unbedingt erforderlich ist (Held, 1963).
16
2.3.
O
BJEKTREPRÄSENTATIONEN UND
O
BJEKTERKENNUNG IM VISUELLEN
S
YSTEM
Die Tatsache, daß es im Kortex Neurone gibt, die anscheinend spezifisch
auf komplexe Formen reagieren (Kap.2.1.5), hat viele Leute dazu veranlaßt
zu spekulieren, daß es auch Neurone in höheren visuellen Arealen geben
müsse, die auf die Erkennung einzelner Objekte spezialisiert sind. Aner-
kannte Neurobiologen, wie z.B. D
AVID
H
UBEL
selbst, haben jedoch für der-
artige Spekulationen nicht viel übrig:
Spezialisieren sich die Zellen auf zentraleren Verarbeitungs-
stufen immer weiter, bis man schließlich auf einer bestimm-
ten Stufe Zellen findet, die nur noch auf das Gesicht eines
individuellen Menschen, beispielsweise der eigenen Groß-
mutter, reagieren? Diese Vorstellung, die man als Großmut-
terzellentheorie bezeichnet hat, kann man nur schwerlich
ernst nehmen. Sollten wir etwa getrennte Zellen für eine lä-
chelnde Großmutter, eine weinende Großmutter und eine
nähende Großmutter erwarten? Und unterschiedliche Zellen
für verschiedene Konzepte oder Definitionen von
´Großmutter´ - die Mutter der Mutter oder die Mutter des Va-
ters? Und wenn wir Großmutterzellen hätten, wohin würden
sie projizieren?
(Hubel, 1989)
Eine Alternative zur Großmutterzellentheorie läßt sich aus den - 1962 von
H
UBEL
und W
IESEL
vorgeschlagenen - Verschaltungsmechanismen zur Erklä-
rung der Entstehung von RF für Kanten und Winkel der einfachen, komple-
xen und hyperkomplexe Zellen, ableiten:
17
Das Rezeptive Feld einer einfachen kortikalen Zelle, könnte durch die
Konvergenz mehrerer CGL-
Neurone, mit sich überlap-
penden konzentrischen
ON-Off-RF, zustande kom-
men (Abb.2.6). Die On-
Zentren (+) dieser RF müß-
ten dabei in Übereinstim-
mung mit der Orientie-
rungsachse des Rezeptiven
Feldes der einfachen kortikalen Zelle eine gerade Linie auf der Netz-
haut bilden (strichlierter Balken in Abb.2.6).
Das RF einer Komplexen Zelle kann durch die Konvergenz mehrerer Ein-
facher Zellen erklärt werden
(Abb.2.7). In unserem Fall er-
gibt das »Zusammenschal-
ten« der RF von 3 Einfachen
Zellen mit einer Präferenz für
horizontal orientierte Kanten,
ein größeres RF einer Kom-
plexen Zelle, welches über
den gesamten Bereich für
horizontal orientierte Kanten sensibel ist (strichliertes großes Rechteck in
Abb.2.7).
Durch die Konvergenz einer inhibitorisch (hemmend) und einer exzi-
tatorisch (erregend) wir-
kenden Komplexen Zelle
auf eine Hyperkomplexe
Zelle kann die Entstehung
eines RF für horizontale E-
ckenreize erklärt werden
(Abb.2.8). Der in Abbil-
dung 2.8 dargestellte Kan-
tenreiz über beide RF der
Komplexen Zellen führt zu keiner maximalen Erregung der Hyperkomple-
xen Zelle, da der inhibitorische Input den exzitatorischen Input nivelliert.
RF der Einfachen Zellen
Komplexe Zelle
Einfache Zellen
+
+
+
+
+
+
+
+
+
+
+
+
Abb.2.7
Hyperkomplexe Zelle
RF der Komplexen Zellen
Komplexe Zellen
inhibitorisch
exzitatorisch
Abb.2.8
Einfache Zelle
CGL-Neurone
RF der CGL-Neurone
+
+
+
+
Abb.2.6
18
Ein auf das linke RF-Areal (ausgezogenes linkes Rechteck in Abb.2.8) be-
grenzter Kantenreiz würde jedoch zu einer maximalen Erregung der Hy-
perkomplexen Zelle führen, da die inhibitorische Komplexe Zelle nicht
aktiviert wird.
Aus diesen Schaltplänen geht hervor, daß niemals nur eine Zelle an der
Wahrnehmung eines einfachen visuellen Reizes beteiligt ist, sondern immer
ein ganzes Netz von Neuronen. So sind nach dem obigen Modell bei der
Wahrnehmung einer Kante über einen größeren Netzhautbereich
(Abb.2.7) mindestens 16 Zellen gleichzeitig aktiv (12 CGL-Neurone kon-
vergieren auf drei Einfache Zellen, welche wiederum auf eine Komplexe
Zelle konvergieren). Wenn nun bei einem neurobiologischen Experiment
nur die Aktivität einer dieser Zellen abgeleitet werden würde, dann könnte
fälschlicherweise der Eindruck entstehen, daß genau diese Zelle für die
Wahrnehmung einer Kante zuständig sei. Unter diesem Aspekt sind auch
die in Kapitel 2.1.5 erwähnten Experimente von G
ROSSBERG
u. Mitarb. zu se-
hen.
Man kann sich vorstellen, daß durch die »Zusammenschaltung« vieler klei-
nerer Neuronennetze mit einfachen Rezeptiven Feldern, ein größeres Netz
entsteht, welches genau dann maximal aktiviert ist, wenn ein bestimmtes
Objekt, beispielsweise eine Vase, im Gesichtsfeld erscheint.
Hubel bezeichnet solche Neuronennetze als »K
ONSTELLATIONEN
«:
... [
9
Als] Alternative [zur Großmutterzellentheorie] ist anzu-
nehmen, daß ein Objekt jeweils eine bestimmte Konstella-
tion von Zellen zum Feuern anregt, die allesamt auch ande-
ren Konstellationen angehören können. Wie wir wissen, führt
die Zerstörung eines kleinen Gehirnstücks im allgemeinen
nicht zum Verlust spezifischer Gedächtnisinhalte, und wir
müssen deshalb davon ausgehen, daß die Zellen einer Kon-
stellation nicht in einem einzigen corticalen Gebiet lokali-
siert, sondern auf viele Gebiete verteilt sind. Die nähende
Großmutter ist dann eine größere Konstellation, welche die
Definition von Großmutter, Großmutters Gesicht und die Tä-
tigkeit Nähen umfaßt.
(Hubel, 1989)
Diese Zellkonstellationen oder neuronalen Netzwerke kann man auch als
das anatomische Substrat interner Objektrepräsentationen sehen. Somit
9Anmerkungen des Verfassers sind in eckigen Klammern eingeschlossen.
19
könnte theoretisch jedem Objekt der Außenwelt ein Netzwerk aus Neuro-
nen im visuellen System zugeordnet werden. Da sich jedoch die Objekte
einer Klasse - beispielsweise Vasen - ähneln, würden sich auch die Konstel-
lationen aktivierter Neurone für die einzelnen verschiedenen Vasen über-
lappen; d.h. man kann eine »Schittmenge« von Neuronen aus allen Zell-
konstellationen annehmen, die bei allen Vasenformen aktiviert ist. Dieser
»kleinste gemeinsame Nenner« von Neuronen würde das anatomische
Substrat des S
CHEMAS
»Vase« darstellen.
2.3.1.
M
ODERNE
T
HEORIEN DES
S
EHENS
Aufbauend auf den Entdeckungen Hubels und Wiesels haben sich einige
Computerwissenschaftler Gedanken über das Sehen gemacht (Hofstadter,
1989; Dreyfus, 1987).
H
OFSTADTER
schließt sich der Hubel´schen Theorie der »aktivierten Zellkonstel-
lationen« direkt an:
Vielleicht wird ein Gegenstand, den man betrachtet, implizit
durch seine ´Signatur´ im Sehkortex identifiziert, d.h. durch ei-
ne Reaktion von einfachen, komplexen und hyperkomple-
xen Zellen zusammengenommen. Vielleicht braucht das
Gehirn gar keine weiteren Erkennungsinstrumente für eine
besondere Form.
(Hofstadter, 1988)
D
REYFUS
betont die Wichtigkeit der internen Repräsentationen für das Se-
hen. Er glaubt, daß Sehen und Erkennen durch einen direkten Assoziati-
onsprozeß erfolgt:
Wenn wir eine Gestalt betrachten, ermöglicht uns eine Asso-
ziation, die Figur als, sagen wir einmal, Großmutter zu identifi-
zieren. Diese Assoziation beruht ausschließlich auf Gehirnzu-
ständen, die ungefähr den Lichtverhältnissen der betrachte-
ten Figur entsprechen.
(Dreyfus, 1987)
Die Theorien von H
OFSTADTER
und D
REYFUS
kann man zu den sogenannten
10
PDP-M
ODELLEN
zählen, auf die im Kapitel 3.6 näher eingegangen wird.
10PDP = Parallel Distributet Processing = parallel verteilte Datenverarbeitung.
20
Auch die Hypothese des Neurobiologen W
OLF
S
INGER
zur Figur-Grund-Unter-
scheidung im visuellen System schließt direkt an die »Zellkonstellations-
Theorie« von H
UBEL
an (Singer, 1990):
Singer konnte nachweisen, daß die Antworten von Merkmalsdetektoren
auf visuelle Reize rhythmisch sind, und mit einer Frequenz von ungefähr 40
Hertz oszillieren. Wenn nämlich Konturen dargeboten wurden, die sich in-
nerhalb des Gesichtsfelds mit derselben Geschwindigkeit in die gleiche
Richtung bewegten, dann begannen die oszillierenden Antworten von
räumlich verteilten Merkmalsdetektoren mit ähnlichen Richtungs- und Ori-
entierungspräferenzen, in Phase zu schwingen. Figur-Grund-Unterschei-
dungen sind demnach für das visuelle System dadurch möglich, daß be-
stimmte Neuronengruppen (Merkmalsdetektoren) - abhängig von der Art
des visuellen Reizes - von asynchrone in synchrone Aktivierungszustände
übergehen. Die synchron aktivierten Neuronengruppen kodieren die Figur,
die asynchron aktivierten den Grund (Singer, 1990).
Diese, sich durch Phasenkohärenz auszeichnenden Neuronengruppen,
nennt S
INGER
»E
NSEMBLES
« und entsprechen den H
UBEL
´
SCHEN
Zellkonstellatio-
nen. S
INGER
glaubt, daß die verschiedenen Zellensembles mit jeweils un-
terschiedlichen Frequenzen oszillieren; dadurch wird eine Vermischung ih-
rer Antworten bei der Darbietung mehrerer Objekte (Superpositionsprob-
lem) verhindert.
21
2.3.1.1.
E
INE
A
RBEITSHYPOTHESE
:
»S
EHEN ALS
Z
UORDNEN VON INTERNEN
R
EPRÄSENTATIONEN ZU
O
BJEKTEN DER
A
UßENWELT
«
Es wurde bereits erwähnt, daß die Rezeptoren für einfache geometrische
Formen wie Kanten, Ecken oder rechte Winkel immer aus Nervennetzen
gebildet werden (Kap.2.2). Man könnte diese neuronalen Netzwerke auch
als die anatomische Realisierung von internen Repräsentationen einfacher
geometrischer Formen betrachten.
Wenn in einem bestimmten Netzhautbereich eine solche einfache geo-
metrische Form auftaucht, dann wird demnach im visuellen Kortex die ent-
sprechende interne Repräsentation aktiv. Da sich die Objekte der Außen-
welt immer aus mehreren einfachen geometrischen Formen zusammen-
setzen, werden beim Betrachten dieser Objekte auch gleichzeitig mehrere
interne Repräsentationen einfacher geometrischer Formen aktiv sein. Die
Gesamtheit aller, beim Betrachten eines bestimmten Objekts gleichzeitig
aktiven internen Repräsentationen, ergeben die interne Repräsentation
des gesamten betrachteten Objekts.
Die Nervennetze, in welchen diese internen Repräsentationen angelegt
sind, werden von den verschiedenen Autoren mit unterschiedlichen Be-
zeichnungen belegt: H
UBEL
spricht von »Konstellationen« (Kap.2.2), S
INGER
von »Ensembles« (Kap.2.2.1), H
OFSTADTER
von »Signaturen« (Kap.2.2.1), und
P
ALM
von »Assemblies« (Kap.3.6.2.3.1).
Es wurde bereits ausgeführt, daß es theoretisch möglich ist, jedem Objekt
der Außenwelt ein solches Nervennetz zuzuordnen (Kap.2.2 und 2.2.1).
Darauf aufbauend, soll der Vorgang des Sehens - im Sinne moderner PDP-
Theorien - folgendermaßen als Arbeitshypothese formuliert werden:
Sehen könnte als Assoziation (Zuordnung) der entsprechenden internen
Repräsentationen mit den Objekten der Außenwelt funktionieren.
Unter diesem Gesichtspunkt wird im Kapitel 4 versucht, den Seh- und Um-
lernvorgang während des Tragens einer Umkehrbrille durch ein einfaches
musterassoziierendes Matrixspeichermodell zu beschreiben.
22
3.
C
OMPUTERSIMULIERTE NEURONALE
N
ETZWERKE
3.1.
E
INLEITUNG
11
Computersimulierte neuronale Netzwerke haben eine fast fünfzigjährige
Geschichte und erleben nun, nach einem Einbruch während der 70´er
Jahre, einen enormen Boom (siehe das Kapitel 3.3).
Sie werden mittlerweile in vielen Bereichen der Technik, Industrie und For-
schung eingesetzt und sind dort nicht mehr wegzudenken. Als einige typi-
sche Einsatzbereiche wären hier Objekterkennung, Signalfilterung, Quali-
tätskontrolle, Kreditrisikoabschätzung und die Aktienkursprognose zu nen-
nen.
In all diesen Bereichen bewältigen neuronale Netzwerke die an sie gestell-
ten Aufgaben wesentlich effizienter als eigens dafür entwickelte
12
Algorith-
men oder prozedurale Computerprogramme (siehe das Kapitel 3.4).
In der neurobiologischen Forschung werden neuronale Netze immer häufi-
ger zur Hypothesengenerierung und -validierung eingesetzt (Anderson,
1989). Optimisten glauben sogar, daß dadurch in naher Zukunft ein Groß-
teil von neurobiologischen Versuchen an Tieren überflüssig werden (Schö-
neburg, 1990).
Auch der beginnende Einsatz neuronaler Netze in der psychologischen
Grundlagenforschung, wie beispielsweise die Arbeiten T
EUVO
K
OHONEN
´
S
zum
menschlichen Gedächtnis oder zur Farbwahrnehmung (Kohonen, 1984),
macht es möglich, traditionelle Theorien und Modelle zu prüfen und even-
tuell weiterzuentwickeln.
Daß Ergebnisse aus Simulationen mit neuronalen Netzwerkmodellen je-
doch nicht uneingeschränkt zur Interpretation der Verarbeitungsvorgänge
in biologischen Systemen herangezogen werden können, wird im Kapitel
3.2 zu diskutieren versucht.
11Da der Ausdruck »Computersimulierte neuronale Netzwerke« etwas umständlich ist, soll stattdes-
sen künftig der Ausdruck »neuronale Netzwerke« verwendet werden. Natürliche (biologische) neu-
ronale Netzwerke werden künftig als »biologische neuronale Netze« bezeichnet.
12Ein Algorithmus ist eine Rechenanweisung, also die Festlegung eines Rechenvorganges durch
eindeutige Regeln. Man unterscheidet endliche (begrenzte) und unendliche Algorithmen. Auf
Computern werden sogenannte Algorithmussprachen (= Programmiersprachen) zur Beschreibung
endlicher Algorithmen angewendet. Wenn für einen Ablauf ein Algorithmus gebildet werden kann,
dann kann auch ein Computerprogramm erstellt werden, das diesen Ablauf nachbildet. Somit stellt
jedes Computerprogramm selbst einen endlichen Algorithmus dar (Schulze, 1989).
23
Unter diesem Aspekt ist auch der in dieser Arbeit im Kapitel 4.4 beschrie-
bene Versuch zu werten, den neuronalen Umlernvorgang während des
Tragens einer Umkehrbrille mit Hilfe eines neuronalen Netzwerks nachzubil-
den.
24
3.2.
V
ERGLEICH ZWISCHEN NATÜRLICHEN UND KÜNSTLICHEN NEURONALEN
N
ETZWERKEN
Neuronale Netzwerke sind in Struktur und Funktionsweise ihren biologischen
Vorbildern nachempfunden. Sie sind Systeme aus kleinen, untereinander
verbundenen Verarbeitungseinheiten (= P
ROZESSORELEMENTE
) und sind in der
Lage, durch Anpassung der Stärke der Verbindungen zwischen den einzel-
nen Prozessorelementen, zu lernen.
S
TRUKTURELLE
Ä
HNLICHKEIT
und L
ERNFÄHIGKEIT
sind aber nicht die einzigen Paralle-
len zu natürlichen neuronalen Netzwerken; die folgende Aufzählung soll ei-
nen Überblick über die Gemeinsamkeiten natürlicher und künstlicher
Netzwerksysteme geben:
P
ARALLELITÄT
: Das menschliche Gehirn enthält bei einem Durch-
schnittsgewicht von 1300 Gramm ca. 10 Milliarden
13
Neuronen.
Jedes Neuron ist mit 1000 bis 10.000 anderen Neu-
ronen über
14
synaptische Verbindungen in Kontakt
(Abb.3.1). Viele dieser Neuronen sind gleichzeitig
aktiv, und ein Neuron kann sogar gleichzeitig an
mehreren Verarbeitungsvorgängen beteiligt sein
(siehe das Kapitel 3.6).
In dieser hohen K
ONNEKTIVITÄT
und P
ARALLELITÄT
liegt die
Leistungsfähigkeit des menschlichen Gehirns be-
gründet. Computersimulierte neuronale Netze be-
stehen zwar aus weitaus weniger Neuronen (= Pro-
zessorelemente) als das menschliche Gehirn, sind aber innerhalb eines
klar definierten Aufgabenbereichs, für den sie speziell trainiert werden
können, trotzdem sehr leistungsfähig.
Da die meisten neuronalen Netzwerke noch auf seriellen Rechnern
nach der
15VON
-N
EUMANN
-
A
RCHITEKTUR
simuliert werden, kann in solchen
13Nachdem die Neuronenzahl des menschlichen Gehirns nur geschätzt werden kann, differieren
die Angaben darüber bei den verschiedenen Autoren zum Teil erheblich. Einige Schätzungen ge-
hen sogar bis zu 100 Milliarden Neuronen (Schöneburg, 1990).
14Synapsen sind die Kontaktstellen zwischen den Neuronen eines Nervennetzes. Über sie werden
Aktionspotentiale von einer Nervenzelle auf die nächste übertragen. Man unterscheidet exzitatori-
sche (erregende) von inhibitorischen (hemmenden) Synapsen.
151945 beschrieb der Computertechniker J
OHN VON
N
EUMANN
den klassischen Aufbau und die Funkti-
onsweise eines Rechners mit den Bestandteilen Z
ENTRALEINHEIT
(CPU; Gliederung in Prozessor und
Abb.3.1
Axon
Dendriten
Zellkörper
Axon
25
Fällen nicht von einer »echten« Parallelität gesprochen werden. Rech-
ner nach dieser Architektur können nämlich immer nur die Aktivität ei-
nes Prozessorelements zur selben Zeit berechnen, und dann zur Abar-
beitung des nächsten Elementes springen; sie machen dies aber so
schnell, daß von einer »quasi - Gleichzeitigkeit« gesprochen werden
kann.
Um neuronale Netzwerke mit auch nur einigen tausend Neuronen zu
simulieren, reichen die gängigen Rechnermodelle nicht mehr aus; des-
halb ist man dazu übergegangen, Multiprozessorsysteme mit 10.000
oder mehr Prozessoren, von denen jeder ein Neuron simuliert, zu konstru-
ieren (Anderson, 1989).
F
EHLERTOLERANZ
: Biologische neuronale Netzwerke zeigen auf zwei Arten
fehlertolerantes Verhalten; zum einen können sie fehlerbehaftete oder
unvollständige Daten richtig verarbeiten (Mustervervollständigung),
zum anderen funktionieren sie selbst dann noch, wenn eine beträchtli-
che Anzahl von Neuronen zerstört wird (Lashley, 1950). In einem späte-
ren Kapitel (Kap.3.6) wird demonstriert, daß computersimulierte Netz-
werke sich auf ähnliche Weise fehlertolerant verhalten können.
G
LOBALE
S
PEICHERUNG
: Bereits 1929 schrieb der englische Neurophysiolo-
ge K
ARL
S
PENCER
L
ASHLEY
über das Problem der Lokalisation des Ge-
dächtnisses:
Es ist nicht möglich, den gesonderten Ort einer Gedächtnis-
spur irgendwo im Nervensystem aufzuzeigen.
und weiter meinte er:
... daß innerhalb eines funktionellen Bereichs die Zellen des
gesamten Bereichs die Fähigkeit erlangen, in bestimmten
festgelegten Mustern zu reagieren, die jede beliebige Vertei-
lung in dem Bereich haben können.
(zitiert aus Schreiber, 1988)
Diese Theorie der Verteilung von Gedächtnisinhalten über große Teile
der Hirnrinde ist bis heute gültig und aktueller denn je (Gardner, 1984).
Hauptspeicher) und D
ATENKANÄLE
(Schulze, 1989). Fast alle heute gängigen Computermodelle sind
nach dieser Architektur strukturiert.
26
Auch computersimulierte neuronale Netze speichern
16
Muster global,
also über alle Prozessorelemente verteilt, ab (siehe das Kapitel 3.6.2).
Diese verteilte Speicherung von Gedächtnisinhalten verleiht biologi-
schen und künstlichen neuronalen Netzwerken ihre hohe Fehlertoleranz.
Trotz all dieser Gemeinsamkeiten stellt sich für viele, in diesen Forschungs-
bereich Involvierte, die Frage: »Sind neuronale Netze tatsächlich Modelle
des menschlichen Gehirns?« (Anderson, 1989).
Diese Frage scheint durchaus berechtigt, angesichts der Tatsache, daß der
Aufbau der Prozessorelemente und die Art der Verbindungen zwischen
diesen Verarbeitungseinheiten, bei allen bisher entwickelten neuronalen
Netzwerken - im Vergleich zu biologischen Systemen - eine mehr oder we-
niger starke Vereinfachung darstellt; S
CHWEIZER
schreibt dazu:
Erklärter Zweck ... der ... Simulationsinstrumente ist es, die
Funktion von Nervensystemen ... zu studieren - und das, ...,
indem man die funktionalen Eigenschaften der Nervenzellen,
die man ohnehin nur unvollkommen kennt, auch noch dras-
tisch vereinfacht und zum Teil gar ignoriert.
(Schweizer, 1986)
Obwohl die jüngst entwickelten Netzwerkmodelle den physiologischen
Gegebenheiten mehr und mehr Rechnung tragen (Anderson, 1989; Hinton,
1992), scheint eine physiologisch exakte Nachbildung schier unmöglich zu
sein.
Wendet man sich jedoch von einer starr physiologischen Sichtweise ab,
und betrachtet die gängigen Netzwerkmodelle in ihrer Funktionalität als
Ganzes, dann scheinen diese Modelle durchaus für die psychologische
und neurobiologische Grundlagenforschung geeignet zu sein (Hinton,
1992).
Weiters muß man bedenken, daß diese Netzwerkmodelle Hirnfunktionen
weit besser nachbilden, als alle bisherigen Modelle der traditionellen
17
KI-
Forschung, deren Vertreter noch nie zimperlich waren, direkte Vergleiche
16Der Begriff »M
USTER
« steht im Rahmen der Theorie neuronaler Netzwerke nicht für Bilder, sondern
vielmehr für Datenmuster. Ein Datenmuster ist nichts anderes als eine Anordnung gleichberechtigter
Datenwerte; z.B. diese Bitfolge: 0 0 1 0 1 1 0 0 1.
17Künstliche Intelligenz: Forschungsrichtung, die traditionellerweise versucht, die natürliche Intelli-
genz des Menschen durch spezielle Algorithmen, bzw. durch prozedurale Programmierung
(A
DVANCED
P
ROGRAMMING
) zu simulieren (Schulze, 1989). Seit der Mitte der 80´er Jahre werden von KI-
Forschern zunehmend auch neuronale Netzwerke eingesetzt; die Forschung mit und an neuronalen
Netzwerken gilt heute als ein Teilgebiet der KI.
27
zwischen ihren Modellen und bestimmten Hirnfunktionen anzustellen
(Gardner, 1984). Abschließend dazu schreibt Schweizer:
Trotz der außergewöhnlichen Vereinfachung zeigen diese
[
18
neuronalen] Netzwerke im Gegensatz zu den vorgenann-
ten Simulationssystemen eine klar erkennbare Funktionscha-
rakteristik, die eine neurobiologische, ja sogar psychologi-
sche Interpretation nicht nur zuläßt sondern geradewegs he-
rausfordert.
(Schweizer, 1986)
Unter diesen Gesichtspunkten sollen auch die in dieser Arbeit beschriebe-
nen Simulationen betrachtet werden.
18Anmerkung d. Verfassers.
28
3.3.
G
ESCHICHTLICHER
Ü
BERBLICK DER
E
NTWICKLUNG NEURONALER
N
ETZ
-
WERKE
Theorie und Technik computersimulierter neuronaler Netze sind keine Inno-
vation der 80´er Jahre, sondern haben vielmehr eine fast 50-jährige Tradi-
tion.
Das Jahr 1941 kann als die Geburtsstunde des Digitalcomputers bezeich-
net werden; in diesem Jahr wurde nämlich der erste programmgesteuerte
Relaisrechner (»Z3«) von dem deutschen Ingenieur K
ONRAD
Z
USE
gebaut.
Schon knapp zwei Jahre danach veröffentlichten M
C
C
ULLOCH
und P
ITTS
eine theoretische Abhandlung, in der sie bewiesen, daß ein Netzwerk aus
einfachen Verarbeitungseinheiten (binäre Schwellenwertelemente, =M
C
-
C
ULLOCH
-P
ITTS
-N
EURONE
) anspruchsvolle Operationen ausführen kann, die
sonst nur durch komplizierte Algorithmen beschreibbar sind.
Dieses erste künstliche neuronale Netzwerk war jedoch noch nicht lernfä-
hig, da die Verbindungen zwischen den Binärneuronen noch starr waren.
Erst durch eine 1949 von D
ONALD
H
EBB
formulierte L
ERNREGEL
, wurde erstmals
eine schlüssige Theorie für die physiologischen Vorgänge während des Ler-
nens vorgelegt, die die Entwicklung lernfähiger künstlicher neuronaler Net-
ze ermöglichten sollte. Die Grundannahme dieser H
EBB
´
SCHEN
L
ERNREGEL
ist
folgende:
Lernen geschieht durch die Veränderung der Verbindungen zwischen den
Nervenzellen, indem immer dann die Verbindung zwischen zwei Neuronen
verstärkt wird, wenn diese gleichzeitig aktiv sind (zitiert aus: Schöneburg,
1990).
Diese Theorie von Hebb gilt, in ein wenig differenzierterer Form, bis heute.
Renommierte Neurobiologen wie z.B. E
RIC
K
ANDEL
oder G
ERALD
E
DELMAN
, ver-
treten ebenfalls die Ansicht, daß Lernen weniger in der Ausbildung neuer
Synapsen, als vielmehr in der Veränderung der Stärke bereits bestehender
synaptischer Verbindungen, begründet liegt (Gardner, 1984).
0 comments