Entwicklung und Erprobung eines stereoskopischen Videoaufnahmesystemes unter Verwendung von Mini-DV Camcordern


Tesis, 1999

131 Páginas, Calificación: 1


Extracto


1 Einleitung
2
Schmidt, Christian: Entwicklung und Erprobung eines stereoskopischen
Videoaufnahmesystemes unter Verwendung von Mini-DV Camcordern
Abgabe: SS 99
In dieser Diplomarbeit wird ein Aufnahmesystem für stereoskopisches Video
entwickelt und erprobt. Basierend auf zwei Mini-DV Camcordern wird eine
mobile 3-D Kamera konstruiert, welche eine hohe Bildqualität liefert. Die
technischen Möglichkeiten und Einschränkungen dieses Aufnahmesystemes
werden dabei genau untersucht. Weiterhin thematisiert diese Arbeit die
Nachbearbeitung, Speicherung und Wiedergabe stereoskopischer Videos.
Auch werden die zum Bildeindruck beitragenden physiologischen und
geometrischen Parameter untersucht, um daraus für das Aufnahmesystem eine
Produktionsgrammatik zu entwickeln. Diese beinhaltet Aufnahmetechniken,
Bildgestaltungsregeln, Schnittverfahren und Wiedergabehinweise. Dies soll den
Nutzern des Aufnahmesystemes ermöglichen, stereoskopische Videos mit einer
hohen Betrachtungsqualität zu erstellen.
Abschließend wird ein kurzes 3-D-Video erstellt, um die Möglichkeiten dieses
Aufnahmesystemes zu demonstrieren.

1 Einleitung
3
Vorwort
Diese Diplomarbeit entstand durch den Vorschlag von Prof. Dr. Bersick, Leiter
des Labors für Film- und Fernsehtechnik, zwei Mini-DV Camcorder für stereo-
skopische Aufnahmen miteinander zu verkoppeln. Entsprechende Erfahrungen
lagen bereits bei der Verkoppelung zweier Filmkameras vor. Interesse für eine
derartige kompakte 3-D Videokamera signalisierte die Lufthansa AG. Sie
könnte somit erstmals Fallschirmkunstspringen mittels eines stereoskopischen
Videoverfahrens dokumentieren. Darüberhinaus gibt es viele weitere
Anwendungsgebiete, bei denen eine stereoskopische Videodokumentation von
großem Interesse sein dürfte.
Mein besonderer Dank gilt Herrn Prof. Dr. G. Bersick für die sehr intensive
Betreuung meiner Arbeit und Herrn Prof. Dr.-Ing. S. Breide für die kompetente
Koreferenz.
Für die technische Unterstützung danke ich:
·
Herrn Limbach, Fa. Sony, Köln
·
Fa. Gahrens und Battermann, Bergisch Gladbach
·
Herrn Martin Majewski, Fa. Tektronix, Köln
·
Herrn B. Mosbauer, Fa. ViDiSys, Sauerlach
·
Herrn Andreas Schöbel, Fa. Virtual Reality Technologies, Dieburg
Ohne die großzügige Unterstützung der oben genannten Firmen hätte die
Diplomarbeit nicht realisiert werden können.
Zu erwähnen ist auch Stefan Lukanow, welcher mich bei der Produktion der
stereoskopischen Videos intensiv unterstützte.
Weiterhin danke ich:
·
Herrn Dr. Siegmund Pastoor, Heinrich Hertz Institut, Berlin
·
Herrn Dr. Rüdiger Sand, ehemals Institut für Rundfunktechnik, München
für die mir gegebenen Informationen und die ausführliche Beantwortung meiner
Fragen.

1 Einleitung
4
Inhaltsverzeichnis
1
Einleitung ... 8
1.1
Ziel der Diplomarbeit ... 8
1.2
Heutiger Stand der 3-D Videotechnik ... 9
1.2.1
Angebot an Filmen ... 9
1.2.2
Kameratechnik ... 10
1.2.3
Speicherung... 11
1.2.4
Wiedergabe... 12
1.2.5
Qualität... 12
2
Physiologische Grundlagen... 14
2.1
Augenphysiologische Wahrnehmung ... 14
2.1.1
Der Sehvorgang ... 14
2.1.2
Die Tiefenwahrnehmung ... 15
2.1.2.1
Monokulare Tiefenzeichen ... 16
2.1.2.2
Binokulare Tiefenzeichen ... 18
2.1.3
Querdisparation als eine Ursache stereoskopischen Sehens ... 19
2.1.3.1
Berechnung der stereoskopischen Parallaxe ... 21
2.1.4
Die Grenzen der stereoskopischen Tiefenwahrnehmung ... 21
2.1.4.1
Berechnung der Tiefenwahrnehmungsgrenze ... 22
3
Physiologisch- technische Aspekte bei Aufnahme und Wiedergabe ... 24
3.1
Aufnahme... 24
3.2
Wiedergabe... 26
3.3
Betrachtungsabstand ... 28
3.4
Das Scheinfenster ... 29
3.5
Tiefenausdehnungsfaktor und Stereofaktor ... 30
3.5.1
Berechnung des Tiefenausdehnungs- und Stereofaktors: ... 30
3.5.2
Variation stereoskopischer Parameter ... 33
3.6
Die Tiefenbedingung ... 35
3.6.1
Berechnung der maximalen Tiefenausdehnung... 36
3.7
Einfluß des Aufnahmesensors auf die minimale Tiefenauflösung ... 38
3.8
Einfluß der Blende auf die Tiefenschärfe ... 40

1 Einleitung
5
3.9
Wiedergabemöglichkeiten ... 44
3.9.1
Zeitlich parallele Wiedergabe ... 45
3.9.2
Wiedergabe mit zwei Monitoren ... 45
3.9.3
Wiedergabe mit zwei Projektoren ... 46
3.9.3.1
Trapezverzerrung bei Wiedergabe mit zwei Projektoren... 47
3.9.4
Betrachtung mit Polfilterbrille ... 53
3.9.5
Zeitsequentielle Wiedergabe... 55
3.9.6
Entstehung von Tiefenartefakten ... 56
3.9.7
Betrachtung mit Shutterbrille... 57
4
Das Aufnahmesystem ... 60
4.1
Die Camcorder ... 60
4.1.1
Camcorder Sony DCR PC 7 ... 62
4.1.2
Die Optik ... 63
4.1.3
Audio... 63
4.2
Modifikation der Camcorder für Stereoaufnahmen... 64
4.2.1
Synchronisation von Aufnahmefunktion und Zoom ... 64
4.2.2
Synchronisation der Bänder... 65
4.2.3
Gleichlauf der Bänder ... 69
4.2.4
Luminanz und Chrominanzdifferenzen... 69
4.2.4.1
Meßtechnische Beurteilung... 70
4.2.4.2
Visuelle subjektive Beurteilung... 73
4.2.4.3
Bewertung der Luminanz- und Chrominanzdifferenzen und
deren Korrektur... 74
4.2.5
Mechanische Ausrichtung der Camcorder ... 75
4.2.5.1
Durchführung der Justage... 75
4.2.6
Bildhöhendifferenz und Bildversatz ... 78
4.3
Technische Einschränkungen der "Stereocam PC 7" ... 81
4.4
Einsatz des "Steadycam JR"... 82
4.5
Weitere Aufnahme- und Synchronisationssysteme... 84
4.5.1
Kameraköpfe und externe Recorder ... 84
4.5.2
Synchronisation mittels des LTC-Timecodes ... 86
5
Nachbearbeitung ... 88
5.1
Schnitt ... 88
6
Speicherung der Videoströme ... 89

1 Einleitung 6
6.1
Festplattenrecorder ... 89
6.2
Videorecorder... 90
7
Wiedergabe ... 92
7.1
Zeitsequentielle Wiedergabe mit der "Vidisys-Overlaykarte"... 92
7.2
Zeitlich parallele Wiedergabe mit Projektoren ... 93
8
Die Praxis der Produktion... 94
8.1
Geometrische Größen bei der Aufnahme... 96
8.2
Gestaltungsregeln bei der Aufnahme ... 100
8.3
Das stereoskopische Drehbuch ... 102
8.4
Bedienung der "Stereocam PC 7" ... 103
8.5
Nachbearbeitung... 104
8.6
Parameter bei der Projektion... 105
8.7
Nutzung von 3-D Videos ... 107
8.7.1
Informationstheoretische Vorteile der Stereoskopie... 107
8.7.2
Anwendungsgebiete... 108
9
Weitere Verbesserungen... 110
9.1
Camcorder ... 110
9.1.1
Sonderfunktionen der Sony DCR PC 7 ... 110
9.1.2
Weitere Camcordertypen ... 110
9.2
Aufnahme... 111
9.2.1
Synchronisation der Camcorder... 111
9.2.1.1
Timecode ... 111
9.2.1.2
Genlock ... 112
9.2.1.3
Time Base Corrector (TBC)... 112
9.3
Codierung... 112
9.3.1
MPEG-2 Multi-View-Profile (MVP) ... 112
9.3.2
MPEG-4 ... 114
9.4
Aufzeichnungsmedien ... 114
9.4.1
DVD ... 114
9.4.2
D-VHS... 115
9.5
Übertragung mit ADSL ... 115
9.6
Wiedergabe... 116
9.6.1
Head Mounted Displays ... 116
10
Schlußbetrachtung ... 117

1 Einleitung 7
11
Anhang ... 119
11.1
Kostenkalkulation ... 119
11.2
Produktionsablaufdiagramm... 121
11.3
Meßdaten der Graustufentesttafel... 122
11.4
Farbbalkentesttafel... 123
11.5
Graustufentesttafel ... 124
11.6
Testbilder der Objektivqualität der DCR PC 7 und der Vorsätze... 125
11.6.1
Testbild Teleobjektiv ... 125
11.6.2
Testbild Weitwinkelobjektiv ... 126
11.6.3
Testbild Weitwinkelvorsatz... 127
11.7
Meßdaten Bildhöhendifferenz und Bildversatz ... 128
11.8
Literatur ... 129
11.9
Verzeichnis der Abbildungen... 131
11.10
Verzeichnis der Tabellen... 132
11.11
Verzeichnis der Diagramme ... 132
11.12
Formalia ... 133

1 Einleitung
8
1 Einleitung
1.1 Ziel der Diplomarbeit
Das Ziel dieser Diplomarbeit ist es, ein Aufnahmesystem für stereoskopisches
Video zu entwickeln und zu erproben. Basierend auf zwei Mini-DV Camcordern
soll eine mobile 3-D Kamera konstruiert werden, welche eine gute Bildqualität
liefert. Die technischen Möglichkeiten und Einschränkungen dieses Aufnahme-
systemes werden dabei genau untersucht. Weiterhin wird die Nachbearbeitung,
Speicherung und Wiedergabe stereoskopischer Videos thematisiert.
Auch werden die zum Bildeindruck beitragenden physiologischen und
geometrischen Parameter untersucht, um daraus für das Aufnahmesystem eine
Produktionsgrammatik zu entwickeln. Diese beinhaltet Aufnahmetechniken,
Bildgestaltungsregeln, Schnittverfahren und Wiedergabehinweise. Dies soll den
Nutzern des Aufnahmesystems ermöglichen, stereoskopische Videos mit einer
hohen Betrachtungsqualität zu erstellen.
Abschließend soll ein kurzes 3-D Video hergestellt werden, um die
Möglichkeiten dieses Aufnahmesystems zu demonstrieren.
In Kapitel 1 wird der heutige Stand der stereoskopischen Videotechnik dar-
gestellt. Kapitel 2 befaßt sich mit den physiologischen Grundlagen des räum-
lichen Sehens. In Kapitel 3 wird die Technik der Aufnahme und Wiedergabe
unter physiologischen Gesichtspunkten untersucht. In Kapitel 4 schließt sich die
Beschreibung des Aufnahmesystemes an. Kapitel 5 und 6 thematisieren Nach-
bearbeitung und Speicherung der Videoströme. In Kapitel 7 wird die Wieder-
gabe beschrieben. In Kapitel 8 wird dann die Produktionsgrammatik entwickelt.
Kapitel 9 gibt einen Ausblick auf mögliche zukünftige Weiterentwicklungen.
Kapitel 10 faßt schließlich die Ergebnisse dieser Arbeit zusammen. Der Anhang
in Kapitel 11 bildet den Schluß dieser Diplomarbeit.

1 Einleitung
9
1.2 Heutiger Stand der 3-D Videotechnik
Dreidimensionales Video ist heute wenig verbreitet, trotz der immensen
Vorteile, die es gegenüber zweidimensionalem Video bietet. Durch die
Einbeziehung der dritten Dimension kann dem Zuschauer erheblich mehr
Bildinformation geboten werden.
So können komplexe Vorgänge deutlicher dargestellt werden (medizinische
Ferndiagnose, technische Fernwartung, Ausbildungsfilme), die Auswertung von
aufgezeichneten Vorgängen (Crash-Tests, Materialtests, Bewegungsanalysen
im Sport) wird erleichtert, und im Unterhaltungs- und Promotionsbereich bieten
3-D Videos ein intensives Erleben des Geschehens.
Die Technik zur Aufnahme, Nachbearbeitung und Wiedergabe von 3-D Videos
ist bekannt, und es existieren auf dem Markt eine Vielzahl von unter-
schiedlichen Systemen. Jedoch verhindert eine Reihe von Faktoren deren
Verbreitung:
1.2.1 Angebot an Filmen
Zweidimensionales Video bietet heute praktisch allen Interessengruppen eine
Vielzahl von Themen, die dramaturgisch gekonnt aufbereitet sind. Auch hat der
potentielle Zuschauer viele Möglichkeiten, an die gewünschten Filme zu
gelangen (Kauf, Miete über Videothek, Aufzeichnung von Fernseh-
programmen).
Im 3-D Video Bereich existieren jedoch nur sehr wenige Filmangebote, die auch
nur spezielle Interessenten ansprechen. Dieses geringe Angebot trägt auch mit
zum Desinteresse an 3-D Video bei.

1 Einleitung 10
1.2.2 Kameratechnik
Im Gegensatz zu der Flut von Kameratypen für 2-D Video gibt es nur wenige
3-D Kameras. Folgend werden die wichtigsten aufgeführt:
·
Ikegami stellte eine serienmäßige 3-D Studiokamera her, deren Produktion
in der Zwischenzeit mangels Nachfrage wieder eingestellt wurde. Die LK 33
genannte Kamera besaß mit 2*3 CCD Sensoren volle Broadcast-Qualität
und kostete ca
E
50.000.
·
Philips Research Laboratories in Eindhoven, Niederlande, entwickelten
Ende der 80er Jahre ein Labormuster einer 3-D Studiokamera. Konvergenz,
Basisabstand, Zoom und Entfernung konnten über eine Fernbedienung
gesteuert werden.
·
Im Rahmen des von der EU geförderten RACE-Programmes DISTIMA
1
wurde Anfang der 90er Jahre eine 3-D Studiokamera entwickelt. Sie besaß
2*3 CCD Sensoren, Zoomoptik, variable Basis von 0-100mm und
verstellbare Konvergenz.
·
In einem weiteren EU Programm (ACTS-MIRAGE)
2
wurde eine kleine und
leichte 3-D Kamera entwickelt. Sie besitzt 2*1 CCD Sensoren; Konvergenz
und Basis sind einstellbar. Als externe Recorder dienen zwei
umfunktionierte Hi-8 Kameras.
·
Toshiba produziert einen 3-D VHS-C Videocamcorder mit der Bezeichnung
SK-3D7. Mit 2*1CCD Sensor und sequentieller Bildaufzeichnung auf VHS-
Band ist diese Kamera für professionelle Ansprüche nicht geeignet.
Wie obiger Überblick über 3-D Kameras zeigt, sind professionelle Kameras
relativ schwer und voluminös. Mit diesen Kameras sind somit nur Studio-
aufnahmen und mit vielen Einschränkungen (Stativ, Transport, Recorder,
1
RACE: Research and Development of Advanced Communications Technologies in Europe.
DISTIMA: Digital Stereoscopic Imaging and Applications.
http://www.tnt.uni-hannover.de/projects/eu/distima/camera/html
2
ACTS: Advanced Communications Technologies and Services
MIRAGE: Manipulation of Images in Real-time for Artificially Generated Environments
www.uk.infowin.org/ACTS

1 Einleitung 11
Stromversorgung) Aufnahmen ,,on location" möglich. Transportable Kameras
wiederum liefern keine gute Bildqualität oder besitzen keinen eingebauten
Recorder.
Somit sind 3-D Kameras gegenüber 2-D Kameras in ihrer Mobilität
eingeschränkt. Dies bedeutet, daß der Kameramann erheblich weniger
Freiheiten hat in Bezug auf den Aufnahmeort (Expeditionsfilme etwa setzen
eine leichte Kamera voraus) und die Art der Kameraarbeit (Freihandaufnahmen,
Kamerabewegungen, ...). Die begrenzten Möglichkeiten der 3-D Kamera
beschränken somit auch das Angebot von Filmthemen.
Viele 3-D Vorhaben scheitern so am Nichtvorhandensein einer geeigneten
professionellen 3-D Kamera, wie folgendes Zitat zeigt: ,,Das Problem, welches
viele Absichten (in 3-D zu filmen) verhinderte, war das Fehlen einer
komfortablen 3-D TV Kamera, die professionelle Ansprüche befriedigt."
3
Abhilfe würde eine Kamera schaffen, die akzeptable Qualität (hohe Auflösung),
günstigen Preis, eingebauten Recorder, Mobilität (geringes Gewicht, Volumen
und Stromverbrauch) in einem Gerät vereint.
1.2.3 Speicherung
Die parallele Speicherung der zwei Videoströme auf zwei Bändern ist
aufwendig (Kosten, Synchronisation) garantiert dafür eine gute Wieder-
gabequalität.
Am weitesten verbreitet (vor allem im Amateurbereich) ist jedoch die zeit-
sequentielle analoge Speicherung der zwei Videoströme auf einem Band. Der
Vorteil der einfachen Wiedergabe (nur ein Videogerät, keine Asynchronitäten)
wird mit Qualitätsverlusten (reduzierte Auflösung, Flimmern) erkauft. Dies führt
dazu, daß sich die Begeisterung für diese Art von 3-D Video in Grenzen hält.
In Entwicklung und Erprobung sind digitale Speichersysteme.
3
Rüdiger Sand, ,,3-DTV research and development in Europe", Sonderpublikation, Institut für
Rundfunktechnik, München, S. 5

1 Einleitung
12
1.2.4 Wiedergabe
2-D Videos sind mit relativ geringem Aufwand (Videorecorder, TV oder Beamer)
und ohne besonderes Expertenwissen vorführbar.
Für 3-D Videos gibt es auch eine Vielzahl von Wiedergabegeräten, die jedoch
erheblich teurer sind, meist einer aufwendigen Einrichtung (z.B. Justage)
bedürfen und eine Einweisung für den Bediener erfordern. Somit ist eine 3-D
Wiedergabe nur mit besonderem Fachwissen durchführbar.
Das ideale Wiedergabesystem würde aus bekannten Komponenten aus preis-
günstiger Massenproduktion (TV, PC, Videorecorder, Beamer) bestehen, deren
Funktionsweise und Bedienung allgemein bekannt sind. Die Einrichtung und der
Betrieb sollten so einfach wie bei 2-D Video sein.
1.2.5 Qualität
Oft ist die Qualität von 3-D Vorführungen trotz des Tiefenerlebnisses subjektiv
schlechter als von 2-D Video. Gründe sind z.B das gewählte 3-D Verfahren
oder Unkenntnis über die besonderen Anforderungen an eine 3-D Produktion.
1982 sendete der NDR einige 3-D Filme nach dem Anaglyphenverfahren. Die
anfängliche Begeisterung ließ schnell nach, da die Bildqualität des Anaglyphen-
verfahrens unbefriedigend ist.
Ende 1998 zeigte der Sender PRO 7 einige Naturfilme in 3-D nach dem
Pulfrich-Verfahren. Dies ist jedoch ein Pseudo- 3-D Verfahren, die erzeugte
scheinbare räumliche Tiefe steht in keinem Zusammenhang mit der
tatsächlichen Raumtiefe. Auch erhalten nur sich horizontal bewegende Objekte
eine scheinbare Tiefenausdehnung.

1 Einleitung 13
Der Vorteil des Anaglyphen- und des Pulfrichverfahrens ist, daß die vorhandene
Fernsehkette verwendet werden kann. Außer einer billigen 3-D Brille muß sich
der Zuschauer keine weiteren Geräte anschaffen.
Im Gegensatz dazu führte das Institut für Rundfunktechnik (IRT) auf den
internationalen Funkausstellungen in Berlin (1983, 1985, 1987) hochqualitatives
3-D Video vor. Zwei Videosignale wurden von verkoppelten BNC-Maschinen
mittels zwei CRT-Projektoren projiziert. Die Bildtrennung erfolgte durch Polfilter.
Die Zuschauerreaktionen waren positiv und auch das Echo in den Medien war
vielfach enthusiastisch
4
. Der für diese Bildqualität nötige technische Aufwand
verhinderte aber eine massenhafte Verbreitung dieses Systems.
Aufgrund des geringen Interesses der Industrie und der Sender stellte das IRT
Ende 1994 dann die Forschungen zu 3-D ein.
So gab es also von verschiedenen Sendern und Institutionen immer wieder
Anläufe, 3-D Video zu etablieren. Trotz des großen Publikumsinteresses hat
sich 3-D Video nicht durchgesetzt, da es an einem für breite Anwendungen
geeigneten technischen Verfahren fehlt.
4
Rüdiger Sand, ,,3D Fernsehen - Entwicklungsstand und Perspektiven", Rundfunktechnische
Mitteilungen, Heft 3, 1993, S. 110-118

14
2 Physiologische Grundlagen
2.1 Augenphysiologische Wahrnehmung
2.1.1 Der Sehvorgang
Beim natürlichen Sehen konvergieren die Augenachsen auf den fixierten
Gegenstand (Konvergenzpunkt). Die Augen drehen sich dabei so, daß das Bild
des fixierten Gegenstandes in die Fovea (Netzhautgrube) fällt. In der Fovea,
welche eine Ausdehnung von 2°-3°
5
hat, ist die für die Sehschärfe
verantwortliche Zäpfchendichte am höchsten. Der unbewußt ablaufende Prozeß
der Konvergenz, auch Fusionszwang genannt, garantiert, daß der fixierte
Gegenstand mit maximaler Sehschärfe gesehen wird.
Gekoppelt mit der Konvergenz ist die Akkomodation der Augenlinsen auf den
fixierten Gegenstand. Konvergieren die Augen auf einen Gegenstand in einer
anderen Tiefenebene, so ändert sich auch die Akkomodationsentfernung.
Gegenstände mit Tiefenausdehnung werden als scharf wahrgenommen, da
diese vom Auge in ihrer Tiefe abgetastet werden (durch Änderung der
Konvergenz und Akkomodation) und die Einzeleindrücke im Gehirm zu einem
scharfen Bild fusioniert werden.
Diese beim natürlichen Sehen bestehende Koppelung von Akkomodation und
Konvergenz kann aufgehoben werden, wodurch das Betrachten von stereo-
skopischen Bildern und Filmen möglich wird. Der Konvergenzwinkel zwischen
den Augen verändert sich bei der Betrachtung von Vorder- und Hintergrund des
stereoskopischen Bildes / Filmes, wobei die Augen konstant auf die Bild-,
Bildschirmebene akkomodieren.
Jede Stelle auf der Netzhaut entspricht einem Ortswert, der durch den
physiologischen Abstand in gleicher Richtung zur Fovea definiert ist.
5
Otto Vierling, ,,Die Stereoskopie in der Photographie und Kinematographie", Wissenschaftliche
Verlagsgesellschaft mbH, Stuttgart, 1965, S. 5

2 Physiologische Grundlagen
15
Netzhautstellen beider Augen mit gleichen Ortswerten werden korres-
pondierende Netzhautstellen genannt. Die korrespondierenden Netzhautstellen
vom linken und rechten Auge sind durch Nervenfasern mit einem Empfangs-
element im Gehirn verbunden. Das Gehirn kann beide Bilder fusionieren, wenn
diese auf korrespondierenden Netzhautstellen abgebildet werden.
2.1.2 Die Tiefenwahrnehmung
Die Tiefenwahrnehmung ist ein komplexer Prozeß, an dem viele Faktoren
beteiligt sind. Dazu zählen Erfahrungswerte (über Größe von Objekten, daß
sich ein verdecktes Objekt hinter dem verdeckenden Objekt befindet), physio-
logische Anpassungsprozesse der Augen (Konvergenz) und retinale Prozesse
(Disparität). Alle diese Faktoren werden vom Gehirn interpretiert, um zu einer
Wahrnehmung von "Tiefe" zu gelangen. Die wahrgenommene Tiefe ist also
kein absoluter Wert, sondern kann je nach Betrachter verschieden interpretiert
werden .
Die monokularen Tiefenzeichen geben dem Betrachter Informationen über die
Lage und Größe des anvisierten Objektes, die binokularen Tiefenzeichen geben
Hinweise über die räumliche Lage der im Blickfeld vorhandenen Objekte
zueinander.
Monokulare und binokulare Tiefenzeichen ergänzen sich somit, wobei die
monokularen Tiefenzeichen den größten Beitrag zur Tiefenwahrnehmung
leisten, die binokularen Tiefenzeichen dienen dem Gehirn als weitere
sekundäre Zusatzinformationen
6
. Daß die monokularen Tiefenzeichen zur
Wahrnehmung von Tiefe (mit Einschränkungen) ausreichen, zeigen stereo-
blinde Personen, deren Tiefenwahrnehmung ohne binokulare Tiefenzeichen
zustandekommt.
6
Thaddeus R. Morroughs, "Depth Perception", Journal of the Society of Motion Pictures and Television
Engineers (SMPTE), June 1953, S. 666

2 Physiologische Grundlagen 16
2.1.2.1 Monokulare Tiefenzeichen
Folgende Tiefenzeichen sind bei monokularer Beobachtung sichtbar:
Perspektive: je weiter ein Objekt entfernt ist, desto kleiner erscheint es dem
Betrachter und desto kleiner ist die Abbildung auf der Retina. Die Größe von
Objekten kann somit eine Information über den Tiefenabstand liefern, sofern die
Größe des abgebildeten Objektes dem Betrachter bekannt ist. Von der
abgebildeten Größe einer Zigarettenschachtel etwa kann auf deren Abstand im
Raum geschlossen werden, da die Größe einer Zigarettenschachtel allgemein
bekannt ist. Den Abstand eines abgebildeten Raumschiffes Typ ,,Orion"
7
wiederum wird kaum jemand abschätzen können, da die Größe dieses
Objektes allgemein nicht bekannt ist.
Überlappung: Ein (teilweise) verdecktes Objekt wird als sich hinter dem
verdeckenden Objekt stehend wahrgenommen.
Dunst / Nebel: Objekte, welche durch einen Dunstschleier gesehen werden,
erscheinen weiter entfernt, als sie tatsächlich sind.
Licht: Helle Objekte befinden sich subjektiv näher am Betrachter als dunkle,
sofern dem andere Tiefenzeichen nicht widersprechen. Auch eine ausge-
leuchtete Fläche erscheint größer als eine dunkle Fläche mit gleichen Maßen.
Allgemein wird die Aufmerksamkeit des Betrachters weg von den dunklen
Bildpartien zu den hellen gelenkt. Dieser Prozeß läuft im Unterbewußtsein ab.
Schatten: Der Schattenwurf von Objekten auf den Boden oder auf andere
Objekte gibt dem Betrachter Informationen über das Raumvolumen des
Objektes sowie über die Entfernung von Objekten untereinander. Auch erhöht
er die wahrgenommene Plastizität der Objekte. Reliefs etwa wirken erst mit
einem Schattenwurf plastisch.
7
Siehe Fernsehserie ,,Raumpatrouille Orion", gesendet vom Norddeutschen Rundfunk, 60er Jahre

2 Physiologische Grundlagen 17
Textur (Oberflächenstruktur): Aus der Textur von bekannten Objekten kann auf
deren Abstand geschlossen werden, z.B. erkennt man die Struktur einer Strick-
jacke bei naher Betrachtung, aus der Ferne sieht die Strickjacke strukturlos aus.
Bewegungsparallaxe: Bewegt sich der Beobachter beim freien Sehen, so
ändert sich mit der Betrachterposition auch die Ansicht des unbewegten
Objektes. Sitzt der Beobachter etwa in einem fahrenden Auto, so bewegen sich
Objekte im Vordergrund (z.B. Verkehrsschilder) relativ schnell über das Blick-
feld und ändern somit auch schnell ihre Perspektive. Hintergrundobjekte (z.B.
Häuser) bewegen sich dazu langsamer und ändern auch langsamer ihre
Perspektive.
Steht der Beobachter still und bewegt sich das Objekt, ergibt sich auch eine
Bewegungsparallaxe. Bei einem Fahrzeug, welches sich nah am Beobachter
durch dessen Blickfeld bewegt, wird dieser eine stärkere Perspektiv-
veränderung wahrnehmen als bei einem weit entfernten Fahrzeug.
Durch Bewegung des Beobachters oder des Objektes wird also eine
Perspektivveränderung wahrgenommen, welche wiederum den Tiefeneindruck
steigert. Die Ursache ist, daß das sich bewegende Objekt (oder die ganze
Szenerie bei sich bewegendem Beobachter) mit einer sich zeitlich kontinuierlich
ändernden Parallaxe auf der Retina abgebildet wird.
Bewegungsparallaxe ist ein monoskopisches Tiefenzeichen, da dieses bei
Bewegung / Rotation des Beobachters / Objektes in horizontaler und vertikaler
Richtung wahrgenommen wird.
Ton: Die räumliche Position einer Schallquelle lokalisiert unser Gehirn durch die
unterschiedlichen Laufzeiten des direkten Schalls zu beiden Ohren. Der von
Objekten (Wände) reflektierte Schall liefert weitere Hinweise über die räumliche
Situation. Die akustischen Informationen verstärken somit die visuellen Tiefen-
informationen über die räumliche Position des Objektes / der Schallquelle.

2 Physiologische Grundlagen
18
2.1.2.2 Binokulare Tiefenzeichen
Folgende binokulare Tiefenzeichen tragen / tragen nicht zur Tiefen-
wahrnehmung bei:
Akkomodation: Sie ermöglicht lediglich das scharfe Sehen des Bildes, eine
Tiefeninformation liefert sie nicht.
Augenabstand: Direkt ergibt sich aus dem Augenabstand kein Tiefenzeichen.
Das Tiefenzeichen der retinalen Disparität aber hat seine Ursache in dem
Augenabstand.
Konvergenz: Bei dem Fixieren eines Objektes funktioniert das Auge
physikalisch wie ein Meßsucher, die Augen konvergieren auf das Objekt,
welches sich im Kreuzpunkt beider Blicklinien befindet. Die visuelle Wahr-
nehmung selbst funktioniert aber nicht wie ein Meßsucher, denn Abstand und
Tiefe eines Objektes werden nicht über den Konvergenzwinkel der Augen
(Anspannung der Augapfelmuskeln) erfaßt
8
.
Das Gehirn hat kein Empfinden für absolute Konvergenzwinkel der Augen,
jedoch für Konvergenzwinkelunterschiede, was für die maximale Tiefen-
ausdehnung von wiedergegebenen stereoskopischen Bildern von Bedeutung ist
(Siehe Kapitel 3.6). Aus der Konvergenz resultiert die Disparität beider
Abbildungen auf der Retina, welche ein wichtiges Tiefenzeichen ist.
Disparität: Infolge des Augenabstandes besitzt jedes Netzhautbild eine andere
Perspektive, der Vergleich beider ungleicher Netzhautbilder ermöglicht
räumliches Sehen. Teile des abgebildeten Gegenstandes fallen auf korres-
pondierende Netzhautstellen, und Teile auf querdisparative Netzhautstellen. Ist
die Querdisparation gering, so fällt die Abbildung in den Panumbereich der
Netzhaut (direkte Umgebung der korrespondierenden Netzhautstellen) und das
8
D.L. Mac Adam, "Stereoscopic Perception of Size, Shape, Distance and Direction", Journal of the
Society of Motion Pictures and Television Engineers (SMPTE), April 1954, S. 281

2 Physiologische Grundlagen
19
Gehirn kann beide Bilder verschmelzen, wodurch die Empfindung der Tiefen-
ausdehnung entsteht. Ist die Querdisparation zu hoch, so wird die Bild-
information des nicht dominanten Auges unterdrückt (Bei 70-80% aller
Menschen ist das rechte Auge dominant, bei 20-30% das linke, bei einem
geringen Prozentsatz der Menschen gibt es keine Präferenz
9
).
Etwa 10% der Menschen sind stereoblind
10
, sie können also nicht stereo-
skopisch sehen.
2.1.3 Querdisparation als eine Ursache stereoskopischen Sehens
Abb. 1: Querdisparation und stereoskopische Parallaxe
9
Bernd Weissenborn, ,,Einkanalige Stereofarbfernsehverfahren", Dissertation, TH Graz, 1974, S. 29
10
M. Starks, ,,Stereoscopic video and the quest for virtual reality", Proceedings of the int. society of
optical engineers (SPIE), Vol. 1669: Stereoscopic Displays and Applications 3, San Jose, California,
1992, S. 217
Ebene
Fernpunkt
Objekt
Ebene
Konvergenzpunkt /
Nahpunkt Objekt
Ebene
Augenlinse
rechtes
Auge
linkes
Auge
r
p
t
e
a
b
Auge
P
Auge
K
r
q
l
q
Auge
P
Auge
K
l
p
K
P
2
2
1
2

2 Physiologische Grundlagen
20
K
:
Konvergenzpunkt / Nahpunkt Objekt
P
:
Fernpunkt Objekt
a
b
:
Augenabstand, Augenbasis
e
:
Nahpunktweite
t
:
Tiefenausdehnung des Objektes
r
l
q
q ,
: Querdisparation linkes und rechtes Auge
Auge
K
: Abbildung Punkt
K
auf Netzhaut
Auge
P
: Abbildung Punkt
P
auf Netzhaut
:
Winkelwert der stereoskopischen Parallaxe
2
1
,
: Konvergenzwinkel
l
r
p
p ,
: Parallaxe des Nah- und Fernpunktes in der Konvergenzebene
Die Blicklinien der Augen konvergieren auf den Konvergenzpunkt
K
, welcher in
den Netzhautgruben
Auge
K
abgebildet wird. Der Punkt
K
erscheint dabei unter
dem Konvergenzwinkel
1
. Alle weiteren Punkte, welche unter diesem
Konvergenzwinkel gesehen werden, fallen auf korrespondierende Netzhaut-
stellen.
Der Punkt
P
wird in den Punkten
Auge
P
abgebildet. Da der Konvergenzwinkel
2
, unter dem der Punkt
P
gesehen wird, nicht mit dem Winkel
1
.überein-
stimmt, fällt der Punkt
P
auf nicht korrespondierende Netzhautstellen. Ist die
Winkeldifferenz
2
1
-
zu groß, kann das Auge den Punkt
P
nicht fusionieren
(Siehe Kapitel 3.6). Die Strecken
r
l
q
q ,
(Abstand
Auge
K
-
Auge
P
), das Maß für die
Querdisparation, können dabei identisch sein oder auch voneinander
abweichen.
Die Querdisparation
r
l
q
q ,
läßt sich nicht direkt messen, sie wird daher über die
stereoskopische Parallaxe definiert. Als stereoskopische Parallaxe werden die
Winkel
r
l
,
bezeichnet, die in geometrischem Zusammenhang zur Quer-
disparation
r
l
q
q ,
stehen. Die Winkel
r
l
,
sind somit das meßbare Maß für die
Querdisparation.

2 Physiologische Grundlagen
21
2.1.3.1 Berechnung der stereoskopischen Parallaxe
Aus Abb. 1 und unter Einbeziehung der Näherung für kleine Winkel
tan
tan
)
tan(
+
=
+
ergibt sich:
t
e
b
e
b
a
a
+
-
=
tan
t
e
e
t
b
a
+
=
2
tan
Gleichung 1
Aus Gleichung 1 lassen sich folgende Erkenntnisse ziehen:
·
Die Genauigkeit der Tiefenunterscheidung nimmt linear zu mit der Größe
der Augenbasis
a
b
. Eine Vergrößerung / Verkleinerung der Basis über das
natürliche Maß hinaus resultiert jedoch in geometrischen Verzerrungen
(Liliputismus / Gigantismus).
·
Die Genauigkeit der Tiefenunterscheidung nimmt quadratisch ab mit der
Entfernung
e
.
·
Im Nahbereich ist die Tiefenunterscheidung am höchsten.
·
Wird der Abstand
=
e
, ist ein räumliches Unterscheidungsvermögen nicht
mehr gegeben.
2.1.4 Die Grenzen der stereoskopischen Tiefenwahrnehmung
Theoretisch können Gegenstände als räumlich wahrgenommen werden, die
etwas weniger als
entfernt sind. Tatsächlich jedoch hört das Tiefenunter-
scheidungsvermögen schon bei erheblich kürzeren Entfernungen auf, da es an
eine Mindestgröße von
gebunden ist.

2 Physiologische Grundlagen
22
2.1.4.1 Berechnung der Tiefenwahrnehmungsgrenze
Konvergiert das Auge auf einen Gegenstand, so wird dieser auf der Fovea
Centralis (Stelle deutlichsten Sehens) der Netzhaut abgebildet. Die Dichte der
für Sehschärfe zuständigen Zapfen beträgt hier 160 000 Zapfen /mm2
11
.
Daraus ergibt sich ein Zapfenabstand von 2,5 µm. Um zwei Linien aufzulösen,
sind drei Zapfen erforderlich, also 5µm Abstand. Die Brennweite des gesamten
auf die Ferne akkomodierten Sehsystemes beträgt 17,0 mm (58,8 Dioptrien)
12
.
Abb. 2: Auflösungsvermögen des Auges
Für den minimalen Winkel, unter dem das Auge zwei Punkte auflösen kann, gilt:
mm
m
f
x
17
5
tan
µ
=
=
1
=
minarc
11
Heinwig Lang, ,,Farbmetrik und Farbsehen", Oldenbourg Verlag, München, 1978, S. 268
12
Bergmann; Schäfer, ,,Lehrbuch der Experimentalphysik", Band 3: Optik, de Gruyter, Berlin, 9. Aufl.,
S. 139
Objektebene
Augen-
linse
Netzhaut mit
Zäpfchen
f
X=5 µm

2 Physiologische Grundlagen
23
Mit einer Augenbasis von 65 mm ergibt sich bei einem Winkel von
1
=
minarc
mit Gleichung 1:
m
arc
mm
b
e
a
223
)
min
1
tan(
65
tan
=
=
=
Theoretisch können also Gegenstände in einer Entfernung von 223m noch als
vom Hintergrund abgehoben wahrgenommen können.
In der Praxis können jedoch nach Otto Vierling höchstens 5 minarc
13
unter-
schieden werden, was die Grenzentfernung auf unter 50m beschränkt.
13
Otto Vierling, ,,Die Stereoskopie in der Photographie und Kinematographie", Wissenschaftliche
Verlagsgesellschaft mbH, Stuttgart, 1965, S. 34

24
3 Physiologisch- technische Aspekte bei
Aufnahme und Wiedergabe
3.1 Aufnahme
Abb. 3: Stereoskopische Aufnahme
fk
t
: Entfernung des Fernpunktes zur Konvergenzebene
ka
e
: Entfernung der Konvergenzebene zur Objektivebene (Aufnahmeentfernung)
os
e
: Entfernung der Objektivebene zur Sensorebene
k
b
: Basisabstand der Kameraobjektive
fk
p
: Parallaxe des Fernpunktes in der Konvergenzebene
fs
p
: Parallaxe des Fernpunktes in der Sensorebene
p
ks
: Abstand des Konvergenzpunktes von der Bildmitte des Sensors
Konvergenz-
ebene
Objektiv-
ebene
CCD-Sensor-
ebene
Ebene
Fernpunkt
rechte
Kamera
linke
Kamera
2
/
fk
p
ka
e
k
b
fk
t
2
/
fs
p
os
e
p
ks
/ 2

3 Physiologisch- technische Aspekte bei Aufnahme und Wiedergabe 25
Berechnung der Parallaxen von Konvergenz- und Fernpunkt in der Sensor-
ebene.
Es gilt:
ka
os
fk
fs
k
e
e
p
p
v
=
=
für
f
e
ka
>>
gilt:
f
e
os
=
ka
k
ks
os
ks
e
b
f
p
e
p
=
2
2
2
Umstellen nach
ks
p
ergibt die Parallaxe für den Konvergenzpunkt:
ka
k
ks
e
b
f
p
=
Gleichung 2
Weiterhin gilt:
ka
fk
fs
k
e
f
p
p
v
=
=
sowie:
)
(
2
2
tan
fk
ka
k
fk
fk
t
e
b
t
p
+
=
=
Beide Gleichungen nach
fk
p
umstellen, gleichsetzen und nach
fs
p
auflösen
ergibt die Parallaxe für den Fernpunkt:
)
(
fk
ka
ka
k
fk
fs
t
e
e
b
t
f
p
+
=
Gleichung 3
äquivalent gilt für die Parallaxe des Nahpunktes:
)
(
nk
ka
ka
k
nk
ns
t
e
e
b
t
f
p
-
=
Gleichung 4

3 Physiologisch- technische Aspekte bei Aufnahme und Wiedergabe 26
3.2 Wiedergabe
Abb. 4: Stereoskopische Wiedergabe
b
a
: Augenbasis
e
kw
: Entfernung des Konvergenzpunktes des Bildes von der Augenbasis
w
t
: Tiefenausdehnung des Bildes
e
zd
: Entfernung des Zuschauers zum Display / Schirm
p
kd
: Abstand des Konvergenzpunktes von der Bildmitte des Displays
z
: horizontaler Versatz beider Bilder auf dem Display ( auseinander:
+
z
, zueinander:
-
z
)
d
v
: flächiger Vergrößerungsfaktor (CCD - Display)
d
h
: Höhe des Displays / Schirmes
ccd
h
: Höhe des CCD-Sensor
Der Vergrößerungsfaktor des Displays ist:
s
d
d
h
h
v
=
Gleichung 5
w
t
e
kw
e
zd
z
Ebene
Augenbasis
Ebene
Konvergenz-
punkt
Ebene
Fernpunkt
Ebene
Display /
Schirm
b
a
p
kd
2
p
kd
2
Ebene
Nahpunkt

3 Physiologisch- technische Aspekte bei Aufnahme und Wiedergabe 27
Der Abstand des Konvergenzpunktes von der Mitte des Schirmes ist (ohne
Berücksichtigung des Versatzes
z
):
d
ks
kd
v
p
p
=
Einsetzen in Gleichung 5:
ka
d
k
kd
e
v
b
f
p
=
Gleichung 6
Die Konvergenzweite berechnet sich (mit Berücksichtigung des Versatzes
z
):
z
e
b
v
f
b
e
b
z
p
b
e
b
e
ka
k
d
a
zd
a
kd
a
zd
a
kw
+
+
=
+
+
=
Gleichung 7
Ist
0
=
z
, so liegt der Unendlichpunkt des Bildes in der Schirmebene. Nah- und
Konvergenzpunkt liegen vor der Schirmebene.
Ist
)
(
kd
p
z
-
=
, so liegt der Konvergenzpunkt in der Schirmebene. Der Nahpunkt
liegt davor und der Fernpunkt dahinter.
Ist
)
(
kd
p
z
-
<
, so liegt der Konvergenz- und Fernpunkt hinter der Schirmebene
Ist
)
(
a
b
z
-
=
, so sind die Augenpupillen bei Betrachtung von Punkten ohne
Parallaxe (etwa im Unendlichen) parallel ausgerichtet.
Auch ist zu beachten, daß die Augenpupillen nicht divergieren dürfen, da sonst
Sehbeschwerden auftreten. Somit darf der maximale Abstand zwischen dem
linken und rechten Bild 65 mm betragen (
z
p
b
kd
a
+
=
=
).
Final del extracto de 131 páginas

Detalles

Título
Entwicklung und Erprobung eines stereoskopischen Videoaufnahmesystemes unter Verwendung von Mini-DV Camcordern
Universidad
Cologne University of Applied Sciences
Calificación
1
Autor
Año
1999
Páginas
131
No. de catálogo
V185575
ISBN (Ebook)
9783656983088
ISBN (Libro)
9783867464765
Tamaño de fichero
1520 KB
Idioma
Alemán
Palabras clave
entwicklung, erprobung, videoaufnahmesystemes, verwendung, mini-dv, camcordern
Citar trabajo
Christian Schmidt (Autor), 1999, Entwicklung und Erprobung eines stereoskopischen Videoaufnahmesystemes unter Verwendung von Mini-DV Camcordern, Múnich, GRIN Verlag, https://www.grin.com/document/185575

Comentarios

  • No hay comentarios todavía.
Leer eBook
Título: Entwicklung und Erprobung eines stereoskopischen Videoaufnahmesystemes unter Verwendung von Mini-DV Camcordern



Cargar textos

Sus trabajos académicos / tesis:

- Publicación como eBook y libro impreso
- Honorarios altos para las ventas
- Totalmente gratuito y con ISBN
- Le llevará solo 5 minutos
- Cada trabajo encuentra lectores

Así es como funciona