In einer Gegenüberstellung des Iconic und Pictorial Turns, die beide einen Paradigmenwechsel in den Bildwissenschaften beschreiben, wird sich dem Verhältnis von Bild und Sprache genähert. Am Beispiel einer Bildanalyse eines Artificial Intelligence-Bildes wird der Widerspruch zwischen Text als Befehl für die Erstellung eines AI-Bildes und den gleichzeitigen Eigensinn von Bildern herausgearbeitet.
In der Auseinandersetzung mit dem Iconic und Pictorial Turn wird herausgearbeitet, welche theoretischen Annahmen von Boehm und Mitchell mithilfe der AI bestätigt oder hinterfragt werden können. Für dieses Vorhaben wurde eine Gliederung in insgesamt sieben Teilbereiche gewählt. Das erste inhaltliche Kapitel (2.) führt in die wissenschaftstheoretischen Erläuterungen des Iconic und Pictorial Turns (2.1. & 2.2.) ein. Die Kürze der vorliegenden Arbeit erlaubt keine allumfassende Darlegung der Überlegungen von Boehm und Mitchell. Es wird jedoch in der Kürze umrissen, welche Hauptargumente angebracht werden und zu welchem Schluss die beiden Theoretiker gelangen. Anschließend verschafft das Kapitel drei einen Überblick über die Definition von Artificial Intelligence und über die technischen sowie interaktiven Möglichkeiten, die sich durch DALL-E mini eröffnen. Es wird darauf hingewiesen, dass die Quellen dieses Kapitels aufgrund der Aktualität des Themas nicht wissenschaftlichen Charakters sind. Wie ein AI-generiertes Bild in der Interaktion entsteht und aussieht, wird in Kapitel vier dargestellt. An dieser Stelle wird auch eine kurze Bildbeschreibung vorgenommen, um der Eigenart eines AI-Bildes näher zu kommen.
Inhaltsverzeichnis
1. Einleitung
2. Das Verhältnis von Sprache und Bild - Ein Paradigmenwechsel
2.1. Überschreitung von Sprache: Iconic Turn
2.2. Bilder im Kontext der Gesellschaft: Pictorial Turn
3. Möglichkeitsräume von Artificial Intelligence am Beispiel von DALL-E mini
4. Exempel eines AI-generierten Bildes: „Greta Thunberg holding speech drawing style”
5. Fazit: Ausdifferenzierung des Verhältnisses von Sprache und Bild durch Artificial Intelligence
Zielsetzung & Themen
Die Arbeit untersucht das theoretische Verhältnis von Sprache und Bild vor dem Hintergrund von KI-generierten Inhalten. Dabei wird analysiert, inwieweit Bild- und Sprachwissenschaftliche Paradigmen wie der Iconic und Pictorial Turn auf aktuelle Anwendungen wie DALL-E mini anwendbar sind und was diese Generierungsprozesse über das Verhältnis von Mensch, Programm und Bild aussagen.
- Verhältnisbestimmung von Sprache und Bild im digitalen Zeitalter
- Iconic Turn (Boehm) und Pictorial Turn (Mitchell) im Kontext von KI
- Technische Grundlagen und Möglichkeitsräume von DALL-E mini
- Praktische Fallanalyse: Generierung und Interpretation von KI-bildern
- Kritische Reflexion über Bild-Rezeption und künstliche Intelligenz
Auszug aus dem Buch
Möglichkeitsräume von Artificial Intelligence am Beispiel von DALL-E mini
Die bereits erwähnte Möglichkeit, aus Stichwörtern Bilder entstehen zu lassen, hält die AI DALL-E mini bereit. Was bedeutet AI? Eine breit akzeptierte Definition zu finden, stellt sich als eine Illusion heraus. Dennoch muss erläutert werden, was unter Articial Intelligence verstanden wird, da es sich um einen grundlegenden Begriff in der vorliegenden Arbeit handelt.
Artificial Intelligence setzt sich aus zwei Konzepten zusammen: Zum einen aus dem Künstlichen (engl. Artificial) und zum anderen aus dem Intelligenten. Was das Intelligente in diesem Zusammenhang meint, versucht Wang (2019) in einer ausführlichen Herleitung darzulegen und in einer anschließenden eigenen Definition zu systematisieren. Seiner Auffassung nach handelt es sich bei der Intelligenz, die im Zusammenhang mit AI implizit gemeint wird, um „the capacity of an information-processing system to adapt to its environment while operating with insufficient knowledge and resources.” (Wang 2019, S. 17) Intelligent sind dementsprechend Systeme, die eine, gemessen an den jeweiligen Möglichkeiten, große Kapazität haben, sich an ihre Umwelt anzupassen, während die Ressource Wissen limitiert ist.
Bereits in der Einleitung klang die Funktionsweise von AI-generierten Bildern an. An dieser Stelle soll genauer darauf eingegangen werden, welche Möglichkeiten die Funktionen von DALL-E mini eröffnen. Es wurde dargestellt, dass die AI auf eine Vielzahl an bereits existenten Bildern zurückgreift. Um dies technisch umzusetzen, müssten Wörter in einzelne Bildstrukturen übersetzt werden, erklärt Programmierer Boris Dayma, der DALL-E mini codiert hat (Biewald 2022). Die open Source Version des, von OpenAI kommerziell erstellten, Programms DALL-E lernt immer weiter dazu und kann von interessierten Programmierer*innen weiterentwickelt werden (Dayma und Cuenca 2022). Mittlerweile wurde die Software mit Millionen an Bildern angereichert (ebd.), mit deren Hilfe das Programm bestimmte Konzepte nachahmen kann, auch wenn diese nicht im gewöhnlichen Zusammenhang zueinanderstehen, wie „Eiffel tower is landing on the moon“.
Zusammenfassung der Kapitel
1. Einleitung: Die Einleitung stellt die Fragestellung nach dem Verhältnis von Sprache und KI-generierten Bildern anhand des Beispiels DALL-E mini vor.
2. Das Verhältnis von Sprache und Bild - Ein Paradigmenwechsel: Dieses Kapitel erläutert die theoretischen Grundlagen des Iconic und Pictorial Turns und deren Bedeutung für die Bildwissenschaft.
2.1. Überschreitung von Sprache: Iconic Turn: Der Abschnitt diskutiert die Theorie von Gottfried Boehm zur eigenständigen Logik von Bildern gegenüber der sprachlichen Unterordnung.
2.2. Bilder im Kontext der Gesellschaft: Pictorial Turn: Hier wird W.J.T. Mitchells Ansatz thematisiert, der Bilder als in soziale Strukturen und Praktiken des Sehens eingebettet betrachtet.
3. Möglichkeitsräume von Artificial Intelligence am Beispiel von DALL-E mini: Es werden die technischen Grundlagen von KI und die Funktionsweise von DALL-E mini zur Übersetzung von Text in Bildstrukturen analysiert.
4. Exempel eines AI-generierten Bildes: „Greta Thunberg holding speech drawing style”: Eine praktische Fallstudie, in der ein KI-generiertes Porträt hinsichtlich seiner ästhetischen und ikonischen Wirkungsweise untersucht wird.
5. Fazit: Ausdifferenzierung des Verhältnisses von Sprache und Bild durch Artificial Intelligence: Die Arbeit schließt mit einer Synthese, wonach KI-Bilder trotz Sprachdeterminismus einen eigenständigen ikonischen Charakter besitzen.
Schlüsselwörter
Artificial Intelligence, DALL-E mini, Iconic Turn, Pictorial Turn, Bildwissenschaft, Sprache-Bild-Verhältnis, KI-generierte Bilder, Visual Culture Studies, Bildanalyse, digitale Kunst, künstliche Intelligenz, Rezeption, Bildtheorie, Repräsentation, Künstliche Intelligenz Forschung.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Publikation untersucht, wie künstliche Intelligenz, speziell das Programm DALL-E mini, das traditionelle Spannungsfeld zwischen Sprache und Bild in den Geisteswissenschaften verändert.
Was sind die zentralen Themenfelder?
Die zentralen Themenfelder umfassen bildwissenschaftliche Theorien, die Funktionsweise von KI-Bildgeneratoren und die Analyse des Eigensinns von digital erzeugten Bildern.
Was ist das primäre Ziel oder die Forschungsfrage?
Das Ziel ist die Verhältnisbestimmung zwischen Rezipienten, dem technischen Programm und dem Bild, unter der Frage, ob KI-Bilder letztlich doch von menschlicher Sprache dominiert bleiben oder einen eigenen ikonischen Charakter entfalten.
Welche wissenschaftliche Methode wird verwendet?
Es wird eine theoretische Auseinandersetzung anhand der Ansätze von Boehm und Mitchell geführt, ergänzt durch einen konkreten Selbstversuch (Fallbeispiel) mit der DALL-E mini Software.
Was wird im Hauptteil behandelt?
Im Hauptteil werden zunächst die theoretischen Konzepte des Iconic und Pictorial Turn dargelegt, gefolgt von einer technischen Untersuchung der DALL-E mini Architektur und einer Analyse eines generierten Greta-Thunberg-Bildes.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die wichtigsten Schlagworte sind Artificial Intelligence, Iconic Turn, Pictorial Turn, Bildwissenschaft, digitale Repräsentation und das Sprache-Bild-Verhältnis.
Wie trägt der Selbstversuch zur Erkenntnis bei?
Der Selbstversuch macht die theoretischen Annahmen praktisch erfahrbar und zeigt konkret auf, wie eine KI Konzepte (wie Greta Thunberg) durch unterschiedliche Trainingsdaten verarbeitet und visualisiert.
Welches Fazit zieht die Autorin bezüglich der KI-Bilder?
Die Autorin kommt zu dem Schluss, dass KI-Bilder trotz eines direkten Sprachdeterminismus einen ikonischen Charakter wahren und die Perspektiven von Iconic und Pictorial Turn vereinen können.
- Quote paper
- Noelle Amber-Joe Jensen (Author), 2022, Das Verhältnis von Sprache und Bild. Die Artificial Intelligence Anwendung "DALL-E mini", Munich, GRIN Verlag, https://www.grin.com/document/1356352