192 91 11MB
German Pages 394 [396] Year 1996
MEDIEN
IN FORSCHUNG + UNTERRICHT Serie A Herausgegeben von Dieter Baacke, Wolfgang Gast, Erich Straßner in Verbindung mit Wilfried Barner, Hermann Bausinger, Helmut Kreuzer, Gerhard Maletzke Band 42
Anke-Marie
Lohmeier
Hermeneutische Theorie des Films
Max Niemeyer Verlag Tübingen 1996
Die Deutsche Bibliothek - CIP-Einheitsaufnahme Lohmeier, Anke-Marie: Hermeneutische Theorie des Films / Anke-Marie Lohmeier. - Tübingen : Niemeyer, 1996 (Medien in Forschung + Unterricht : Ser. A ; Bd. 42) NE: Medien in Forschung + Unterricht / A ISBN 3-484-34042-8
ISSN 0174-4399
© Max Niemeyer Verlag GmbH & Co. KG, Tübingen 1996 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Druck: Weihert-Dmck GmbH, Darmstadt Einband: Hugo Nadele, Nehren
Inhalt
Einleitung
xiii-xxii
Kapitel I Filmtheoretische
Voraussetzungen: Film als Rede
A. Bild und Sprache
l l
1. Bilder und Begriffe: Über Ecos Theorie der ikonischen Kodes
3
2. Die vor-begriffliche Struktur der Bilderwelt 11 Bilder haben keine Wörter: Die nicht-klassifikatorische Struktur der Bildersprache (12) - Zwischenbilanz (18) - Bilder haben keine prädikative Struktur (19) Bilder sind keine Sätze (20) - Bilder sind keine Aussagen (22) - Bilder machen Aussagen (23) B. Bilder als Sprechakte Die Subjekt-Objekt-Struktur von Bildern (24) - Bilder als Sprechakte (27) - Die Doppelbedeutung ikonischer Zeichen: Ikon und Symptom (28)
23
C. Kinematographische Sprechakte
29
1. Voraussetzungen: Zeitlichkeit und Narrativität 29 Bewegung und Zeit (30) - Filmisches Geschichtenerzählen und sein Subjekt: Der filmische Erzähler (31) - Exkurs: Die präsentische Rede des Films und der Schnitt - ein erzähltheoretischer Widerspruch (33) 2. Die filmische Sprechsituation 35 Der kinematographische Erzählakt im Horizont dramatischer und narrativer Sprechakte (36) - Einzelheiten zum Verhältnisfilmischerund sprachlicher Erzählerrede (39) - Zwei Ebenen des kinematographischen Sprechakts: Darstellungsebene und Abbildungsebene (42) - Die filmische Sprechsituation (43) D. Schlußfolgerungen: Filmanalyse im Horizont literaturwissenschaftlicher Analysemethoden 48 Die Anwendung literaturwissenschaftlicher Analysemethoden auf filmische Sachverhalte (48) - Die Grenzen einer aus literaturwissenschaftlichen Methoden abgeleiteten Filmanalyse: Bildkomposition und Filmmusik (50)
Kapitel II Kameraverhalten:
Die Organisation der
Subjekt-Objekt-Struktur
filmischer Bilder
51
A. Grundbegriffe der Analyse Das Analyseraster: Fünf Kriterien der Analyse (54) - Referat und Kommentar (56)
52
vi Inhaltsverzeichnis Β. Distanzverhalten: Ästhetische Strukturen und Funktionen von Einstellungsgrößen 58 1. Kategorien der Beschreibung 59 2. Kategorien der Funktionsanalyse 63 Objektgröße: Definition des Btickobjekts (64) - Objektbeziehungen: Integration und Isolation (67) - Blickfeld: Raumerfahrung und Wahrnehmungsverhalten (69) - Rezipientenperspektive: Informationsvergabe und Zuschauerlenkung (72) Entfernung: Distanz und Nähe (74) - Resümee: Die MultifunktionaUtät von Einstellungsgrößen (77) C. Standort und Blickwinkel: Ästhetische Strukturen und Funktionen von Kameraperspektiven 78 1. Kategorien der Beschreibung 79 2. Kategorien der Funktionsanalyse 83 Objekteigenschafien : Die »Seiten« der sichtbaren Welt (84) - Objektbeziehungen: Ansichten räumlicher Verhältnisse (86) - Die Strukturierung des Blickfeldes durch Perspektiven: Raumerfahrung und Reichweite der Wahrnehmung (88) Kameraperspektive und Rezipientenperspektive (91) - Blickrichtungen und soziales Verhalten (92) D. Bewegungsverhalten: Ästhetische Strukturen und Funktionen von Kamerabewegungen 96 1. Kategorien der Beschreibung 98 2. Kategorien der Funktionsanalyse 103 2.1 Objektgebundene Kamerabewegungen: Begleitschwenks und Begleitfahrten 104 Objekteigenschaften: Richtung, Tempo und Reichweite (104) - Objektbedehungen: Die Neuregelung von Entfernungsverhältnissen (106) - Blickfeld: Paradoxe Dynamik (109) - Rezipientenperspektive: Identifikatorische Effekte objektgebundener Kamerabewegungen (110) - Objektgebundene Kamerabewegungen als Interaktionsverhalten (110) 2.2 Freie Kamerabewegungen ill Blickfeld und Rezipientenperspektive: Verlagerung oder Bündelung der Wahrnehmung (112) - Objekteigenschafien: Motivierung freier Kamerabewegungen (114) - Objektbeziehungen: Explizite Relationierung (115) - Eigenbewegung: Explizite Thematisierung der Subjekt-Objekt-Relation filmischer Bilder (117) 2.3 Scheinfahrten: Zoom E. Einstellungslänge
119 120
Kapitel III Montage: Verfahren der filmischen Textbildung
123
A. Vorüberlegungen
123
Inhaltsverzeichnis
vii
1. »Filmsyntax« Bilderfolgen und Sätze (125) - Textkohärenz und »Textgrammatik« (127)
124
2.Textkohärenz und Textschema
131
B. Grundformen filmischer Textbildung: Voraussetzungen der narrativen, deskriptiven und systematischen Montage 134 Zeit im Film (134) - Rekurrenztypen (136) - Narrative, deskriptive und systematische Montage (142) - Formale und thematische Rekurrenzen (143) C. Narrative Montage: Strukturen filmischen Erzählens 144 1. Die Segmentierung des filmischen Diskurses 144 Christian Metz' »große Syntagmatik« (145) - Einstellung, Szene und Sequenz als quantitative und qualitative Größen (148) 2. Formen der narrativen Strukturierung
149
2.1 Zeitliche Strukturierung: Organisationsformen der Zeitstruktur im Film 149 Szenisches Erzählen (150) - Reffung und Dehnung (150) - Phasenbildung (151) - Raffungsarten: Sukzessive und thematische Raffung (152) - Verdeckte Raffung: Alternierende Szenenverknüpfung (153) - Zeitebenen: Riickwendungen und Vorgriffe (154) - Realitäts- und Fiktionsebenen (158) 2.2 Technische, räumliche und konfigurative Strukturierung
158
2.2.1 Segmentierungssignale 159 Einstellungskonjunktionen (159) - Schauplatzwechsel (160) - Konfigurationswechsel und Kadrierung (162) 2.2.2 Beispielanalyse: Technische, konfigurative und räumliche Segmente als szenische Subsegmente 2.3 Handlungslogische Strukturierung: Sequenzen
163 166
2.3.1 Verfahren der Sequenzbildung 168 Begriffsklärung: Handlung, Geschehen, Situation (168) - Sequenzen und Subsequenzen (170) 2.3.2 Die Organisation von Sequenzen auf der narrativen Achse 173 Nebenordnung: Alternierende Sequenzverknüpfung (173) - Unterordnung (174) 2.3.3 Haupt-und Nebengeschichten 174 D. Deskriptive und systematische Montage
176
1. Deskriptive Textbildung
177
2. Systematische Textbildung: Filmische Verfahren der Begriffsbildung
179
2.1 Voraussetzungen: Vergleich, Klassifikation, Begriffsbildung....
180
2.2 Formen 181 Grundform I: Systematische Montage narrativer Bilder (182) - Grundform 2: Digressionen (185)
vili
Inhaltsverzeichnis
Kapitel IV Filmische Erzählsituationen
188
A. Die Ich-Erzählsituation 1. Literaturwissenschaftliche Begriffsexplikation 2. Die Ich-Erzählsituation im Film
189 189 196
B. Die personale Erzählsituation 1. Literaturwissenschaftliche Begriffsexplikation 2. Die personale Erzählsituation im Film
198 198 201
C. Die auktoriale Erzählsituation 1. Literaturwissenschaftliche Begriffsexplikation 2. Die auktoriale Erzählsituation im Film
207 207 210
Kapitel V Die Selbstdarstellung des Erzählten: Dramatische Informationsvergabe im Film 214 A. Sprachliche Informationsvergabe: Figurenrede im Film 1. Figurenrede im Spannungsfeld von Normal- und Bühnensprache 2. Funktionen der Figurenrede
215 215 217
Proposition, lllokution, Perlokution (217) - Lokation als soziales Handein (220) - Metasprachliche, poetische und expressive Funktion (221)
3. Formen der Figurenrede: Monolog und Dialog
224
Monologe im Film (224) - Dialoge im Film (225) - Dialog und Kadrierung (227)
B. Nonverbale Informationsvergabe 1. Zur Analyse transitorischer nonverbaler Zeichen 1.1 Grundprobleme der Erfassung und Deutung nonverbaler Zeichen
228 228 229
Unwillkürüche Enkodierung und unbewußte Dekodierung nonverbaler Zeichen (230) - Zeichenhaftes und nicht-zeichenhaftes Körperverhalten (231) Die Mehrdeutigkeit nonverbaler Zeichen (233)
1.2 Verhaltenswissenschaftliche Forschungen zur nonverbalen Kommunikation: Ein Überblick
234
Linguistisch inspirierte Ansätze: Kinesik (234) - Semantisch-kontextanalytische Ansätze (235) - Semantische Ansätze: Ethologisch-psychologische Forschungen (237) - Formale und funktionale Klassifikationsversuche (239)
1.3 Möglichkeiten der Operationalisierung verhaltenswissenschaftlicher Forschungsergebnisse für die Filmanalyse 1.4 Techniken nonverbaler Enkodierung
239 242
Inhaltsverzeichnis
1.5 Funktionen nonverbaler Enkodierung : Ansätze zur funktionalen Klassifikation nonverbaler Zeichen 1.5.1 Der klassifikatorische Ansatz von Ekman/Friesen
ix
245 245
1.5.2 Der klassifikatorische Ansatz von Scherer
247
1.5.3 Vorschläge zu einer modifizierten Klassifikation
251
Nonverbale Proposition (252) - Nonverbale Illokution (255) - Parasemantische Funkäonen (258) - Expressive Funktionen (259) - Gesprächsregulierende (metakommunikative) Funktionen (259) - Verwendungs- und Reaktionsregeln (260)
1.6 Die Beschreibung nonverbaler Zeichen im Filmprotokoll 2. Nicht-transitorische nonverbale Zeichen
261 264
Besetzung (266) - Maske (268) - Kostüm (269)
C. Kategorien der Figurenanalyse
270
Personal: Quantitative und qualitative Relationen (270) - Figurenkonstellation (271) - Konfiguration (271) - Figurencharakterisierung (273)
D. Schauplätze: Funktionen des fiktiven Raumes im Film
274
1. Eigentliche Raumkonzepte
275
2. Uneigentliche Raumkonzepte
278
Relationen innerhalb eines Schauplatzes (278) - Relationen zwischen Schauplatz und Geschehen (280) - Relationen zwischen mehreren Schauplätzen (281) - Relationen zwischen Schauplatz und Offscreen (282)
Kapitel VI Die Perspektivenstruktur filmischer Texte A. Perspektiven und die Verfahren ihrer Strukturierung 1. Perspektiven und Perspektivträger im Film
284 285 285
Figurenperspektiven (287) - Α-perspektivische Informationen (287) - Erzählerperspektive (288) - Rezipientenperspektive (289) - Perspektivenstruktur und »Botschaft« (291)
2. Die Organisation der Perspektivenstruktur: Techniken der Rezipientensteuerung
292
2.1 Quantitative Relationierung der Figurenperspektiven
292
2.2 Qualitative Relationierung der Perspektiven
293
Figurenkompetenz (293) - Figurenakzeptanz (294)
2.3 Bewertungssignale B. Typen der Perspektivenstruktur
295 296
1. Geschlossene Perspektivenstruktur
297
2. Offene Perspektivenstruktur
298
χ
Inhaltsverzeichnis
Kapitel VII Uneigentliche Rede im Film
299
A. Begriffsklärungen: Terminologische Fehlentscheidungen in der Filmwissenschaft 300 Metasememe (302) - Metasememe und ikonische Zeichen (303) - Die »Filmmetapherχ, eine Metapher (307) - Tropische Topoi: Filmische Replikate sprachlicher Tropen und ikonographischer Konventionen (309) - Indices (311) - Konnotationen (312) B. Voraussetzungen uneigentlicher Bilderrede
313
1.Die metalogische Struktur uneigentlicher Bilderrede 313 Metalogismen (314) - Die metalogische Struktur uneigentächer Bilderrede (316) 2. Metalogische Formsignale 317 Redundante Informationsvergabe (319) - Defizitäre Informationsvergabe (321) C. Formen I: Allegorie und Symbol
322
1. Literaturwissenschaftliche Begriffsexplikation 322 Das Abgrenzungsproblem und sane historischen Voraussetzungen: Goethes Begriffsbestimmung (324) - Die Begriffsbestimmungen von Gerhard Kurz (326) 2. Versuch einer Reformulierung der Begriffe 2.1 Grundbestimmungen
329 330
2.2 Allegorie 333 Proprium und lmproprium als Elemente disjunkter Mengen (334) - Proprium und lmproprium als Elemente der allegorischen Menge MA (334) Konventionen und das Problem von Essenz und Akzidens (336) - Konvention und Konventionswandel: Anwendungsprobleme (338) - Resümee: Mengentheoretische Definition der Allegorie (339) - Der allegorische 'Fehler' (340) - Der allegorische Praetext (340) - Allegorische Sinnsignale (341) 2.3 Symbol 342 Die Elementbeziehung zwischen Proprium und lmproprium (343) - Proprium und lmproprium als Elemente disjunkter Mengen (343) - Der symbolische 'Fehler' (344) - Die Konventionalität der symbolischen Elementbeziehung (344) - Konvention und Konventionswandel: Anwendungsprobleme (346) - Resümee: Mengentheoretische Definition des Symbols (346) - Der symbolische Praetext (347) - Symbolische Sinnsignale (347) 3. Allegorische Rede im Film Allegorische Mengenbildungen (348) - Allegorische Sinnsignale (349)
348
4. Symbolische Rede im Film Symbolische Mengenbildungen (352) - Symbolische Sinnsignale (353)
352
5. Allegorie und Symbol: Zwei Konzepte erzählerischer Weltaneignung und ihre Bedeutung für den Film 354 Das symbolische Realitätsmodell (355) - Das allegorische Realitätsmodell (357)
Inhaltsverzeichnis D. Formen II: Vergleichende Rede im Film
xi 359
1. Die metalogische Struktur filmischer Vergleiche 359 Der metalogische 'Fehler' filmischer Vergleiche (359) - Metalogische Formund Sinnsignale (360) - Die Unnabhängigkeit filmischer Vergleiche von Praetexten und Konventionen (360) 2. Formen vergleichender Rede Symbolische Vergleiche (361) - Allegorische Vergleiche (362)
Literaturverzeichnis
361
365
Einleitung
Dieses Buch sollte eigentlich nur ein Kapitel in einem ganz anderen Buch werden. Im Zusammenhang einer Untersuchung zur Funktionsgeschichte des Films »Jud Süß« (1940)1 sollte es der Interpretation dieses Films eine theoretische und methodische Grundlage verschaffen. Daß daraus dann gleich ein ganzes Buch wurde, hat - und deshalb wird es hier erwähnt - einige Signifikanz für die gegenwärtige Situation der filmwissenschaftlichen, insbesondere filmgeschichtlichen Forschung, dafür nämlich, daß das Fundament aller filmgeschichtlichen Bemühung, die präzise, methodisch kontrollierte und kontrollierbare Filminterpretation, derzeit keine theoretischen und methodischen Voraussetzungen vorfindet, die ihre Aussagen über konkrete Filme und filmgeschichtliche Prozesse verläßlich zu begründen imstande wären: Reicht einerseits das Methodeninventar der herkömmlichen (quantitativen) Filmanalyse nicht hin für die Lösung komplexerer Interpretationsprobleme, so sind andererseits die filmsemiotischen Ansätze, die die filmtheoretische Diskussion seit geraumer Zeit beherrschen, nicht in der Lage, Untersuchungen zu fundieren, deren Problem weniger die Dekodierung filmischer Zeichen als vielmehr das Verstehen der mit diesen Zeichen erzeugten filmischen Texte und dessen Begründung ist, deren Problem also ein hermeneutisches, nämlich Konsequenz der Annahme ist, daß ein Text mehr ist als die Summe seiner Zeichen und Zeichenrelationen, daß sein Verstehen deshalb eines »textüberschreitenden Entwurfs« bedarf, 2 dessen Prozeduren auf zeichentheoretischem Wege nicht zu begründen sind. Dieser Mangel an Methoden einer das Verstehen von Filmen begründenden Filmanalyse und Filminterpretation hat notwendig zur Folge, daß interpretatorische Aussagen über Filme nur beschränkte Geltung beanspruchen können, weil und solange sie sich zu großen Teilen auf Verstehensakte berufen müssen, die einer systematischen Reflexion und Kontrolle entzogen bleiben. Ein thesenhafter Überblick über den Stand filmwissenschaftlicher Theorie- und Methodenreflexion mag dieses Fazit zunächst allgemein begründen. 3 ι
Diese Untersuchung, in der es vor allem um die Funktion des »Jud Süß«-Films im politisch-kulturellen Diskurs der frühen Nachkriegsjahre in Westdeutschland geht, wird separat erscheinen.
2
FRANK 1982, 140.
3
Detailliertere Auseinandersetzungen mit zentralen Positionen der neueren filmwissenschaftlichen Forschung werden in den nachfolgenden Kapiteln gefuhrt.
xiv
Einleitung
Die theoretische Beschäftigung mit dem Film hat sich in ihren Anfangen zum überwiegenden Teil außerhalb des etablierten Wissenschaftsbetriebs und damit zumeist auch ohne Kontakt zur Theorie- und Methodendiskussion der geisteswissenschaftlichen Disziplinen entwickelt. 4 Ihre Institutionalisierung im Kanon der traditionellen kunst- und kulturwissenschaftlichen Fächer verläuft, in der Bundesrepublik zumal, noch immer zögernd. Die filmwissenschaftliche Theorie- und Methodendiskussion, die sich im Rahmen der alten philologischen Disziplinen entwickelt hat, bewegt sich noch immer in erster Linie auf propädeutischer Ebene, konzentriert sich auf elementare Probleme der theoretischen Bestimmung des Gegenstands, ist also noch immer damit beschäftigt, sich ihre Grundlagen allererst zu verschaffen. Neben den herkömmlichen Modellen der Filmanalyse, die insbesondere quantitative Analyseverfahren entwickelt haben, stehen dabei vor allem semiotische Modelle der Sprach- und Literaturwissenschaft und deren Adaptionsmöglichkeiten zur Diskussion, die das Interesse nachhaltig auf eine zeichentheoretische Bestimmung des Gegenstands gerichtet haben. Die quantitative Filmanalyse liefert ein Inventar beschreibender Begriffe, die der Erfassung der spezifisch kinematographischen Abbildungsverfahren dienen sollen und die zum überwiegenden Teil der produktionstechnischen Terminologie entlehnt sind. Darin spiegelt sich ihre Orientierung an Filmtechnik und -praxis, die einer filmwissenschaftlichen Theoriebildung bislang eher im Wege stand, weil sie die Illusion zu nähren geeignet war, die Rekonstruktion des Herstellungsprozesses in der Analyse sei eine ausreichende Voraussetzung, um den Gegenstand »sachgerecht« zu erfassen. Auf der Grundlage ihrer produktionstechnischen Terminologie hat die quantitative Filmanalyse Verfahren der statistischen Auswertung filmischer, vor allem kameraspezifischer Daten entwickelt, deren wohl prominentester Modellversuch von Bernward Wember lange Zeit, insbesondere in der Medienpädagogik, als vorbildhaft galt 5 und die auch in neueren Handbüchern und Einführungswerken noch immer eine gewichtige Rolle spielen. 6 Sie sind von der Überzeugung geleitet, daß die statistische Auswertung kinematographischer Daten der Filminterpretation eine verläßliche Grundlage verschaffen kann. Allerdings ist bislang versäumt worden, die theoretischen Vorannahmen zu explizieren, die diese hohe Gewichtung quantitativer Merkmale des filmischen Diskurses begründen. Sie
*
Signifikant dafür ist der Umstand, daß die Standardwerke der Filmtheorie zum überwiegenden Teil von Filmregisseuren, Filmkritikern, Journalisten etc. stammen (vgl. Béla Balász, Sergej Eisenstein, Wsewolod Pudowkin, André Bazin u.a.).
5
V g l . WEMBER 1972.
6
V g l . Z.B. KUCHENBUCH 1978, 1 4 f f . ; FAULSTICH/FAULSTICH 1977, 6 1 - 1 2 4 ; FAULSTICH
1980, 125ff.
Einleitung
XV
beruht offenkundig auf der Annahme, daß den verschiedenen Formen des Kameraverhaltens eine substantielle Bedeutungshaltigkeit zuzuordnen sei, die noch vor einer spezifischen Beziehung zum je konkreten Bildinhalt als gegeben vorauszusetzen wäre. Nun ist zwar nicht zu leugnen, daß sich im Laufe der Filmgeschichte Formen des Kameraverhaltens herausgebildet haben, die unter Umständen zu relativ selbständigen Bedeutungsträgern avancieren konnten. Abgesehen davon aber, daß diese semantischen Funktionen einzelner kinematographischer Formen historischem Wandel unterliegen und folglich außerordentlich labil sind, läßt sich die Annahme fester semantischer Funktionen angesichts der hochgradigen Multifunktionalität kinematographischer Abbildungsverfahren nicht aufrechterhalten, begründet vielmehr, wie zu zeigen sein wird, eine unzulässige Reduktion ihrer semantischen Potenzen (vgl. v.a. Kap. II). Quantitative Verfahren, die für die Filminterpretation durchaus heuristischen Wert haben können, bedürften daher einer filmtheoretischen Begründung, die den Status kinematographischer Abbildungsverfahren als spezifischer filmischer »Redeformen« und als sinnkonstituierender Elemente des filmischen Diskurses präzise zu bestimmen in der Lage wäre, ohne sie dabei semantisch festzuschreiben. Dazu aber bedürfte es einer systematischen, aus einheitlicher theoretischer Perspektive zu entwickelnden Theorie filmischen Erzählens, für die es in der neueren Diskussion vielerlei Ansätze, aber noch kein theoretisch kohärentes Modell gibt. Die wissenschaftliche Theoriereflexion konzentriert sich nun aber - seit mehr als zwanzig Jahren - vor allem auf die Adaption semiotischer Denkmodelle. Ihr entschiedenes Interesse, Semiotik als disziplinspezifische Metatheorie zu konstituieren, und ihr ebenso entschiedenes Desinteresse an historischhermeneutischen Problemstellungen verweist auf die besonderen Umstände ihrer Anfänge: Die in den späten sechziger und frühen siebziger Jahren einsetzende Rezeption der Semiotik7 und (vor allem französischen) Filmsemiologie8 verschaffte der in wissenschaftsgeschichtlicher Hinsicht nahezu traditionslosen Disziplin einen methodologischen Reflexionsrahmen, der ihrem dringenden Bedürfnis nach wissenschaftlicher Legitimation entgegenkam. Daß die gerade in diesen Jahren gern als »obskurantistisches« Erkenntnisparadigma abqualifizierte Hermeneutik dieses Legitimationsbedürfnis nicht befriedigen konnte, ist mit Blick auf die an szientistischen Vorbildern orientierten Diskussionen der Kulturwissenschaften in jenen Jahren begreiflich, hat aber dazu geführt, daß filmwissenschaftliche Theorie- und Methodenreflexion sich von Anfang an jenseits hermeneutischer Denktraditionen entfaltet, sich also auch gar nicht erst mit den Traditionen hermeneutischer Methodenreflexion 7 8
Vgl. KNELLI 1971. Vgl. BARTHES 1969; METZ 1972; 1973.
xvi
Einleitung
auseinandergesetzt hat. Vielmehr hat man hier mit den zeichentheoretischen Ansätzen auch gleich die Vorbehalte der an szientistischen Erkenntnisparadigmen orientierten Semiotik gegen hermeneutische Ansätze unbesehen übernommen, so daß erkenntnistheoretische Selbstvergewisserung hier im Grunde gar nicht erst stattgefunden hat. 9 Entsprechend nahm und nimmt man hier auch weder die grundlegende Kritik, die sprachanalytische Philosophie und Semiotik von erkenntnistheoretischer und wissenschaftsethischer Seite erfahren haben, 10 noch die Chancen zur Kenntnis, die eine kritische Hermeneutik für die Explikation der »Probleme einer nicht experimentell wiederholbaren, sondern nur als Geschichte rekonstruierbaren Selbsterfahrung der Gesellschaft« eröffnet, eine Explikation, deren »praktische Bewährung nicht im jederzeitigen Machenkönnen, sondern im geschichtlichen Fortschritt der gesellschaftlichen Interaktion liegt«, weshalb ihre Geltung auch »nicht mit szientistischen Maßstäben« gemessen werden kann.11 In methodenpraktischer Hinsicht hat diese ausschließliche Konzentration der jüngeren filmwissenschaftlichen Theoriereflexion auf semiotische Paradigmen dazu geführt, daß Probleme des Filmverstehens und damit Methodenprobleme der Filminterpretation generell in den Hintergrund getreten sind. Das kann auch nicht verwundern: Als Disziplin, die auf die Erkenntnis universaler kommunikativer Strukturen und Systeme zielt, interessiert Semiotik sich - das ist zunächst allgemein festzustellen - für die Bedeutungen kommunikativer Akte nur insoweit, als sie ihre Frage nach den semiotischen Strukturen von Kommunikation als Voraussetzungen für deren Gelingen berühren. Sie untersucht, was die Hermeneutik immer schon voraussetzt, und erweist sich damit als Ausdruck eines erkenntnistheoretischen Verhaltens zur Welt, das diese als im Prinzip unverständlich gewordene begreift und deshalb den hermeneutischen Verstehensbegriff negieren muß: Sie begibt sich, wie Odo Marquard in polemischer Absicht konstatiert hat, »methodisch-künstlich heraus aus jener - phänomenologisch ausgezeichneten - Situation, in der wir lebenswelttäglich existieren: aus der Situation der immer bzw. je schon (irgendwie) verstandenen oder vorverstandenen Sprache, Textwelt, Sozialwelt«.12 Geht Hermeneutik von einer »grundsätzlich vertrauten, schon verstandenen Welt« aus, weshalb ihre Rekursinstanz auch »nicht der 'Code', sondern die Geschichte« ist, so stellt Semiotik eben dieses hermeneutische Vorverständnis Vgl. etwa M ö l l e r 1986, der auf weite Strecken, ohne es zu merken, hermeneutisch argumentiert und deshalb keinen Anlaß sieht, die Differenz seines erklärtermaßen semiotischen Ansatzes zu hermeneutischen Ansätzen zu bezeichnen (vgl. z.B. die Ausführungen zum »Kontexttheorem«, 29-56). 10 Vgl. APEL 1976, bes. Bd. 1, 9-76, 167-196, 335-377. H Ebd. 19 (Hervorhebung im Text).
9
12 MARQUARD 1 9 8 4 ,
136.
Einleitung
xvii
in Frage und sieht sich genötigt, seine Voraussetzungen zu untersuchen, weshalb sie Geschichte auch vorläufig ins »Problemexil« verbannen muß. 13 Wo Semiotik demnach, vereinfacht gesagt, an ihr Ziel gelangt, nämlich in der Klärung der Zeichen, aufgrund deren wir Welt immer schon irgendwie verstehen, setzt die Hermeneutik recht eigentlich erst an: »Während die Hermeneutik ihr Basislager der Vorverständnisse - dank der Geschichte, die es dorthin transportierte - immer schon knapp unter der Kammhöhe der konkreten Verständnisprobleme hat, muß die code-knakkende Wissenschaft ständig in der Tiefenzone der Täler am Fuß der Problemberge auf Null oder gar im Minusbereich anfangen.« 14 Die Polemik verfehlt ihr Ziel, wo Semiotik sich als facherübergreifende Grundlagenforschung versteht. Sie trifft es, und zwar recht exakt, wo Semiotik sich als verbindliche disziplinspezifische Theorie geriert, die die Aporien allen Textverstehens und damit zugleich die der Hermeneutik überwinden zu können meint. Es ist denn wohl auch kein Zufall, daß filmwissenschaftliche Erkenntnisziele mit dem entschiedenen Zugriff auf semiotische Modelle zunehmend ihre disziplinspezifischen Konturen verloren haben, sich nämlich einerseits in einer allgemeinen semiotischen Grundlagenforschung, andererseits in einer allgemeinen Texttheorie aufzulösen im Begriff stehen, zumindest dort, wo mit dem semiotischen Ansatz ernstgemacht wird, semiotische Begrifflichkeit nicht zum bloßen Jargon depraviert. Denn wo filmwissenschaftliche Arbeit konsequent zeichentheoretisch fundiert werden soll, entsteht beim gegenwärtigen Forschungsstand die Notwendigkeit, Filmwissenschaft als semiotische Grundlagenforschung zu betreiben: Die Semiotik hat Theorien über Zeichenstrukturen und Kodesysteme mit universalem Geltungsanspruch für alle Bereiche der Kommunikation entwickelt, ist aber in praxi - außerhalb des engeren linguistischen Arbeitsfeldes - noch nicht wesentlich über die Konstruktion hypothetischer Modelle hinausgelangt, 15 und das gilt auch und gerade für die Semiotik des Films. Es genügt nämlich nicht zu fordern, daß bei der Analyse filmischer Bilder nicht von »Männern, Mädchen, Kühe(n), Katzen und ähnliche(n) Inhalte(n)« die Rede sein soll, sondern »selbstverständlich« von den »verschiedenen Kodes und Kodierungs- bzw. Mitteilungsebenen, die ein Bild beinhaltet«:16 Man muß auch sagen können, welcher Art diese Kodes sind, wie sie funktionieren und wie sie beschrieben und analysiert werden können. Gerade
13 Ebd. 137. H Ebd. 15 Vgl. die Übersicht über das projektierte »semiotische Feld» bei ECO 1972, 20ff., das, wie die Zwischenbilanz zeigt, die Winfried Nöth dreizehn Jahre später gezogen hat (NÖTH 1985), in den meisten Bereichen inzwischen allenfalls grob durchpflügt worden ist. 16 KNILLI/REISS 1 9 7 1 , 6 7 .
xviii
Einleitung
das aber bereitet erhebliche Schwierigkeiten, eben weil die Vielzahl von Kodes, die als Konstituenten filmischer Kommunikation anzusetzen sind, zum weitaus größten Teil überhaupt noch nicht oder nur grob - als Kodes, d.h. unter zeichentheoretischen Prämissen - erforscht sind. Die bloße Umbenennung dessen, was man auf der Leinwand sieht und versteht, in »Kodes und Kodierungs- und Mitteilungsebenen«, kann die Frage, aufgrund welcher Voraussetzungen man das, was man da sieht, versteht, nicht beantworten, ist vielmehr geeignet, unkontrollierte Verstehensprozesse in Ergebnisse semiotischer Operationen umzutaufen und ihnen damit einen Status zu geben, den sie nicht haben. Sofern die Filmwissenschaft mit ihrer Fundierung in der Zeichentheorie ernstmachen will, wird sie sich folglich vorerst als Teildisziplin der allgemeinen Semiotik definieren, sich nämlich der semiotischen Grundlagenforschung im Feld der für den Film relevanten Zeichensysteme verschreiben müssen. Dieser Konsequenz aber hat sie sich bisher entzogen: Dem Entwurf einer Theorie der visuellen Kodes, den Umberto Eco schon 1968 (deutsch 1972) vorgelegt hat, ist seither nichts Wesentliches hinzugefügt worden. 17 Stattdessen vollzog sich im Verlauf der siebziger und vor allem der achtziger Jahre eine allgemeine »Umorientierung« auf »Probleme der filmischen Textualität«, 18 die der schwierigen Frage nach der Struktur visueller Zeichen aus dem Wege ging, vielmehr ihren »konkreten filmsemiotischen Erklärungswert« nun unversehens für »limitiert« erklärte 19 oder gar gleich das »Scheitern der klassischen Semiotik des Films« verkündete, 20 um nun die »Filmsyntax« zur »zentralein) Komponente einer Theorie der filmischen Formen« zu erheben, 21 einer Theorie, die dann freilich das Problem hat, über eine »Syntax« reden zu müssen, deren satzbildende Einheiten sie zeichentheoretisch nicht bestimmen kann. Als Grund für diese »Umorientierung« wird gern die Einsicht genannt, daß filmische Bilder hochgradig »kontextsensitiv« sind, 22 eine aus hermeneutischer Perspektive nicht eben originelle und zudem alles andere als filmspezifische Einsicht. Sie hat indes nicht zu einer Auseinandersetzung mit hermeneutischen Ansätzen geführt, sondern zur Adaption text-, insbesondere erzählgrammatischer Ansätze der strukturalen Literaturwissenschaft, die sich die Semiotik - als »Textsemiotik« - einverleibt hat 23 und die in der Filmsemiotik zumeist unter dem Begriff »Filmsyntax« firmieren. Auch die Adaption textse17
Vgl. ECO 1972,
18
SIEGRIST 1 9 8 6 ,
195-292. 53.
-
Zu dieser Umorientierung vgl. bes.
ELLING/MÖLLER 1985; KLOEPFER/MÖLLER 19
SIEGRIST 1 9 8 6 ,
53.
20 MÖLLER 1 9 8 6 , x i i .
21 Ebd. 352. 22 Ebd. 29-56, 352. 23 V g l . NÖTH 1 9 8 5 , 4 5 5 - 5 2 5 .
1986.
MÖLLER
1978; MÖLLER
1984;
Einleitung
xix
miotischer Ansätze aber kann das Grundproblem der gegenwärtigen Filmwissenschaft nicht lösen, das nach wie vor allererst in der Spezifik des filmischen Diskurses, in der Frage nach den Bedingungen seines Verstehens und damit nach den Methoden seiner Analyse und Interpretation liegt. Denn Erzählgrammatik und Textwissenschaft beschäftigen sich ja gerade nicht mit medienspezifischen, sondern mit medienwnspezifischen, diskursunabhängigen Superstrukturen, nötigen also gar nicht erst zu der Frage, aufgrund welcher Voraussetzungen der Diskurs verstanden wird. Folglich können sie die Entwicklung von Methoden einer filmischen Diskursanalyse auch nicht vorantreiben. Vielmehr setzt die Rekonstruktion textsemiotischer Superstrukturen das Verstehen der Texte, aus denen sie abgeleitet werden, immer schon voraus, so daß hier der bemerkenswerte Fall einer Semiotik entsteht, die das, was sie doch klären wollte, die Voraussetzungen, aufgrund deren wir Welt verstehen, schon nicht mehr wissen will, vielmehr hermeneutische Operationen zu ihrer (uneingestandenen und daher kritischer Reflexion entzogenen) Voraussetzung machen muß, - ein disziplinspezifisches und methodenpraktisches Beispiel für das, was Karl-Otto Apel in erkenntnistheoretischer Perspektive die »geisteswissenschaftliche Verstrickung« der »Propagandisten szientifisch-technologischer Rationalität« genannt hat, und ein Sachverhalt, auf den zurückzukommen sein wird. 24 Damit zugleich und vor allem konturiert sich hier eine Filmwissenschaft, die sich nicht mehr mit Filmen, sondern mit Strukturen wird befassen müssen, die jeder als Text definierbare kommunikative Sachverhalt aufweist. Denn auch diese neue Rekursinstanz der Filmsemiotik ist nicht so weit ausgereift, daß sich die Filmwissenschaft ihrem spezifischen Gegenstand zu widmen schon Chancen hätte: Ausgehend von Propp und Lévi-Strauss, 25 hat die strukturale Erzähltheorie 26 Ansätze zu einer narrativen »Grammatik« entwickelt und sich dabei auf die Erkenntnis »thematischer«, allererst handlungslogischer Superstrukturen in erzählenden Texten konzentriert, ist aber über deren Erprobung an einfachen Formen (Märchen, Mythen, Trivialromanen) noch nicht wesentlich hinausgelangt. 27 Die textwissenschaftliche Narrativik 28 hat Kategorien für die Erfassung »formaler« Superstrukturen, für die Beschreibung narrativer Schemata sog. »natürlicher Texte« entwickelt, aus denen sie sich komplexere Texte über »ziemlich komplizierte Transformationen« abgeleitet denkt, ohne doch diese Transformationsprozesse schon beschreiben zu 24 APEL 1976, B d . l , 21; vgl. dazu hier Kap. III.A. 25 V. Propp, Morphologie des Märchens (1928), Frankfurt 1975; C. Lévi-Strauss, Strukturale Anthropologie (1958), Frankfurt 1975. 26 Vgl. ihre Grundansätze bei BREMOND 1964; 1966; 1970; 1973; GREIMAS 1970; 1972; TODOROV 1 9 6 7 ; 1 9 7 3 .
27 Vgl. Kap. III.A. 28 Vgl. VAN DUK 1972; 1980.
XX
Einleitung
können. 29 Von ihrem Arbeitsziel, der Formulierung einer universalen »Grammatik« des Erzählens bzw. der Textbildung überhaupt, sind beide Ansätze also noch deutlich entfernt. Mit ihren Rekursen auf Modelle der Erzählgrammatik und Textwissenschaft steht die Filmsemiotik also vor demselben Problem wie bei dem gar nicht erst ernsthaft in Angriff genommenen Versuch, die im filmischen Diskurs aktivierten Zeichensysteme semiotisch zu untersuchen: An eine gegenstandsspezifische, geschweige denn historische Filmforschung ist unter diesen Voraussetzungen auf längere Sicht nicht zu denken. Vielmehr müßte Filmwissenschaft sich vorerst einer allgemeinen texttheoretischen Forschung verschreiben, nämlich an der Entwicklung einer kohärenten Textgrammatik mitarbeiten, die die Voraussetzung für eine textgrammatische Analyse konkreter Filme ist: Solange sie nicht zur Verfügung steht, bleiben die Filme Erkundungs- und Illustrationsmaterial der theoretischen Selbstvergewisserung. In dieser Perspektive erscheinen die Bemühungen der Filmsemiotik, Theorien und Methoden der Filmwissenschaft aus der Anlehnung an gegenstandsunspezifische Metatheorien zu gewinnen, als Versuche, den zweiten Schritt vor dem ersten zu tun, nämlich der Auseinandersetzung mit dem Spezifikum ihres Gegenstands, mit den immanenten Strukturen des filmischen Diskurses aus dem Wege zu gehen. Solange aber kein fundiertes Instrumentarium für die Analyse des filmischen Diskurses zur Verfügung steht, wird die praktische, an konkreten Filmen interessierte Forschung, die filmhistorische Forschung zumal, weiter stagnieren. Für diese praktische, filmhistorische Forschung geht es demnach immer noch um sehr elementare Fragen: Nach wie vor hat die Disziplin noch keine schlüssige Antwort auf die erste und einfachste Frage, die jede Disziplin beantworten können muß, auf die Frage nach ihrem Gegenstand und nach ihren Methoden. Wenn das aber so ist, dann muß sie ihre Orientierung an gegenstandsunspezifischen Metatheorien wohl doch zumindest vorübergehend - aufgeben und vorerst ihr eigenes Feld bestellen, nämlich eine Theorie ihres Gegenstandes entwickeln und daraus Methoden ableiten, die die praktische, an konkreten Filmen und Filmgeschichte interessierte Forschung in die Lage versetzen, ihre Arbeit in überprüfbaren Filmanalysen zu verankern. Für den hier zu entwickelnden Entwurf einer historisch-hermeneutischen Theorie des Films hat das zur Folge, daß dabei auf elementarster Ebene angesetzt werden muß, was nicht nur mit der allgemeinen, noch immer von propädeutischen Problemen geprägten Situation der Filmwissenschaft, sondern auch mit deren theoretischer Distanz zu hermeneutischen Ansätzen zu tun hat: 29 VAN DDK 1980, 140.
Einleitung
xxi
Wo hermeneutische Reflexionen keine Tradition haben, gibt es auch keinen hermeneutischen Gegenstandsbegriff. Ein erklärtermaßen hermeneutisch konzipierter Modellentwurf der Filmanalyse wird sich folglich zuerst seines Gegenstands zu vergewissern haben. Das wird hier in Auseinandersetzung mit dem alten Theorem der »Filmsprache« und seiner semiotischen Reformulierung durch Eco geschehen, deren kritische Sichtung zu dem Ergebnis führen wird, daß die Sprache der Bilder eine vorbegriffliche ist, die deshalb einem zeichentheoretischen Zugriff, der seine Theorie an der Struktur der Verbalsprache ausgebildet hat, notwendig entzogen bleiben muß. Diese Einsicht wird den Ausgangspunkt liefern für eine Bestimmung der Bildersprache als einer Sprache, deren kommunikative Potenz auf der Subjekt-Objekt-Struktur von Bildern beruht. Diese Bestimmung eröffnet dann die Möglichkeit, Bilder als Sprechakte, deren verzeitlichte Variante, den kinematographischen Sprechakt, als narrativen Sprechakt und Filme schließlich als narrative Texte zu bestimmen (Kap. I). Diese grundsätzliche theoretische Explikation des Gegenstandes liefert nicht nur das Fundament für alle nachfolgenden Kapitel, in denen die wichtigsten Verfahren filmischer Informationsvergabe nacheinander einer analysetheoretischen Klärung unterzogen werden (Kap. II-VII), sondern sie liefert auch eine Legitimation für den Umstand, daß hier eine Literaturwissenschaftlerin, die etwas von Sprache, wenig aber von Bildern versteht, über Bilder zu reden sich anheischig macht, ein Umstand, der problematisch bleibt auch dann, wenn sie sich den fremden Gegenstand vertraut macht, indem sie ihn im Rekurs auf den komfortablerweise erweiterten Textbegriff der Literaturwissenschaft als Text definiert: Die theoretische Explikation kann das Argument, das sie zu ihrer Rechtfertigung vorzubringen hat und das besagt, daß sich die Etablierung der Filmwissenschaft als eigenständiger Disziplin im Kanon der kulturwissenschaftlichen Disziplinen nur in einem allmählichen Herauswachsen aus diesen Disziplinen vollziehen kann und wird, konkretisieren, kann nämlich zeigen, daß die Filmanalyse für einen erheblichen Teil der filmischen Informationsvergabe auf das methodische Instrumentarium der literaturwissenschaftlichen Textanalyse zurückgreifen kann, sofern sie es den veränderten medialen Bedingungen entsprechend reformuliert. Das heißt: Sie kann zeigen, daß und warum die Literaturwissenschaft keine selbstangemaßte, sondern eine legitime Taufpatin der Filmwissenschaft ist, wird allerdings auch zeigen, wo eine aus literaturwissenschaftlicher Perspektive betriebene Filmwissenschaft an Grenzen stößt, die darauf hindeuten, daß die Filmwissenschaft weiterer Paten bedarf, bevor sie als eigenständige Disziplin aus der Taufe gehoben werden kann.
xxii
Einleitung
Diese Arbeit hat - gemeinsam mit der eingangs erwähnten filmhistorischen Untersuchung - der Philosophischen Fakultät der Christian-Albrechts-Universität Kiel im Wintersemester 1990/91 als Habilitationsschrift vorgelegen. Ihre Entstehung wurde gefördert durch ein Habilitandenstipendium, für das ich der Deutschen Forschungsgemeinschaft sehr zu Dank verbunden bin.
Kapitel I Filmtheoretische Voraussetzungen: Film als Rede
A. Bild und Sprache »Wie viele Schriftsteller vor mir schon mögen die Untauglichkeit der Sprache beseufzt haben, Sichtbarkeit zu erreichen, ein wirklich genaues Bild des Individuellen hervorzubringen/« (Serenas Zeitblom) Die Frage, ob der Film eine »Sprache« sei, ob er eine der Wortsprache vergleichbare Struktur habe, ist fast so alt wie die Filmtheorie selbst. Von den frühen Theoretikern des Kinos, den russischen Formalisten vor allem, 1 bis zu den Vertretern der modernen Semiotik reicht ein Diskussionszusammenhang, der unter sich wandelnden sprachtheoretischen Prämissen stets auf dieselbe Grundfrage nach dem Sprachcharakter des Films abzielte. 2 Die Einsicht, daß eine Abfolge beweglicher Bilder offenkundig eine Art Rede darstellt, die verstanden wird, daß mit einer solchen Bildabfolge - und zunächst, im Stummfilm, sogar ohne wesentliche Zuhilfenahme der Verbalsprache - Geschichten erzählt werden können und verstanden werden, legte die Annahme nahe, daß es sich hier um ein der Sprache ähnliches Zeichensystem handeln müsse. Einer theoretischen Begründung dieser Annahme standen und stehen nun aber aus der Sicht einer entschieden linguistisch geprägten Zeichentheorie - vor allem zwei Argumente entgegen: Zum einen geht filmischen Zeichen offensichtlich die Arbitrarität ab, die die an de Saussure anknüpfende Sprachwissenschaft als definitorisches Merkmal eines sprachlichen Zeichens betrachtet. Die photographischen Abbilder von Wirklichkeit sind zweifellos motivierte Zeichen, weshalb man zu dem Schluß kam, daß beim Bild - also auch beim Film - »Signifikat und Signifikant quasi-tautologisch sind«, daß die Zeichen hier nicht »aus einer institutionellen Reserve geschöpft« werden und folglich nicht kodifizierbar sind. 3 Zum anderen und vor allem schien filmischen Zei1
Vgl. die Zusammenstellung filmtheoretischer Texte russischer Formalisten bei BEILEN-
2
HOFF 1974. Vgl. u . a . COHEN-SEAT 1962, 7 7 f f . ; MORIN 1958, 193ff.; BARTHES 1969; WOLLEN 1969,
116ff. und vor allem die Arbeiten von METZ (1964, 1966c, 1966/67, 1973) und ECO 1972. 3 BARTHES 1969, 161. Um eine photographische (oder allgemein bildliche) Nachricht zu verstehen, so meinte Roland Barthes, aktivieren wir keine Kodes, sondern »nur das von
2
Kapitel I: Film als Rede
chen gerade das zu fehlen, was in der Zeichentheorie lange Zeit als conditio sine qua non jedes Zeichensystems galt, die doppelte Gliederung:4 Das analogische, »quasi-tautologische« Filmbild schien unmöglich in distinkte Einheiten zerlegbar, die den Phonemen (Figuren) und Morphemen (Zeichen) der Wortsprache vergleichbar wären. 5 Christian Metz kam deshalb zu einem ähnlichen Schluß wie Roland Barthes mit Bezug auf die Photographie, nämlich daß es sich beim Film um eine »langage ohne langue*6 bzw. um eine »reiche Nachricht mit armem Kode« handeln müsse.7 Er fundierte daher den Sprachcharakter des Films in der Narrativität des Kinos, in der »Syntax« des Films8 und konstruierte damit einen kategorialen Gegensatz zwischen der Photographie und dem (aus Photographien bestehenden) Film, indem er das Einzelbild (die Photographie, das einzelne Photogramm des Filmstreifens und ebenso die filmische Einstellung) als Kombination nicht-konventioneller, nicht kodifizierbarer Zeichen bestimmte und erst die Anordnung mehrerer Bilder (Einstellungen) als einen auf Konvention, auf einem Regelsystem beruhenden Akt anerkennen wollte.9 Umberto Ecos Entwurf einer Theorie der visuellen Kommunikation10 schien dann aber doch Argumente für die Regelhaftigkeit und Konventionalität visueller Zeichen zu liefern und damit dem Basisaxiom der Filmsemiotik, der Annahme einer sprachanalogen Organisation der »Filmsprache«, endlich eine Begründung zu verschaffen. Daß die fundamentalen Probleme dieses Theorieentwurfs (vgl. Kap.I.A) nicht wahrgenommen und die schwierige Frage nach dem semiotischen Status ikonischer Zeichen seither nicht mehr gestellt wurde, mag mit diesem Begründungsbedarf zu tun haben. Denn auf diese Weise ließ (und läßt) sich die grundlegende Legitimationsfunktion, die Ecos Modell für die Filmsemiotik, auch und gerade für ihre neuerdings stärker den »grammatischen« Systemen des Films zugewandten Fragen (vgl. S. xviif.) explizit oder (häufiger) implizit übernommen hat, ebenso aufrechterhalten wie die Tradition logozentrischen Denkens überhaupt, die nach wie vor dafür sorgt, daß die Identifikation sprachanaloger Strukturen von Filmbildern immer noch deutlichen Vorrang hat vor der überfalligen Aufgabe, das,
unserer Wahrnehmung gelieferte Wissen« (ebd.); Barthes spricht deshalb auch von einer »Nachricht ohne Code« (ebd.). - Vergleichbare Feststellungen treffen COHEN-SEAT 1962, 8 6 , 9 4 f . u . p a s s . ; METZ 1964, 108f. u . p a s s . ; WOLLEN 1969, 120, 124.
*
Zur Kritik am »Mythos der doppelten Gliederung« vgl. ECO 1972, 231-235 u. pass.
5
V g l . METZ 1964, bes. 9 0 - 1 0 4 .
6 Ebd. 68ff. (Hervorhebung im Text). ι Ebd. 101. 8 »Von einem Bild zu zweien überzugehen bedeutet: vom Bild zur Sprache | langage] zu kommen« (METZ 1964, 72); vgl. auch METZ 1973, 175 u. pass. 9 V g l . METZ 1966c, bes. 138f. 10 V g l . ECO 1972, 197-292.
Kapitel I: Film als Rede
3
was der Film im Vergleich zur Sprache nicht ist,11 theoretisch präzise und positiv zu bestimmen.12 Es ist deshalb wohl doch noch nicht »überholt«,13 abermals nach dem Verhältnis von Wortsprache und »Bildersprache« zu fragen und die Differenzen zwischen beiden - auf einer sehr fundamentalen Ebene in Erinnerung zu bringen.
1.
Bilder und Begriffe: Über Ecos Theorie der ikonischen Kodes
Seit Metz - und von Eco bestätigt - hat man sich angewöhnt zu sagen, die filmische Einstellung entspreche nicht etwa einem Wort, sondern einer Aussage:14 Die Großaufnahme eines Revolvers, so hatte Metz schon 1964 betont, entspreche nicht einfach dem Wort »Revolver«, sondern immer schon einer Aussage, etwa dem Satz: »Hier ist ein Revolver«.15 Allerdings meldete er dabei zugleich vage Zweifel an dieser Äquivalenz an, wollte sie als nur »grobe Äquivalenz«16 und nur äußerliche Entsprechung17 verstanden wissen, um den Begriff »Äquivalenz« später dann ganz fallen zu lassen:18 Ein Bild, das einen Mann zeige, der auf einer Straße gehe, entspreche zwar irgendwie dem Satz »Ein Mann geht auf der Straße«, aber dennoch entspreche das Bild ja nicht den einzelnen Wörtern »'Mann' oder 'geht' oder 'Straße' und noch viel weniger dem Artikel 'der' oder dem Null-Morphem des Verbs 'geht'.« 19 Warum das so ist, fragte Metz allerdings nicht. Tatsächlich berührte er damit die entscheidende Differenz zwischen Sprache und »Bildersprache«, den Umstand nämlich, daß - wie noch gezeigt wird (Kap. I.A.2) - ikonische Zeichen im Normalfall - im genauen Gegensatz zu sprachlichen Zeichen - keine klassifi11 METZ 1 9 6 4 , 9 0 .
12 Daß die Filmsemiotik damit ihren Gegenstand zum Verschwinden zu bringen nicht geringe Gefahr läuft, liegt auf der Hand. Vgl. etwa SPRINGER 1987, der die »Satz-für-Satz-Analyse« zum Modell einer filmischen Diskursanalyse erheben möchte (170ff.), die nicht etwa den Film, sondern das Filmprotokoll zum »Ausgangspunkt der Untersuchung« macht und davon ausgeht, daß damit - weil es sich dabei ja »wieder um einen sprachlichen Text handelt« - die herkömmliche »Beschränkung in der Entwicklung der Diskursanalyse auf natürlichsprachliche Sätze im Nachhinein gerechtfertigt« sei (171), - ein sprechendes Beispiel dafür, wie sich die Filmsemiotik zuletzt um ihren Gegenstand bringt, indem sie ihn auf sprachliche Derivate reduziert. 13 V g l . METZ 1 9 7 3 , 3 1 2 .
14 Vgl. METZ 1964, 97; 1966/67, 161; Eco bestimmt Bilder ausdrücklich als »ikonische Aussagen (Seme)« (vgl. ECO 1972, 236f., 242-249). 15 METZ 1 9 6 4 , 9 8 .
16 Ebd. 97. Π Ebd. 96, Anm. 79. 18 METZ 1 9 6 6 / 6 7 , 161. 19 METZ 1 9 6 4 , 9 7 .
4
Kapitel I: Film als Rede
kalorischen Zeichen sind, daß Bilder deshalb keine prädikative Struktur und folglich auch keine der verbalsprachlichen Syntax entsprechende Organisation ihrer Zeichen haben, und das heißt: daß Bilder im Normalfall keine »Aussagen« darstellen, zumindest nicht im linguistischen und prädikatenlogischen Sinne. Ecos Theorie der ikonischen Kodes besagt das genaue Gegenteil. Ausgangspunkt seiner Überlegungen ist die Auseinandersetzung mit Definitionen des ikonischen Zeichens von Peirce und Morris,20 denen zufolge ikonische Kommunikation auf Ähnlichkeitsbeziehungen zwischen den ikonischen Zeichen und ihren Referenten (Denotaten) beruht, die den ikonischen Zeichen den Status motivierter Zeichen geben und den ikonischen Kode als analogischen Kode ausweisen. Eco, geleitet von dem Interesse, ikonische Zeichen als arbiträre Zeichen und den ikonischen Kode als digitalen zu bestimmen (und also mit dem Sprachkode analog zu setzen), bestreitet jegliche Ähnlichkeit zwischen Zeichen und Referenten, zwischen dem Bild von einer Sache und dieser Sache selbst, läßt Ähnlichkeit allenfalls zu zwischen dem Bild von einer Sache und unserem mentalen »Wahrnehmungsmodell« von dieser Sache: Ausgehend von der Annahme, daß wir uns von den visuellen Phänomenen der wirklichen Welt Wahrnehmungsmodelle angefertigt haben, ideale 'Muster' der Dinge oder visuellen Sachverhalte, aufgrund deren wir diese Dinge oder Sachverhalte in der Realität erkennen und wiedererkennen oder erinnern, bestimmt er Bilder als Kommunikate, die diesen Wahrnehmungsmodellen homologe Modelle von »Beziehungen (unter graphischen Phänomenen)« produzieren, so daß wir aufgrund derselben kodischen Voraussetzungen, die auch unsere Wahrnehmung der wirklichen Welt ermöglichen, in der Lage sind, Bilder zu entziffern.21 Die Ähnlichkeit ikonischer Zeichen mit ihren 'außersprachlichen' Denotaten ist demnach eine nur vermeintliche, betrifft vielmehr das Verhältnis der Zeichen zu dem (über Wahrnehmungs- und Erkennungskodes organisierten) »Modell der Wahrnehmungsbeziehungen (...), das wir beim Erkennen und Erinnern des Gegenstandes konstruieren«,22 also das Ver20 Charles S. Peirce: Collected Papers, Bd. 1-6, hg. ν. Ch. Hartshorne u. P. Weiss, Cambridge/Mass. 1931-35 (v.a. Bd. 2, §§ 247, 276, 299); Charles Morris: Signs, Language and Behavior, New York 1946. 21 »Das ikonische Zeichen konstruiert (...) ein Modell von Beziehungen (unter graphischen Phänomenen), das dem Modell der Wahrnehmungsbeziehungen homolog ist, das wir beim Erkennen und Erinnern des Gegenstandes konstruieren. Wenn das ikonische Zeichen mit irgendetwas Eigenschaften gemeinsam hat, dann nicht mit dem Gegenstand, sondern mit dem Wahmehmungsmodell des Gegenstandes. Es ist konstruierbar und erkennbar auf Grund derselben geistigen Operationen, die wir vollziehen, um das Perzept zu konstruieren, unabhängig von der Materie, in der sich diese Beziehungen verwirklichen. « (ECO 1972, 213). 22 Ebd.
Kapitel l: ñlm als Rede
5
hältnis des Bildes eines Gegenstandes zu unserer - mit Saussure zu reden Vorstellung von diesem Gegenstand. Dies ist das Basistheorem von Ecos Theorie ikonischer Kodes, auf dem dann seine Generalthese aufbaut, wonach ikonische Kodes dieselbe doppelte Gliederung aufweisen wie der Sprachkode.23 Dieses Basistheorem beseitigt nun zwar - mit dem berechtigten Hinweis auf die Differenz zwischen der visuellen Wirklichkeit »an sich« und unseren visuellen Perzepten von ihr - das den analogischen Definitionen inhärente 'ontologische' Problem,24 schränkt aber zugleich seinen Geltungsbereich und damit seinen Erklärungswert drastisch ein: Abgesehen davon, daß es seine These von der Arbitrarität ikonischer Zeichen nicht begründen kann, sondern vielmehr und sogar, wie gleich gezeigt wird, das Gegenteil besagt, kann es nämlich nur erklären, aufgrund welcher Voraussetzungen wir einen ikonisch dargestellten Gegenstand oder Sachverhalt versprachlichen können. D.h. es bietet eine plausible Erklärung dafür an, warum wir einen abgebildeten Gegenstand einer der uns geläufigen Klassen von Dingen zuordnen und mit dem im Lexikon dafür vorgesehenen Begriff bezeichnen können, warum also beispielsweise jedermann das Photo meiner Katze »Minka« als das Photo einer Katze identifizieren, d.h. das Abgebildete als Katze klassifizieren und ihm den Begriff »Katze« zuordnen kann: Das Photo reproduziert offenbar (unter anderem) Merkmale, die wir - zusammen mit dem Wort »Katze« - als die klassentypischen Merkmale von Katzen gespeichert haben, produziert also graphische Phänomene, die unserem Wahrnehmungsmodell »Katze« homolog sind, und evoziert damit dann das Wort »Katze«. Das aber heißt: Was Eco »Wahrnehmungsmodelle« nennt und was ikonische Zeichen seiner Theorie zufolge »homolog« - in Gestalt graphischer Phänomene - reproduzieren, sind (was ihm selbst entgeht) nichts anderes als die Signifikate sprachlicher Signifikanten, nichts anderes als jene mehr oder weniger idealen Modelle, 'Vorstellungen', 'concepts', die wir uns von den Dingen angefertigt haben, um sie jederzeit erkennen und benennen zu können. Das heißt dann aber auch und zugleich, daß ikonischer Signifikant und ikonisches Signifikat 'homolog' strukturiert sind, denn wenn der ikonische Signifikant deshalb für uns »erkennbar«, also dekodierbar ist, weil er unseren Wahrnehmungsmodellen 'homologe' Strukturen graphisch reproduziert, dann ist das, was wir da 'erkennen', sein 23 Vgl. ebd. 214-249, v.a. 242-249; für den kinematographiscben Kode setzt Eco eine dreifache (um den Bewegungsfaktor erweiterte) Gliederung an (vgl. ebd. 250-262). 24 Die Annahme einer Ähnlichkeit zwischen dem ikonischen Zeichen und dem von ihm referierten 'wirklichen' Gegenstand ignoriert die Differenz zwischen diesem 'wirklichen' Gegenstand und unserem visuellen Perzept von ihm und impliziert damit eine Ontologisierung sowohl unserer visuellen Perzepte als auch der ikonischen Zeichen.
6
Kapitel I: Film als Rede
Signifikat, nichts anderes als dieses mentale Wahrnehmungsmodell selbst, nichts anderes als jene ideale 'Vorstellung' vom Gegenstand.25 Folglich unterscheiden sich ikonischer Signifikant und ikonisches Signifikat nur dadurch, daß jener graphisch materialisiert, was dieses als mentale 'Vorstellung' ist. Damit aber ist der Versuch, die Arbitrarität des ikonischen Zeichens nachzuweisen, fehlgeschlagen, denn mit diesem Basistheorem beweist Eco exakt das Gegenteil von dem, was er beweisen wollte: Indem er die von den analogischen Definitionen angenommene Ähnlichkeit zwischen Zeichen und Referenten sinnvollerweise (wenn auch ohne es recht zu bemerken)26 durch eine Ähnlichkeit ('Homologie') zwischen Signifikanten und Signifikaten ersetzt, stellt er genau die Bedingung her, die der linguistische Begriff des motivierten Zeichen einfordert: die durch Ähnlichkeit begründete Motiviertheit des ikonischen Signifikanten durch sein Signifikat. Die These einer 'Homologie' ikonischer Signifikanten und sprachlicher Signifikate, die die Identifikation ikonischer und sprachlicher Signifikate nach sich zieht, widerlegt nun nicht nur die These von der Arbitrarität ikonischer Zeichen, sondern schränkt auch und vor allem den Geltungsbereich dieser Theorie des ikonischen Zeichens ein dadurch, daß sie das ikonische Zeichen auf seine mit dem sprachlichen Zeichen kompatiblen Elemente reduziert. Eben deshalb kann sie zwar erklären, warum wir einen (wirklichen oder abgebildeten) Gegenstand der sichtbaren Welt erkennen und auf den Begriff bringen können, nicht aber, warum wir außerdem und zugleich auch alle diejenigen Merkmale dieses Gegenstands erkennen und wiedererkennen können, die über diesen Begriff hinausgehen, d.h. die über seine klassenspezifischen Merkmale hinausgehende, einmalige Merkmale, nämlich seine individuellen Merkmale sind, warum also jedermann das Photo meiner Katze »Minka« nicht nur als das Photo einer Katze, sondern darüber hinaus und zugleich auch als das Photo einer ganz bestimmten Katze, »Minka« eben, also auch alle die Merkmale erkennen und wiedererkennen kann, die dieser ganz bestimmten Katze als ihre individuellen Merkmale eigen sind (z.B. ihre meergrünen Augen, ihr graues, nur schwach getigertes Fell, der dunkle Fleck auf der Stirn 25 Wenn wir ein gezeichnetes Zebra als »Zebra« erkennen, weil dieses gezeichnete Zebra Strukturen aufweist, die unserem mentalen Wahrnehmungsmodell von einem Zebra homolog sind, dann ist das, was uns dieses Erkennen ermöglicht, der ikonische Signifikant, genau dasselbe wie das, was wir als sein Signifikat erkennen: ein (ideales) Zebra, die 'Vorstellung' eines Zebras. 26 Eco entgeht offenkundig sowohl der Umstand, daß seine »Wahrnehmungsmodelle« nichts anderes sind als Signifikate sprachlicher Zeichen, als auch der Umstand, daB seine These, wonach ikonische Signifikanten diesen Wahrnehmungsmodellen homologe graphische Modelle produzieren, zugleich die Identifikation ikonischer und sprachlicher Signifikate erzwingt.
Kapitel I: Film als Rede
7
usw.). Und das wiederum heißt: Ecos Theorie des ikonischen Zeichens kann genau das nicht erklären, um dessentwillen ich dieses Photo gemacht habe und anderen zeige, will sagen, sie kann genau das nicht erklären, um dessentwillen wir auf ikonischem Wege kommunizieren. Denn Bilder fertigen wir in der Regel nicht an, um mit ihnen ikonische Replikate sprachlicher Begriffe herzustellen, d.h. um mit ihnen Klassen von Sachverhalten zu bezeichnen, sondern wir kommunizieren miteinander ikonisch allererst dort, wo es darum geht, die individuellen, einmaligen visuellen Merkmale eines Gegenstandes zu vermitteln, nicht zuletzt gerade dort, wo das »unbeholfen sich annähernde Wort« versagt, nicht fähig ist, »ein wirklich genaues Bild des Individuellen hervorzubringen«, wie Serenus Zeitblom angesichts der Schwierigkeit klagte, »dem, der nicht sah«, dem Leser, die anmutige Erscheinung des kleinen Nepomuk Schneidewein vor Augen zu führen. 27 Das heißt wohlgemerkt nicht, daß Bilder nicht in der Lage sind, Allgemeines zu bezeichnen, wohl aber, daß sie dafür auf Zeichen angewiesen sind, die zunächst und von Hause aus nur Individuelles bezeichnen können, weil sie nicht-klassifikatorischer Natur sind (weshalb es hier auch, sobald ein Allgemeines bezeichnet werden soll, ziemlich komplizierter Operationen oder aber konventionalisierter Verabredungen bedarf)· 28 Daß Eco diese für die Differenz von sprachlicher und ikonischer Kommunikation zentrale Fähigkeit ikonischer Zeichen, das Besondere, Individuelle zu bezeichnen, nicht wahrnimmt, vielmehr und sogar überzeugt ist, daß ikonische Zeichen »eher das Universelle als das Besondere bezeichne(n)«,29 dokumentiert die radikal logozentrische Sicht, die hier den Blick auf die Welt der Bilder beherrscht. Sie motiviert die eben beschriebene Reduktion des ikonischen Zeichens auf seine mit sprachlichen Zeichen kompatiblen Elemente und hat zur Folge, daß die potentiell unendliche Vielfalt ikonischer Erscheinungen hier nicht als die Mannigfaltigkeit des Individuellen, nicht als Konsequenz der nicht-klassifikatorischen Struktur ikonischer Zeichen erkannt wird, sondern stattdessen auf die Bildproduzenten, nämlich auf die je »persönlichein) Stile eines Autors« (Malers, Graphikers, Photographen etc.)30 zurückgeführt und wechselnd als fakultative Varianten, suprasegmentale Züge oder ikonische »Idiolekte« angesprochen wird.31
27 Thomas Mann: Doktor Faustus, Frankfurt 1960 (Gesammelte Werke in 13 Bänden, Bd.6), 612. 28 Vgl. Kap. I.A.2 und Kap. VII. 29 ECO 1972, 213. 30 Ebd. 245. 31 Vgl. ebd. 217-220, 244f.; zur Identifikation von »Stil« und »Idiolekt« vgl. ebd. 245.
8
Kapitel I: Film als Rede
Nötig wird diese Reduktion ausgerechnet des Spezifikums ikonischer Kommunikation zu bloßen Aspekten der fakultativen, suprasegmentalen oder idiolektischen Varianz von Zeichen, weil sich nur so die These von der doppelten Gliederung der ikonischen Kodes aufrechterhalten läflt.32 Sie steht ihrerseits ganz im Zeichen des von der Wortsprache determinierten Blicks auf die Bildersprache, denn die Einheiten, die dabei als quasi-morphematische (kleinste 'bedeutungstragende') Einheiten (»Zeichen«) ausgegliedert werden, sind allemal identisch mit Einheiten, für die die Sprache Wörter hat, während die sie konstituierenden Linien und Flächen, für die es keine (gegenstandsbezogenen) Wörter gibt, als quasi-phonematische (kleinste 'bedeutungsdifferenzierende') Einheiten (»Figuren«) klassifiziert werden: Letztere, die Elemente der zweiten Gliederung, bestimmt Eco als »Wahrnehmungsbedingungen«, die erfüllt sein müssen, damit ein abgebildetes Ding überhaupt erkannt werden kann. Es handelt sich dabei um die (durch graphische »Übertragungscodes« geregelten)33 künstlichen Entsprechungen der Wahrnehmungskodes (Lichtverhältnisse, Größenrelationen u.a.), die bei der Realitätswahrnehmung aktiviert werden.34 Eco hält den Versuch, ikonische »Figuren« mit Hilfe der klassischen strukturalistischen Verfahren zu katalogisieren, von vornherein für aussichtslos und auch für unnötig, besteht aber darauf, daß aus den praktischen Schwierigkeiten, den Code zu erkennen, nicht abgeleitet werden dürfe, »daß es ihn nicht gibt«.35 Die Wahrnehmungskodes seien ohnehin nicht Angelegenheit der Semiotik, sondern der Wahrnehmungspsychologie,36 und deshalb könne sich die Semiotik der visuellen Kommunikation getrost auf die Einheiten der ersten Gliederung, die den »Morphemen« der Wortsprache entsprechenden »Zeichen«, konzentrieren. Diese bestimmt Eco als die künstlichen Entsprechungen der Erkennungskodes, die bei der Realitätswahrnehmung aktiviert werden:37 Das gestreifte Fell des Zebras ist sein wichtigstes Erkennungsmerkmal, das es zugleich von einem Maultier zu unterscheiden erlaubt. Erkennungskodes sind dasselbe wie das, was Eco sonst »Wahrnehmungsmodell« nennt: Sie sind auf Seiten des visuellen 'Materials', des realen Gegenstands oder seines Abbildes 32 Vgl. ebd. 214-230; 236-249. 33 Vgl. ebd. 246. 34 Vgl. ebd. - So würde z.B. die Kameraaufhahme einer Felswand aus größtmöglicher Nähe gegen diesen Kode verstoßen, weil sie Bildstrukturen erzeugen würde, die das Aufnahmeobjekt nicht mehr erkennen ließen (vgl. die »Rätselbilder« in Illustrierten). 35 Ebd. 247. - Vielmehr, so Eco, genüge es, »wenn man sagt, daß der ¡konische Code auf der Ebene der Figuren Größen als relevante Züge wählt, die einen analytischeren Code, den Wahrnehmungscode, betreffen« (ebd. 244; vgl. seine Ausführungen über »analytische und synthetische Codes«, 240-242). 36 Ebd. 246. 37 Ebd.
Kapitel I: Film als Rede
9
das, was auf Seiten seiner mentalen Repräsentation das »Wahrnehmungsmodell« von ihm ist, nämlich ein Ensemble signifikanter, d.i. klassifikatorischer Merkmale, die das »Wahrnehmungsmodell« zusammen mit dem dazugehörigen 'Namen' aufbewahrt. Eco faßt diese künstlich reproduzierten Erkennungskodes als »Erkenntniseinheiten (Nase, Ohr, Himmel, Wolke) oder 'abstrakte Modelle', Symbole, Begriffsdiagramme des Gegenstandes (die Sonne als Kreis mit fadenförmigen Strahlen)« auf, 38 also als Einheiten, die den Einheiten des Wörterbuchs, allererst den Nomina, entsprechen. Diese faktische Gleichsetzung ikonischer Zeichen und sprachlicher Nomina ist die praktische Konsequenz seiner Definition des ikonischen Zeichens (s.o.). Daß auch die Segmentierung der »Zeichen« erhebliche Schwierigkeiten machen kann, weil »sie sich als nicht-diskret in einem graphischen Kontinuum darstellen«,39 erkennt Eco an, sieht dieses Problem aber dadurch entschärft, daß die »Erkennbarkeit« der »Zeichen« doch meistens durch den Bildkontext gewährleistet sei, sich »auf der Ebene der Kontext-Code-Aussage«, also im Zuge der Wahrnehmung des Gesamtbildes, einstelle, und kommt deshalb zu dem Schluß, daß »die Katalogisierung der figurativen Bilder als codifizierter auf der Ebene der Aussageeinheiten geschehen (muß)« und daß diese Ebene »ausreichend für eine Semiotik der visuellen Kommunikation« sei.40 Das heißt erstens: Das Segmentierungsproblem, das ikonische Zeichen aufwerfen und das Eco an anderer Stelle zutreffend in dem Umstand gesehen hat, daß ikonische Zeichen »keinen Oppositions- und Stellenwert haben, weil sie nicht durch die Tatsache, daß sie erscheinen oder nicht erscheinen, bedeuten«,41 wird hier im Rekurs auf Segmentierungseinheiten eines anderen Zeichensystems, der Sprache, zu lösen versucht, indem die mit Wörtern (Nomina) benennbaren Teile des Bildes als ikonische Zeichen und damit als Segmentierungseinheiten gesetzt und klassifiziert ('katalogisiert') werden.42 Dabei avanciert zweitens der Bildkontext, die »ikonische Aussage« (s.u.), zu einer maßgeblichen Rekursinstanz, an die bestimmte Kohärenzerwartungen gestellt werden, die sich aus Erfahrungssätzen der alltäglichen visuellen RealitätsWahrnehmung speisen. Ob diese Semiotik damit nicht unter der Hand und unfreiwillig zu einer her-
3« Ebd. 247. 39 Ebd. 40 Ebd. 245. - Der Begriff »figurative Bilder« wird (ebenso wie das {Compositum »KontextCode-Aussage«) nicht expliziert. Anscheinend soll er soviel besagen wie »realistische Bilder«, also Bilder, die die Welt des Sichtbaren abbilden. 41 Ebd. 217. 42 Hier wird, wie NÖTH feststellt, »die Struktur verbaler Bildparaphrasen zum Kriterium der Bildsegmentierung genommen« (NÖTH 1985, 415).
10
Kapitel 1: Film als Rede
meneutisch fundierten Disziplin mutiert, scheint mir keine unberechtigte Frage zu sein. 43 Die faktische Gleichsetzung ikonischer Zeichen mit sprachlichen Nomina ist der Ausgangspunkt für die Entwicklung des Theorems der ikonischen Aussage. Es vollendet den sprachanalogischen Theorieentwurf folgerichtig, bestimmt nämlich Bilder schließlich als komplexe 'Bildsätze', als Aussagen, und erkennt ihnen damit eine prädikative Struktur zu: Ikonische Aussagen »sind uns gewöhnlich unter dem Namen 'Bilder' (...) bekannt (ein Mann, ein Pferd usw.). Sie stellen in Wirklichkeit eine komplexe ikonische Aussage dar (vom Typ: 'dies ist ein stehendes Pferd im Profil' oder auch: 'hier ist ein Pferd').« 44 Daß der Begriff »Aussage« nicht als linguistische Metapher gemeint ist, sondern als Begriff, der eigentlich »Satz« (Aussagesatz) meint, nämlich eine durch syntagmatische Kombinationsregeln gesteuerte Organisation ikonischer Zeichen postuliert, wird mehr implizit, denn explizit deutlich. 45 Und wenn es dann heißt, daß die ikonische Aussage selbst wiederum »ein Idiolekt« sei und »für sich eine Art Code« bilde, der »seinen analytischen Elementen Bedeutung verleiht«, 46 dann wird erkennbar, daß hier eine der sprachlichen Syntax analoge »Bildsyntax« postuliert wird, eine »Bildsyntax« allerdings, die, weil es in der Bilderwelt nur »Idiolekte« gibt (s.o.), zugleich auch das »System« darstellen soll, das die Zeichen überhaupt erst zu Zeichen macht (ihnen »Bedeutung verleiht«), indem sie sie in Relationen zueinander setzt, die sie dann zugleich als »Satzglieder« ausweisen sollen. 47 43 Wenn Eco die »Erkennbarkeit der ikonischen Zeichen« auf der Ebene der »Kontext-CodeAussage« gegeben sieht, dann rekurriert er nicht auf Zeichenstrukturen, sondern auf die Kohärenz von (ikonischen) Texten, beruft sich also auf die Geltungsfähigkeit jener (zirkulären) Bewegung vom Besonderen zum Allgemeinen (und vice versa), der sich die Hermeneutik anvertraut. 44 ECO 1972, 247. 45 So etwa an Beispielen wie diesem: »Ich erkenne das Zeichen 'Kopf im Kontext der Aussage 'stehendes Pferd im Profil' nur, wenn es in Opposition steht zu Zeichen wie 'Hufe', 'Schwanz' oder 'Mähne'; sonst würden diese Zeichen als sehr vieldeutige Gestaltungen erscheinen, die nichts ähneln« (ebd. 244). Warum hier von 'Oppositionen' (an anderer Stelle gar von »signifikanten Oppositionen«, ebd. 247) die Rede ist, die ja eigentlich nicht auf die Ebene der syntagmatischen, sondern der paradigmatischen Relationen gehören, bleibt unklar, daß hier aber von syntagmatischen Relationen die Rede ist, nicht. 46 Ebd. 244. 47 Hier entsteht also der Fall einer »Syntax«-Theorie, die die Syntax der »Bildersprache« nicht nur erkennen, sondern sogar schon die Struktur der von ihr organisierten »Bildsätze« - als »Aussagesätze« - definieren zu können meint, obwohl sie die Segmente, deren Relationen diese Syntax regeln soll, nicht als diskrete ikonische Zeichen erkennen, segmentieren und als syntaktische Paradigmen (als ikonische »Wortarten«) klassifizieren kann (weil sie sich »als nicht-diskret im ikonischen Kontinuum darstellen«, ebd. 247) und schon gar nicht die Zeichen, mit denen die Relationen zwischen diesen Einheiten angezeigt werden, die grammatischen Morpheme, identifizieren kann. Wenn sie nun ihr Segmentierungspro-
Kapitel I: Film als Rede
2.
11
Die vor-begriffliche Struktur der Bilderwelt
Die vorstehende Rekapitulation der wichtigsten Thesen der Ecoschen Theorie ikonischer Kodes kommt zu dem Ergebnis, daß diese Theorie eine Erklärung dafür anbietet, warum wir ein reales oder abgebildetes Ding als Vertreter einer bestimmten Klasse von Dingen erkennen und benennen können, warum wir also in der Lage sind, visuelle Informationen zu versprachlichen. Damit ist einiges, aber noch lange nicht, wie Eco glaubt, alles gewonnen. Vielmehr bleibt dieser Theorie gerade entzogen, was das Spezifikum ikonischer Kommunikation und damit zugleich ihre fundamentale Differenz zur sprachlichen Kommunikation ausmacht: Der Wahrnehmungsprozeß, bei dem wir uns vergewissern, daß das Ding, auf das John Wayne sich eben geschwungen hat, ein Pferd und kein Fahrrad ist, liefert nur die erste und primitivste Voraussetzung für die Dekodierung dessen, was das Bild 'sagt'. Denn Bilder haben mehr und anderes zu 'sagen' als bloße Äquivalente sprachlicher Begriffe, und genau in diesem 'Mehr' und 'Anderen' ist das Spezifikum der visuellen Kommunikation anzutreffen, das, was uns dazu bewegt, uns mit Bildern statt mit Wörtern zu verständigen. Es liegt, wie nun im weiteren näher gezeigt werden soll, in dem Umstand begründet, daß ikonischen Zeichen genau das abgeht, was sprachliche Zeichen definiert, die klassifikatorische (begriffliche) Struktur, und, umgekehrt, darin, daß sie aufgrund ihrer nicht-klassifikatorischen (vorbegrifflichen) Struktur die Fähigkeit haben, die, wie Serenus Zeitblom
blem zu lösen hofft, indem sie sich selbst zu ihrer eigenen heuristischen Hilfsgröße erklärt, dann macht sie sich zur Voraussetzung der Erkenntnis ihrer eigenen Voraussetzung. Eco sieht sich zu diesen Annahmen durch sein Konzept »synthetischer Codes« legitimiert, durch die Annahme, daß es (»synthetische«) 'Super-Kodes' gebe, die eine Fülle (»analytischerer«) Sub-Kodes zur Voraussetzung hätten, um die man sich nicht zu kümmern brauche, wenn man sich auf der Ebene des 'Super-Kodes' (hier: der ikonischen Aussage) bewege (ebd. 240-242). Das ist gewiß richtig, nur müBte wohl zuvor bewiesen sein, daß dieser 'Super-Kode' (den Hermeneutiker zunächst einmal schlicht nur »Kontext« nennen würden) im konkreten Fall tatsächlich existiert. Da Eco diesen 'Super-Kode' (Aussagesatz) zur Voraussetzung der Erkenntnis der als »Zeichen« postulierten Wort-Äquivalente macht, deren Kenntnis wiederum die Voraussetzung für die Erkenntnis dieses 'Super-Kodes' wäre, wird eine Behauptung durch eine zweite begründet: Die Behauptung, daß die solchermaßen aufgrund des Kontextes erkennbaren »Zeichen« zugleich auch »Satzglieder« sind, wird durch die Behauptung »begründet«, daß dieser Kontext ein »Aussagesatz« sei. In Wahrheit, so scheint mir, beschreibt diese Argumentation nichts anderes als einen hermeneutischen Zirkel und provoziert damit abermals die Frage, ob hier nicht ein im Prinzip hermeneutisches Verfahren in ein semiotisches umgedeutet wird, indem als Rekonstruktion semiotischer Sachverhalte deklariert wird, was Hermeneutiker die - auf Kohärenz· und Sinnerwartung beruhende - zirkuläre Bewegung zwischen Besonderem und Allgemeinem, zwischen (Text-) Detail und (Text-) Ganzem nennen würden.
12
Kapitel I: Film als Rede
klagte, sprachlichen Zeichen fehlt, die Fähigkeit, »ein wirklich genaues Bild des Individuellen hervorzubringen«. Bilder haben keine Wörter: Die nicht-klassifikatorische Struktur der Bildersprache Wörter sind (mit einigen Ausnahmen) 'Klassennamen' ('Katze'): Sie beruhen auf Abstraktionen, auf jenen Klassifikationsprozessen, mit denen wir uns die Welt geordnet, die so geordneten Dinge mit 'Namen' versehen und uns dabei, soweit es sich um sichtbare Dinge handelt, zugleich modellhafte visuelle 'Vorstellungen' (Ecos »Wahrnehmungsmodelle«) angefertigt haben, um den Klassifikationsprozeß nicht jedesmal neu vollziehen zu müssen. Diese 'Klassenna,men' werden erst im je aktuellen Sprechakt durch die Verwendungssituation oder durch zusätzliche deiktische Zeichen als Bezeichnung eines individuellen Vertreters dieser Klasse expliziert und verstanden ('Sieh die Katze da'). Bilder dagegen verwenden, um in der linguistischen Terminologie zu verbleiben, (mit einigen Ausnahmen) 'Eigennamen' (zeigen eine ganz bestimmte Katze, z.B. »Minka«) und können erst durch bestimmte Verwendungssituationen (z.B. das Bild von »Minka« als Beispiel der Hauskatze in einem zoologischen Lehrbuch) als Bezeichnung einer Klasse von Dingen (z.B. 'Felis domestica') expliziert und verstanden werden. Die Situation ist hier also genau umgekehrt. Die klassifikatorische Struktur sprachlicher Zeichen begründet zugleich die (synchrone) Endlichkeit des sprachlichen Zeichensystems, den Umstand, daß die Wortsprache ein zwar beständig sich wandelndes und daher hochdynamisches, im je synchronen »Schnitt« aber endliches System ist (genauer: ein System mit einer im synchronen Schnitt endlichen und daher als System überhaupt beschreibbaren Menge von Zeichen und Zeichenrelationen). Die nicht-klassifikatorische Struktur ikonischer Zeichen dagegen begründet die Unendlichkeit des ikonischen Zeichensystems, den Umstand, daß die Bildersprache ein 'System' (wenn es denn ein System sein sollte) mit einer unendlichen Menge von Zeichen und Zeichenrelationen ist, weil sie für jedes individuelle Einzelding einen 'Namen' hat. Diese fundamentale Differenz kann erst gesehen werden, wenn die logozentrische Wahrnehmung, die das Nachdenken über Bilder so nachhaltig geprägt hat, aufgegeben wird, was offenbar schwerfallt: Unser von der Sprache zutiefst vorstrukturiertes theoretisches (nicht unser praktisches) Verhalten gegenüber visuellen Phänomenen verstellt immer neu den Zugang zur Identifikation dessen, was wir bei der Wahrnehmung visueller Phänomene - über die bloße Identifikation der Dinge mit ihren Begriffen hinaus - eigentlich tun. Deshalb sollen die eben aufgestellten Behauptungen im weiteren an einem Beispiel begründet werden, und zwar an einem möglichst einfachen und all-
Kapitel l: Film als Rede
13
täglichen Beispiel, bei dem sprachlich und bildlich vermittelte Informationen in Konkurrenz treten, so daß beider Differenz sichtbar wird: Gewählt sei die Situation einer brieflichen Kommunikation, die sich um einen visuellen Sachverhalt dreht, den der Empfänger im Kommunikationsakt (beim Lesen des Briefes) nicht vor Augen hat. Ich stelle mir also beispielsweise vor, daß ich jemandem in einem Brief schreibe, ich hätte mir auf einer Urlaubsreise eine sündhaft teure Vase gekauft, die von ausnehmender Schönheit sei. In diesem Fall wird der Empfänger nur eine sehr globale Vorstellung von meiner Vase haben und deshalb auch keine Vorstellung davon, worin ihre 'ausnehmende Schönheit' besteht, weil das Wort »Vase« nur wenig über Form, Material und Größe dieser bestimmten Vase aussagt: Das Wort »Vase« evoziert im Bewußtsein des Empfangers nur ein »Wahrnehmungsmodell«, das ideale Modell einer Vase, eines Gefäßes, in das man Blumen stellen kann und das deshalb bestimmte Bedingungen erfüllen muß (wasserdichtes Material und ausreichenden Hohlraum für die Aufnahme des Wassers; eine oben befindliche Öffnung, in die die Blumen gestellt werden; eine Größe, die, korrespondierend mit der variablen Größe von Blumen, erheblich variieren kann usw.). Dieses Wahrnehmungsmodell kann das von mir gemeinte außersprachliche Ding, den Referenten meiner Mitteilung, nur äußerst grob erfassen. Wenn mir nun daran liegt, meinem Empfänger eine möglichst genaue Vorstellung von meiner Vase zu vermitteln, dann könnte ich die Vase, ihre Farbe, Form, Größe, ihr Material usw. näher beschreiben, das heißt: Ich könnte versuchen, das ideale Wahrnehmungsmodell des Gegenstandes in ein Vorstellungsbild von diesem individuellen Gegenstand selbst umzuwandeln. Ich könnte beispielsweise sagen, daß die Vase grün sei. Aber der Ausdruck »grün« umfaßt nun auch wieder eine ganze Klasse von Farbtönen, kann also das ganz bestimmte Grün meiner Vase nicht klären. Ich müßte also weitergehen, könnte also etwa sagen, es handele sich um ein jadeartiges Grün, was nun aber gleich neue Mißverständnisse erzeugen kann, weil auch Jade viele Farbabtönungen hat und mein Empfanger vielleicht noch nie Jade oder nur eine bestimmt getönte Jade gesehen hat, usw. usf. Und genauso müßte ich bei der Beschreibung der Form, der Größe und des Materials verfahren, müßte dabei aber immer noch eine Fülle von Unbestimmtheitsstellen und die Gefahr von Mißverständnissen in Kauf nehmen, eben weil ich für meine Beschreibungsversuche immer nur die klassifikatorischen Begriffe der Wortsprache zur Verfügung habe, die jedesmal neue ideale Wahrnehmungsmodelle erzeugen. Deshalb wird sich mein Adressat von dem individuellen Ding eine zwar durch umständliche Beschreibungen vielleicht schon präzisierte, dabei aber doch immer noch ideale, niemals 'wirkliche', vollständige 'Vorstellung' machen können, solange die-
14
Kapitel I: Film als Rede
ses individuelle Ding seiner visuellen Wahrnehmung nicht zugänglich ist. Das heißt: Die Umwandlung des idealen Wahrnehmungsmodells des Gegenstandes in ein Vorstellungsbild von diesem individuellen Gegenstand selbst kann mit sprachlichen Mitteln niemals vollständig gelingen. Erst wenn der Empfänger meine grüne Vase selbst in 'Augenschein' genommen hat, hat er eine präzise Vorstellung von ihr, von ihrem ganz bestimmten Grün, von ihrer ganz bestimmten Form, von ihrer ganz bestimmten Größe usw. Erst die visuelle Wahrnehmung eines Gegenstandes liefert also eine präzise optische Vorstellung von diesem Gegenstand. Und deshalb verzichten wir in der Regel auch darauf, einen visuellen Sachverhalt mit sprachlichen Mitteln so präzise wie nur irgend möglich zu erfassen: Dieser Weg ist uns zu umständlich. Dieses umständliche Verfahren kann ich mir ersparen, wenn ich dem Brief eine Photographie meiner Vase beilege. Dann nämlich wird mein Adressat je nach Qualität der Aufnahme - sofort eine sehr viel präzisere 'Vorstellung' von diesem Gegenstand gewinnen. Denn das Bild reproduziert nicht - wie Eco behaupten würde - das ideale Wahrnehmungsmodell »Vase«, sondern es reproduziert ein (mein) konkretes Wahrnehmungsbild von einer konkreten grünen Vase, von einer ganz bestimmt geformten Vase mit einem ganz bestimmten Grün. Es bedarf daher keiner umständlichen Präzisierungen und Vereindeutigungen seines Denotats wie der entsprechende sprachliche Ausdruck: Es ist (relativ) eindeutig. Wenn das aber so ist, wenn das Bild nicht das ideale Wahrnehmungsmodell »grüne Vase«, sondern das konkrete Wahrnehmungsbild einer konkreten grünen Vase bezeichnet, genauer: mein (im Bildherstellungsvorgang photographisch annähernd transponiertes) Wahrnehmungsbild von ihr, dann ist sein Signifikat auch etwas anderes als - wie Eco behaupten würde - der Begriff »grüne Vase«: Das Bild 'sagt' nicht »grüne Vase«, 'sagt' auch nicht, daß ich grüne Vasen so oder so ähnlich sehe, sondern daß ich 'diese Vase hier', nämlich meine grüne Vase so oder so ähnlich sehe. Das ist die Konsequenz der Motiviertheit ikonischer Zeichen (vgl. S. 5f.): Da die Beziehung zwischen Signifikant und Signifikat hier durch Ähnlichkeit konstituiert ist, kann das Signifikat nie 'weniger' enthalten als sein Signifikant, kann das Bild einer Vase niemals nur »Vase«, sondern muß immer schon 'diese Vase hier' bedeuten, d.h. kann das Bild eines Gegenstands niemals nur seinen Begriff, d.h. seine klassenbildenden Eigenschaften, sondern muß immer schon seine individuelle Erscheinung denotieren. Das aber heißt dann zugleich, daß auch der Referent des Bildes, das außersprachliche (außerbildliche) Denotat, im Bild immer schon mit angegeben ist: Während der sprachliche Ausdruck »grüne Vase« auf alle grünen Vasen dieser Welt bezogen werden kann und erst im je aktuellen Sprechakt auf eine be-
Kapitel I: Film als Rede
15
stimmte Vertreterin dieser Klasse als j e konkretes Referens des Sprechakts bez o g e n wird (»Gib mir bitte die grüne V a s e v o m Schrank«), ist dieses j e konkrete Referens bei Bildern immer schon durch das Bild selbst definiert: D a s Bild zeigt nicht ein Exemplar der Gattung »grüne Vasen«, sondern eine g a n z bestimmte, eben meine grüne V a s e . Erst w e n n dieses Photo in einer anderen Verwendungssituation - beispielsweise im Verkaufskatalog der Porzellanmanufaktur - erschiene, entstünde die M ö g l i c h k e i t , es nicht als Darstellung einer individuellen V a s e , sondern als Darstellung einer Klasse v o n V a s e n (eines A r tikels im Sortiment der, Manufaktur) aufzufassen. Anders als bei W ö r t e r n ist demnach bei Bildern auch der Bezug zwischen schon
geklärt,
Zeichen
und Referenten
immer
immer schon vereindeutigt: W e n n ich ein Bild sehe, habe ich
den v o n ihm gemeinten individuellen Referenten immer schon v o r A u g e n , 4 8 und ich verstehe j e d e s Bild als A b b i l d eines individuellen D i n g e s , solange mir durch den kommunikativen Kontext, in dem es erscheint, keine anderslautenden A n w e i s u n g e n g e g e b e n werden. E x k u r s . Wenn aber das Signifikat ¡konischer Zeichen immer schon ein Individuelles ist, ja sogar sein Referent im Bild immer schon 'mitgenannt' ist, dann entstehen plötzlich Zweifel an der zunächst doch so einleuchtenden Definition Ecos (s.o.), die besagt, daß wir Bilder deswegen sofort als Abbilder von etwas erkennen und benennen können, weil ikonische Zeichen unseren idealen Wahrnehmungsmodellen von diesen Dingen homologe graphische Modelle konstruieren: Hat das Photo meiner Vase wirklich graphische Strukturen, die dem Wahrnehmungsmodell homolog sind, das mein Adressat bei dem Wort »Vase« aktiviert? Sind die visuellen Strukturen meiner Vase, die bei ihrer photographischen Projektion auf die Fläche erhalten bleiben, wirklich schon in diesem Wahrnehmungsmodell enthalten, also etwa ihr undurchsichtiges Material, ihre bauchigen Seitenlinien, ihr dadurch angezeigter runder Grundriß, ihr nach außen ausschwingender Rand, die Proportionen zwischen ihrem Durchmesser und ihrer Höhe usw.? Und wenn ja, wie kommt es dann, daB mein Adressat das Bild einer gläsernen, viereckigen Vase mit geraden, randlosen Seitenlinien genauso als Abbildung einer Vase erkennen würde wie das Bild meiner ganz anders geformten Vase? Das heißt: Sind die klassenbildenden Merkmale (»Erkennungskodes«) des Gegenstands, die in dem Wahrnehmungsmodell »Vase« zusammen mit dem dazugehörigen Begriff aufbewahrt sind, überhaupt ein konsistentes Ensemble von Linien und Flächen, die man zeichnen könnte, und also Linien und Flächen, die es gibt und die man deshalb in jedem beliebigen Bild jeder beliebigen Vase wieder antreffen und identifizieren könnte? Oder handelt es sich dabei nicht vielmehr um ein abstraktes Konzept, ein 'Verzeichnis' von stark abstrahierten Merkmalen, das eine ganze Fülle von Konkretisationen, also sehr viele verschiedene Linien- und Flächenrelationen zuläßt, auch solche, die man noch nie gesehen hat und dennoch - weil sie in das abstrakte Konzept 'pas48 Dabei ist es nicht wichtig, ob der Referent in der außerbildlichen Realität wirklich existiert oder ob seine Existenz fingiert ist: Es kommt nicht darauf an, ob van Goghs Sonnenblumen so wirklich in der Realität existiert haben oder nicht, sondern darauf, daß sein Bild die Existenz dieser Sonnenblumen 'behauptet', daß es diese ganz bestimmten Sonnenblumen als seiend setzt, ein Sachverhalt, auf den noch zurückzukommen sein wird (vgl. Kap. I.C. 1). Bei (konventionellen) Photographien und Filmen ist stets die »wirkliche« Existenz der abgebildeten Dinge zu unterstellen, weil sie (auch bei fingierten Spielhandlungen) auf der »Ablichtung« realer visueller Sachverhalte beruhen.
16
Kapitel l: Film als Rede
sen' - sofort als Linien- und Flächenrelationen einer Vase erkennt? Muß das nicht sogar so sein, müssen diese Merkmale nicht hochgradig abstrakt sein, wenn sie als »Erkennungskodes« bei jedem individuellen Vertreter einer Dingklasse funktionieren sollen, d.h. ist es nicht sogar so, daß diese abstrakten Merkmale deshalb auch gar nicht in der Realität und auch nirgendwo auf Bildern erscheinen dürfen, weil sie sonst ihre Funktion als Erkennungskodes verlören, zu Merkmalen eines individuellen Dinges würden? Und ist es vielleicht deshalb so schwer, ikonische Zeichen zu segmentieren, im graphischen (Continuum zu isolieren, das heißt: Gibt es das, was Eco ikonische Zeichen nennt, womöglich gar nicht, weil unsere Wahrnehmungsmodelle von den Dingen, die sie ihm zufolge 'homolog' reproduzieren, viel zu abstrakt sind, um ikonisch reproduziert werden zu können? Denn wenn die Annahme zutrifft, daß es sich bei diesen Wahrnehmungsmodellen um abstrakte Merkmalsverzeichnisse handelt, die gar keine konsistenten Gebilde von Linien oder Flächen ergeben, dann sind sie auch nicht ikonisch, lassen sich folglich auch nicht ikonisch reproduzieren.49 Die Beziehung zwischen Wahrnehmungsmodell und (wirklichem oder abgebildetem) Objekt ist dann vielmehr als die von Allgemeinem und Besonderem, von Klasse und Klassenelement anzusprechen, also - in mengentheoretischer Diktion - nicht als Beziehung zwischen zwei Mengen, die man vergleichen (und 'homolog' setzen) könnte, sondern als Elementbeziehung (a e M): Die im Wahrnehmungsmodell gespeicherten klassifikatorischen Merkmale von Vasen sind demnach Abstraktionen aller realisierten und realisierbaren besonderen Merkmale von Vasen, enthalten diese je besonderen Merkmale also immer schon: als deren Abstraktion. Die Besonderheit meiner grünen Vase ist demnach nicht in Merkmalen anzutreffen, die sie außer den für Vasen klassifikatorischen Merkmalen zusätzlich auch noch hätte, sondern vielmehr in der je individuellen Art und Weise, in der sie das ideale Modell realisiert, in der sie das abstrakte Wahmehmungsmodell »Vase« Wirklichkeit werden läßt, 'zur Erscheinung bringt'. Wenn das aber so ist, dann sind ikonische Zeichen auch keine 'homologen' Reproduktionen unserer Wahrnehmungsmodelle, sondern immer schon deren je individuelle Realisationen.50 Ob die in diesen Fragen und Überlegungen implizierten Annahmen zutreffen oder nicht, könnte wohl in der Tat nur die Wahrnehmungspsychologie schlüssig beantworten. Weil aber immerhin einiges, wenn auch nur Heuristisches für die Annahme spricht, daß unsere Wahrnehmungsmodelle von den Dingen abstrakte, ideale Konstrukte sind, die in der Realität oder
50
Mit der Aufgabe, mein ideales Wahrnehmungsmodell »Vase« zu zeichnen, wäre ich überfordert, weil ich viele verschiedene Vasen gesehen habe, von denen ich manche vielleicht als »ausgefallene«, die meisten aber als »normale« Vasen bezeichnen würde, und unter diesen unendlich vielen »normalen« Vasen keine wäre, von der ich sagen könnte, das sie meinem idealen Modell von einer Vase näher käme als die anderen. Etwas, aber im Prinzip dennoch nicht anders läge der Fall, wenn man mich aufforderte, eine der »klassischen« Vasenformen zu zeichnen: Hier wäre die Auswahl geringer, aber da es bekanntlich eine ganze Reihe sehr unterschiedlicher »klassischer« Vasenformen gibt (etwa die aus den Formen der altgriechischen Amphora oder Lekythos oder aus dem Konus abgeleiteten »Klassiker«), müßte ich mich auch hier für eine Form entscheiden. Aufgefordert, mein ideales Modell von einem Zebra zu zeichnen, vermöchte ich nur zu sagen, daß das gezeichnete Tier Streifen haben muß, nicht aber, wie diese Streifen verlaufen sollen: Abgesehen davon, daß ich gar nicht genau zu sagen wüßte, wie diese Streifen an welchen Körperregionen genau verlaufen (weil das für das Erkennen des Zebras unerheblich ist), könnte ich viele, auch in der Körpergestalt sehr unterschiedlich aussehende Zebras zeichnen, ohne sagen zu können, welche dieser Zeichnungen meinem idealen Modell näher käme. Das heißt nichts anderes, als daß ich mein ideales Modell zeichnerisch nicht materialisieren kann, vielmehr immer schon ein Individuelles darstelle, gleichgültig, wie schematisiert ich dabei verfahre.
Kapitel I: Film als Rede
17
auf Bildern so nirgendwo erscheinen, sollte man vorerst besser von der Hypothese ausgehen, daß das, was uns befähigt, ein abgebildetes Ding zu erkennen und zu versprachlichen, etwas ist, das wir tun, und nichts, was die Bilder tun: Die Zuordnung der individuellen Erscheinungen, die Bilder zeigen, zu den Klassen, die wir uns im sprachlichen Zugriff auf Welt geschaffen haben, wird dieser Hypothese zufolge nicht von den Bildern selbst vollzogen, sondern vom Betrachter, wäre demnach kein den Bildern selbst einwohnender Prozeß. Wohl müssen Bilder Bedingungen herstellen, die auch bei der Realitätswahrnehmung gegeben sein müssen, um ein Ding erkennen zu können: Sie müssen, wie Eco gezeigt hat, bestimmte Wahrnehmungsbedingungen (Lichtverhältnisse, Größenrelationen u.a.) herstellen, und sie müssen das Ding so zeigen, daß die Merkmale, die mit seinem idealen Konstrukt 'zusammenpassen', zu sehen sind. Nur scheint es nicht ratsam und im Horizont dieser Überlegungen auch gar nicht möglich, diese Merkmale kurzerhand mit den Merkmalen, die in unseren Wahrnehmungsmodellen aufbewahrt sind, identisch bzw. 'homolog' zu setzen, wie Eco das tut, denn diese Merkmale sind, wie es scheint, viel zu abstrakt, um als eine ganz bestimmte Linie oder als eine ganz bestimmte Fläche erscheinen zu können.
Das Spezifikum ikonischer Kommunikation, das, was sie im Vergleich zur sprachlichen Kommunikation nicht ist, liegt demnach gerade nicht in der ikonischen Replikation der in der Sprache präsenten begrifflichen Ordnung der Welt, sondern in der Fähigkeit von Bildern, Welt als eine noch vorbegriffliche Welt, als Ensemble individueller, einmaliger Erscheinungen zu erfassen. Diese Fähigkeit beziehen sie aus der nicht-klassifikatorischen Struktur ihrer Zeichen, die wiederum in der Motiviertheit dieser Zeichen begründet liegt, in der auf Ähnlichkeit beruhenden Beziehung zwischen ikonischen Signifikanten und Signifikaten: Ikonische Zeichen bezeichnen nicht Klassen von Sachverhalten, sondern individuelle Sachverhalte. Das ist der Grund, warum die ersten Bücher, die wir Kindern geben, noch bevor sie sprechen können, Bilderbücher sind, und warum wir sie an diesen Bilderbüchern - mit dem Zeigefinger - die Namen der Dinge lernen, also den Übergang vom vorbegrifflichen zum begrifflichen Denken einüben lassen: Bilder erlauben es, weil sie die Dinge als Individuen bezeichnen, Welt als eine noch vorbegriffliche in Erfahrung zu bringen. Und wenn nicht nur Kinder, sondern auch Erwachsene, die ihre Welt schon längst »verwortet« haben, sich mit Hilfe von Bildern über Welt verständigen, dann besagt das, daß dieser Fähigkeit der Bilder eine bei der visuellen Wahrnehmung von Welt oder der Bilder von ihr aktivierte Fähigkeit (und ein Bedürfnis) entspricht, mehr und anderes als Klassen von Dingen wahrzunehmen, mehr und anderes zu tun als das, was wir bei der begrifflichen Ordnung der Welt tun: Bei der visuellen Wahrnehmung nehmen wir sehr viel mehr und anderes wahr als das, was wir begrifflich beim 'Namen' nennen können, nämlich eine Fülle nicht-klassifizierter (nicht-klassifizierbarer?) vorbegrifflicher Sachverhalte. Alles Wiedererkennen individueller Dinge beruht auf dieser nicht-klassifizierenden, vorbegrifflichen Wahrnehmung: Was die Bildsemiotik umtreibt, die Frage, warum wir ein Ding als dieses Ding, d.h. als Vertreter einer bestimmten Klasse von Dingen erkennen und
18
Kapitel I: Film als Rede
mit dem entsprechenden Namen aus unserem Wörterbuch benennen können, hat ihr den Blick dafür geschwächt, daß es zu einem ganz wesentlichen Teil dieses Erkennen und Wiedererkennen individueller Dinge ist, das uns befähigt, uns in der Welt zurechtzufinden, die uns vertrauten Dinge, Orte und Menschen immer wieder als dieselben zu identifizieren. Wenn ich ein Photo meines Freundes Hans sehe, dann dekodiere ich nicht »Mensch« oder »männlicher Mensch« oder »männlicher Mensch mit blauen Augen«, sondern einen Eigennamen: Hans, und dazu alles das, was dieser Name für mich repräsentiert, nämlich diesen einen, unverwechselbaren Menschen mit dem (nicht unverwechselbaren, aber etwas Unverwechselbares anzeigenden) Eigennamen Hans.51 Offenbar also geht die Bildersprache genau den umgekehrten Weg wie die Wortsprache: Sie klassifiziert die Welt des Sichtbaren nicht, sondern kennt nur ihre individuellen Erscheinungen und überläßt es uns, ihren Empfängern, diese individuellen Erscheinungen auf den Begriff zu bringen. Auch wenn man mit Eco sagen kann und muß, daß sie durch die Herstellung ausreichender Wahrnehmungsbedingungen (s.o.) Vorkehrungen dafür trifft, daß uns das auch gelingt, bleiben ihre Gegenstände doch die individuellen Dinge der ihr eigenen vorbegrifflichen Erscheinungswelt. Folglich sind Nomina keine Vergleichsgröße für bildliche Zeichen, auch wenn es zutreffen mag, daß »gewisse Formen von Bildern wie Namen verwendbar sind und vielfaltige Handlungszusammenhänge zwischen Namen und Bildern hergestellt werden können«.52 Zwischenbilanz Wenn die vorstehenden Überlegungen Plausibilität beanspruchen können, dann liefern sie hinreichende Gründe für den Schluß, daß - und von dieser Hypothese wird hier im Weiteren ausgegangen - ikonische Zeichen motivierte, auf Ähnlichkeitsbeziehungen zwischen Signifikanten und Signifikaten beruhende Zeichen sind, daß mithin die Sprache der Bilder nicht über Zeichen verfügt, die Klassen von Gegenständen bezeichnen, es sei denn, sie bilden künstliche, eigens zum Zweck der Klassifikation hergestellte, auf Übereinkünften beruhende, arbiträre Zeichen ab53 oder werden durch die Verwendungssituation als Darstellung eines klassifikatorischen Sachverhalts ausge51
Ich wäre aber wohl kaum fähig, das, woran ich das Photo als Photo von Hans erkenne, begrifflich exakt zu fassen: Ich könnte keinen verbalen »Steckbrief« formulieren, der die besonderen optischen Merkmale bezeichnet, die diesen Menschen unverwechselbar machen.
52 MUCKENHAUPT 1 9 8 6 , 6 8 .
53 Dazu gehören z.B. Parteiabzeichen, Umformen oder militärische Rangabzeichen: Sie klassifizieren Menschen nach Maßgabe eines bestimmten Merkmals, der Zugehörigkeit zu einer politischen Partei, einer (Berufe-) Gruppe oder eines Dienstgrades.
Kapitel 1: Film als Rede
19
wiesen (wie das Bild einer Hauskatze in einem zoologischen Lehrbuch). Das bedeutet zugleich, daß das ikonische Zeichenrepertoire, weil es für jedes individuelle Einzelding individuelle Zeichen hat, unendlich ist (vgl. S. 12). Deshalb hat es auch kein Lexikon, wenn man darunter das (synchron) endliche Verzeichnis der Zeichen einer Sprache versteht, deshalb auch bedarf es keines Lexikons, wenn man darunter den Ort versteht, an dem die Verabredungen darüber getroffen werden, was diese Zeichen bedeuten sollen: Solcher Verabredungen bedürfen arbiträre Zeichen; motivierte Zeichen beziehen ihre kommunikative Funktionsfähigkeit aus der Ähnlichkeitsbeziehung zwischen Signifikanten und Signifikaten. Bilder haben keine prädikative Struktur Wenn Bilder keine Wörter haben, ikonische Zeichen also von sich aus nicht in der Lage sind, Klassen von Gegenständen oder Sachverhalten zu bezeichnen, dann haben die mit diesen Zeichen erzeugten Nachrichten auch keine prädikative Struktur. Umgekehrt und positiv formuliert: Bilder vereindeutigen ihre Denotate so präzise, daß sie der Prädikation nicht bedürfen. Das ikonische Zeichenrepertoire hat keine distinkten und »freien«54 Zeichen für die Prädikation55 von Objekten, und das ist lediglich eine Wiederholung der Feststellung, daß es keine klassifikatorischen Zeichen hat: Es gibt keine distinkten und freien ikonischen Zeichen für Formen, Farben, Größen usw., für räumliche, zeitliche, kausale oder modale Beziehungen, für Tätigkeiten und deren Modus. Das heißt: Es gibt keine distinkten ikonischen Zeichen für die Prädikationsformen, die die Wortsprache kennt, also für Adjektive, Präpositionen, Verben und Adverben, und schon gar nicht für Wortarten wie Artikel, Pronomina oder Konjunktionen. Bilder, photographische Bilder zumal, reproduzieren die Welt der Dinge, und spezifizierende »Aussagen« über diese Dinge, über ihre Eigenschaften, über ihre Beziehungen zu anderen Dingen, über ihre Tätigkeiten usw. werden ihnen im Bild nicht 'hinzugefügt', sondern haften ihnen immer schon an: Es gibt kein distinktes und freies ikonisches Zeichen für die Farbe Grün, es sei denn, die Farbe Grün erscheint als Eigenschaft ei54 »Frei« meint hier - in Analogie zum Begriff des »freien Morphems« - die Selbständigkeit eines Zeichens als Bedeutungsträger (also ein Zeichen mit kontextunabhängiger Eigenbedeutung). 55 »Prädikat« wird hier nicht im engeren Sinne der traditionellen Grammatik (als verbales Satzglied), sondern im weiteren Sinne der formalen Logik als Gesamtheit der sprachlichen Ausdrücke verstanden, die zusammen mit einem Argumentausdruck eine Aussage bilden (vgl. BUSSMANN 1983, 398f.; WELTE 1974, 440-443). »Prädikation« meint in diesem Sinne »den Sachverhalt, daß einem Gegenstand eine Eigenschaft zugeschrieben, sowie denjenigen, daß zwischen Gegenständen eine Beziehung ausgesagt wird.« (F. Schmidt, Zeichen und Wirklichkeit, Stuttgart 1966, 28, zit. nach WELTE 1974, 446).
20
Kapitel I: Film als Rede
nes Dinges, also als ein immer schon an ein Objekt gebundenes Zeichen. 56 Ebenso gibt es - um ein filmisches Beispiel zu nennen - kein distinktes und freies Zeichen für das Verb »gehen«, es sei denn, das »Gehen« erscheint als Tätigkeit eines Menschen. Während der sprachliche Ausdruck »grüne Vase« zwei Zeichen, zwei Lexeme nebeneinander stellt und sie durch grammatische Morpheme zueinander in Beziehung setzt, hat das Bild einer grünen Vase solche grammatischen Morpheme nicht nötig, weil hier die Beziehung der Vase zu der Farbe Grün unzweideutig geklärt ist. Das heißt: Zwischen der Vase und ihrer Farbe muß nicht eigens eine syntagmatische Beziehung hergestellt werden, weil es sich hier nicht, wie in der Wortsprache, um zwei 'freie Morpheme' oder Lexeme handelt, deren Beziehung geregelt werden muß, sondern um eine komplexe Einheit. Genauer: Zwischen der Vase und ihrer Farbe besteht kein (über die syntaktische Organisation erst herzustellendes) Beziehungsverhältnis, sondern ein Verhältnis der Inhärenz: Das Grün ist nicht irgendeines, sondern das der Vase, es unterhält keine syntagmatischen Beziehungen zu der Vase (was heißen würde, daß es auch unabhängig von der Vase erscheinen könnte), sondern es kann gar nicht umhin, die Farbe »von etwas« zu sein; und die Vase ist nicht irgendeine, sondern eine grüne, auch sie unterhält keine syntagmatische 'Beziehung' zu ihrer Farbe (was heißen würde, daß sie 'frei' von einer bestimmten Farbe, Form usw., eben als ideales Modell einer Vase, erscheinen könnte), sondern sie kann gar nicht umhin, eine Farbe (Form, Größe usw.) zu 'haben', also immer schon als, wenn man so will, »prädiziertes« Objekt zu erscheinen. Bilder sind keine Sätze Die Wörter des Satzes »Hier ist eine grüne Vase« stehen in syntagmatischen und paradigmatischen Relationen: Die syntagmatische Relation ist, indem sie über die syntagmatische 'Verträglichkeit' (Kombinierbarkeit) von Zeichen entscheidet, die Voraussetzung für die durch Substitutionsproben zu gewinnende Klassifikation der Paradigmen, auf der Ebene der Syntax also für die Klassifikation der im gleichen Kontext potentiell substituierbaren Wörter bzw. Wortarten. Für ikonische Zeichen lassen sich vergleichbare Relationen nicht feststellen: Wenn Bilder keine prädikative Struktur haben, zwischen ihren Zeichen also keine prädikativen Beziehungen bestehen, sondern Beziehungen Muckenhaupt kommt zu ähnlichen Ergebnissen, wenn er sagt, »daß Gegenstände und ihre Eigenschaften nicht getrennt voneinander darstellbar sind. Daher kann die Darstellung eines Gegenstandes auch nicht aus zwei entsprechenden Teilhandlungen, der Darstellung des Gegenstandes und der Darstellung seiner Eigenschaften, zusammengesetzt werden« (MUCKENHAUPT 1 9 8 6 , 107).
Kapitel
l: Film als Rede
21
der Inhärenz, dann existieren zwischen diesen Zeichen auch keine syntaktischen Relationen. Die Photographie einer roten - statt grünen - Vase kommt nicht durch den Austausch eines Paradigmas (Farbadjektivs) zustande, sondern durch den Austausch des gesamten Bildgegenstands, d.h. durch ein neues Objekt. Das Bild einer unter (statt auf) einem Tisch stehenden Vase kommt nicht durch den Austausch einer Präposition zustande, sondern durch die Umstellung des gesamten Objekts, weil es kein distinktes ikonisches Zeichen für »auf« oder »unter« gibt. Wohl gibt es räumliche Beziehungen zwischen den auf einem Bild abgebildeten Dingen. Aber diese Beziehungen unterliegen keinen 'grammatischen', syntaktischen Regeln. Das Bild einer unter einem Tisch stehenden Vase artikuliert keinen grammatisch falschen »Bildsatz«, verstößt nicht gegen syntaktische Regeln, sondern nur gegen einen Erfahrungssatz, der besagt, daß Vasen gewöhnlich auf und nicht unter Tischen stehen, das heißt: Dieser »Bildsatz« ist nicht unverständlich, wie es ein grammatisch falscher Satz der Wortsprache wäre, der an einer bestimmten Stelle ein falsches Paradigma setzte (z.B. *Die Vase steht zu dem Tisch), sondern bezeichnete nur - ebenso wie der grammatisch wohlgeformte Satz »Die Vase steht unter dem Tisch« - einen etwas ungewöhnlichen Sachverhalt. Das heißt: Zwischen dem »Auf-« und »Unter-dem-Tisch-Stehen« einer Blumenvase besteht keine paradigmatische Opposition, die es zuließe, bestimmte Raumbeziehungen zwischen den abgebildeten Dingen zur Regel zu erklären, wie die Syntax die syntagmatischen Beziehungen zwischen bestimmten Paradigmen der Wortarten zur Regel erklärt und deshalb sagen kann, ob ein Satz grammatisch oder ungrammatisch gebaut ist (also z.B. sagen kann, daß, wo eine räumliche Beziehung zwischen zwei Dingen angezeigt werden soll, die Kombination des Verbs »stehen« mit der Präposition »zu« unzulässig ist). Zwar kennt die Sprachgrammatik auch semantische Selektionsbeschränkungen, die Fragen der adäquaten, erwartungsgemäßen Darstellung von Welt betreffen: Die Transformationsgrammatik etwa erfaßt sie für jeden Lexikoneintrag als dessen »Selektionsmerkmale« (denenzufolge z.B. das Verb »erfreuen« ein belebtes Subjekt oder Objekt erfordert). Aber nicht zufällig hat es unter Linguisten auch eine harte Kontroverse um die Annahme Chomskys gegeben, es handele sich bei diesen Selektionsbeschränkungen um syntaktische (grammatische) Größen, 57 die es dann folglich auch erlauben müßten, bestimmte Sätze - etwa den Satz »Der Baum dachte an seine Jugend« - ebenso als ungrammatisch zu klassifizieren wie den Satz »*Der Greis dachte unter seine Jugend«. Da der erste Satz verständlich ist, obwohl er semantisch 'falsch' ist (und deshalb sofort als »poetische« Äuße-
57 V g l . WELTE 1 9 7 4 , 5 4 9 - 5 5 1 ; BUSSMANN 1983, 4 5 4 .
22
Kapitel I: Film als Rede
rung verstanden würde), hat er zweifellos einen anderen Status als der zweite. Bilder können nur semantisch 'falsche' »Sätze« der ersten Kategorie aber keine syntaktisch (grammatisch) falschen »Sätze« der zweiten Kategorie bilden, weil die Beziehung zwischen ihren Zeichen keine erst noch grammatisch zu regelnde, sondern eine Beziehung der Inhärenz ist. Die für Filmsemiotiker so zentrale Frage, ob Bilder eine der Wortsprache vergleichbar strukturierte Syntax haben, ist demnach negativ zu beantworten. Wenn es bei Bildern keine syntagmatischen Kombinationsregeln gibt, dann gibt es auch keine Möglichkeiten, Klassen von ikonischen Zeichen (z.B. Morphemklassen oder ikonische »Wortarten«) durch Substitutionsproben zu bilden und ihnen damit fest bestimmbare syntagmatische Stellen anzuweisen: Jede Substitution wäre potentiell möglich und folglich lassen sich keine Minimalpaare bilden. Ikonische Zeichen haben also, was Metz schon gesehen hat und Eco ausdrücklich feststellte (ohne allerdings seine Hypothese von der Kodifizierbarkeit ikonischer Zeichen aufzugeben), keinen paradigmatischen Oppositions- und Stellenwert:58 Das Bild meiner grünen Vase bezieht seine Bedeutung nicht aus dem Umstand, daß die Vase nicht rot oder keine Teetasse ist, und auch nicht aus dem übrigen ikonischen Kontext, in dem sie auftaucht, also etwa aus dem Umstand, daß sie in einer Wohnung auf einem Tisch steht (sie wäre auch dann noch als Vase erkennbar, wenn sie in einen für Vasen ungewöhnlichen Kontext, etwa in einer Hundehütte, mitten im Wald oder auf dem Mond stände). Das heißt: Die 'paradigmatischen' Substitutionsmöglichkeiten sind bei Bildern unendlich (und deshalb nicht paradigmatisch, d.h. nicht klassifizierbar), weil das 'Lexikon' der Bilder unendlich ist, und dieses 'Lexikon' ist unendlich und deshalb kein Lexikon (vgl. S. 12, 19), weil in ihm jedes individuelle Einzelding der sichtbaren Welt als Lemma erscheinen kann, weil seine Lemmata, wenn man so will, aus lauter Nomina propria gebildet sind. Bilder sind keine Aussagen Der Aussage »Hier ist eine grüne Vase« entspricht das Bild einer grünen Vase, so hat man sich angewöhnt zu sagen. Aber wenn ikonische Zeichen keine Prädikationen vollziehen können, dann können sie auch keine Aussagestruktur haben, denn die Prädikation ist die Grundoperation jeder Aussage. Der Satz »Hier ist eine grüne Vase« ist folglich nicht das sprachliche Analogon der Bildzeichen, sondern eine Aussage über das Bild, ist der Versuch, den Bildinhalt sprachlich zu beschreiben. Metz und Eco haben, so scheint es, die Form ihrer Aussagen über das Bild den ikonischen Zeichen des Bildes als
58 METZ 1964, 100 u.pass.; ECO 1972, 217.
Kapitel I: Film als Rede
23
Eigenschaft zugeschlagen, wenn sie vom »assertorischen Charakter« des Bildes 59 bzw. von »ikonischen Aussagen« reden. Bilder machen Aussagen Nun haben Bilder aber ja gleichwohl etwas 'Assertorisches' an sich, nämlich eine Art demonstrativen Gestus, der in ihrem Bildcharakter selbst zu liegen scheint: Bilder erheischen durch ihre bloße Existenz Aufmerksamkeit für das von ihnen Dargestellte, artikulieren schon und nur dadurch, daß sie erscheinen, die Aufforderung, sie zu betrachten, d.h. sie präsentieren sich als kommunikative Akte. Möglicherweise ist es der damit verbundene Eindruck, daß Bilder etwas »sagen wollen«, der Metz und Eco dazu verführt hat, von Bildern als von Aussagen zu reden. Derselbe Eindruck wird formuliert, wenn man sagt, Bilder zeigten »etwas« oder stellten »etwas« dar, d.h. man unterscheidet implizit zwischen dem Bild - als realem Faktum - und dem, was auf ihm - als nicht-reale, sondern abgebildete Erscheinung - zu sehen ist. Wenn man sagt, ein Bild zeige einen Revolver, oder wenn man das, was das Bild »aussagt«, zu umschreiben versucht mit dem Satz »Hier ist ein Revolver«, dann erklärt man das reale Faktum 'Bild' zum Subjekt, das von ihm Abgebildete, den Revolver, zum Objekt der Abbildungstätigkeit. Man unterscheidet also zwischen den ikonischen Zeichen, mit denen das Bild den Revolver darstellt, und dem nicht-ikonischen (denn das Bild selbst ist ja nicht abgebildet), sondern realen visuellen Zeichen 'Bild'. Vielleicht liegt hier eine Möglichkeit, den Widerspruch aufzulösen, der zwischen der Feststellung, daß ikonische Zeichen keine prädikative und damit keine Aussagestruktur haben, und dem gleichwohl bestehenden Eindruck, daß Bilder etwas »aussagen«, klafft. Die Begründung dieses Eindrucks läßt sich allerdings nicht mehr aus der Theorie der ikonischen Kodes ableiten, denn dabei befinden wir uns nicht mehr auf der Ebene der Zeichenstrukturen von Bildern, sondern auf der Ebene ihrer Verwendung in kommunikativen Situationen, also auf der Ebene der »Rede«.
B. Bilder als Sprechakte Wenn wir Bilder betrachten, nehmen wir das Abgebildete zwar auf dieselbe Weise (auf der Basis derselben Wahrnehmungs- und Erkennungskodes) wahr wie visuelle Realität, verstehen das Wahrgenommene aber offensichtlich anders, nehmen nämlich den artifiziellen Charakter der wahrgenommenen Zei59 METZ 1 9 6 4 , 9 7 .
24
Kapitel l: Film als Rede
chen, den bloßen Umstand, daß sie etwas eigens Hergestelltes und damit auf ein Subjekt der Herstellung zurückzuführen sind, als Anzeichen dafür, daß sie etwas »sagen« sollen, also eine kommunikative Funktion haben. Das heißt: Wir verstehen den Akt der Bildherstellung und des Zeigens von Bildern als eine Art Sprechakt, sind deshalb bei der Bildrezeption von (je nach Bildtyp und Kontext unterschiedlich prädisponierten)60 Sinnerwartungen geleitet. Der - so verstandene - 'assertorische' Charakter von Bildern wäre demnach in seinem künstlichen Hergestelltsein, im Status des Bildes als Bild, sodann im Akt des Zeigens dieser Bilder und in dessen kommunikativem Kontext, in der spezifischen Verwendungssituation (z.B. Verkaufskatalog, Lehrbuch, Photoalbum, Ausstellung oder auch Kino) zu suchen. Dieser gegenüber visuellen Erscheinungen der Wirklichkeit differente kommunikative Status ikonischer Zeichen und ihr kommunikativer Kontext haben für die Grundlegung einer allgemeinen Hermeneutik des Films naheliegender weise erhebliche Bedeutung, denn sie markieren die Stelle, an der die Dekodierung ikonischer Zeichen, das Wahrnehmen und Erkennen dessen, was das Bild »darstellt«, in Funktion gesetzt wird für das Verstehen dessen, was das Bild »sagen« soll: Das Photo meiner grünen Vase, das ich meinem Brief beilege, wird von meinem Adressaten nicht bloß dekodiert wie ein beliebiges Ding der sichtbaren Welt, sondern es wird zugleich verstanden, nämlich als spezifischer kommunikativer Akt mit spezifischer kommunikativer Absicht, in diesem Fall als Versuch, die Schönheit der Vase und darin vielleicht auch meine Freude über ihren Erwerb zu vermitteln. Für eine Hermeneutik des Films ist es daher von besonderem Interesse, genauer zu klären, aufgrund welcher Voraussetzungen Bilder als Sprechakte verstanden werden. Die Subjekt-Objekt-Struktur von Bildern Das Bild meiner grünen Vase könnte, mit einem anderslautenden Begleitbrief versehen, auch eine ganz andere kommunikative Absicht als die eben genannte verfolgen, könnte z.B. ein Verkaufsangebot begleiten oder sich auch gar nicht auf die Vase, sondern auf die Blumen darin beziehen. Das legt den Schluß nahe, daß Bilder, wenn sie nicht in eindeutig spezifizierten kommunikativen Situationen erscheinen, auch nichts zu »sagen« haben, daß sie erst und nur zu 'sprechen' beginnen, wenn sie einen je spezifischen Kontext (wie hier den Begleitbrief) haben, also erst durch ihren kommunikativen Kontext als Sprechakte verständlich werden. Dem steht nun allerdings die alltägliche Erfahrung entgegen, daß Bilder durchaus für sich sprechen, also auch ohne ausdrückliche Rezeptionsanweisungen als Sprechakte verstanden werden können, 60 Die Kommunikationssituation »Photoalbum« etwa produziert andere Sinnerwartungen als beispielsweise die Kommunikationssituation »Photoausstellung«.
Kapitel I: Film als Rede
25
und das wiederum legt den Schluß nahe, daß es neben kontextuellen auch immanente Voraussetzungen geben muß, die das - über das bloße Dekodieren der ikonischen Zeichen hinausgehende - Verstehen von Bildern als Sprechakten ermöglichen. Das würde dann bedeuten, daß bei meinem Photo die Variabilität der Aussagen gar nicht nur an dem durch anderslautende Briefe jeweils veränderbaren kommunikativen Kontext liegt, sondern auch daran, daß das Bild so mehrdeutig ist, daß es unterschiedlichsten Interpretationen zugänglich ist, daß die intendierte Aussage also nicht hinreichend vereindeutigt wurde. Nehmen wir also das Beispiel einer stärker vereindeutigten Photographie: Es könnte z.B. sein, daß es mir darauf ankommt, daß mein Adressat besonders die Form, weniger die Farbe meiner Vase oder die Blumen darin beachtet. In diesem Fall würde ich die Vase für die Aufnahme ins Gegenlicht stellen, so daß ihre Umrisse wie im Schattenriß hervortreten und die Informationen über Farbe und Material weitgehend eliminiert würden. Ein Teil der visuellen Merkmale des Objekts würde also aus dem Bild verschwinden, ein anderer besonders hervorgehoben und so die Vieldeutigkeit der 'normalen' Aufnahme eingeschränkt. Die Frage ist nun, ob und auf welche Weise das dabei entstehende Bild immanente Voraussetzungen liefert, aufgrund deren es als Sprechakt, nämlich als Aussage über die Form der Vase, verstanden werden kann. Niemand, der die Vase auf dem Fensterbrett stehen sähe, käme auf die Idee zu sagen, die Vase (oder das Gegenlicht) weise damit auf ihre Form hin: Er nähme wohl wahr, daß ihre Form so besonders gut 'zur Geltung kommt', aber er verstünde diesen Sachverhalt nicht als eine Aussage, sondern als Funktion der Lichtverhältnisse und seines Blickpunkts, mit dessen Veränderung auch die schattenrißartige Wirkung verschwände. Sobald aber diese optische Situation abgebildet wird, die realen visuellen Erscheinungen also zu ikonischen werden, werden die Umrisse der Vase plötzlich nicht mehr als etwas, das zur Geltung 'kommt' verstanden, sondern als etwas, das zur Geltung 'gebracht' wurde. Es ist also nicht nur das bloße Faktum 'Bild', nicht nur sein Hergestelltsein, das auf ein Subjekt der Herstellung verweist, sondern auch der je besondere Blick, den Bilder auf das Abgebildete eröffnen: Bilder nötigen ihren Betrachtern einen ganz bestimmten Blick auf das Dargestellte auf, bringen sie, indem sie sie in eine bestimmte Wahrnehmungsposition versetzen, in eine je besondere optisch-räumliche Beziehung zum Dargestellten, der sie sich, anders als bei der Wahrnehmung realer Dinge, nicht entziehen können. Diese Beziehung ist identisch mit der optisch-räumlichen Beziehung, die der Bildproduzent im Herstellungsvorgang zu dem von ihm Abgebildeten (tatsächlich oder auch nur mental) aufgenommen und über seinen Abbildungsapparat (Pinsel, Kohlestift, Kamera etc.) reproduziert hat, das heißt: Der kommunikative Kontakt zwischen Sender und Empfanger kommt bei Bildern
26
Kapitel I: Film als Rede
allererst über die Perspektive des im Bild selbst (im Kommunikationsakt) nicht mehr anwesenden Bildsubjekts zustande, die sich in das Bild einschreibt. Bilder betrachten heißt die Welt mit den Augen eines anderen sehen: An die Stelle selbstbestimmter optisch-räumlicher Beziehungen zur Welt des Sichtbaren in der alltäglichen Wahrnehmung treten bei der Wahrnehmung von Bildern fremdbestimmte Beziehungen zum Wahrnehmungsobjekt, und zwar in doppelter Hinsicht, nämlich zum einen schon durch die Auswahl des Blickobjekts selbst und zum anderen durch die Blickweise, die sich nach Maßgabe der unterschiedlichen Bildherstellungstechniken unterschiedlich, in jedem Fall aber in dem Blickpunkt, in der Perspektive manifestiert, aus der das gewählte Objekt gesehen wird. Bilder überführen das Abgebildete in die jeder Wahrnehmung zugrundeliegende Subjekt-Objekt-Relation und - darin besteht der eigentliche kommunikative Akt - versetzen dabei den Empfänger an die Stelle des Senders, des Bildsubjekts, also in die Subjektposition dieser Relation. Bilder vermitteln also etwas anders (z.B. sprachlich) kaum adäquat Mitteilbares, nämlich die subjektive optische Wahrnehmung der sichtbaren Welt. Die Versetzung des Empfangers an die Stelle des wahrnehmenden Subjekts ist dabei der Garant für das Gelingen der Kommunikation: Die Kommunizierbarkeit dieser subjektiven Bezugnahme auf Welt, die Mitteilbarkeit dessen, was in der alltäglichen Verständigung über optische Wahrnehmungen mitzuteilen immer nur rudimentär gelingt, weil jeder die Welt mit seinen Augen sieht, wird durch diesen Akt des Versetzens möglich. Der kommunikative Bezug zwischen Sender und Empfänger kommt, wenn man so will, durch Identifikation (mit der Perspektive, der 'Sichtweise' des Senders) zustande und ist deshalb unmittelbarer und zwingender als der über Sprache organisierte: Wer Bilder betrachtet, läßt sich, ob er will oder nicht, auf die Perspektive des Bildsubjekts ein. Eben darin entsteht Kommunikation, entsteht so etwas wie »Rede«: Bilder sind Aufforderungen, die Welt mit den Augen eines anderen zu sehen, machen aus dem alltäglichen Akt der subjektiven Wahrnehmung von Realität, indem sie ihn abbilden, einen Akt der Mitteilung, einen Sprechakt.61
61 Die vorstehenden Überlegungen finden sich durch Einsichten bestätigt, zu denen Béla Baláis auf intuitivem Wege schon vor fünfzig Jahren gekommen ist. Was hier die Bestimmung von Bildern als Sprechakten begründet, galt ihm als Indiz für den Kunstcharakter von Bildern: In dem, was er »Rakkurs« nannte, in der »Einstellung«, verstanden als das 'Eingestelltsein' der Kamera, in dem sich die Subjektivität eines Betrachters artikuliert, sah er die Voraussetzung für eine »Synthese von Objekt und Subjekt im Bild« (BALAZS 1982c, 166). DaB diese Überlegung nicht die ihr gebührende Beachtung gefunden hat, hat zweifellos damit zu tun, daß Balázs sie zum Hauptargument für den Kunstcharakter des Films machte und damit in einen Argumentationszusammenhang stellte, der ihr nicht zukommt.
Kapitel I: Film als Rede
27
Bilder als Sprechakte In der Subjekt-Objekt-Relation der Bilder wird faßbar, woraus eine Bestimmung von Bildern als kommunikativen Akten, als Sprechakten, ihre Legitimation beziehen kann. Für deren Explikation beziehe ich mich hier indes nicht auf die Modelle der Sprechakttheorie, die für die Anwendung auf Bilder schon zu eindeutig auf sprachspezifische Sachverhalte zugeschnitten sind, 62 sondern auf das allgemeinere Organon-Modell von Karl Bühler, 6 3 dessen drei Funktionsbestimmungen sprachlicher Zeichen (Darstellung/Symbol, Ausdruck/Symptom, Appell/Signal) bereits die zwei wichtigsten Grundelemente der Sprechakttheorie - Proposition (»Darstellung«) und Illokution (»Appell«) enthält, darüber hinaus aber einen Aspekt berücksichtigt, der hier besonders interessiert, nämlich die subjektive Beziehung des Sprechers zu dem von ihm referierten Sachverhalt (»Ausdruck/Symptom«): Mit Bühler kann man Sprechakte als Handlungen bestimmen, bei denen sich ein Subjekt mit Hilfe eines verabredeten Kommunikationsmittels (Bühlers »Zeichen« als »Schallphänomen«) über einen außersprachlichen Sachverhalt äußert, indem es ihn zum einen referiert (Darstellung/Symbol), zum anderen seine Beziehung zu ihm formuliert (Ausdruck/Symptom) und damit zum dritten an seinen Hörer appelliert, sich in bestimmter Weise zu verhalten (Appell/Signal). Im Horizont dieser Begriffsexplikation können Bilder als Sprechakte bestimmt werden: Bilder, verstanden als ikonische Reproduktionen optischer Bezugnahmen eines Subjekts auf einen außerbildlichen optischen Sachverhalt, vollziehen einen referentiellen Akt, indem sie diesen optischen Sachverhalt darstellen (Darstellung/Symbol); sie vollziehen einen Ausdrucksakt, indem sie das Dargestellte aus der Sicht des Bildsubjekts zeigen und damit dessen Beziehung zu ihm als optische, d.h. als über den Blick realisierte Beziehung mitteilen (Ausdruck/ Symptom), und sie vollziehen einen appellativen Akt, indem sie den Empfänger an die Stelle des Bildsubjekts versetzen, ihm den Blick des Bildsubjekts aufnötigen und ihn damit auffordern, die Welt mit den Augen des Bildsubjekts zu betrachten (Appell/Signal). 64
So läßt sich etwa der (nach SEARLE 1971) als Teil des propositionalen Akts bestimmte Prädikationsakt bei Bildern, wie gezeigt wurde (S. 19f.), nicht nachweisen. Zu den Grundbegriffen der Sprechakttheorie vgl. COHEN 1980, 24-32; HINDELANG 1983; BUSS-
MANN 1983, 498 und hier Kap. V.A.2. 63 BÜHLER 1934, 24-33.
64 Ob und welche weitergehenden 'Appelle' an den Empfänger daraus resultieren, läßt sich selbstverständlich nur aus den je konkreten bildlichen Sprechakten ableiten.
28
Kapitel I: Film als Rede
Die Doppelbedeutung ikonischer Zeichen: Ikon und Symptom Darstellungs- und Ausdrucksfunktion des ikonischen Sprechakts haben unmittelbare Konsequenzen für die Struktur ikonischer Zeichen.65 Sie haben zum einen zur Folge, daß ikonische Zeichen als Zeichen mit zwei Bedeutungen anzusprechen sind, weil sie nicht nur visuelle Sachverhalte bezeichnen, sondern immer auch und zugleich Auskunft über die Beziehung des Bildsubjekts zu diesen Sachverhalten geben: Sie sind nicht nur Ikon (»Darstellung«), sondern stets auch Symptom. Das hat zum anderen zur Folge, daß ein und dasselbe Ikon (ein und dieselbe ikonische 'Proposition') nach Maßgabe seiner wechselnden Symptomfunktionen in unterschiedlichsten Gestalten erscheinen kann: Sämtliche abbildungstechnische und -ästhetische Entscheidungen, die das Bildsubjekt bei der Herstellung eines Bildes (nicht bei der eventuellen 'Herrichtung' der abzubildenden Objekte, sondern im Abbildungsakt selbst)66 trifft, darunter allererst die Wahl seines Blickpunktes (s.o.), schreiben sich als Symptome in das Bild ein, und je nachdem, wie diese Entscheidungen ausfallen, fallen auch die Erscheinungsbilder der dargestellten Objekte anders aus. Ikonische Zeichen verändern also nach Maßgabe der vom Bildsubjekt gewählten Abbildungsverfahren ihre Gestalt: Ein Quader, aus frontaler Perspektive gesehen, ergibt das Bild eines kurzen, von der Seite gesehen dagegen das Bild eines langen Rechtecks. In ihrer Eigenschaft als Ikone (mit Blick auf ihre Darstellungsfunktion) denotieren die ikonischen Zeichen hier in beiden Fällen dasselbe, vollziehen also in beiden Fällen identische Propositionen; in ihrer Eigenschaft als Symptome dagegen denotieren sie Différentes, nämlich verschiedene (hier als schlichte Raumbeziehungen realisierte) Beziehungen des Bildsubjekts zum Dargestellten. Nun ergäbe sich allerdings aus keiner der bei diesem Beispiel denkbaren Wahrnehmungspositionen das Bild einer runden Form, das heißt: Da ikonische Zeichen motivierte Zeichen sind, schreiben sich die Formeigenschaften der Objekte (genauer: unsere Perzepte von ihnen) gleichermaßen in das Bild ein, prädisponieren die möglichen Erscheinungsweisen dieser Objekte und damit die möglichen Varianten ikonischer Zeichen: Als Ikone sind ikonische Zeichen stets Funktionen der Formeigenschaften der Objekte und werden ab solche zu Symptomen der Beziehung des Bildsubjekts zu diesen Objekten. 65 Die Appellfunktion kann bei dem folgenden Gedankengang vernachlässigt werden, weil sie sich bei ikonischen Sprechakten aus der Ausdrucksfunktion ableitet. 66 Bei der 'Herrichtung' der Objekte (z.B. der Anordnung von Gegenständen als Modellen für ein Stilleben, der Inszenierung einer Spielfilmszene usw.) wird die Objektstruktur, nicht die Subjekt-Objekt-Relation organisiert; sie hat einen anderen Status als die die Beziehung des Subjekts der bildlichen Rede zu ihm artikulierenden Herstellungsverfahren, auch wenn seine 'Herrichtung' natürlich erhebliche Funktion für die Sinnkonstitution hat und auch immer schon auf das Herstellungsverfahren bezogen ist.
Kapitel I: Film als Rede
29
Ikonische Zeichen stehen demnach - das begründet ihre Doppelbedeutung in doppelseitiger Relation, einerseits zum Objekt, andererseits zum Subjekt der Bilder. Sie werden deshalb auch doppelseitig »gelesen«: Bei der Betrachtung eines Bildes, das einen aus der Froschperspektive photographierten Wolkenkratzer zeigt, auf dem also die Seitenlinien des Gebäudes als nach oben hin sich verjüngende, als stürzende Linien erscheinen, wird der Rezipient diese stürzenden Linien, so lange er ihre objektspezifische Relation aktualisiert, sie also auf den Wolkenkratzer selbst bezieht (als Ikone wahrnimmt), ignorieren, genauer: korrigieren, denn er »liest« sie nicht als Zeichen dafür, daß sich der Wolkenkratzer nach oben verjüngt, sondern er interpretiert sie in gerade Linien um. Erst wenn er die subjektspezifische Relation dieser Zeichen aktualisiert, sie also auf das Bildsubjekt bezieht, gewinnt der schräge Verlauf der Linien Bedeutung, wird als Folge der Wahrnehmungsposition des Bildsubjekts und damit als Symptom verstanden.
C. Kinematographische Sprechakte Die vorstehenden Überlegungen liefern die Voraussetzung für die theoretische Bestimmung kinematographischer Sprechakte als spezieller Formen bildlicher Sprechakte. Um das Verfahren abzukürzen, sollen hier nun nicht nur die Besonderheiten, die filmische Sprechakte - als photographische und als verzeitlichte - von anderen ikonischen Sprechakten unterscheiden, sondern auch gleich die allgemeinen Merkmale jener filmischen Sprechakte in die Bestimmung einbezogen werden, von denen von nun an ausschließlich die Rede sein soll, die Merkmale filmischer Narration. Kinematographische Sprechakte sollen hier also gleich von vornherein als kinematographische Erzählakte kategorisiert werden.
1.
Voraussetzungen: Zeitlichkeit und Narrativität
Bisher war von Bildern allgemein und dabei von unbewegten Einzelbildern die Rede. Der Film besteht aus einer Vielzahl unbewegter Einzelbilder, und deshalb gilt, was bisher gesagt wurde, prinzipiell auch für ihn. Was ihn von Einzelbildern unterscheidet, ist die durch die rasche Abfolge vieler solcher Einzelbilder erzeugte Illusion von Bewegung, und das heißt: seine Erstrekkung in der Zeit. Sie ist die Voraussetzung für die Fähigkeit des Films, Geschichten zu erzählen und damit eine fiktive Welt zu illusionieren. Beides
30
Kapitel I: Film als Rede
schafft besondere Konditionen für die Subjekt-Objekt-Struktur filmischer Bilder und damit für die Struktur kinematographischer Sprechakte. Bewegung und Zeit Produktion wie Rezeption filmischer Bilder sind an eine fest bestimmte zeitliche Erstreckung gebunden, die in der Regel mit 24 Bildern pro Sekunde bemessen ist (weshalb die Rezeption filmischer Bilder, anders als die Rezeption unbewegter Bilder oder auch sprachlicher Erzähltexte, insofern entprivatisiert ist, als Zeitpunkt, Dauer und Tempo der Rezeption festgelegt sind). Während unbewegte Einzelbilder optische Situationen erfassen, erlaubt es die rasche Abfolge vieler Einzelbilder, Veränderungen optischer Situationen, Bewegungen, 67 abzubilden und damit eine Funktion der Zeit kontinuierlich68 zu erfassen: Handlung. Nicht zufallig hießen die ersten Filmstreifen der Filmgeschichte so wie die Handlung, die sie abbildeten, denn eben darin, in der Reproduktion von Bewegungen und damit von in der Zeit ablaufenden Vorgängen, bestand ja die sensationelle Neuheit des Kinematographen: »L'Arrivée d'un train en gare de La Ciotat«, »La Sortie des usines«, »La Démolition d'un mur« (Lumière). Mit der Verzeitlichung von Bildern verändert sich ihre Objektstruktur und damit auch ihre Subjekt-Objekt-Struktur. Neben räumliche Beziehungen treten zeitliche, wird die Objektstruktur filmischer Bilder um die Dimension der Zeit erweitert: Die Bilder der Welt, mit deren Hilfe sich das Bildsubjekt artikuliert, geben, indem sie beweglich werden, die Möglichkeit, Welt im Medium der Zeit zu erfassen, ein Bild der Welt im Ereignishaften zu entwerfen. Die ersten Filmstreifen der Brüder Lumière dauerten in der Regel so lange wie die Handlung, die sie abbildeten. Die filmästhetische Relevanz der Möglichkeiten, die in der doppelten Zeiterstreckung des Films, in der potentiellen Differenz von Filmzeit und gefilmter Zeit, und das heißt: in der Montage, steckten, sollten erst ihre Nachfolger erkennen und gezielt nutzen: Die doppelte Zeiterstreckung filmischer Bilder eröffnet dem Bildsubjekt neue Wege bildlicher Rede, neue Möglichkeiten, seine Beziehung zu den Objekten seiner Wahrnehmung zu artikulieren, indem es sein Zeitmaß zu dem der Objekte in Beziehung setzt. Die Relation von Filmzeit und gefilmter Zeit wird so zu einem gewichtigen Strukturelement kinematographischer Sprechakte.
67
68
Kinesische Zeichen sind 'temperierte Icons', also in Bewegung geratene ¡konische Zeichen (vgl. ECO 1972, 250-266). Da sie - als ¡konische - denselben grundsätzlichen Voraussetzungen gehorchen wie ikonische Zeichen, muß ihr theoretischer Status hier nicht noch einmal eigens diskutiert werden. Die Illusiomening kontinuierlicher Bewegungsabläufe unterscheidet den Film von der Bildergeschichte, die Bewegung nur diskontinuierlich abbilden kann.
Kapitel I: Film als Rede
31
Mit der beweglichen Kamera entstand eine weitere Möglichkeit, die Zeitlichkeit filmischer Bilder für die Organisation der Subjekt-Objekt-Struktur zu nutzen: Die bewegliche Kamera verschafft dem filmischen Bildsubjekt nicht nur ein erheblich vergrößertes Wahrnehmungsfeld und die Möglichkeit, weiträumige Objektbewegungen zu verfolgen, sondern gibt ihm darin auch Verfahren in die Hand, seine Beziehung zum Bildobjekt über die Eigenbewegung zu artikulieren. Filmisches Geschichtenerzählen und sein Subjekt: Der filmische Erzähler Die Fähigkeit des Films, zeitliche Vorgänge, Handlungen, abzubilden, begründet seine Fähigkeit, Geschichten zu erzählen, und die Abbildung dargestellter (fingierter) Spielhandlungen eröffnet ihm die Möglichkeit, fiktive Geschichten zu erzählen. Was das an realen Ereignissen interessierte Aktualitätenkino der Brüder Lumière nur in Ausnahmefällen bot (»L1 Arroseur arrosé«), wurde für ihren Konkurrenten Méliès und wenig später für Griffith zum beherrschenden Anliegen: die Illusionierung einer Welt des Scheins, des 'Als ob', die Möglichkeit, mit bewegten Bildern »eine Welt der Fiktion auf Augenblicke als eine Welt der Wirklichkeit« erscheinen zu lassen.69 Wie die Verzeitlichung der Objektstruktur verändert auch deren Fiktionalisierung die Redebedingungen des Bildsubjekts: Analog zu der alten Frage der Erzähltheorie, wer denn den Roman erzählt, stellt sich auch hier die Frage, wer denn die fiktiven Bildwelten des Films wahrnimmt und diese Wahrnehmungen kommuniziert. Wie zwischen Erzählen und Erzähltem im sprachlichen Erzähltext besteht auch im Erzählkino zwischen Abbilden und Abgebildetem insoweit kein Aussageverhältnis, als es sich dabei nicht um Bezugnahmen eines empirischen Subjekts auf ein empirisches (reales) Objekt handelt. Denn das Erzählte/Abgebildete ist fiktiv (autoreferentiell) und folglich konstituiert das Erzählen/ Abbilden keine Wirklichkeitsaussagen (keine pragmatischen, auf Sachverhalte der Realität bezogenen Kommunikationssituationen).70 Da nun aber erzählende Texte zwar nicht den Status, wohl aber die Form von Wirklichkeitsaussagen haben (sie sprechen ja nicht im Irrealis), kann man das, was etwa Käte Hamburger lieber »Erzählfunktion« nennen wollte,71 als fingierte Wirklichkeitsaussage, das Subjekt dieser Aussagen seinerseits als fingiertes Aussagesubjekt (»Erzähler«) und das empirische Werksubjekt schließlich als beider 69 Theodor Fontane: Gustav Freytag. Die Ahnen [1875], in: Th. F., Werke und Schriften, hg. v. W. Keitel/H. Nürnberger, Bd. 28, München 1969, 118f. 70 Zur kommunikationstheoretischen Begründung des Fiktiven vgl. die zusammenfassende Darstellung von GUMBRECHT 1977. 71 HAMBURGER 1 9 6 8 , 113.
32
Kapitel I: Film als Rede
Urheber bestimmen, der eine 'zweite', 'andere' Welt schafft und ein Subjekt, das dieser Welt angehört, aus ihr berichten läßt, den fiktiven Erzähler. Die Rede, die dieses fiktive Aussagesubjekt führt, hätte folglich insofern legitimerweise die Struktur von Wirklichkeitsaussagen, als sie sich nicht auf die Wirklichkeit des empirischen Rezipienten, sondern auf die Wirklichkeit seiner - fiktiven - Welt bezieht.72 Dies ist - auf kürzeste Formeln gebracht - der theoretische Stand, von dem die literaturwissenschaftliche Praxis mehr oder weniger selbstverständlich ausgeht und den die literaturwissenschaftliche Propädeutik ansetzt.73 Beim Erzählfilm ist die Unterscheidung von fiktivem Erzählsubjekt und empirischem Werksubjekt eine bare Notwendigkeit, weil sich der Erzählakt hier als Wahrnehmungsakt vollzieht: Wenn das Wahrgenommene als fiktiv zu bestimmen ist, dann muß auch das Subjekt seiner Wahrnehmung als ein fiktives bestimmt werden, andernfalls müßte man das Wahrgenommene als Realität oder das empirische Werksubjekt als Fiktion bestimmen. Denn filmisches Erzählen beruht grundsätzlich auf der Fiktion, daß sich sein Subjekt, der Erzähler, am Ort des Geschehens befunden, dem Geschehen 'zugesehen' und 'zugehört' hat: Als ein über sinnliche (visuelle und akustische) Wahrnehmungen vermittelter Erzählakt setzt filmisches Erzählen die zeit-räumliche Koinzidenz von Wahrnehmen (Erzählen) und Wahrgenommenem (Erzähltem) voraus. Deshalb kann der filmische Erzähler sich auch nicht, wie seine wortsprachlichen Verwandten, auf die Zitierung von Gewährsleuten, auf die Herausgeberfiktion u.ä. und damit auf die Position eines unter Vorbehalten (unter dem Vorbehalt der Zuverlässigkeit seiner Gewährsleute, seiner Quellen usw.) erzählenden Erzählers zurückziehen: Die Beglaubigung des Erzählten liegt hier in der Anwesenheit des Erzählers am Schauplatz des Geschehens, und was 72 Demnach wäre es nicht der Autor, sondern sein fiktiver Erzähler, der sich für die 'Wahrheit' seiner Geschichte verbürgt, und weil er selbst jener Welt der Fiktion, aus der er berichtet, angehört, kann ihn niemand, der dieser Welt nicht angehört, der Falschaussage bezichtigen (weshalb z.B. historische Romane, anders als historische Sachtexte, ihre ihnen eigene 'Wahrheit' auch dann bewahren, wenn sie geschichtliche Tatbestände 'falsch' darstellen). 73 Vgl. Z.B. PFISTER 1982, 19-22; KAHRMANN/REISS/SCHLUCHTER 1986, 25-53. - In der
theoretischen Diskussion stehen diese Annahmen nach wie vor unter dem Druck kommunikations- und rezeptionsästhetischer Einwände (vgl. dazu die zusammenfassende Darstellung bei HARTH/VOM HOFE 1982, 28-30), die hier indes nicht zu diskutieren sind, weil es hier darum geht, der Filmtheorie Uberhaupt den AnschluB an allgemein anerkannte und erprobte erzähltheoretische Standards zu verschaffen. Denn in der Filmwissenschaft werden die Begriffe »Erzählkino«, »filmisches Erzählen« oder »filmischer Erzähler« zumeist noch immer ohne alle (theoretischen) Umstände benutzt und sind deshalb bisher auch weitgehend unfhichtbar geblieben (vgl. z.B. die in erzähltheoretischer Hinsicht naiven Setzungen verschiedener »Schichten des Filmbildes« bei PETERS 1971, 56f).
Kapitel 1: Film als Rede
33
immer dieser Erzähler zeigt, er muß sich, weil es etwas von ihm Wahrgenommenes ist, dafür als für eine 'wahre Begebenheit' verbürgen (und sei es auch nur die 'Wahrheit' einer Vorstellung, einer Erinnerung, eines Traumes usw.)· 74 Nicht zufällig hat man es Hitchcock als Verstoß gegen die Gesetze des Films angekreidet, daß er sich in »Stage Fright« (GB 1950) »etwas erlaubt, was ich nie hätte machen dürfen: eine Rückblende, die eine Lüge war«.75 Die filmische Erzählinstanz kann Träume, Visionen, Halluzinationen (ihre oder die einer ihrer Figuren) 'sehen' und 'hören', aber sie kann nichts sehen und hören, was (objektiv oder subjektiv) nicht ist.76 Exkurs: Die präsentische Rede des Films und der Schnitt - ein erzähltheoretischer Widerspruch Die eben erwähnte zeit-räumliche Koinzidenz von Wahrnehmen und Wahrgenommenem für die Dauer jeder filmischen Einstellung hat zur Konsequenz, daß das Tempus der filmischen Erzählerrede nicht das epische Präteritum, sondern das Präsens, die Jetzt-Zeit der wahrgenommenen Objekte ist. Die Möglichkeit des Erzählers sprachlicher Erzähltexte, mit dem Wechsel vom epischen Präteritum ins Präsens den Wechsel von der Narration zu den sog. zeitlosen Redeformen (Kommentar, Erörterung etc.) anzuzeigen, steht dem filmischen Erzähler deshalb nicht zu Gebote (vgl. S. 39-42). Weil das Erzählte nicht als etwas Vergangenes, sondern hier und jetzt, im Akt der Wahrnehmung sich Ereignendes erscheint, läßt sich in der per se präsentischen Bildersprache nicht eigens eine von der Zeitebene des Erzählten differierende Zeitebene der Erzählgegenwart anzeigen, können Zeit und Ort des Erzählvorganges und Zeit und Ort des Erzählten nicht auseinandergelegt werden: Jeder Wechsel der Zeitebene, jede Rückblende auf vergangenes Geschehen etwa, muß aus der Jetzt-Zeit des Erzählens/Erzählten (z.B. aus der 'hier und jetzt' Aufgrund solcher Motivierung des Erzählens durch subjektive Erinnerungshandlungen kann z.B. Akira Kurosawa es sich leisten, die Ermordung des Samurai in »Rashomon« (J 1950) in mehreren einander widersprechenden Varianten zu zeigen: Hier hat jede Variante ihre eigene, subjektive Wahrheit, weil sie als subjektive Erinnerungen der jeweils berichtenden Figuren begründet werden. 75 TRUFFAUT 1 9 8 2 , 185.
76 Jonathan Cooper (Richard Todd), dessen Lügengeschichte die Rückblende zu Beginn von »Stage Fright« zeigt, weiß, daß er Eve Gill (Jane Wyman) belügt, und dasselbe gilt für den filmischen Erzähler, der deshalb auch keine Anstalten macht, die Rückblende psychologisch (etwa als Wunschvorstellung des Lügners oder als Vorstellung der Belegenen) zu motivieren. Sie dient ihm vielmehr allein zur Irreführung des Zuschauers, soll die Spannung dieses »Whodunit« bis zur Auflösung aufrechterhalten. Es gibt in diesem Film also keine Figur, für die diese Rückblende Realität hat, und eben deshalb verstößt sie in der Tat gegen ein Gesetz des Films, das aus der besonderen Bedingung filmischen Erzählens, der Realisierung des filmischen Erzählakts als Wahrnehmungsakts, resultiert.
34
Kapitel l: Film als Rede
stattfindenden Erinnerung einer Figur) motiviert werden. Deshalb sind Vorgriffe im Film praktisch nicht durchführbar, ohne daß sich dabei die Jetztzeit des Erzählens im Film auf den Zeitpunkt dessen verlagert, worauf vorgegriffen wird, und den Bildern, die das zeitlich Zurückliegende zeigen, den Status von Rückblenden gibt (vgl. Kap. III.C.2.1). 7 7 Diese zeiträumliche Koinzidenz von Erzählen und Erzähltem, die dem fiktiven Erzähler die Rolle eines 'Zuschauers' zuweist, der den Ausgang der Geschichte ebensowenig kennt wie die Figuren, macht nun aber die erzähltheoretische Begründung jener Abbildungsverfahren zu einem Problem, die einen Erzähler voraussetzen, der die Geschichte bereits kennt. Dieses Problem betrifft neben bestimmten Formen des Erzählerkommentars vor allem die Montage: Denn die zeitliche und handlungslogische Strukturierung des Erzählvorgangs in der Montage (vgl. Kap. III.C) setzt in der Regel ein Erzählsubjekt voraus, das die Geschichte als ganze bereits übersieht, für das die Geschichte also schon Vergangenheit ist. Diese in der Montage angedeutete Nachzeitigkeit des Erzählakts widerspricht mithin dem präsentischen Modus filmischen Erzählens, und dieser Widerspruch ist theoretisch nicht auflösbar, denn weder läßt sich aus der Montage die Nachzeitigkeit des gesamten Erzählakts ableiten, also das Gesetz der in den Bildern herrschenden zeiträumlichen Koinzidenz von Erzählen und Erzähltem aufheben, noch läßt sich dieses Gesetz auf den Vorgang der Montage ausdehnen und die zwischen den Bildern indizierte Nachzeitigkeit in Gleichzeitigkeit umdeuten. Nur scheinbar könnte man sich hier aus der Affare ziehen, indem man produktionstechnische Aspekte in die Theorie filmischen Erzählens aufnimmt, den Erzählakt nämlich in einen (präsentischen) Wahrnehmungsakt (Dreharbeiten) und einen (nachzeitigen) Akt der Organisation des phototechnisch fixierten Wahrgenommenen (post-production) auseinanderlegt. Diese Lösung ist keine, nicht nur, weil sie schon in produktionstechnischer Hinsicht fragwürdig ist (denn in den meisten Fällen prädisponiert das Montagekonzept zu erheblichen Teilen bereits die Dreharbeiten), sondern auch, weil sie rezeptionsästhetischen Sachverhalten und damit zugleich wesentlichen Aspekten der hier entwickelten theoretischen Begründung filmischen Erzählens widerspricht, wonach ikonische Kommunikation auf dem Umstand zurückzuführen ist, daß Bilder ihre Rezipienten in die Subjektposition der ihnen immanenten Subjekt77
Deshalb verliert der Rezipient bei länger dauernden Vor- oder Rückgriffen auch den Eindruck des Pro- oder Retrospektiven, erliegt vielmehr der Gegenwärtigkeit der Bilder, wie sich regelmäßig bei Filmen beobachten läßt, die ihre Geschichten in der Form ein- oder mehrfacher Rahmenerzählungen präsentieren, wie z.B. »Citizen Kane« (USA 1940, Regie: Orson Welles) oder »Romanze in Moll« (D 1943, Regie: Helmut Käutner): Der Eindruck der Nachzeitigkeit des Erzählens (der Erinnerungsvorgänge) gebt schon nach wenigen Einstellungen verloren.
Kapitel I: Film als Rede
35
Objekt-Relation versetzen. Im Horizont dieser Begründung ikonischer Kommunikation sind Einstellungswechsel nicht als Ergebnis der Arbeit am Schneidetisch, sondern als Blickwechsel des Erzählsubjekts zu kategorisieren, und deshalb stützt sich der durch die Montage vermittelte Eindruck der Nachzeitigkeit auch nicht auf das Wissen um die Nachzeitigkeit der Schneidearbeiten, sondern allein auf den Umstand, daß sich in diesen Blickwechseln ein mit dem Verlauf der Geschichte bereits vertrautes Erzählsubjekt zu erkennen gibt. Der Widerspruch zwischen dem präsentischen Tempus der Bilder und dem präteritalen Gestus ihrer Montage läßt sich also nicht lösen. Er ist dem Film immanent. Nun hält allerdings der Eindruck der Nachzeitigkeit, den die Montage hervorruft, der Präsenz der Bilder selten stand. Denn die Montage kann ihren nachzeitigen Standort nicht näher bezeichnen, ihr Zeitpunkt bleibt unbestimmt. Das liegt daran, daß der Schnitt selbst kein selbständiges, sondern ein semantisch 'leeres', indifferentes Zeichen darstellt, dessen Bedeutung nicht von ihm, sondern von den ihn umgebenden Bildern geklärt wird. In diesen Bildern aber herrscht der präsentische Modus, der den präteritalen Gestus der Montage 'überwältigt'. Deshalb reicht dieser präteritale Gestus nicht aus, um eine Ebene der Erzählgegenwart zu konstituieren und die Zeitebene des Erzählten ins Präteritum zu verlegen.
2.
Die filmische Sprechsituation
Der kinematographische Sprechakt zeichnet sich also durch seine Verzeitlichung und - im Erzählkino - durch seinen fiktionalen Status aus: Die optische Bezugnahme eines Bildsubjekts auf ein Wahrnehmungsobjekt, in der sich der bildliche Sprechakt realisiert, vollzieht sich im Film im Medium der Zeit und erweist sich im Erzählfilm als eine fiktive, als Bezugnahme eines fiktiven Bildsubjekts, des filmischen Erzählers, auf seine - fiktive - Welt. Beides begründet die Kategorisierung kinematographischer Sprechakte, wie sie das Erzählkino realisiert, als Erzählakte. Diese Erzählakte gehorchen als bildsprachliche besonderen Bedingungen, unterliegen anderen Voraussetzungen als wortsprachliche Erzählakte. Der Vergleich zwischen beiden wird im folgenden den heuristischen Ansatzpunkt liefern für eine erste Klassifikation filmischer Verfahren der Textkonstitution im Horizont literaturwissenschaftlicher Theoreme. Als Vergleichskriterium wird dabei eine alte rhetorisch-poetische Kategorie fungieren: das Redekriterium (»Wer spricht?«). Jenseits herkömmlicher gattungstheoretischer Fixierungen, also nicht auf literarische Textgattungen, sondern »auf Rudimentäreres«,
36
Kapitel I: Film als Rede
nämlich auf die Frage nach der Sprechsituation bezogen,78 liefert das Redekriterium die Voraussetzung für die Unterscheidung zweier grundlegender Sprechsituationen, die schon die antike Rhetorik und Poetik traf und mit dem Begriffspaar »Diegesis« und »Mimesis* (»Bericht« und »Darstellung«) kennzeichnete,79 nämlich die Unterscheidung zwischen der 'performativen' (dramatischen) und der 'berichtenden' (narrativen) Sprechsituation.80 Diese Unterscheidung kann behilflich sein, das Spezifikum der kinematographischen Sprechsituation zu erfassen, wobei hier nun von vornherein von den fiktionalen Varianten beider Typen (dramatisch vs. narrativ) ausgegangen wird. Der kinematographische Erzählakt im Horizont dramatischer und narrativer Sprechakte Der dramatische Sprechakt ist, mit Peter Szondi zu reden, »absolut«,81 weil er nicht als ein von einem vermittelnden Subjekt (Erzähler) referierter, sondern als ein von den Akteuren der Geschichte selbst realisierter erscheint. Dramatische Rede ist »Darstellung« (»Mimesis«): Dramatisches Geschehen »stellt sich selber dar, ist es selbst«,82 beruht auf der »Alleinherrschaft des Dialogs«,83 der (multilateralen) Kommunikation der fiktiven Figuren. 84 Die kommunikative Tätigkeit des Autors beschränkt sich auf die Herstellung bestimmter Voraussetzungen dafür, daß das Dargestellte als Selbstdarstellung erscheinen kann, und ist daher nicht mehr spürbar: »Der Dramatiker ist im Drama abwesend. Er spricht nicht, er hat Aussprache gestiftet.«85 Bei narrativen Sprechakten dagegen wird das gesamte Geschehen durch eine (fiktive) Vermittlungsinstanz kommuniziert: Das in narrativer Rede Dargestellte ist deshalb, mit Peter Szondi zu reden, »relativ«, eben bezogen auf das fiktive Aussagesubjekt, den Erzähler, der es, indem er es zum Objekt seiner Rede macht, in die epische Subjekt-Objekt-Relation überführt. Narrative Rede ist »Bericht« (»Diegesis«): Sie ist sprachliche Bezugnahme auf ein Geschehen, das - im Unterschied zum dramatisch dargestellten Geschehen, das als ein 'hier und jetzt' sich ereignendes fingiert wird - als ein zeitlich jenseits des Erzählvorganges selbst liegendes Seiendes fingiert wird, das im Erzählakt sprachlich re-präsen78 HEMPFER 1 9 7 3 , 1 6 0 .
79 Vgl. Aristoteles: Poetik, übers, und hg. v. Manfred Fuhrmann, Stuttgart 1982, 9; Piaton, Politela, 392a-398 (Stephanus-Zählung). 80 Vgl. HEMPFER 1973, 161f. - Die Begriffe 'perfonnativ' bzw. 'berichtend' bezieht Hempfer auf pragmatische (non-fiktive) Sprechsituationen. 81 SZONDI 1 9 7 0 , 15.
82 Ebd. 16. 83 Ebd. 15. 84 HEMPFER 1 9 7 3 , 1 6 2 . 85 SZONDI 1 9 7 0 , 1 5 .
Kapitel I: Film als Rede
37
tiert wird; sie beruht auf der (unilateralen) Kommunikation eines Sprechers mit einem Hörer, der im Akt der Sprachproduktion in der Regel nicht anwesend ist.86 Diese »relativierende« Funktion des Narrativen hat zur Folge, daß dramatische Sprechakte (Dialoge) ihren »absoluten« Status verlieren, sobald sie erzählt, also nicht von den Figuren selbst vollzogen, sondern vom Erzählsubjekt - etwa als »direkte« oder »indirekte Rede« - re-präsentiert, referiert werden. In erzählten Dialogen reden nicht die Figuren, vielmehr hat ihre Rede - auch in der direkten Rede - stets den Status »zitierter« Rede: In narrativen Sprechsituationen, stellt man sie sich phonetisch realisiert vor, hört man immer nur eine und dieselbe Stimme, nämlich die des Erzählers, in dramatischen Sprechsituationen dagegen immer nur die vielen verschiedenen Stimmen der Figuren.87 Der kinematographische Sprechakt nun scheint den Bedingungen der narrativen Sprechsituation zu gehorchen, wie schon die Herleitung der Bestimmung von Bildern als Sprechakten aus der Subjekt-Objekt-Struktur von Bildern zeigt: Die Dinge der sichtbaren Welt werden, indem sie abgebildet werden, zu Objekten der Wahrnehmung eines Bildsubjekts, verlieren also ihren »absoluten« Subjektstatus, den man ihnen als vorfilmischen Phänomenen zusprechen kann.88 Die kinematographischen Abbildungsverfahren sind als Vermittlungstätigkeit zu kategorisieren, die das dargestellte Geschehen als ein vermitteltes ausweist, es im Akt der kinematographischen Reproduktion in die genuin narrative Subjekt-Objekt-Relation von Abbilden (Erzählen) und Abgebildetem (Erzähltem) überführt, und im Verhalten der Kamera zum Abgebildeten und in der Organisation von Raum und Zeit durch die Montage artikuliert sich eine dem fiktiven Erzähler wortsprachlicher Texte vergleichbare Vermittlungsinstanz, die das Erzählte aus je subjektivem Blickwinkel und in je spezifischer raumzeitlicher Organisation präsentiert. Dieser Vermittlungsakt vollzieht sich hier nun aber nicht im Medium der Sprache, sondern im Medium ikonischer Zeichen, die hier zudem auf dem 86 HEMPFER 1973, 162. 87 Vgl. die schematische Darstellung des Sachverhalts bei pfister 1982, 20f. und dessen Reproduktion hier S. 45. Szondis Begriff des »Absoluten« bzw. »Relativen« steht hier durchgehend in Anfuhrung, weil er ein rein heuristischer ist: Daß es keine absoluten Erscheinungsweisen der Dinge gibt, versteht sich von selbst und wird mit diesen Begriffen auch nicht in Frage gestellt, denn wenn hier, Szondis Begrifflichkeit folgend, vom »absoluten« Status der vorfilmischen Phänomene die Rede ist, Hann meint das nicht den Status dieser Phänomene als Dingen »an sich«, sondern den Umstand, daß sie, solange sie nicht Objekte der Wahrnehmung sind, als »für sich seiende« Subjekte gedacht werden können. »Absolut« meint also das im eigentlichen Wortsinne 'Abgelöst-Sein' dieser Phänomene von Wahrnehmung, ihr 'Nicht-Objekt-Sein' und insofern 'Subjekt-Sein', das erst im Akt der Wahrnehmung aufgehoben wird.
38
Kapitel I: Film als Rede
Wege der photo- und tontechnischen Reproduktion Zustandekommen. Das hat zur Folge, daß das filmisch Erzählte (Abgebildete), anders als das sprachliche Erzählte, seine 'authentische' sinnliche Erscheinung zu großen Teilen bewahrt. Der filmische Erzählakt beruht auf der Fiktion, daß der Erzähler dem fiktiven Geschehen selbst beigewohnt hat, daß er ihm 'zugesehen' und 'zugehört' hat (vgl. S.32f.): Der Rezipient, so will es die filmische Fiktion, sieht und hört mit den 'Augen' und 'Ohren' des fiktiven Erzählers nicht die 'Wiedererzählung' eines (anderswo und zu anderer Zeit vorgefallenen) Geschehens, auch nicht dessen 'Nachahmung', sondern dieses Geschehen selbst, dessen Duplikat zwar, aber ein Duplikat seiner authentischen sinnlichen Erscheinung, nicht eine diese sinnliche Erscheinung in ein abstraktes Medium, die Sprache, transformierende 'Übersetzung'. Das heißt zunächst, daß das Erzählte hier nicht - wie das sprachlich Erzählte - als ein zeiträumlich jenseits des Erzählvorganges liegendes Seiendes gedacht werden kann (vgl. S. 36f.), das im Erzählakt noch einmal - retrospektiv - re-präsentiert wird. Vielmehr ist es im Erzählvorgang selbst präsent, und eben darin liegt das Spezifikum filmischen Erzählens: Das Erzählte erscheint hier nicht als etwas (sprachlich) Rekapituliertes, in eine andere Gestalt 'Übersetztes', sondern - vermittelt freilich über den Apparat - in seiner authentischen sinnlichen Gestalt, als es selbst: Es »stellt sich selber dar, ist es selbst«,89 erscheint hier also in Gestalt (verbaler und non-verbaler) dramatischer Sprechakte, gehorcht folglich den Redebedingungen der dramatischen Sprechsituation. Das aber heißt, daß die Subjekt-Objekt-Relation von Erzählen und Erzähltem, die die narrative Sprechsituation definiert, beim Film - anders als beim sprachlichen Erzähltext - beschränkt ist auf den Akt der optisch-akustischen Abbildung dramatischer Sprechsituationen: Die narrative Sprechsituation vollzieht sich beim Film in der Abbildung anderer, nämlich dramatischer Sprechsituationen. Und erst im Akt dieser Abbildung, in der Art und Weise der kinematographischen Reproduktion, entwickelt die filmische Erzählerinstanz ihre eigene, spezifische Sprache: Distanz, Perspektive oder Bewegungsverhalten der Kamera begründen (wie alle übrigen kinematographischen Abbildungsverfahren) im Film das, was im sprachlichen Erzähltext die Erzählerrede im Akt der sprachlichen Repräsentation des Erzählten leistet: die Organisation der Beziehung des Erzählers zum Erzählten (Erzählsituation, Perspektivierung, Kommentierung, Zeitstrukturierung etc.). Das Erzählte selbst aber erscheint - sofern es als Bild und nicht in versprachlichter Gestalt, als Gegenstand sprachlicher Erzählakte (voice over, Schriftinserts) erscheint - grundsätzlich im Modus dramatischer Rede, zeigt das »wesentlich dramatische Ineinanderübergehen von Subjekt 89 SZONDI 1970, 16.
Kapitel I: Film als Rede
39
und Objekt«. 90 Filmische Erzählerrede kann sich demnach nicht anders denn im Akt der Abbildung dramatischer Sprechsituationen vollziehen: Weil der kinematographische Apparat nichts sehen und hören kann, was sich nicht gegenständlich-real vor seinen 'Augen' und 'Ohren' vollzieht, kann er nur erzählen, indem er das im Modus dramatischer Selbstdarstellung erscheinende Erzählte photo- und tontechnisch reproduziert. 91
Einzelheiten zum Verhältnis filmischer und sprachlicher Erzählerrede Man könnte meinen, daß die Bindung des filmischen Erzählens an ein im Modus dramatischer Rede erscheinendes Erzähltes noch kein Argument für die Differenzierung von narrativer und filmischer Sprechsituation sei, weil ja doch auch die narrative Sprechsituation die Möglichkeit hat, dramatische Sprechsituationen zum Gegenstand des Erzählens zu machen. In der Tat könnte man filmisches Erzählen mit solchen Abschnitten erzählender Texte vergleichen, in denen Figurenrede in der Form direkter Rede (Dialoge, innere Monologe) vermittelt wird, in denen also dramatische Sprechakte Gegenstand des Erzählens sind (und die man deshalb auch nicht zufällig mit einem dem Drama entlehnten Begriff als »szenische Darstellung« zu beschreiben pflegt): In der direkten Rede beschränkt der fiktive Erzähler seine Vermittlerrolle auf die eines Sprachrohrs der Figuren, zeigt an, daß er ihre Rede (oder Gedanken) genau und ohne Auslassungen wiedergibt, und der Rezipient hat die Illusion, den 'authentischen' Wortlaut des Gesprochenen ohne Eingriffe der Erzählinstanz verfolgen zu können. Und doch bleibt hier immer noch ein erheblicher Unterschied zum filmischen Erzählen bestehen: Im sprachlichen Erzähltext wird Figurenrede »zitiert«, im Film dagegen tontechnisch reproduziert. Das heißt: Im Erzähltext hat der Rezipient nur das wortgetreue Referat, mithin nur den 'authentischen' Wortlaut, nicht aber die phonetische Realisierung des Gesprochenen vor sich, denn er 'hört' dabei - stellt man sich den Text in der erzählerischen 'Ursituation' mündlichen Erzählens als gesprochenen vor - immer nur die Stimme des Erzählers, niemals die der Figuren selbst, denn die sind im Erzählakt - das epische Präteritum zeigt es an - zwar
oo Ebd. 117. 91 Dramatische Sprechsituationen, das ist mit Blick auf den Film eigens zu betonen, sind nicht nur solche, in denen Figuren sprechen und agieren. Sobald sich im Theater der Vorhang hebt, hat das Drama begonnen auch dann, wenn noch keine Figur auf der Bühne erschienen und scheinbar noch nichts geschehen ist, d.h.: mit dem Öffnen des Vorhangs und dem Sichtbarwerden der fiktiven Welt des Dramas, der Bühne, sind Zeit und Raum schon Zeit und Raum des dramatischen Geschehens. Ebenso beim Film: Sobald sich das Kameraauge öffnet, also ein Stück Film entsteht, entstehen Abbilder genuin dramatischer Sprechsituationen auch dann, wenn sie keine Handlungen zeigen, wenn sich in ihnen, wie z.B. in deskriptiven Einstellungen, scheinbar nichts ereignet (vgl. dazu Kap. III.D.l).
40
Kapitel I: Film als Rede
'vergegenwärtigt', aber nicht mehr gegenwärtig, sind schon Vergangenheit. Der Film aber liefert den authentischen Sprechakt der Figur selbst, also nicht nur dessen Wortlaut, sondern auch dessen phonetische und paralinguistische Realisation sowie - über den Bildkanal - die nonverbale, sprachbegleitende Mimik und Gestik und damit all jene zusätzlichen Informationen, die die nonverbalen Aspekte dramatischer Sprechakte implizieren und die der sprachliche Erzähltext nur über den Erzählerbericht - in versprachlichter Gestalt also vermitteln kann. Alle diese Informationen gehen im Film aber vom Erzählten selbst, nicht vom Erzähler aus, und das heißt: Dem filmischen Erzähler steht eine dem Erzählerbericht (d.i. die Gesamtheit aller Erzählformen außer der direkten Figurenrede) der Form nach92 entsprechende Darbietungsweise nicht zur Verfügung, denn er hat gar keine Möglichkeit, das Erzählte anders denn als (verbale und nonverbale) »Rede« der Objekte, also im Modus dramatischer Selbstdarstellung zu präsentieren. Das liegt daran, daß sein Erzählmedium ein im Prinzip 'leerer', sprachloser Apparat ist, der nur 'sprechen' kann, wenn seine Wahrnehmungsobjekte (optisch oder akustisch) sprechen. In zeichentheoretischer Perspektive ist dieses Fehlen einer dem Erzählerbericht - der Form nach - entsprechenden Darbietungsweise im Film die logische Konsequenz der fundamentalen Unterschiede zwischen sprachlichen und bildlichen Zeichen: Weil ikonische Zeichen nicht, wie sprachliche Zeichen, arbiträre und klassifikatorische, sondern motivierte und nicht-klassifikatorische Zeichen sind, können Bilder nur 'reden', indem sie die gemeinte Sache selbst zeigen. Sie können nicht, wie die Sprache, von der sinnlichen Erscheinung der bezeichneten Sache abstrahieren, sind ihr gegenüber nicht, wie die Sprache, autonom. Und wo sie gar, wie hier, auf der phototechnischen Reproduktion beruhen, sind sie ganz unmittelbar an diese sinnliche, gegenständlich-reale Erscheinung der Dinge gebunden, können nur entstehen, wenn der Apparat diesen Dingen leibhaftig gegenübersteht. Die Autonomie, die der Erzählerbericht den sinnlichen Erscheinungen der erzählten Welt gegenüber wahren kann, ist die der Sprache als eines Systems abstrakter 'Stellvertreter' der bezeichneten Dinge. 92 Der Funktion nach steht ihm ein den Erzählerbericht maßgeblich charakterisierendes Mittel, die Raffung der erzählten Zeit, mit der Montage zur Verfügung; die Montage aber verändert den Status der Bilder selbst ja nicht (und damit auch nicht die Form filmischen Erzählens), sondern umgekehrt: Es sind die Bilder, die den Status des jeweiligen Schnitts bestimmen, eben weil der Schnitt selbst in semantischer Hinsicht eine Nullstelle ist (vgl. S. 35), die erst durch die beiden umgebenden Einstellungen definiert wird (vgl. dazu Kap. III.B). - Die Möglichkeit, einen Off-Erzähler (voice over) einzusetzen, der den Erzählerbericht liefert, bleibt hier, wie gesagt, außer Betracht, weil es sich dabei um ein akzidentielles Mittel handelt, das für die theoretische Klärung der Grundfrage, wie mit Bildern Geschichten erzählt werden, uninteressant ist.
Kapitel I: Film als Rede
41
Filmische Bilder dagegen sind höchst konkrete 'Stellvertreter', können die Dinge nicht benennen, ohne sie - als sie selbst - zu zeigen. Diese Bindung der filmischen Erzählinstanz an den dramatischen Darstellungsmodus ihrer Objekte hat des weiteren zur Folge, daß es keine filmischen Redeweisen gibt, die den sog. zeitlosen Erzählweisen sprachlicher Erzähltexte (Erzählerkommentaren, Erörterungen, Beschreibungen) der Form nach entsprechen (funktionale Äquivalente dieser Erzählweisen werden noch zu Sprache kommen; vgl. Kap. III.D.2). Dieser Sachverhalt verweist abermals auf ein fundamentales Prinzip filmischen Erzählens, auf den Umstand, daß, wo Film ist, immer auch auf beiden Ebenen, der des Films und der des Gefilmten, Zeit vergeht (und nur zwischen den Bildern übersprungen werden kann), daß diese Zeit auf beiden Ebenen gleichsinnig verläuft und folglich das Tempus filmischen Erzählens nicht das epische Präteritum, sondern das Präsens, d.h. die Jetzt-Zeit der gefilmten Objekte ist. Die Kamera muß, solange sie läuft, Zeit und Raum mit den wahrgenommenen Objekten teilen, kann, solange sie läuft, Zeit und Raum nicht transzendieren, kann den Zeitfluß der Gegenwart nicht anhalten (ebensowenig verlangsamen oder beschleunigen),93 so daß folglich alles, was sie erfaßt, nur im genuin dramatischen Modus des 'hic et nunc' erscheinen kann. Eben deshalb gibt es im Film, anders als in Photographie oder Malerei, keine Bilder, in denen nichts 'geschieht',94 gibt es hier keine zeitlosen Bilder, d.h. Bilder, in denen die erzählte Zeit 'stillgelegt' ist: Der filmische Erzähler kann nicht eigens eine von der Zeitebene seiner Objekte differierende Ebene der Erzählgegenwart anzeigen, denn das Tempus seiner Rede ist immer schon das Präsens, die Jetzt-Zeit der Objekte.95 Und weil er mit seinen Mitteln, mit bildlichen Mitteln, das Tempus seiner Rede nicht verändern kann, nicht, wie der Romanerzähler das bei KomFür Zeitraffer- und Zeitlupenaufnahmen, die als filmische Äquivalente subjektiver, vom Chronometer abweichender Zeiterfahrungen in Funktion treten, gilt im Prinzip dasselbe: Auch hier reproduziert die Kamera die - in diesem Fall eben subjektive - Zeit ihrer Objekte. 94 Vgl. Anm. 91. - Der Eindruck, daß sich, wo unbelebte Dinge zu Protagonisten filmischer Bilder werden, nichts ereignet, ist eine Täuschung. Abgesehen davon, daß jede Bewegung - ein Blatt im Wind, eine Wolke etc. - Geschehen ist, geschieht auch in einer völlig reglosen Szenerie etwas: Es vergeht Zeit, und eben deshalb ist die Situation am Ende der Einstellung eine andere als an deren Beginn, hat sich etwas, wenn auch nicht durch »Handlung«, sondern bloß durch das 'Geschehen von Zeit', verändert. Das ist ein grundlegendes Spezifikum filmischer Bilder: Sie können die Dinge der sichtbaren Welt grundsätzlich nur in der Zeit, als dem Vergehen von Zeit unterworfene Dinge erfassen, zeigen Welt immer als Vorgang. 95 Das meint nicht, daß im Film nicht auf verschiedenen Zeitebenen erzählt werden kann, sondern nur, daß die Zeitebene des Erzählens nicht von der des Erzählten getrennt werden kann (vgl. dazu Kap. III.C.2).
42
Kapitel 1: Film als Rede
mentaren, Erörterungen, Selbstreflexionen usw. normalerweise tut, vom epischen Präteritum ins Präsens wechseln kann, bedarf es anderer als zeitlicher (z.B. räumlicher) Signale, um den veränderten Status nicht-narrativer Einstellungen anzuzeigen (vgl. Kap. III.D). Zwei Ebenen des kinematographischen Sprechakts: Darstellungsebene und Abbildungsebene Die vorstehenden Überlegungen zu den Voraussetzungen filmischen Erzählens begründen die Annahme zweier Ebenen der kinematographischen Informationsvergabe, die hier zunächst, in Berücksichtigung ihrer 'materialen' Aspekte, Darstellungsebene und Abbildungsebene genannt seien (bevor sie dann in einem zweiten Schritt, in Berücksichtigung ihres kommunikativen Status im Modell der filmischen Sprechsituation, als das innere bzw. vermittelnde Kommunikationssystem zu identifizieren sein werden).96 Auf der Darstellungsebene sind die Objekte des kinematographischen Sprechakts in ihrer Funktion als Subjekte der dramatischen Selbstdarstellung situiert. Diese Ebene umfaßt sämtliche im Produktionsprozeß vor dem Abbildungsapparat befindlichen Objekte und Vorgänge, also die Gesamtheit jener gegenständlichen Welt, auf die Kamera und Mikrophon reagieren, die 'Auge' und O h r ' des fiktiven Erzählers wahrnehmen können. Auf ihr herrschen die Bedingungen der dramatischen Sprechsituation, denn hier entfaltet sich die objektspezifische Relation ikonischer (akustischer) Zeichen, d.h. die Bedeutung dieser Zeichen (als Ikone), insofern sie Funktionen der Eigenschaften der Objekte sind (vgl. S. 28f.). Die Darstellungsebene umfaßt folglich ein ganzes Bündel unterschiedlichster, eigenständiger Zeichenrepertoires, deren gemeinsames Kennzeichen ihre Sichtbarkeit (Hörbarkeit) ist, also etwa die Zeichenrepertoires der Mimik, Gestik und Proxemik, der Ikonographie bzw. konventionalisierten Symbolik, der Sprache und Paralinguistik u.v.m. Aus der Sicht der Darstellungsebene ist die Abbildungsebene lediglich Voraussetzung dafür, daß die Selbstdarstellung der Objekte zur Erscheinung kommen kann: Ihre Funktion und damit die Darstellungsfunktion des kinematographischen Sprechakts beschränkt sich hier auf die Bereitstellung ausreichender Wahrnehmungsbedingungen. Auf der Abbildungsebene ist das Subjekt des kinematographischen Sprechakts situiert, geht es um den Abbildungsakt in seiner Funktion als Äußerung eines (fiktiven) Subjekts über seine Beziehung zum Abgebildeten. Diese 96 Die Unterscheidung dieser beiden 'materialen' Ebenen ist - mit Blick auf die Einheit des kinematographischen Sprechakts - ein Konstrukt, das indes für die Klärung der Strukturen filmischer Rede, vor allem für die Klärung der verwendeten Zeichenrepertoires und ihres kommunikativen Status unumgänglich ist.
Kapitel I: Film als Rede
43
Ebene umfaßt sämtliche bei der Herstellung der Bilder eingesetzten Abbildungsverfahren, sämtliche die Handhabung des Abbildungsapparats betreffenden Techniken, über die das Bildsubjekt seine Beziehung zum Objekt vermittelt. Auf ihr herrschen die Bedingungen der narrativen Sprechsituation, denn hier entfaltet sich die subjektspezifische Relation ikonischer (akustischer) Zeichen, d.h. die Bedeutung dieser Zeichen (als Symptome), insofern sie Funktionen des Blickverhaltens des fiktiven Erzählers sind. Die Abbildungsebene umfaßt folglich die spezifischen kinematographischen Zeichenrepertoires, also etwa das Zeichenrepertoire der Kamera (Aufnahmedistanz, Perspektive, Kamerabewegungen, Blendentechnik usw.), der Montage u.a.m. Aus der Sicht der Abbildungsebene ist die Darstellungsebene Voraussetzung dafür, daß das Bildsubjekt seine Beziehung zur Welt überhaupt artikulieren kann. Die filmische Sprechsituation Den vorstehenden Überlegungen zufolge ist der Film, was seine Sprechsituation betrifft, ein Zwitter, der weder der dramatischen noch der narrativen Sprechsituation klar zugeordnet werden kann: Das Subjekt filmischen Erzählens kann nur erzählen, indem es dramatische Sprechsituationen abbildet, und diese dramatischen Sprechsituationen können nur erscheinen, indem sie abgebildet werden, verlieren also die »Absolutheit«, die dramatische Sprechsituationen definiert, werden im Abbildungsakt in die genuin narrative SubjektObjekt-Relation überführt. Gleichwohl zeigen sie eine erheblich weiterreichende Unabhängigkeit von der narrativen Vermittlungsinstanz als etwa Dialoge und Monologe in narrativen Texten. Denn das filmische Erzählsubjekt kann nur bedingt über sie verfügen, kann sich ihrer nicht, wie der Erzählerbericht, bemächtigen (s.o.): Es kann zwar darüber verfügen, wie (aus welcher Perspektive, Entfernung etc.), wie lange, wann (in welcher Reihenfolge) und in welcher Funktion sie erscheinen, kann aber den dramatischen Modus ihrer Erscheinung selbst nicht verändern. Seine Wahrnehmungsobjekte, so könnte man sagen, bewahren hier zu wesentlichen Teilen ihren Subjektstatus (vgl. S. 38), weil sie, auch als abgebildete, weiterhin als Aussagesubjekte figurieren, weil die Informationen über sie von ihnen selbst (ihrer Gestalt, Sprache, Mimik, Gestik etc.) ausgehen, nicht oder nur dadurch vom Erzählsubjekt, daß es diese Informationen in ihrer 'authentischen' Gestalt 'weitergibt'. Die Aufhebung der »Absolutheit« dramatischer Sprechsituationen durch den narrativen Vermittlungsakt ist hier also eine nur bedingte. Ursache dafür ist die Ikonizität der Bilder (und, wenn man das so sagen darf, auch des Tons): Sie muß dem Abgebildeten den dramatischen Modus seiner (optischen und akustischen) Erscheinung belassen, setzt es darin aber zugleich in Beziehung zu
44
Kapitel 1: Film als Rede
dem Subjekt seiner Abbildung, denn diese Beziehung schreibt sich - als Symptom - in das Abgebildete ein (vgl. S. 28f.). Dieser Sachverhalt läßt sich jetzt in einem Modell der filmischen Sprechsituation zusammenfassen, in dem nun auch die Positionen des Werksubjekts und des Rezipienten zu besetzen sind. Seine graphische Darstellung (vgl. Abb. 1, S. 45) orientiert sich an den in der literaturwissenschaftlichen Propädeutik üblichen Modellen, hier an einem von Manfred Pfister entworfenen graphischen Modell der dramatischen und narrativen Sprechsituation,97 das vier Niveaus oder »Kommunikationssysteme« der in einem dramatischen oder Erzähltext realisierten Kommunikation unterscheidet und ihnen je spezifische Sender/Empfänger-Paare zuordnet: Das äußere Kommunikationssystem (Niveaus N4 und N3) betrifft den über den (als Kasten dargestellten) Text hergestellten kommunikativen Bezug zwischen Werksubjekt und Rezipienten, und zwar einerseits in »idealisierter Form«, d.h. als Bezug zwischen dem im Text selbst implizierten »idealen« Autor als Subjekt des Werkganzen (S3) und dem im Text selbst implizit formulierten »idealen« Rezipienten (E3), und andererseits in »realer Form«,98 d.h. als Bezug zwischen dem empirischen Werksubjekt in seiner Rolle als Werkproduzent (S4) und seinem empirischen Rezipienten (E4). Das vermittelnde Kommunikationssystem (Niveau N2), betrifft die im Text selbst sich realisierende Beziehung zwischen dem im Text sich artikulierenden fiktiven Erzähler (S2) und dem im Text formulierten (unter Umständen explizit angesprochenen) fiktiven Rezipienten (E2) als dessen Adressat. Das innere Kommunikationssystem (Niveau Nl) schließlich betrifft die im Text realisierte Beziehung zwischen den miteinander kommunizierenden fiktiven Figuren (S/El). Sofern das vermittelnde Kommunikationssystem (in narrativen Texten) realisiert ist, wird das innere Kommunikationssystem von ihm überlagert (erscheint z.B. Figurenrede als vom Erzähler »zitierte«, vgl. S. 37, 39f.), was in der graphischen Darstellung durch die doppelte Schraffur (N1/N2) angedeutet wird. Während sich nun narrative und dramatische Sprechsituation dadurch unterscheiden, daß in letzterer das vermittelnde Kommunikationssystem fehlt, die Positionen S2 und E2 also nicht besetzt sind (weshalb das Theater zum »epischen Theater« wird, sobald sie besetzt sind), zeigt sich bei der filmischen Sprechsituation ein anderes Bild: Zwar sind hier - wie bei der narrativen Sprechsituation - sämtliche Positionen besetzt und sämtliche Kommunikationssysteme vorhanden, zwar kann auch hier - anders als bei der dramatischen Sprechsituation - das innere Kommunikationssystem (Nl) nicht unabhängig vom vermittelnden Kommunikationssystem (N2) erscheinen, anders aber als »7 Vgl. PFISTER 1982, 20f. - Vgl. ähnlich auch KAHRMANN/REISS/SCHLUCHTER 1986, 4 5 f . 98 PFISTER 1 9 8 2 , 2 1 .
Kapitel I: Film als Rede
45
bei der narrativen Sprechsituation, und das macht das Spezifikum der filmischen Sprechsituation aus, kann hier umgekehrt auch das vermittelnde KomA b b . l : Sprechsituationen
Narrative Sprechsituation
Filmische Sprechsituation
Kommunikationssysteme I 1\\\1 Sender S4: S3: S2: S/El: E2: E3: E4:
(KS):
I N4/N3: äußeres KS
Υ / / Λ N l : inneres KS (Figurenrede)
N2: vermittelndes KS K K X ^ l N1/N2: über N2 vermitteltes inneres KS (Sj der der der die der der der
und Empfinger (E): empirische Autor im Werk implizierte "ideale" Autor als Subjekt des Werkganzen im Werk formulierte fiktive Erzähler miteinander kommunizierenden fiktiven Figuren im Werk formulierte fiktive Rezipient als Adressat von S2 im Werk implizierte "ideale" Rezipient empirische Rezipient (ModelUntwurf nach PFISTER 1982, 20f.)
munikationssystem (N2) nicht unabhängig vom inneren Kommunikationssystem (Nl) erscheinen, gibt es im Film keine Ebene der unmittelbaren Kommunikation zwischen Erzähler (S2) und fiktiven Rezipienten (E2), wie sie der Erzählerbericht in sprachlichen Erzähltexten konstituiert, es sei denn, der filmische Erzähler bedient sich der Mittel seines Verwandten, der sprachlichen
46
Kapitel I: Film als Rede
Kommunikation (voice over, Schriftinserts). Die genuin filmische, ikonische Kommunikation zwischen Erzähler und fiktiven Rezipienten muß im Film deshalb stets den Weg über das innere Kommunikationssystem nehmen; der fiktive Rezipient kann also - auf ikonischem Wege - nur mittelbar, nur über das innere Kommunikationssystem, nicht aber, wie im sprachlichen Erzähltext, unmittelbar angeredet werden." Der (einfach schraffierte) Bereich des vermittelnden Kommunikationssystems, in dem diese unmittelbar an den fiktiven Leser gerichtete Rede, der normalerweise größte Teil des Erzähltextes, der Erzählerbericht, situiert ist, fallt also im Modell der filmischen Sprechsituation im Prinzip weg, kann allenfalls durch nicht-filmische, sprachliche Erzählerrede realisiert werden. Davon abgesehen aber kommen inneres und vermittelndes Kommunikationssystem beim Film vollständig zur Deckung, eben weil filmisches Erzählen sich in der Abbildung des inneren Kommunikationssystems (dramatischer Sprechsituationen) vollzieht. Das Differenzkriterium, aufgrund dessen die Felder N1/N2 und N2 im Modell der narrativen Sprechsituation unterschieden werden, die traditionelle Klassifikation der beiden grundlegenden Formen des Erzählens (Erzähler- vs. Figurenrede bzw. Erzählerbericht vs. »szenische Darstellung«), kann im Film also bloß hinsichtlich der Unterscheidung zwischen bildsprachlicher und wortsprachlicher Erzählerrede zur Anwendung kommen. Der im graphischen Modell mit dem Stichwort Digressionen versehene Verbindungsweg zwischen fiktivem Erzähler und fiktivem Rezipienten spielt für die Bestimmung der filmischen Sprechsituation keine Rolle, ist hier nur der Vollständigkeit halber eigens erwähnt. Er bezeichnet filmische Äquivalente der sog. zeitlosen Erzählweisen (vgl. S. 41f.), vor allem des Erzählerkommentars, die beim Film ebenfalls nur über das innere Kommunikationssystem Zustandekommen können: Abgesehen von den im Akt der Narration selbst sich vollziehenden Formen der kommentierenden Kameraführung (vgl. Kap. II.A) und der kommentierenden (systematischen) Montage narrativer Bilder (vgl. Kap. III.D.2), können sich filmische Erzählerkommentare, wie noch gezeigt wird (Kap. III.D.2.2), auch dadurch vollziehen, daß die Kamera für die Dauer einer oder mehrerer Einstellungen den Schauplatz der erzählten Geschichte verläßt (»digrediert«) und Objekte oder Vorgänge zeigt, die in keiner Beziehung zur Welt der erzählten Geschichte stehen, sondern (über vergleichende, symbolische oder allegorische Operationen) das erzählte Gesche99 Andere, nichtsprachliche Einsatzmöglichkeiten des Off-Tons, vor allem die Filmmusik, können nicht als vom inneren Kommunikationssystem unabhängige Erzählerrede klassifiziert werden, weil sie sich erst in der Beziehung zu den Bildern, nicht unabhängig von ihnen, konstituieren. - Auch die Montage bleibt an das innere Kommunikationssystem gebunden (vgl. Anm. 92), konstituiert keine von ihm unabhängige Erzählerrede.
Kapitel I: Film als Rede
47
hen kommentieren.100 Auch hier muß Erzählerrede also den Weg über das innere Kommunikationssystem nehmen, nur ist dieses innere Kommunikationssystem ein anderes als das der narrativen Bilder, steht in keinem raum-zeitlichen Zusammenhang mit dem der erzählten Geschichte. Das graphische Modell macht zugleich die Beziehung zwischen empirischem Werksubjekt (S4), fiktivem Erzähler (S2) und Erzähltem (S/El) deutlich: Erzählen und Erzähltes konstituieren das Werkganze, den filmischen Text, der das empirische Werksubjekt als 'ideales' (S3)101 impliziert, d.h. in den sich das Werksubjekt als Urheber des fiktiven Erzählers wie des Erzählten einschreibt. Erzählen und Erzähltes stehen in gleichrangiger Relation zum Subjekt des Werkganzen: Filmische Erzählerrede (Abbildungsebene) wie Figurenrede (Darstellungsebene) sind gleichermaßen als vom Werksubjekt gestiftete Rede zu kategorisieren. Das innere Kommunikationssystem (Darstellungsebene) verdankt dem vermittelnden Kommunikationssystem (Abbildungsebene) also zwar sein Erscheinen und darin zugleich die Art und Weise seines Erscheinens, nicht aber seine Erscheinung selbst (seine »Inszenierung«), denn das vermittelnde Kommunikationssystem ist nicht ihr Urheber, sondern nur ihr 'Referent', und als solcher gleichermaßen Produkt des Werksubjekts wie das innere Kommunikationssystem. Erst beide zusammen, Erzählen und Erzähltes, Abbildungsebene und Darstellungsebene, vermittelndes und inneres Kommunikationssystem konstituieren das Werkganze als kohärenten Text, die Einheit des filmischen Textes und damit seine Funktionsfahigkeit als Medium nonfiktiver Kommunikation, nämlich als den zusammenhängenden Sprechakt eines empirischen Subjekts (S4), den der Text als ganzer darstellt.
100 vgl. etwa das berühmte Beispiel der drei steinernen (eines schlafenden, eines erwachenden und eines brüllenden) Löwen aus Eisensteins »Panzerkreuzer Potemkin« (UDSSR 1925), die den erzählten Vorgang, den Angriff der »Potemkin«-Besatzung auf den Generalstab, allegorisierend kommentieren. Vgl. dazu unten Kap. III.D.2. ιοί D.h. als allein aufgrund dieses einen Werks beschreibbares, biographisch, soziologisch usw. noch nicht genau fixiertes (und deshalb auch noch nicht aufgrund anderer Werke bestimmbares) Werksubjekt, soweit es bzw. sein Weltbild, sein Wissen, seine Überzeugungen usw. aus dem Werk rekonstruiert werden können. - Ihm entspricht auf der Empfängerseite der »ideale«, »intendierte« Rezipient, d.h. der ebenfalls biographisch, soziologisch usw. noch nicht fixierte, aber mit einem bestimmten Weltbild, Wissens- und Bildungsstand usw. ausgestattete Rezipient, den das Werksubjekt voraussetzt.
48
Kapitel I: Film als Rede
D. Schlußfolgerungen: Filmanalyse im Horizont literaturwissenschaftlicher Analysemethoden Die hier entwickelte theoretische Bestimmung von Bildern als Sprechakten und von Filmen als Erzählakten liefert eine aus dem Gegenstand selbst bezogene Legitimation für die einleitend angesprochene Rolle der Literaturwissenschaft als Taufpatin der Filmwissenschaft: Sie liefert die allgemeine theoretische Voraussetzung für die Anwendung literaturwissenschaftlicher Analysemethoden auf filmische Sachverhalte und verschafft damit dem in den folgenden Kapiteln vorzustellenden Versuch, ein Modell der Filmanalyse im Horizont literaturwissenschaftlicher Methoden zu entwickeln, seine grundsätzliche Legitimation. Die Anwendung literaturwissenschaftlicher Analysemethoden auf filmische Sachverhalte Die Bestimmung von Filmen als Erzählakten und deren Rückführung auf ein mit literarischen Texten kompatibles Modell der filmischen Sprechsituation schafft zunächst Voraussetzungen, um herkömmliche Verfahren der Filmanalyse theoretisch präziser zu verorten. So kann etwa die übliche, in jedem Filmprotokoll schon im äußeren Erscheinungsbild erkennbare Auflösung der primären Einheit filmischer Bilder in eine Vielzahl disparater Daten hier nun auf eine systematische, kommunikationstheoretisch (statt produktionstechnisch) begründete Struktur zurückgeführt werden, indem das disparate Datenmaterial im Wege der Zuordnung zum jeweiligen Kommunikationsniveau organisiert und damit zugleich analyse- und interpretationsmethodisch qualifiziert wird, nämlich als Gegenstand der Analyse der filmischen Erzählerrede bzw. der (verbalen und nonverbalen) Figurenrede (oder der »Rede« der Objekte) klassifiziert wird: Die über die subjektspezifischen Relationen ikonischer (akustischer) Zeichen indizierten Abbildungsverfahren erfüllen allererst die Symptom-Funktion des kinematographischen Sprechakts, konstituieren die Abbildungsebene, auf der die Beziehung des narrativen Subjekts zum Erzählten artikuliert wird; abbildungstechnische Daten sind als Elemente des vermittelnden Kommunikationssystems zu fassen, das die genuin epische SubjektObjekt-Relation organisiert. Die über die objektspezifischen Relationen ikonischer (akustischer) Zeichen indizierte dramatische »Selbstdarstellung« des Erzählten auf der Darstellungsebene übernimmt den wesentlichen Teil der Darstellungsfunktion des kinematographischen Sprechakts, die Propositionen, und konstituiert das innere Kommunikationssystem. Beide zusammen konstituieren den filmischen Text: Die Informationsmengen beider Ebenen zu erfassen
Kapitel I: Film als Rede
49
und ihre 'Textur' als relationale Struktur, als Beziehungsverhältnis zwischen beiden zu erkennen, erweist sich so als generelle Aufgabe der Filmanalyse. Die Bestimmung des Films als Erzähltext, der eine mit literarischen Textstrukturen kompatible Struktur aufweist, zeigt der Filmwissenschaft zugleich methodische Wege zur Bewältigung dieser allgemeinen Aufgabe an, die sie auf weite Strecken mit der Literaturwissenschaft gemeinsam hat, denn sie kann sich auf dieser Grundlage eines erheblichen Teils der in der Literaturwissenschaft für die Analyse von Texten entwickelten methodischen Instrumentarien bedienen, ohne sich dabei der Spezifik ihres Gegenstandes zu begeben. Das betrifft zunächst die auf der Darstellungsebene vergebenen Informationen, die allesamt nicht auf filmspezifischen Kodes beruhen: 1 0 2 Das Erzählte kommt auf der Grundlage von Kodes zustande, die auch in anderen Kunstformen begegnen, namentlich im Theater (darunter vor allem die menschliches Handeln betreffenden Kodes der Sprache und des Körperverhaltens). Es besteht deshalb wenig Anlaß, für die Analyse der auf der Darstellungsebene vergebenen Informationen ein neues, eigens für den Film zu entwickelndes Instrumentarium zu erarbeiten. Denn diese Analyse kann sich zu erheblichen Teilen auf Theorie und Methoden der Analyse dramatischer Texte stützen, sofern sie die spezifischen Voraussetzungen für das Erscheinen der im Wege dramatischer Informationsvergabe vermittelten Informationen im Film reflektiert. Dramenanalytische Kategorien und Kriterien sind in der Lage, einer historisch-hermeneutisch orientierten Filmanalyse ein methodisches und begriffliches Instrumentarium zu bieten, das ihren Aussagen über die Struktur des Erzählten und damit zugleich einem erheblichen Teil dessen, was die Interpretation von Filmen fundiert, eine verläßliche und bewährte Grundlage verschafft (vgl. Kap. V und VI). Dieses Instrumentarium ist im Prinzip offen auch für die Beschreibung und Kategorisierung der Informationen, die die vor allem auf die wortsprachliche Informationsvergabe geschriebener Texte konzentrierte Dramenanalyse nur am Rande berücksichtigt, nämlich für die über nonverbale und paralinguistische Kodes vermittelten Informationen. Deren Erfassung freilich erfordert die Formulierung spezifischer Analysekriterien, die erst im Rekurs auf Ergebnisse der mit nonverbalen Kommunikationsprozessen befaßten Disziplinen zu gewinnen sind (vgl. Kap. V . B ) .
102 Der Umstand, daß sie in produktionstechnischer Hinsicht zu erheblichen Teilen das Ergebnis spezifischfilmtechnischerVerfahren sind, ändert daran nichts: Bauten und Lichtführung, Rückprojektionen, Schüfftan- oder Modellaufnahmen und viele andere, die Darstellungsebene betreffende technische Verfahren der Filmproduktion dienen lediglich der künstlichen Herstellung dieser Informationen, unterscheiden sich daher im Prinzip - als Verfahren der Illusionierung von Wirklichkeit - nicht von ähnlichen Verfahren der Theaterinszenierung.
50
Kapitel i: Film als Rede
Was mit Blick auf die Darstellungsebene dramenanalytische Methoden leisten, leisten mit Blick auf die filmische Abbildungsebene Methoden der Erzähltextanalyse. Ihre Anwendung allerdings unterliegt ungleich komplexeren Voraussetzungen, denn sie hat es mit einer nicht-sprachlichen »Rede« zu tun, kann sich also nicht, wie bei der Analyse der Darstellungsebene, auf ein zu wesentlichen Teilen gleichartiges Medium der Informationsvergabe, die Sprache, stützen. Der weitaus größte Teil der auf der Abbildungsebene vergebenen Informationen beruht auf filmspezifischen Verfahren, bezeichnet also den Bereich der Filmanalyse, der es mit spezifisch kinematographischen Vermittlungsformen zu tun hat: Kamerahandlung und Montage. Die Anwendung erzähltheoretischer Kategorien (vgl. Kap. III.C-D, IV) auf diese Vermittlungsformen setzt also deren Klärung als spezifisch kinematographischer Verfahren filmischer Rede voraus (Kap. II und III.A-B).
Die Grenzen einer aus literaturwissenschqftlichen Methoden abgeleiteten Filmanalyse: Bildkomposition und Filmmusik Eine literaturwissenschaftlich inspirierte Filmtheorie und Filmanalyse kommt, auch wenn sie sich die Klärung der kinematographischen Spezifik ihres Gegenstandes zur Voraussetzung macht, an ihre Grenzen dort, wo es um filmische Sachverhalte geht, die sie zwar unter dem großzügigen Dach ihres erweiterten Textbegriffs unterbringen könnte, aber nicht selbst untersuchen kann, weil ihr dafür die fachwissenschaftliche Kompetenz fehlt. Gemeint sind damit in erster Linie bildkompositorische Gestaltungsverfahren des Films 103 sowie der gesamte Bereich der Filmmusik, deren Untersuchung kunstwissenschaftliche und kunsthistorische bzw. musikwissenschaftliche Kompetenz voraussetzt. Eine an literaturwissenschaftlichen Theorien und Methoden orientierte Filmwissenschaft, die sich auch dieser Bereiche der filmischen Informationsvergabe glaubt annehmen zu können, wird sich folglich den berechtigten Vorwurf des Dilettantismus gefallen lassen müssen, solange sie dafür nicht auf einschlägige Vorarbeiten von seiten der Kunst- und Musikwissenschaft zurückgreifen kann. Das ist der Grund, warum hier gar nicht erst der Versuch gemacht wird, Bildkomposition und Filmmusik in die Analyse einzubeziehen: Da es zwar eine ganze Reihe von Reflexionen und kunst- und kulturkritischen Essays zum Thema und auch Studien über einzelne Kameramänner oder Filmmusiker, aber noch keine systematischen Untersuchungen der filmischen Bildkomposition und der Filmmusik von kompetenter Seite gibt, könnte er nur dilettantisch ausfallen.
103 Unter Bildkomposition wird hier die formästhetische Organisation der Flächen, Linien und Farben des Filmbildes verstanden.
Kapitel II Kameraverhalten: Die Organisation der Subjekt-ObjektStruktur filmischer Bilder
Filmische Erzählerrede entfaltet sich als eine optische in der Wahrnehmungstätigkeit des kinematographischen Apparats: In dessen optisch-räumlicher sowie zeitlicher Bezugnahme auf die Welt des Sichtbaren entsteht der filmische Sprechakt, vollzieht sich die Organisation der jedem Sprechakt immanenten Relation von Subjekt und Objekt der Rede. Die Besonderheit filmischer Rede, das wurde im vorhergehenden Kapitel geklärt, besteht darin, daß ihre Objekte insoweit Subjektstatus bewahren, als sie sich auch unter den Bedingungen filmischer Abbildung 'selbst darstellen', den Bedingungen der dramatischen Sprechsituation gehorchen. Der daraus abgeleiteten Differenzierung von Abbildungs- und Darstellungsebene (S. 42f.) folgt die Konzeption dieses und aller weiteren Kapitel, indem die Strukturen und Funktionen der kinematographischen Abbildungsverfahren einerseits (Kap. II, III, IV) und die Bedingungen für das Erscheinen der erzählten Welt, die Präsentationsformen der Darstellungsebene andererseits (Kap. V), wenn auch unter beständiger wechselseitiger Bezugnahme, so doch soweit als möglich getrennt untersucht werden, bevor die beiden wichtigsten Aspekte ihres Zusammenwirkens, die Perspektivenstruktur filmischer Texte (Kap. VI) und die Verfahren uneigentlicher Rede im Film (Kap. VII) zur Sprache kommen. Bei der Analyse der kinematographischen Abbildungsverfahren in diesem und in den beiden darauffolgenden Kapiteln wird es in erster Linie um die spezifisch bildsprachlichen Verfahren filmischen Erzählens gehen, weshalb der Tontrakt kaum berücksichtigt wird: Die Filmmusik wird aus den genannten Gründen (S. 50) aus der Betrachtung ausgeschlossen; die sprachlichen Formen erzählerischer Informationsvergabe (voice over, Schriftinserts) und die Möglichkeiten der 'Verfremdung' akustischer Informationen (etwa durch Verzerrung, Überlagerung, Ausblendung des On-Tons) werden als akzidentielle Darstellungsverfahren nicht oder nur am Rande behandelt. Die Auswahl der Filme, an denen die Ergebnisse im weiteren belegt und exemplifiziert werden, folgt dem Prinzip der möglichst problemlosen Zugänglichkeit für den Leser und konzentriert sich deshalb, soweit irgend möglich, auf bekannte Filme, die in der Regel, zumindest auf Videoband, greif-
52
Kapitel II: Kameraverhalten
bar sind. Zudem soll die Zahl der Beispielfilme so klein wie nur möglich gehalten werden, weil sich im wiederholten Rückgriff auf dieselben Filme im Verlauf der Untersuchungen sukzessive Profile zumindest einiger dieser Filme ergeben werden, die es erlauben, die strukturellen und funktionellen Zusammenhänge zwischen den diversen kinematographischen Formelementen zu zeigen und auf ihre kohärenzstiftenden Funktionen hinzuweisen.
A. Grundbegriffe der Analyse Die nachfolgende Untersuchung der Strukturen des Kameraverhaltens und seiner Funktionen für die filmische Informationsvergabe im Horizont der hier entwickelten Bestimmung des kinematographischen Sprechakts versteht sich als Versuch, über die bloße Bereitstellung von Beschreibungsapparaten hinauszugelangen, auf die herkömmliche filmanalytische Grundlegungen in der Regel beschränkt bleiben: Filmanalyse muß, will sie als methodische Voraussetzung der Filminterpretation Geltung beanspruchen und nicht in selbstzweckhafter Notation kinematographischer Daten sich erschöpfen, in einem theoretischen Bezugsrahmen stattfinden, der die interpretationsmethodische Relevanz dieser Daten anzugeben in der Lage ist. Solange abbildungstechnische Daten nicht als funktionale Elemente filmischen Erzählens qualifiziert sind, bleibt das Begründungsdefizit bestehen, das den üblichen Empfehlungen für die Herstellung von Filmprotokollen anhaftet: Der außerordentlich hohe Aufwand, den die exakte Beschreibung eines Films erfordert, ist nicht zu rechtfertigen, solange nicht geklärt ist, welchen Stellenwert die kameratechnischen Daten für die erzählerische Informationsvergabe und damit für die Interpretation von Filmen eigentlich haben. Dieses Begründungsdefizit läßt sich nun allerdings durch eine semantische Qualifizierung dieser Daten nicht beheben, wie die quantitative Filmanalyse sie versucht, indem sie, wie einleitend erwähnt, den diversen Formen des Kameraverhaltens eigenständige, vom je aktuellen Bildgegenstand weitgehend unabhängige Bedeutungen unterstellt, ein Verfahren, das die jüngere filmsemiotische Forschung zu übernehmen geneigt scheint. 1 Denn solche vom Bildgegenstand weitgehend unabhängigen Bedeutungen abbildungstechnischer Sachverhalte gibt es nicht: Wohl haben sich im Laufe der Geschichte des Films Formen des Kameraverhaltens herausgebildet, die jeweils für eine bestimmte Phase dieser Geschichte den Status nahezu kodifizierter Bedeutungs-
1
V g l . z . B . SIEGRIST 1 9 8 6 ; SPRINGER 1 9 8 7 .
Kapitel II: Kameraverhalten
53
träger gewinnen konnten, aber solche Kodifikationen haben, eben weil sie geschichtlichem Wandel unterworfen sind, für eine allgemeine Analyse der ästhetischen Strukturen und Funktionen des Kameraverhaltens allenfalls heuristischen Wert. Das »empirische Studium« einer zufalligen Sammlung von Filmen und die »Induktion des möglichen textsemiotischen Stellenwerts der verschiedenen kinematographischen Systeme aus Einzelbeispielen«2 kann deshalb generalisierende Aussagen über die Bedeutung kinematographischer Vermittlungsverfahren nicht legitimieren, verwehrt zudem die Einsicht in die Geschichtlichkeit filmsemantischer Strukturen, weil sie eine stets nur als geschichtliche faßbare Semantik in eine systematische umdeutet. Die daraus resultierenden semantischen Festschreibungen begünstigen zudem eine monofunktionale Betrachtungsweise, die der Multifunktionalität kinematographischer Abbildungsverfahren nicht gerecht werden kann. Denn jede Kamerahandlung stellt, wie im folgenden zu zeigen sein wird, immer schon ein komplexes Gefüge von multiplen Beziehungen zwischen Abbildungssubjekt, Abbildungsobjekt und Rezipienten dar, dessen Funktionenvielfalt mit festen semantischen Zuschreibungen gerade verfehlt wird. Dieses komplexe Gefüge unter einheitlicher theoretischer Perspektive zu rekonstruieren, ist das Anliegen dieses Kapitels. Der Gefahr ahistorischer und monofunktionaler Bedeutungsfixierungen sucht der hier vorzustellende Ansatz zu entgehen, indem er die formalen Grundstrukturen kinematographischer Verfahren zum Ausgangspunkt nicht semantischer, sondern funktionaler Qualifizierungen nimmt und damit eine Abstraktionsebene wählt, auf der empirische Beispiele ihren Status als je historisch bedingte Konkretionen dieser allgemeinen formalen Grundstrukturen und ihrer Funktionen bewahren können. Es geht hier also nicht um »Bedeutungen« des Kameraverhaltens, sondern um dessen Strukturen als Voraussetzungen der Sinnproduktion, um die Formen der über das Kameraverhalten artikulierten filmischen Rede und deren Funktionen für die Informationsvergabe als Voraussetzungen der Konstitution von Sinn. Zu diesem Zweck wird hier ein Analysemodell zu entwickeln sein, das der Multifunktionalität der kameraspezifischen Abbildungsverfahren gerecht zu werden sucht und folglich ohne semantische Festschreibungen auskommt: Es basiert auf einem Raster funktionaler, semantisch noch »leerer« Analysekriterien, das die Multifunktionalität des Kameraverhaltens als Ergebnis komplexer Relationen zwischen Subjekt, Objekt und Adressat filmischer Rede erfaßt und dabei zugleich, weil es ein einheitliches, auf alle Parameter der Kameraarbeit anwendbares Raster ist, die Kohärenz dieser Parameter als verschiedener Aspekte ein und desselben Sprechakts einsichtig machen kann. Im 2
SIEGRIST 1 9 8 6 , 8 4 .
54
Kapitel II: Kameraverhalten
Wege differenzierter Einzelanalysen der wichtigsten Parameter der Kameraarbeit (Einstellungsgrößen, Perspektiven, Kamerabewegungen), in denen dieses Analyseraster seine Funktionsfähigkeit unter Beweis stellen soll, wird so ein Instrumentarium zu entwickeln sein, das die Abbildungsverfahren der Kamera einer systematischen Funktionsanalyse zugänglich macht und interpretatorische Entscheidungen auf überprüfbare Grundlagen zu stellen in der Lage ist. Das Analyseraster: Fünf Kriterien der Analyse Das hier nun vorzustellende, aus fünf Kriterien bestehende Analyseraster geht aus von den Bezugsgrößen der im Bühlerschen Organon-Modell (vgl. S. 27) vorgesehenen Funktionen jedes Sprechakts: Redegegenstand/Bildobjekt (Darstellung), Sprecher/Bildsubjekt (Symptom), Hörer/Zuschauer (Appell). Jede dieser drei Bezugsgrößen fungiert hier als heuristischer Ansatzpunkt für die funktionale Qualifizierung von Kamerahandlungen: Ausgehend von den ihnen im Organon-Modell zugewiesenen Funktionen (Darstellung, Symptom, Appell) werden sie daraufhin befragt, welche Anforderungen sie und damit die Erfüllung der auf sie bezogenen Funktionen an die verschiedenen Parameter der Kamerahandlung stellen und, umgekehrt, welche je spezifischen Voraussetzungen diese Parameter selbst für die Erfüllung dieser Funktionen mitbringen, wobei sich aus der Sicht jeder dieser drei Bezugsgrößen/Funktionen immer auch der Blick auf die beiden anderen in je besonderer Weise öffnet, eben weil sich keine dieser Funktionen vollziehen kann, ohne Einfluß auf die Art und Weise zu nehmen, in der sich die beiden anderen vollziehen.3 Diese sich wechselseitig bedingenden Funktionsaspekte sollen hier auseinandergelegt werden: Ein und dieselbe Kamerahandlung (ζ. B. die Wahl der Einstellungsgröße) soll unter wechselnden Perspektiven, die jeweils eine der drei am Sprechakt beteiligten Bezugsgrößen zum Ausgangspunkt nehmen, funktional qualifiziert und so die Multifunktionalität der Kamerahandlungen einer systematischen Beschreibung zugänglich gemacht werden. Dabei werden nun zwei dieser Bezugsgrößen, Bildsubjekt und Bildobjekt, in je zwei Teilaspekte zerlegt: Die Bildobjekte (Darstellungsfunktion) werden zum einen unter dem Aspekt ihrer optischen Eigenschaften selbst, zum anderen unter dem Aspekt ihres räumlichen Kontextes betrachtet. Beide Kriterien fragen also nach den objektspezifischen Voraussetzungen der Kamerahandlung, nach den für die Wahrnehmbarkeit der Objekte und ihrer räumlichen Beziehungen erforderlichen Abbildungsverfahren: Kriterium 1 betrifft dem3
So prädisponiert beispielsweise die Größe eines Bildobjekts die Aufhahmedistanz; ob aber das Bildsubjekt dieser Prädisposition folgt oder nicht, hat nicht nur Bedeutung für die Darstellungsfunktion, sondern gibt immer auch schon Auskunft über seine Beziehung sowohl zum Objekt (Symptom-Funktion) als auch zu seinen Rezipienten (Appellfunktion).
Kapitel II: Kameraverhalten
55
nach die Objekteigenschaften selbst, fragt danach, inwieweit Größe, Gestalt, Position oder Bewegungen der Objekte das Wahrnehmungsverhalten der Kamera steuern, Einstellungsgrößen, Perspektiven und Kamerabewegungen prädisponieren. Kriterium 2 differenziert das erste nach Maßgabe der Frage, wie das Abbildungsverhalten die Objektbeziehungen, die räumlichen Verhältnisse zwischen den Objekten behandelt, ob und wie es den räumlichen Kontext eines Objekts expliziert und charakterisiert. Die auf das Bildsubjekt (Symptomfunktion) bezogenen Kriterien fragen danach, inwieweit die verschiedenen Parameter der Kamerahandlung an sich selbst Symptomfunktion haben, eine Frage, die ebenfalls in zwei Teilfragen zerlegt wird: Im ersten Fall geht es um die Frage nach der rein optischen Quantität und Qualität der Wahrnehmungsbilder, die die verschiedenen Parameter des Kameraverhaltens zu erzeugen fähig sind, d.h. danach, wie sie die optischen Strukturen des Blickfeldes organisieren und inwieweit sie damit Auskunft über die Wahrnehmungsweise des Bildsubjekts als Ausdruck eines je spezifischen (z.B. differenzierten/undifferenzierten) Wahrnehmungsverhaltens und einer je spezifischen Art der optischen Raumerfahrung geben. Im zweiten Fall wird dieses Wahrnehmungsverhalten als Interaktionsverhalten des Bildsubjekts mit seinen Objekten qualifiziert, also hinsichtlich der Frage betrachtet, inwieweit dieses Wahrnehmungsverhalten Auskunft gibt über die nicht mehr nur optische »Einstellung« des Bildsubjekts zu seinen Objekten: Kriterium 3 betrifft also die durch den Kamerablick begründeten Strukturen des Blickfeldes und fragt danach, inwiefern seine Ausdehnung (Einstellungsgröße), seine Reichweite (Perspektive) und beider Verschiebungen (Kamerabewegungen) Auskunft über Qualität und Quantität der Wahrnehmungen und damit über das Wahrnehmungsverhalten des Bildsubjekts geben. Kriterium 4 nimmt die Bestimmung filmischer Bilder als Ausdruck subjektiver Beziehungen eines Wahrnehmungssubjekts zu seinem Wahrnehmungsobjekt ganz buchstäblich zum Ausgangspunkt, indem es das Verhalten der Kamera als optischräumliches Interaktionsverhalten versteht: Es betrachtet das zentrale Formelement des jeweils in Rede stehenden Parameters des Kameraverhaltens nicht in seiner informationsvermittelnden Funktion, sondern als Ausdruck des im optisch-räumlichen Verhalten selbst sich artikulierenden Verhältnisses des Bildsubjekts zu seinen Objekten, fragt danach, welche Rolle Entfernungs-, Blickund Bewegungsverhalten als Indikatoren der Beziehung des filmischen Erzählers zum Erzählten spielen. Auf die Voraussetzungen dieser Fragestellung wird noch zurückzukommen sein. Der Rezipient (Appellfunktion) erscheint hier als noch notwendig unspezifizierte Größe (vgl. S. 27 und Kap. VI), nämlich als gewissermaßen »leerer« Empfänger der filmischen Informationsvergabe und darin als Adressat wahr-
56
Kapitel II: Kameraverhalten
nehmungslenkender Operationen. Die Kamerahandlungen werden hier daher als Techniken der Steuerung der Rezipientenperspektive qualifiziert, ein Aspekt, der sich zu wesentlichen Teilen aus der rezeptionsästhetischen Reformulierung des dritten Kriteriums ergibt: Kriterium 5 betrachtet folglich die mit den vorhergehenden Kriterien, vor allem die mit dem dritten Kriterium erfaßten Funktionen unter dem Aspekt der Beziehung Bildsubjekt/Bildrezipient, verschiebt den Aspekt also auf den mit dem Wahrnehmungsakt vollzogenen Akt der Informationsvergabe und Rezipientensteuerung. Referat und Kommentar Bei der erzähltheoretischen Qualifizierung der mit Hilfe dieses Analyserasters identifizierten formalen und funktionalen Aspekte des Abbildungsverhaltens wird im weiteren mit zwei Begriffen gearbeitet, die hier zunächst im Rekurs auf sprechakttheoretische Kategorien begründet seien, weil sie erst an späterer Stelle auch spezifisch erzähltheoretisch begründet, nämlich aus dem literaturwissenschaftlichen Konstrukt der Erzählsituation abgeleitet werden können (Kap. IV): Mit den Begriffen Referat und Kommentar (referentielles und kommentierendes Abbildungsverhalten) soll ein Sachverhalt erfaßt werden, der in der filmischen Narration ebenso begegnet wie in der sprachlichen, der Umstand nämlich, daß sich der Erzählakt weitestgehend 'neutral' referierend oder aber explizit kommentierend vollziehen kann. Im ersten Fall nimmt sich der Erzähler stark zurück, konzentriert sich seine Vermittlungstätigkeit in erster Linie auf das bloße Referat der Vorgänge, beschränkt sich mithin die Subjekt-Objekt-Relation weitestgehend auf die Grundrelation des Erzählens (Abbildens) und Erzähltwerdens (Abgebildetwerdens). Im zweiten Fall gibt sich der Erzähler als Subjekt der Rede explizit zu erkennen, indem er seine Wahrnehmungstätigkeit als Akt nicht nur der Abbildung der Dinge und Vorgänge, sondern des diese Dinge und Vorgänge zugleich deutenden, kommentierenden 'Sehens' betreibt, seine 'Sicht' der Dinge und Vorgänge optisch expliziert. Der Begriff Referat (referentielles Abbildungsverhalten) meint demnach ein Abbildungsverhalten, das sich wesentlich auf die Funktion der Darstellung im Bühlerschen Sinne (vgl. S. 27), und das heißt bei photographischen Sprechakten: auf die Bereitstellung ausreichender Wahrnehmungsbedingungen konzentriert. Der Begriff Kommentar (kommentierendes Abbildungsverhalten) dagegen meint ein Abbildungsverhalten, das die Symptom-Funktion des Sprechakts im Bühlerschen Sinne (vgl. S. 27) in den Vordergrund stellt, indem es die Beziehung des Bildsubjekts zum Bildobjekt ausdrücklich thematisiert. Das bedeutetet nicht, daß es sich beim Referat etwa um einen seiner übrigen Funktionen (Symptom, Appell) entkleideten Sprechakt handelt, denn
Kapitel II: Kameraverhalten
57
selbstverständlich hat das Referat immer auch schon Symptom-Funktion (und Appell-Funktion): In jedem, auch in vorwiegend referentiellen Wahrnehmungsakten dokumentiert sich - in der Auswahl der Wahrnehmungsobjekte, in der Wahl eines bestimmten Standorts usw. - immer schon eine je spezifische Beziehung des Bildsubjekts zum Bildobjekt; und ebensowenig ist kommentierendes Abbildungsverhalten als ein auf die Symptom-Funktion reduzierter Sprechakt zu fassen, denn selbstverständlich kann auch die SymptomFunktion nicht unabhängig vom Darstellungsakt erscheinen.4 Die Differenz zwischen Referat und Kommentar läßt sich demnach als eine unterschiedliche Gewichtung der Symptom-Funktion beschreiben: Bei referentiellem Abbildungsverhalten, das sich vorrangig auf eine möglichst angemessene Wiedergabe des Geschehens beschränkt, artikuliert sich die Symptom-Funktion in erster Linie in dem Umstand, daß dieses Geschehen überhaupt zum Erzählgegenstand (Wahrnehmungsgegenstand) gemacht wurde, gibt zu verstehen, daß das Bildsubjekt es schon um seiner selbst willen des Erzähltwerdens für wert befindet, und nur implizit verweisen seine Abbildungsverfahren darauf, worin es die Bedeutung des Erzählten 'erblickt'. Der filmische Erzähler gleicht darin einem wortsprachlichen Erzähler, der sich so weit als möglich zurücknimmt, jedes Kommentars enthält und die Ereignisse 'für sich selbst sprechen' läßt. Bei kommentierendem Abbildungsverhalten dagegen, das sich nicht mehr allein den Erfordernissen der Darstellungsebene anpaßt, sondern den Referenzakt nun als Mittel ausdrücklicher Selbstkundgaben des Erzählers in Funktion setzt, wird die Symptom-Funktion des kinematographischen Sprechakts - u.U. sogar auf Kosten der Darstellungsfunktion - explizit thematisiert. Diese explizite Thematisierung der Symptom-Funktion im Kommentar kommt in der Regel durch zwei einfache Verfahren zustande, die deshalb zugleich zwei wichtige Indikatoren kommentierenden Abbildungsverhaltens sind, nämlich durch defizitäre oder durch redundante Informationsvergabe (referentielle Defizite vs. referentielle Redundanzen). Den ersten Fall kann z. B. die berühmte Mordszene in der Dusche in Hitchcocks »Psycho« (USA 1960) illustrieren: Hier signalisiert die deutliche Unterschreitung der Aufnah4
Das übersieht PETERS (1984), wenn er den Unterschied zwischen referentiellem und kommentierendem Abbildungsverhalten mit dem Unterschied zwischen Proposition und lllokution identifiziert und dann von 'propositionalen' bzw. 'illokutiven Sprechakten' spricht. Diese terminologische Entscheidung beruht auf einem MLBverständnis der sprechakttheoretischen Begriffe: Abgesehen davon, daß der Begriff Illokution die kommunikative Funktion (Verwendung) des Sprechakts und also etwas grundlegend anderes meint als das, was Peters damit bezeichnen will (66), sind Proposition und Illokution nicht etwa, wie Peters unterstellt (68f.), zwei verschiedene Arten von Sprechakten, sondern zwei verschiedene Funktionen ein und desselben Sprechakts.
58
Kapitel II: Kameraverhalten
medistanz, die für eine umfassende Wahrnehmung des Vorgangs erforderlich gewesen wäre, der Verzicht nämlich auf Überblick schaffende Halbtotalen oder Halbnaheinstellungen und damit die Vorenthaltung von Informationen über das räumliche Umfeld der Akteure, eine Beziehung des Erzählers zum Erzählten, die sich nicht mehr im bloßen Referat des Vorgangs selbst erschöpft, die vielmehr darauf aus ist, die Situation - durch die Erzeugung klaustrophobischer Effekte - ganz buchstäblich als ausweglos und das Opfer als hilflos ausgeliefertes Objekt der Mordtat zu charakterisieren (vgl. auch S. 66f.). Ein Beispiel für den zweiten Fall zeigt die lange Kranfahrt von der Halbnaheinstellung zur Totale aus großer Höhe, mit der sich der filmische Erzähler in Fred Zinnemanns »High Noon« (USA 1952) von seinem Helden Will Kane (Gary Cooper) entfernt: Hier ist die am Ende der Einstellung erreichte Aufnahmedistanz zwar eine Funktion der großen Ausdehnung des Objekts, des weiten menschenleeren Raums, der den Helden umgibt, aber diesen weiten Raum zu zeigen, ist kein Erfordernis, das die Darstellungsebene stellte. Denn um zu erzählen, daß Kane unschlüssig auf der Straße steht, um sie dann schließlich hinunterzugehen, und daß diese Straße völlig leergefegt ist, bedarf es dieser aufwendigen und langen Kranfahrt nicht, sie geht also über das bloße Referat des Geschehens weit hinaus: Der durch sie entstehende - an dem propositionalen Gehalt des Bildes gemessen - große Überschuß an Informationen signalisiert die über die referentielle Bedeutung hinausgehende Funktion des menschenleeren Raumes als bildsprachlichen Symbols (vgl. Kap. VII) für die Verlassenheit des Helden, dessen einsamer Kampf für Recht und Ordnung tragendes Ideologem des Films ist. In beiden Beispielen beherrscht die Symptom-Funktion das Abbildungsverhalten: Nicht was sich ereignet, sondern wie die Ereignisse vom Erzähler gesehen werden, ist das beherrschende Thema der Bilder.
B. Distanzverhalten: Ästhetische Strukturen und Funktionen von Einstellungsgrößen Die Fähigkeit der Kamera, ihre Objekte aus wechselnder Distanz (und Perspektive) zu betrachten, gehört zu den wichtigsten Konstituenten filmischer Rede und zugleich zu den allein dem Film eigenen Darbietungsmitteln. Anders als der Theaterbesucher, der das Bühnengeschehen aus gleichbleibender Entfernung und Perspektive wahrnimmt, hat der ebenfalls aus gleichbleibender Entfernung und Perspektive auf die Leinwand blickende Kinozuschauer, weil Bilder ihre Betrachter in die Position des Wahrnehmungssubjekts, hier
Kapitel II: Kameraverhalten
59
der Kamera, versetzen (vgl. S. 25f.), die Illusion, unentwegt den Wahrnehmungsstandort zu wechseln. Die Entfernung zwischen Kamera und Objekt ist dabei eine der wichtigsten Varianten: Sie reguliert die Beziehung zwischen Bildsubjekt bzw. Rezipienten und Objekten als eine der Distanz, schafft größtmögliche Nähe oder größtmöglichen Abstand, verengt oder erweitert das Blickfeld, reglementiert die Zuschauerwahrnehmung oder läßt ihr (begrenzten) Spielraum.
1.
Kategorien der Beschreibung
Für die Beschreibung kinematographischer Abbildungsverfahren hat die Filmanalyse Kategorien entwickelt, die überwiegend der Sprache der Filmherstellung entlehnt sind. Was die Beschreibung des Kameraverhaltens betrifft, orientieren sich diese Kategorien an den räumlichen Koordinaten der Blickbeziehung zwischen Kameraauge und Objekt, beschreiben Entfernung (Einstellungsgröße) und Position der Kamera in Relation zum Objekt auf horizontaler und vertikaler Achse (Perspektive) und deren Veränderungen durch Kamerabewegungen. An diesen beschreibenden Begriffen wird hier im Prinzip festgehalten. Dennoch müssen sie an mehreren Stellen, insbesondere bei den Kamerabewegungen (Kap. II.D), präzisiert oder ergänzt werden, sei es, weil sie zu großen Bedeutungsschwankungen unterliegen, sei es, weil für bestimmte kinematographische Sachverhalte noch gar keine Begriffe existieren. Die Beschreibung der Einstellungsgrößen, um die es hier zunächst geht, leidet unter der uneinheitlichen Verwendung der Begriffe: 5 Deshalb ist zunächst der hier bevorzugte Begriffsgebrauch zu benennen.6 Das läßt sich am einfachsten mit Abbildungen bewerkstelligen (vgl. Abb.2, S. 61). Daß bisher noch »keine Filmakademie (...) den genauen Punkt festzulegen versucht (hat), an dem eine halbtotale Einstellung eine Totale wird oder die Totale sich in eine Panorama-Einstellung verwandelt«,7 ist kein Versäumnis von Filmakademien oder von Filmtheoretikern, sondern liegt in der Natur der Sache, nämlich in der Unbegrenztheit der Bildobjekte. Einstellungsgrößen sind relative Größen: Die Distanz zwischen Kamera und Objekt kann bei der Totale einer Innenaufnahme - nach Metern gemessen - der Halbtotalen oder sogar der halbnahen Einstellung einer Außenaufnahme entsprechen. Dieselbe Totale eines Innenraums kann, sobald Figuren in den Raum treten und sich in 5
Vgl. etwa die differierenden Begriffsbestimmungen bei KUCHENBUCH 1978, 20f., FAULSTICH 1980, 5 9 , SILBERMANN et.al. 1980, 52 oder KANDORFER 1990, 76-80.
6
ER folgt FAULSTICH 1980, 59 und BAWDEN 1981, Bd.l., 172f..
7
MONACO 1 9 8 0 , 1 8 3 .
60
Kapitel II: Kameraverhalten
den Mittelgrund bewegen, zur halbtotalen oder halbnahen Einstellung werden. Die Bestimmung von Einstellungsgrößen kann sich also nicht an absoluten Maßstäben orientieren. Umgekehrt aber schafft auch der Versuch, sie als ausschließlich relative zu fassen, sie nämlich allein aus der Relation zum Objekt abzuleiten, keine Klarheit: Faßt man die von der Totale bis zur Detaileinstellung reichende Skala der Einstellungsgrößen allein mit Bezug auf das Objekt als eine Skala, die den Spielraum zwischen der 'Ganzaufnahme' des Objekts und der Aufnahme eines seiner Teile bezeichnet, dann wäre, wie Kuchenbuch zutreffend feststellt, die Verwirrung komplett,8 denn dann wäre z.B. die 'Ganzaufnahme' eines Regentropfens als Totale, die 'Teilaufnahme' einer Landschaft (z.B. eines Baumes) dagegen als Detailaufnahme anzusprechen, ein Umstand, der zudem darauf hinweist, daß die Opposition 'Ganz-' vs. 'Teilaufnahme' hier im Prinzip sachfremd ist, weil Bilder grundsätzlich nur Teile, Teile nämlich des Raumkontinuums, erfassen können. Da nun weder die meßbare Entfernung von den Objekten noch die Frage, ob sie als ganze oder nur zu Teilen erscheinen, die Kategorisierung von Einstellungsgrößen begründen können, behilft sich die Filmanalyse mit einem Vergleichsmaßstab, den die menschliche Gestalt selbst liefert. Sie wird gewissermaßen als 'Normalgröße' der Dinge angesetzt, die der herkömmlichen, aus der Relation zwischen Objekt- und Einstellungsgröße abgeleiteten Größenbestimmung ihren - wenn auch vagen - Parameter gibt: An der menschlichen Gestalt gemessen große Dinge verlangen auch große Einstellungen, also eine relativ große Aufnahmedistanz (weshalb die Bestimmung der 'Teilaufnahme' einer Landschaft, z.B. eines Baumes, als Detailaufnahme herkömmlichem Begriffsverständnis widerspräche); entsprechend kleine Dinge verlangen (oder erlauben) kleine Einstellungen, also eine relativ kleine Aufnahmedistanz (weshalb die Bestimmung der 'Ganzaufnahme' eines Regentropfens als Totale herkömmlichem Begriffsverständnis widerspräche). Die maßgebende Mitte, nämlich die für alle anderen Einstellungsgrößen den Vergleichsmaßstab liefernde Einstellungsgröße ist denn auch die, die die menschliche Gestalt ganz und bildfüllend erfaßt, die Halbnahaufnahme (vgl. Abb.2). Von ihr ausgehend lassen sich die übrigen Einstellungsgrößen grob festlegen: Bilder, in denen die menschliche Gestalt zwar als ganze, aber nicht mehr bildfüllend und also kleiner als in der Halbnahaufnahme erscheint, gehören zur Gruppe der großen (Halbtotale, Totale, Weitaufnahme), und solche, in denen die menschliche Gestalt nicht mehr als ganze, sondern nur zu Teilen und also vergleichsweise groß erscheint, zur Gruppe der kleineren Einstellungsgrößen
«
KUCHENBUCH 1 9 7 8 , 2 1 .
Kapitel II: Kameraverhalten
61
Abb. 2: Einstellungsgrößen
(Amerikanische, Nah-, Groß- und Detailaufnahmen). Die großen Aufnahmen staffeln sich nach Maßgabe der (abnehmenden) Erscheinungsgröße menschlicher Figuren, die kleinen Aufnahmen entsprechend nach Maßgabe der (zunehmenden) Erscheinungsgröße von Teilen der menschlichen Gestalt: Die
62
Kapitel Π: Kameraverhalten
amerikanische Einstellung nimmt etwa zwei Drittel (bis zum Knie), die Nahaufnahme etwa die Hälfte (bis zur Taille), die Großaufnahme etwa ein Viertel und weniger (Gesicht, Arme, Beine usw.) der menschlichen Gestalt ins Bild, die Detailaufhahme noch kleinere Ausschnitte (Augen, Mund, Finger, Ohr usw.). Der Umstand, daß die Verankerung des herkömmlichen Beschreibungsapparats in menschlichen Entfemungs- und Größenrelationen ihm eine gewisse Logik verleiht, kann allerdings nicht darüber hinwegtäuschen, daß seine Termini uneinheitlich sind9 und daß er nur grobe, keineswegs exakte Bestimmungskriterien liefern kann, und dies vor allem aus zwei Gründen. Zum einen droht sein Vergleichsmaßstab 'menschliche Gestalt1 immer dann zu versagen, wenn gar keine Figuren im Bild erscheinen. Kuchenbuchs Vorschlag, »die Bezugsgröße des menschlichen Körpers« in solchen Fällen 'hinzuzudenken', 10 ist in der Tat die einzig mögliche Lösung, denn nur sie gewährleistet eine einigermaßen konstante Bedeutung der Begriffe. Daß dieses 'Hinzudenken' des fehlenden Vergleichsmaßstabs einen erheblichen Ermessensspielraum schafft, an exakte Bestimmungen also von vornherein gar nicht zu denken ist, versteht sich von selbst. Der zweite Grund für die Relativität dieser Bestimmungen wiegt schwerer. Bei vielen Einstellungen erhebt sich nämlich die Frage, in Bezug woraufauf welchen Teil der Bilder ihre Größe denn eigentlich bestimmt werden soll. Das Bild eines mit Menschen gefüllten Raumes beispielsweise, in dem einige im Hintergrund, andere im Mittelgrund und weitere im Vordergrund stehen, ließe sich je nach Bezugspunkt als Halbtotale, Halbnahe oder gar als Nahaufnahme klassifizieren, und das heißt: Es verlangt die Entscheidung darüber, wo der Fokus des Bildes zu lokalisieren ist. In vielen Fällen liefern Geschehen und Figuren selbst ausreichende Anhaltspunkte (Haupt- vs. Nebenfiguren, deren Handlungen, Dialoge, Raumverhalten usw.). Wo das aber nicht der Fall ist, kann die Bestimmung der Einstellungsgrößen zum Problem werden. Unter Umständen können inszenatorische (Lichtführung, Bewegungsregie, Bildkomposition u.a.) oder kameratechnische Indizien - Schärfenführung, insbesondere Schärfenverlagerungen - behilflich sein. Diese Hilfsmittel versagen jedoch bei Bildern, die eine mehr oder weniger große Tiefenschärfe haben: Nicht nur das in dieser Hinsicht berühmteste Beispiel, Orson Welles' »Citizen Kane« (USA 1941), sondern sämtliche mit auch nur einigermaßen tie9 Die Begriffe »Weit-« oder »Panorama-Aufnahme« rekurrieren auf die Ausdehnung des Blickfeldes, »Totale« und »Detail« auf die objektbezogene Opposition 'Ganzes' vs. 'Teile', »Nah« und »Halbnah« auf die subjektbezogene Kategorie der Distanz, »Groß« dagegen wieder auf eine objektbezogene Kategorie, die Erscheinungsgröße des Bildobjekts. 10 KUCHENBUCH 1 9 7 8 , 2 1 .
Kapitel II: Kameraverhalten
63
fer Schärfe gedrehte Filmbilder verlangen für die Bestimmung ihrer Einstellungsgrößen eine Entscheidung darüber, wo der Fokus des Bildes anzusetzen ist.11 Diese Entscheidung aber ist immer schon ein Akt der Interpretation, und folglich spielen schon bei diesem ersten, einfachen Untersuchungsschritt, bei der Beschreibung des Gegenstandes, interpretatorische Vorentscheidungen eine Rolle, die die Ergebnisse der Analyse gfls. erheblich beeinflussen können. Das ist keine originelle Einsicht, sie betrifft die Analyse jeglicher Art von Texten, also jeder potentiell mehrdeutigen und darum auf Verstehen angewiesenen Form der Kommunikation. Wenn sie hier eigens betont wird, so deshalb, weil die Filmanalyse seit jeher besondere Gefahr läuft, ihre Befunde - da sie auf technischen Apparaten beruhende Verfahren der Textkonstitution beschreibt - für 'objektive' Befunde zu halten und so die Illusion zu nähren, deren Dokumentation, das Filmprotokoll, liefere ein über jeden Streit erhabenes Fundament objektiver, rein beschreibender Daten. Die Einsicht, daß das nicht so ist, daß jede Textanalyse vielmehr von Vorverständnissen geleitet ist, begründet die Forderung, daß diese Vorverständnisse offenzulegen und damit der Überprüfung zugänglich zu machen sind. Bei der Filmanalyse ist der Ort dafür - soweit es sich um das ihre Befunde dokumentierende Filmprotokoll handelt - die Spalte, in der der Bildinhalt beschrieben wird: Sie sollte mit hinreichender Deutlichkeit anzeigen, wo der Bildfokus gesetzt, wie das Bild verstanden, worin seine Nachricht gesehen wird, und so die bei der Beschreibung der übrigen Konstituenten des Bildes gefällten Entscheidungen als Resultanten des Bildverstehens zu erkennen geben.
2.
Kategorien der Funktionsanalyse
Bei Einstellungsgrößen hat man es zwar, anders als bei den Perspektiven und Kamerabewegungen, mit nur einer Veränderlichen, der Entfernung zwischen Kamera und Objekt, zu tun, aber in dieser einen Veränderlichen steckt gleich11 Bei manchen Bildern ist das gar nicht möglich: Die bekannte Einstellung aus »Citizen Kane« etwa, die im verschatteten Mittelgrund die im Bett liegende, von einer Überdosis Schlafmittel betäubte Susan Alexander (Dorothy Comingore), im Vordergrund sehr groß die Arzneiflasche und ein Glas, im Hintergrund aber den mit einem Hausangestellten zur Tür hereinstürzenden Kane (Orson Welles) zeigt, ist Halbtotale, Halbnah- und Großaufnahme in einem (vgl. das Standfoto bei MONACO 1980, 175). Wollte man sie als das eine oder andere klassifizieren, dann gäbe man damit einer der drei Informationen des Bildes (die Frau ist leblos; sie hat sich vergiftet; ihr Marni kommt zu Hilfe) ein Gewicht, das ihr nicht zukommt, denn der Bildfokus ist hier gar nicht lokalisierbar, weil er in dem Zusammenhang liegt, den die drei Staffeln der Tiefenebene gemeinsam herstellen. Wird das ignoriert, verändert sich der Sinn des Bildes.
64
Kapitel II: Kameraverhalten
wohl ein komplexes Bündel bildsprachlicher Funktionen. Um dieses Funktionenbündel zu erfassen, werden hier nun die oben eingeführten Kriterien (vgl. S. 54-56) für die Bildung funktionaler Kategorien zur Anwendung kommen: Kriterium 1 (Objekteigenschaften) lenkt den Blick vor allem auf die Größe, auf die räumliche Ausdehnung der Bildobjekte, Kriterium 2 (Objektbeziehungen) auf die Frage, wie Einstellungsgrößen die räumlichen Beziehungen der Bildobjekte behandeln, Kriterium 3 (Blickfeld) auf die Ausdehnung des Blickfeldes, Kriterium 5 (Rezipientenperspektive) auf den Spezifikationsgrad der von den Bildern vergebenen Informationen und ihre Funktion für die Lenkung der Zuschauerwahrnehmung, und Kriterium 4 (Kameraverhalten als Interaktionsverhalten) begründet die Frage, inwiefern das bloße Faktum der Entfernung zwischen Subjekt und Objekt des Bildes als solches Auskunft über die Beziehung des Erzählsubjekts zum Erzählten geben kann. Nach Maßgabe dieser Kriterien wird der Sachverhalt 'Einstellungsgröße' unter wechselnden Gesichtspunkten zu beschreiben sein mit dem Ziel, das Verhalten der Kamera auf der zwischen Weit- und Detailaufnahme sich erstreckenden Skala von Aufnahmedistanzen als einen komplexen Faktor filmischer Rede kenntlich zu machen und mit der Formulierung allgemeiner funktionaler Kategorien Voraussetzungen für die Erfassung seiner Multifunktionalität zu schaffen. Die aus den fünf Analysekriterien abgeleiteten funktionalen Kategorien, die Formaspekte als Funktionsaspekte beschreiben, haben daher zunächst gleichberechtigten Stellenwert. Die bei jeder praktischen Untersuchung entstehende Frage dagegen, welche dieser Aspekte im konkreten Fall leitende Funktion besitzen, ist immer schon eine interpretatorische. Objektgröße: Definition des Blickobjekts Daß Einstellungsgrößen mit der Größe der Bildobjekte korrespondieren, daß mithin die Wahl der Aufnahmedistanz in der Objektgröße Bedingungen vorfindet, die ihrem Entscheidungsspielraum Grenzen setzen, beschreibt die fundamentale Bedingung filmischen Distanzverhaltens: Große Gegenstände oder raumgreifende Bewegungen verlangen, sollen sie vom Rezipienten erkannt werden, eine größere Aufnahmedistanz als kleine Gegenstände oder wenig raumgreifende, z.B. mimische Bewegungen. Die Beziehung zwischen Objektgröße und Einstellungsgröße entscheidet demnach maßgeblich über die Erkennbarkeit der Objekte und hat damit zunächst grundlegende Bedeutung für die referentiellen Funktionen filmischer Rede: Die Aufnahme eines Gebirges aus einer sehr geringen Distanz von z.B. nur einigen Metern ergäbe nicht das Bild eines Gebirges, ein anderes Bildthema träte an seine Stelle ('Gestein', 'Pflanzen' o.ä.); umgekehrt wären bei einer das Gebirge thematisierenden Weitaufnahme die Struktur des Gesteins oder die Gebirgsvegetation nicht
Kapitel II: Kameraverhalten
65
mehr zu erkennen. Das heißt: Einstellungsgrößen definieren das Blickobjekt des Bildsubjekts, und diese Feststellung ist so banal nicht, wie sie klingt. Denn daraus ergibt sich für die Funktionsanalyse von Einstellungsgrößen ein Arbeitsschritt, der für die Erkenntnis referentieller bzw. kommentierender Funktionen des Abbildungsverhaltens (vgl. S. 56-58) einige Bedeutung gewinnen und damit zugleich der Interpretation von Filmen wesentliche Voraussetzungen liefern kann. Es ist dies die Untersuchung der Relation von Blickobjekt und Handlungsfokus, also des Verhältnisses zwischen dem von der Einstellungsgröße nach Maßgabe der Größe des gewählten Objekts definierten Wahrnehmungsbereich des Bildsubjekts und dem Bereich, in dem der Fokus des erzählten Geschehens liegt. Bei der Mehrzahl filmischer Bilder sind beide weitgehend identisch, sind die Entscheidungen über die Aufnahmedistanz also geleitet von den Erfordernissen, die die referentiellen Funktionen des filmischen Sprechakts stellen: Blickobjekt und Handlungsfokus fallen dabei in dem erzählten Vorgang zusammen, auf dessen optimale visuelle Klärung sich das Abbildungsverhalten in diesem Fall konzentriert. Die Größe der Objekte bzw. des von einer Aktion beanspruchten Raums liefert dabei also die entscheidenden Kriterien für die Wahl der Einstellungsgröße.12 Setzt man diesen Fall als den Normalfall filmischen Erzählerverhaltens, dann entsteht ein Begründungsbedarf für alle jene Fälle, in denen Blickobjekt und Handlungsfokus divergieren, d.h. in denen der Wahrnehmungsbereich des filmischen Erzählers nicht mehr in erster Linie an der räumlichen Ausdehnung des erzählten Geschehens orientiert ist, sondern den für die Erkennbarkeit dieses Geschehens nötigen Raumausschnitt deutlich überschreitet oder unterschreitet. Das erwähnte Beispiel der großen Kran-Totale aus »High Noon« (S. 58) konnte das schon veranschaulichen. Der Handlungsfokus liegt hier in einem alltäglichen Vorgang: Der Held geht eine Straße hinunter. Das Blickobjekt aber ist nicht bloß dieser Vorgang, sondern der ihn umgebende, weite und menschenleere Raum, und dieses Blickobjekt läßt sich aus dem Handlungsfokus selbst nicht ableiten, das heißt: Die Erkennbarkeit des Vorgangs ist hier 12 Hitchcocks Vorwurf, »Regisseure, die die Schauspieler nur in die Dekoration stellen und die Kamera mehr oder weniger weit entfernt piazieren, je nachdem ob ihre Personen sitzen, stehen oder liegen«, dächten falsch und leisteten »keine richtige Arbeit, die etwas ausdrückt« (TRUFFAUT 1982, 257), trifft gewiß die weitaus überwiegende Mehrzahl der durchschnittlichen kommerziellen Filme und Fernsehproduktionen. Gleichwohl läßt sich aus der Frage, ob sich die Kamera weitgehend auf ihre referentiellen Funktionen beschränkt oder nicht, noch kein ästhetisches Qualitätskriterium ableiten, wie diese Äußerung nahelegt. Ein Blick auf Filme mit so zurückhaltender, den Dingen selbst den Vortritt lassender und deren Bedeutung so subtil nachhelfender Kamera wie der von Nestor Almendros in Eric Rohmers »Die Marquise von O« (F/BRD 1975) oder von Christian Matras und Claude Renoir in Jean Renoirs »La grande illusion« (F 1937) widerspricht ihr vielmehr.
66
Kapitel II: Kameraverhalten
nicht mehr das entscheidende Kriterium für die Wahl der Einstellungsgröße, vielmehr liefert der große Raumausschnitt eine Vielzahl von Informationen, die für das Verstehen dieses Vorgangs redundant sind. Diese durch die Überschreitung des für die Erkennbarkeit des Geschehens nötigen Raumausschnitts, mithin die referentielle Redundanz (vgl. S. 57) der durch die große Aufnahme gelieferten Informationen, wird so zum Signal für den veränderten Gegenstand der Rede, der in diesem Fall, wie erwähnt, ein uneigentlicher ist: Das Blickobjekt, der weite, menschenleere Raum, der den Helden umgibt, figuriert nicht mehr in seiner eigentlichen Bedeutung als Aktionsfeld der Figur, sondern in uneigentlicher Bedeutung als Symbol der Verlassenheit.13 Den umgekehrten Fall, die Unterschreitung der für die Erkennbarkeit eines Vorgangs erforderlichen Einstellungsgröße, zeigt die ebenfalls schon zitierte Szene aus Hitchcocks »Psycho« (USA 1960), der berühmte Mord in der Dusche:14 Nach einer einführenden Klärung der Situation - Marion (Janet Leigh) unter der Dusche - und einer Nahaufnahme einer (aus der Figurenperspektive, durch den Duschvorhang, nur schemenhaft gezeigten) Gestalt mit einem Messer in der erhobenen Hand folgt ein Wirbel von Groß- und Detailaufnahmen, die den gewalttätigen Vorgang in eine Vielzahl von Partikeln auflösen, von denen keines für sich allein imstande ist, das Geschehen zu klären. Den Zusammenhang liefern hier nicht die Bilder, liefert (von einzelnen Bildverbindungen abgesehen) recht eigentlich auch nicht deren Montage, sondern erst und vor allem der Zuschauer: Er fügt die disparaten Teile zu einem Ganzen, was im übrigen ein wesentlicher Grund für die außerordentliche Gewalttätigkeit dieser Szene ist, denn die durch die Bildfetzen und Geräusche angeregte Vorstellungskraft des Zuschauers übersteigt bei weitem den referentiellen Inhalt der Bilder, die nur minimale Partikel des Geschehens liefern, dessen Brutalität selbst aber nur in einigen Bildern und darin auch nur bruchstückhaft transportieren. Die ganze Szene, aus der Halbnahen gefilmt, bliebe zwar grausam, wäre aber nicht imstande, die kaum erträgliche Atmosphäre der Gewalttätigkeit herzustellen, die ihre Präsentation hier erwirkt. Eben darin liegt denn 13 Einen vergleichbaren Fall erwähnt Hitchcock, der der Überzeugung war, »daß man den Raum nie verschwenden sollte, weil man sich seiner immer dramaturgisch bedienen kann«, mit Bezug auf »The Birds« (USA 1963): Bei dem Angriff der Vögel auf das Haus der Brenners, bei dem Melanie (Tippi Hedren) sich ängstlich in eine Sofaecke drückt, habe er »die Kamera ziemlich weit von ihr entfernt postiert, (...) um die Leere, das Nichts zu suggerieren, vor dem sie zurückweicht. (...) Wenn ich gleich zu Anfang ganz nah bei dem Mädchen begonnen hätte, wäre der Eindruck entstanden, sie wiche zurück vor einer Gefahr, die sie, nicht aber das Publikum sähe. Ich wollte dagegen zeigen, daß sie vor einer Gefahr zurückweicht, die es gar nicht gibt, deshalb diese Verwendung des Raums vor ihr«. (TRUFFAUT 1982, 257). 14 Vgl. die Abbildungen ebd. 270-274.
Kapitel II: Kameraverhalten
67
auch die Funktion dieser die räumliche Ausdehnung des Geschehens so erheblich unterschreitenden Einstellungsgrößen: Sie referieren nicht einfach den Vorgang, sondern zeigen ihn aus der subjektiven, höchst persönlichen Sicht des Erzählers, die ihm Entscheidendes hinzufügt, ihn als einen Vorgang von nicht mehr zu überbietender Gewalttätigkeit deutet, indem sie diese Gewalttätigkeit überhaupt erst erfahrbar macht dadurch, daß sie sie zu wesentlichen Teilen in den Kopf des Zuschauers verlegt. Objektbeziehungen: Integration und Isolation Mit der Entscheidung über die Einstellungsgröße entscheidet das Bildsubjekt zugleich darüber, inwieweit die Einbindung der Bildobjekte in das Kontinuum des Raumes, ihre räumlichen Beziehungen zur Erscheinung kommen oder nicht. Aus dem Umstand, daß Totalen einen relativ großen Ausschnitt des Raumkontinuums erfassen, ergibt sich von selbst, daß sie über räumliche Beziehungen mehr auszusagen imstande sind als die kleineren Einstellungen. Die Skala, die sich in dieser Hinsicht zwischen der Totalen und der Detailaufnahme erstreckt, sei hier mit den Kategorien Integration vs. Isolation und Relativierung vs. Verabsolutierung erfaßt: Die Totalen integrieren die Bestandteile des gezeigten Raumausschnitts in einen Zusammenhang, der sie in wechselseitige räumliche Relationen zueinander setzt, ihre Größen-, Form-, Entfernungs- und Lageverhältnisse klärt; mit zunehmender Verringerung der Aufnahmedistanz werden die Figuren oder Dinge sukzessive von ihrer räumlichen Umgebung isoliert, wird ihr räumliches Bezugsfeld zunehmend abgeschnitten und zumeist auch - je nach gewähltem Objektiv - zunehmend unscharf: Das Verhalten der Figuren und Dinge (Gestalt, Ausdruck, Bewegung usw.) verliert dabei sukzessive den Charakter der Interaktion, erscheint als zunehmend auf sich selbst zurückbezogene (statt auf seinen räumlichen Kontext bezogene) Aktion, wird zunehmend verabsolutiert,15 Einen Extremfall Diese funktionalen Kategorien bleiben nun freilich relative, denn auch hier sind die Objektgrößen eine entscheidende Variable: Wo etwa die Vorgänge auf einem Ameisenhaufen das Thema sind, haben Nah- und Großaufnahmen naheliegenderweise durchaus keine isolierende und verabsolutierende Funktion mehr, sind vielmehr gerade Voraussetzung für die Erkennbarkeit der räumlichen Relationen, der Interaktionen, die sich in einem Ameisenstaat vollziehen. Auch hier spielt also die Frage, wo der Bildfokus zu lokalisieren ist (vgl. S. 62f.), eine unter Umständen entscheidende Rolle, und auch hier muß der Vergleichsmaßstab der menschlichen Gestalt aushelfen: Mit Blick auf ihn kann die zwischen Integration und Isolation sich erstreckende Skala in etwa positiv auf die Skala der Einstellungsgrößen (Totale vs. Detailaufnahme) bezogen werden, während sie mit Blick auf deutlich größere oder kleinere Bildobjekte von Fall zu Fall aus der Relation von Objektgröße und Hinstellungsgröße abzuleiten ist. Und selbst der menschliche Größenmaßstab liefert nur grobe Anhaltspunkte, denn auch hier kommt es immer noch auf den jeweils gezeigten Sachverhalt, etwa auf die Art der Figurenaktionen (ihren 'Raumbedarf) an: Ein Kuß, eine
68
Kapitel II: Kameraverhalten
solcher Verabsolutierung, der reinen Selbstbezüglichkeit des Objekts, stellt die Großaufnahme des menschlichen Gesichts dar, weil sie die bei der normalen, außerfilmischen Wahrnehmung menschlicher Gesichter gegebene Distanz stark unterschreitet, die Umgebung des Gesichts unscharf werden läßt und Ausdruck und Mienenspiel damit zum alleinigen Thema der Einstellung macht. Die Großaufnahme des menschlichen Gesichts ist daher die üblichste und zugleich wirkungsvollste Form der filmischen Vermittlung dessen, was im sprachlichen Erzähltext innerer Monolog, erlebte Rede oder Gedankenbericht (präziser) leisten: der Vermittlung von Innerlichkeit, die hier über die minutiöse Registratur mimischer Zeichen zustandekommt.16 Aus der Frage nach den Gründen einer integrierenden bzw. isolierenden Kameraführung kann die Interpretation filmischer Bilder einige - unter Umständen sogar recht weitreichende - Deutungsansätze beziehen. Ausgangspunkt dafür ist auch hier stets die Frage nach den referentiellen Funktionen des Kameraverhaltens. Wenn sich z.B. Holly Martins (Joseph Cotton) in Carol Reeds »The third man« (GB 1949) von Kurtz (Ernst Deutsch) die Stelle zeigen läßt, an der sein Freund Harry Lime, wie Kurtz behauptet, durch einen Unfall ums Leben kam, dann hat die dabei gewählte Halbnahaufnahme keine andere Aufgabe, als die äußeren räumlichen Beziehungen der Szene zu klären, nämlich die auf die Unfallstelle bezogene sprachliche und gestische Interaktion beider Figuren (die Stelle zeigen/gezeigt bekommen) zu referieren: Die integrierende Halbnaheinstellung orientiert sich an der für die Darstellung der räumlichen Beziehungen zwischen den Figuren sowie zwischen ihren (hinweisenden) Gesten und Blicken und deren Objekt, der Unfallstelle, notwendigen Größe des Raumausschnitts, folgt also ausschließlich referentiellen Erfordernissen. Eine - diese Erfordernisse vernachlässigende - Auflösung Umarmung, die feindseligen Blicke zweier nah voreinander stehender Kontrahenten u.ä. können noch von einer Großaufnahme erfaßt werden, und solche Großaufnahmen haben zwar insofern isolierende Funktionen, als sie den intimen Vorgang aus seinem Umfeld herausnehmen, gleichwohl geben sie auch (und sogar in erster Linie) Auskunft über eine spezifische räumliche Beziehung der Akteure, eben die größtmöglicher Nähe. 16 Vor allem um dieses Vermögens willen, das menschliche Gesicht in allen seinen Nuancierungen zu erfassen, feierte Béla Balázs die Filmkunst als Wiederkehr des 'sichtbaren Menschen': »Die Großaufnahme ist die technische Bedingimg der Kunst des Mienenspiels und mithin der höheren Filmkunst überhaupt. So nahe muß uns ein Gesicht gerückt sein, so isoliert von aller Umgebung, welche uns ablenken könnte (...), so lange müssen wir bei seinem Anblick verweilen dürfen, um darin wirklich lesen zu können. Der Film fordert eine Feinheit und Sicherheit des Mienenspiels, wie es sich der Nur-Bühnenschauspieler nicht träumen läßt. Denn in der Großaufnahme wird jedes Fältchen des Gesichts zum entscheidenden Charakterzug, und jedes flüchtige Zucken eines Muskels hat ein frappantes Pathos, das große innere Ereignisse anzeigt« (BALAZS 1982a, 82). Daß die Kamera damit freilich immer auch in Gefahr ist, zum Voyeur zu werden, spielte fur Balázs noch keine Rolle.
Kapitel II: Kameraverhalten
69
der Einstellung in isolierende Einzelaufnahmen der Gesprächspartner und der Unfallstelle dagegen hätte der Szene ein durchaus verändertes Gesicht gegeben, hätte den Schwerpunkt vom einfachen Referat des Vorgangs und der äußeren Raumbeziehungen verlagert auf ein Referat innerer Beziehungen, nämlich der sehr unterschiedlichen Beziehungen beider zu dem im Unfallort präsenten (angeblichen) Tod Harry Limes: Da Kurtz weiß, daß Harry Lime lebt, da er seinen Gesprächspartner also belügt, hätten Nah- oder Großaufnahmen eine deutliche Divergenz zwischen beider Gefühlen sichtbar gemacht. Damit zugleich hätten sie die von Kurtz vorgetäuschte, aus scheinbar gemeinsamer Betroffenheit erwachsende Gemeinschaft beider Gesprächspartner, die die Halbnahaufnahme bestätigt, zunichte gemacht: Die isolierende Kadrierung wäre so zugleich zu einem Signal der Auflösung von Gemeinschaft geworden. Das Beispiel verweist auf eine semantische Dimension der mit den Begriffen Integration und Isolation angedeuteten funktionalen Opposition, die hier eigens erwähnt sei, weil bei der semantischen Strukturierung von Bildern durch Einstellungsgrößen sehr häufig auf sie rekurriert wird, indem nämlich die integrierende oder isolierende Darstellung einer Figur selbst als Zeichen ihrer (sozialen) Integration oder Isolation gesetzt wird. Die verabsolutierende, die Figur von ihrem Kontext isolierende, sie auf sich selbst zurückwerfende, ihre Innerlichkeit thematisierende Funktion kleiner Einstellungsgrößen legt diese semantische Qualifizierung von selbst nahe. So kann etwa die Auflösung einer Interaktionssituation in isolierende Schuß-Gegenschußaufnahmen das Mißlingen von Interaktion ankündigen oder begleiten, die Differenzen zwischen zwei Interaktionspartnern durch die sie trennenden Einzelaufnahmen signalisieren.17 Blickfeld: Raumerfahrung und Wahrnehmungsverhalten Das dritte Kriterium verschiebt den Aspekt von der Relation Objektgröße/ Einstellungsgröße auf die Frage nach der Struktur des Blickfeldes selbst als •7 Vgl. z.B. die stark raffende Sequenz aus Orson Welles' »Citizen Kane- (USA 1940), die die Entwicklung der ersten Ehe des Helden von ihren zärtlichen Anfängen bis zu ihrem frostigen Ende am Beispiel mehrerer, zeitlich weit auseinanderliegender Frühstücksszenen erzählt (vgl. die Abbildung von Standphotos der Sequenz bei Reisz/millar 1988, 81-84): Beginnend mit einer von der Halbtotalen bis zur Amerikanischen sich annähernden Einstellung, die das verliebte junge Ehepaar in einem Bild erfasst, geht der Erzähler in dem Moment in die Schuß-Gegenschuß-Montage naher (und damit das Referat der räumlichen Beziehungen zwischen den Akteuren vernachlässigender) Aufnahmen über, da im Dialog erste Dissonanzen anklingen, die sich im weiteren zu gereizten Plänkeleien verdichten. Erst am Ende erscheinen beide Ehepartner wieder in einer gemeinsamen Einstellung, die sie, frostig schweigend und weit voneinander entfernt an den Kopfenden eines langen Tisches sitzend, zeigt: Die Phase ehelicher Auseinandersetzungen ist beendet, Resignation und Gleichgültigkeit sind das 'einigende' Band zwischen beiden geworden.
70
Kapitel II: Kameraverhalten
Ausdruck eines spezifischen Wahrnehmungsverhaltens des Bildsubjekts. Hinsichtlich der Einstellungsgrößen geht es dabei allererst um die Frage der Ausdehnung des Blickfeldes. Was ein 'weites' oder 'enges' Blickfeld sei, bemißt sich hier nicht mehr an der Größe der Objekte, sondern an Größenrelationen menschlichen Wahrnehmens. Das weitestmögliche Blickfeld wäre eines, das so weit ist, 'wie das Auge reicht', das engste eines, das so gut wie keine Raumerfahrung mehr zuläßt, so nah wie irgend möglich an die Objekte herangeht, dem Blick keinen Spielraum mehr gestattet. Unter diesem Aspekt läßt sich die Varianzbreite der Einstellungsgrößen zunächst mit der Opposition Weite vs. Enge qualifizieren. Sie beschreibt die Qualität der optischen Raumerfahrung des wahrnehmenden Subjekts als eine das Blickfeld strukturierende Größe: Die Totale gibt dem Blickfeld eine offene, der Raumerfahrung zugängliche Struktur, ist diejenige Einstellungsgröße, die, indem sie den Raum in seiner größtmöglichen Ausdehnung präsentiert, das größte Maß an Raumerfahrung gestattet, das bei unbewegter Kamera möglich ist. Die Detaileinstellung gibt dem Blickfeld eine geschlossene, intime oder auch klaustrophobische Struktur, ist diejenige Einstellungsgröße, die, indem sie Raum in kleinstmöglicher Ausdehnung präsentiert, keine Raumerfahrung mehr zuläßt. Diese Qualität der Raumerfahrung teilt sich den Wahrnehmungsobjekten in der Regel unmittelbar mit, wird, indem sie die Objekte mit Raum umgibt oder aber in den Bildkader regelrecht einschließt, zu einer Qualität der Objekte selbst: In der schon mehrfach erwähnten Einstellung aus »High Noon« (S. 58, 65f.) gibt der Erzähler mit der weiten Ausdehnung seines Blickfeldes dem Bild selbst eine offene Struktur. Der Held ist einsam, aber - ganz buchstäblich - frei zu gehen, wohin er will; er ist nicht ausgeliefert, nicht Objekt heteronomer Bestimmungen, sondern erscheint (und das entspricht der Botschaft des Films) als selbstbestimmtes Subjekt. Die Mordszene aus »Psycho« (vgl. S. 57f., 66f.) suggeriert das genaue Gegenteil: Mit den außerordentlich engen Blickfeldern der Groß- und Detailaufnahmen gibt der Erzähler der Szene eine klaustrophobische Geschlossenheit und Enge und signalisiert so, daß es für das Mordopfer kein Entrinnen, keine Möglichkeit selbstbestimmten Handelns mehr gibt, daß es nur noch Objekt ist. Schon mit einer einzigen Aufnahme aus größerer Distanz, die mögliche Fluchtwege ins Blickfeld gerückt hätte, hätte er den Gedanken zugelassen, daß die Frau vielleicht doch noch eine Chance hat, zu entkommen, hätte folglich auch die Affekte der Zuschauer entsprechend auf diese Möglichkeit, statt auf das reine Objektsein des Opfers gerichtet, das für die Gewalttätigkeit dieser Szene konstitutiv ist. Weite oder Enge des Blickfeldes bestimmen Qualität und Quantität der Wahrnehmung. In dieser Perspektive läßt sich die Varianzbreite der Einstel-
Kapitel II: Kameraverhalten
71
lungsgrößen mit der Opposition Extensität vs. Intensität funktional qualifizieren: Die weite Ausdehnung des Blickfeldes in den Totalen extensiviert die Wahrnehmung, verteilt die Aufmerksamkeit auf viele verschiedene Einzeldinge, signalisiert Interesse an deren räumlichen Zusammenhängen (vgl. Kriterium 2). Mit zunehmender Verengung des Blickfeldes intensiviert sich die Wahrnehmung, konzentriert sich auf Einzelaspekte des Raumkontinuums, signalisiert Interesse am Gesicht einzelner Dinge oder Figuren. Es liegt sehr nahe anzunehmen, daß eine intensive, konzentrierte Wahrnehmung des filmischen Erzählers dem Wahrnehmungsobjekt größere Bedeutung zuweist als eine extensive, und auf einer sehr allgemeinen Ebene und vor allem mit Blick auf konventionelle Abbildungsverfahren des Films hat diese Annahme auch eine gewisse Berechtigung. Gleichwohl bleiben solche Qualifikationen problematisch, weil auch hier die Größe des Blickobjekts (Kriterium 1) sowie die übrigen Abbildungsverfahren als maßgebliche Variablen ins Spiel kommen: Die allegorische Schlußeinstellung von Andrej Tarkowskijs »Nostalghia« (I 1983) beispielsweise - eine (sehr lange) Aufnahme der Ruine einer italienischen Kathedrale, in deren Innern das russische Dorf des Helden Platz gefunden hat - ist, bloß weil sie notwendigerweise eine Totale ist, nicht weniger 'wichtig' als die Groß- und Nahaufnahmen des Films. Die übliche Gleichung 'Großaufnahme = intensive Wirkung' und 'Totale = schwache Wirkung' (»langweilig«)18 mag bei vielen Filmen aufgehen, 19 leidet aber keine Generalisierung. Ihre Problematik liegt darin, daß sie Bilder aufgrund nur eines Kriteriums (Einstellungsgröße) inhaltlich schon sehr weitgehend qualifiziert und damit einem einzelnen Parameter des Abbildungsverhaltens autonome, vom Abbildungsobjekt (und von den übrigen Parametern des Abbildungsverhaltens) unabhängige Bedeutungen zuerkennt. Wie alle übrigen hier vorgestellten Kategorien sind auch die Begriffe Extensität und Intensität als Kategorien zu verstehen, die die Formen der Wahrnehmung und deren potentielle Funktionen erfassen, dabei aber noch nichts über die Bedeutsamkeit oder gar Bedeutung eines Bildes aussagen: Die extensive Wahrnehmungsweise der Totalen kann Bilder von durchaus 'intensiver' Bedeutung hervorbringen, wie die Schlußeinstellung von »Nostalghia« zeigt; und die intensive Wahrnehmungsweise der Detailaufnahmen kann umgekehrt Bilder von durchaus 'extensiver' Bedeutung hervorbringen, wie die Partikel der erwähnten Mordszene aus »Psycho« zeigen, deren Eigenbedeutung vergleichsweise gering ist, weil sie erst aus dem Zusammenhang der Gesamtszene ihre Bedeutung beziehen (vgl. S. 57f., 66f., 70).
18 WEMBER 1 9 7 2 , 3 5 f .
19 Vgl. ebd. 39f.
72
Kapitel II: Kameraverhalten
Rezipientenperspektive: Informationsvergabe und Zuschauerlenkung Da bildliche Kommunikation auf der Identifikation der Wahrnehmungsposition des Rezipienten mit der des Bildsubjekts beruht (vgl. S. 26), gilt, was über die Wahrnehmungstätigkeit des Bildsubjekts gesagt wird, immer auch für die Rezipienten: Der filmische Erzähler organisiert seine Beziehung zu seinen Adressaten über seine Beziehung zu seinen Objekten. Die Frage nach den Strukturen des Blickfeldes ergibt deshalb, rezeptionsästhetisch gewendet, Hinweise auf Funktionen der Einstellungsgrößen für die Steuerung der Rezipientenperspektive: Was eben mit Blick auf das Bildsubjekt als spezifische Weise der Raumerfahrung bzw. als Ausdruck extensiven oder intensiven Wahrnehmungsverhaltens qualifiziert wurde, ergibt unter diesem Aspekt Hinweise auf Verfahren der Informationsvergabe, speziell auf Verfahren der Lenkung der Zuschauerwahrnehmung. Weite oder Enge des Blickfeldes stellen sich in dieser Perspektive als Alternative von indirekter und direkter Rezeptionslenkung dar: Die weite Ausdehnung des Blickfeldes in den Totalen läßt dem Rezipienten eine gewisse Freiheit in der Wahrnehmungstätigkeit, deren Lenkung hier allenfalls indirekt, etwa über Bildkomposition, Bewegungsregie, Lichtführung u.ä., erfolgen kann. 20 Mit zunehmender Einschränkung des Blickfeldes schränken sich auch die Entscheidungsfreiheiten des Rezipienten ein, verstärken sich Formen direkter Lenkung durch die Verengung des Bildausschnitts und die Vergrößerung des Bildobjekts.21 Der kleine Ausschnitt kann Informationen vorenthalten, die ein größerer Ausschnitt geben würde, und so ein kalkuliertes Informationsdefizit des Zuschauers herstellen, wie das etwa bei den wohlbekannten Kamerablicken auf die Füße oder Hände des Täters in Kriminalfilmen der Fall ist. Der kleine Ausschnitt kann aber auch umgekehrt gerade demonstrativ auf einen Sachverhalt hinweisen, der in einem größeren Ausschnitt nicht eigens wahrgenommen würde, womit dem Zuschauer in der Regel ein Informalo Viele Totalen aus Orson Welles' »Citizen Kane« (USA 1940) können die wahnehmungslenkende Funktion der Bildkomposition illustrieren, so etwa die großen Totalen, die eine Wahlveranstaltung Kanes zeigen: Die Bildkomposition gliedert, unterstützt von der Lichtfuhrung, den großen Saal zentrisch auf den Bildmittelpunkt hin, in dem Kane am Rednerpult steht (eine winzige Gestalt, die durch das gigantische Wahlplakat über ihr, das ihr überlebensgroßes Porträt zeigt, noch kleiner wirkt, als die Totale sie ohnehin erscheinen läßt). 21 SIEGRIST 1986, 159 spricht in diesem Zusammenhang von »deiktische(r) Indexfunktion«, in der er die »wesentlichste narrative Spezialisierung des engen Bildausschnitts« erblickt, ein Begriff, der den Sachverhalt der Zuschauerlenkung bereits semantisch qualifiziert (als Verweis des Erzählers auf einen für den Fortgang der Geschichte relevanten Sachverhalt) und damit einseitig festlegt, nämlich die Möglichkeit, daß es dem Bildsubjekt um die Sache selbst (nicht um seine Indexfünktion für kommendes Geschehen) geht, nicht mehr zuläßt.
Kapitel H: Kameraverhalten
73
tionsvorsprung eingeräumt wird, wie das etwa bei den klassischen Kamerablicken auf Requisiten, die von den Figuren übersehen oder vergessen werden, der Fall ist. Die funktionale Qualifizierung der Einstellungsgrößen als eine zwischen extensiver und intensiver Wahrnehmung sich erstreckende Skala stellt sich in rezeptionsästhetischer Perspektive dar als eine den Spezifikationsgrad der vergebenen Informationen anzeigende Skala. Dieser Spezifikationsgrad nimmt mit abnehmender Aufnahmedistanz zu und läßt sich zunächst mit dem Oppositionspaar Übersichts- vs. Detailinformationen grob kategorisieren: Große Einstellungsgrößen, das versteht sich von selbst, geben Informationen über eher großräumige Zusammenhänge und verzichten auf die Vergabe detaillierter Informationen. Kleine Einstellungsgrößen dagegen geben eben solchen Einzelinformationen den Vorzug, konzentrieren sich eher auf Details und verzichten darauf, deren räumlichen Kontext zu klären. Die klassischen Formen der Filmexposition folgen zumeist dem Prinzip der von einer einführenden, Übersicht schaffenden Totale ausgehenden Sukzession zunehmend kleiner werdender Einstellungen: Mit der Totale informiert die Kamera zunächst über den Gesamtschauplatz des Geschehens und nähert sich ihm und seinen Protagonisten dann schrittweise an. Wo die Exposition den umgekehrten Weg geht, muß sie ihn zumeist spiegelbildlich wiederholen, d.h. von der Nähe in die Distanz und von dort wieder in die Nähe gehen, um mit dem Erzählen zu beginnen.22 Ähnliches gilt für klassische Schnittfolgen bei der Darstellung großer, raumgreifender Aktionen: Eine Totale klärt die Gesamtsituation, die dann von den folgenden kleineren Einstellungen spezifiziert wird. In der berühmten Szene auf der großen Hafentreppe von Odessa in Eisensteins »Panzerkreuzer Potemkin« (UDSSR 1925) wird diese klärende Totale zunächst durch drei vorgeschaltete Bilder kleinerer Ausschnittgrößen motiviert, die panische Reaktionen von Menschen zeigen, deren Ursache, den Angriff der zaristischen Soldaten auf die Menschenmenge, die Totale dann enthüllt, bevor sich die Kamera wieder Einzelheiten des Geschehens widmet, indem sie das Schicksal einiger der in der großen Menge flüchtenden Menschen erzählt. Das Beispiel verweist auf einen weiteren, mit dem Spezifikationsgrad der Informationsvergabe verbundenen funktionalen Aspekt, auf den Umstand, daß die kleineren Einstellungsgrößen den Bildobjekten in der Regel individuelle, die großen dagegen nur allgemeine, typisierende Konturen geben: Die flüchtende Menschenmenge auf der Hafentreppe bliebe anonym, würde die Kamera sie nicht durch Nahaufnahmen einzelner Menschen individualisieren und so das Leid, das über diese Masse von Menschen kommt, erfahrbar machen, in22 Vgl. z.B. die Eröfinungssequenz von Orson Welles' »Citizen Kane« (USA 1940).
74
Kapitel II: Kameraverhalten
dem sie es exemplifiziert. Die Opposition Typisierung vs. Individualisierung soll diesen Unterschied zwischen verallgemeinernder und spezifizierender Informationsvergabe mit Bezug auf Figuren oder Einzeldinge festhalten: Aus großer Distanz erscheinen ein Mensch, ein Tier, ein Haus usw. nicht als Individuen, sondern lassen sich lediglich als das eine oder andere identifizieren, eben als irgendein Mensch, Tier oder Haus, und erst mit zunehmender Annäherung werden individuelle Konturen erkennbar. Mit Nah- und Großaufnahmen macht der Erzähler seine Figur für den Zuschauer zur Person, notiert ihre individuellen Merkmale.23 Sehr große Aufnahmen allerdings können diesen Effekt unter Umständen wieder umkehren.24 Entfernung: Distanz und Nähe Einstellungsgrößen sind eine Funktion der Aufnahmedistanz, der Entfernung zwischen Bildsubjekt und Objekt, die hier nun abschließend selbst Gegenstand der Überlegungen sein soll. Denn über die bisher erörterten Funktionen hinaus läßt sie sich auch als Ausdruck von Distanz und Nähe zwischen Subjekt und Objekt der Bilder in einem nicht mehr nur einstellungstechnischen Sinn verstehen: Die Großaufnahme eines Gesichts signalisiert immer auch eine (positiv wie negativ besetzbare) intime Beziehung,2S größere Aufnahmedistanzen dagegen eine eher abstandsvolle Beziehung des Erzählers zu seiner Figur. Die Entscheidung über die Aufnahmedistanz scheint demnach immer auch mit der Frage zu tun zu haben, wie weit sich der filmische Erzähler auf seine Figuren einläßt und damit seine Rezipienten, indem er sie in eine entsprechend enge oder abstandsvolle Beziehung zu seinen Figuren versetzt, gleichermaßen nötigt, sich auf sie einzulassen bzw. Distanz zu ihnen zu wahren. Auch hier sind die Kategorien - Nähe und Distanz - von semantischen Qualifikationen 23 Das gilt selbst dann, wenn diese Figur als Typus angelegt ist: Diederich Heßling etwa, Held der als eine Art satirische Typenkomödie angelegten »Untertan«-Verfilmung (DDR 1951) von Wolfgang Staudte, wird - in gewisser Hinsicht gegen die typisierende Intention, die Handlungsfuhrung, Dialog und Abbildungsverfahren (wie auch die chargierende Darstellung Werner Peters') signalisieren - zur individuellen Figur nicht zuletzt durch die Fülle von Nah- und Großaufnahmen, die dem Typus des Untertanen ein eigenes Gesicht geben. 24 Vgl. etwa die Detailaufnahme eines menschlichen Auges, die Hitchcock im Vorspann von »Vertigo« (USA 1958) zeigt: Sie verliert jede individualisierende Funktion, weil sie durch die starke Isolation keinen individuellen Blick mehr referiert, sondern nur noch ein leeres Starren und deshalb nunnehr irgendein menschliches Auge, nicht das Auge eines bestimmten Menschen meint. Ahnlich sagt auch die Detailaufhahme der das Wort »Rosebud« formenden Lippen des sterbenden Kane am Beginn von »Citizen Kane« (USA 1940) über die Titelfigur noch nichts aus, liefert nur den Erzählanlaß der Geschichte: Ein Reporter soll den Sinn dieses rätselhaften Wortes aufklären und rekonstruiert dabei Kanes Leben, das der Film Hann erzählt. 25
V g l . KUCHENBUCH 1 9 7 8 , 3 8 .
Kapitel II: Kameraverhalten
75
freizuhalten: Die intime Nähe, in die sich der Erzähler bei Großaufnahmen zu seinen Figuren begibt, ist nicht notwendig Ausdruck solidarischer, sympathisierender Beziehungen zur Figur. Gegenbeispiele kann schon jeder Film mit negativem Helden liefern, so etwa Wolfgang Staudtes »Der Untertan« (DDR 1951): Mit vielen Nah- und Großaufnahmen läßt sich das Bildsubjekt hier ganz hautnah auf eine mediokre Figur ein und nötigt seine Zuschauer damit zu demselben verheerenden Ergebnis, das sein detailliertes Studium des wechselweise von lustvoller Unterwerfung, auftrumpfenden Machtgefühlen, kalter Rücksichtslosigkeit, Verlogenheit und Leere geprägten Gesichts zutage fördert. Die intime Nähe der Kamera signalisiert hier nicht Vertrautheit, sondern hat eher mit dem prüfenden Blick eines Diagnostikers zu tun, der seinen Klienten genau untersucht, bevor er seine Diagnose stellt. Mit Blick auf die hier vorgeschlagene Bestimmung bildlicher Sprechakte als Vermittlung subjektiver Wahrnehmungsakte scheint es mir nicht ganz abwegig, Regeln menschlichen Distanzverhaltens in realen Kommunikationssituationen, proxemische Kodes also, als heuristische Hilfsgrößen für die funktionale Qualifizierung des Distanzverhaltens der Kamera (und entsprechend auch der übrigen Parameter des Kameraverhaltens) beizuziehen:26 Wenn die Kamera, das 'Auge' des Bildsubjekts, dieser Bestimmung bildlicher Sprechakte zufolge menschliches Wahrnehmungsverhalten - auf einer freilich hochgradig artifiziellen Ebene - nachahmt, dann liegt es nahe zu fragen, ob und welche Rolle dabei die proxemischen Kodes spielen, die die alltägliche Wahrnehmung, insbesondere die über Distanz- und Blickverhalten zu wesentlichen Teilen organisierte alltägliche Interaktion zwischen Menschen maßgeblich steuern.27 Im Normalfall vollzieht die Kamera nun allerdings keine echten Interaktionen, sondern gleicht eher einem Menschen, der anderen zusieht und zuhört, sie beobachtet. Auch ein nur beobachtender Mensch aber hält Regeln der Distanz ein, kann z.B. vertraute oder ihm untergeordnete Menschen aus größerer Nähe beobachten als fremde oder ranghöhere: Schüler müssen es sich gefallen lassen, sich bei der Klassenarbeit vom Lehrer ins Heft sehen zu lassen, während derselbe Lehrer es sich nicht herausnehmen dürfte, sich über die Schulter seines Direktors zu beugen, um ihm in den Terminkalender zu sehen. Was die Regeln menschlichen Distanzverhaltens betrifft, wissen Humanethologie und Verhaltenspsychologie z.B. schon lange, daß Angehörige nordeuropäischer und anglo-amerikanischer Kulturen in normalen Kommunikationssituationen einen relativ großen (eine knappe Armlänge messenden) in26 Kuchenbuch (ebd. 38f.) meint vermutlich Ähnliches, wenn er Relationen zwischen Kamerastandorten und »elementaren Wahrnehmungs- und Verhaltensstrategien« postuliert. Zur Bedeutung des Blickverhaltens für die nonverbale Interaktion vgl. SCHEFLEN 1976, 26-138 pass.
76
Kapitel II: Kameraverhalten
terpersonalen Abstand, der die gegenseitige Berührung erschwert, für angemessen halten, während Angehörige romanisch-mittelmeerischer, orientalischer oder jüdischer Kulturen einen sehr viel geringeren Abstand als normal empfinden, so daß es bei der Begegnung etwa eines Briten und eines Orientalen vorkommen kann, »daß sie einen regelrechten Tanz von Annäherungsund Entfernungsschritten vollführen müssen, ehe sie einen Kompromiß finden«.28 Entsprechend haben Körpernähe und Berührungen für Romanen, Orientalen oder Juden eine weniger exklusive Bedeutung als für Nordeuropäer oder Anglo-Amerikaner. Für letztere ist die Unterschreitung der 'zeremoniellen Distanz'29 Ausdruck vertrauter oder intimer Beziehungen und damit zugleich Ausdruck einer unzulässigen Grenzüberschreitung dort, wo solche Beziehungen nicht gegeben sind: Sie wird dann als Zeichen plumper Vertraulichkeit, mangelnden Respekts oder demonstrativer Verachtung empfunden. Sie hat daher immer auch etwas mit sozialem Rangverhalten zu tun, kann soziale Symmetrie, Ranggleichheit, oder soziale Asymmetrie, Rangverschiedenheit, zwischen Interaktionspartnern aufdecken.30 Bei symmetrischen Rangverhältnissen sind Distanz- und Berührungsverhalten reziprok, bei asymmetrischen nicht: Der Ranghöhere darf es sich herausnehmen, die 'zeremonielle Distanz' zu unterschreiten, darf auch den Rangniederen freundschaftlich berühren, während dieser weiß, »daß es anmaßend wäre, die Berührung (...) zu erwidern, geschweige denn einen solchen Kontakt (...) zu initiieren«.31 Der Chef darf eben seinem Angestellten anerkennend auf die Schulter klopfen, aber nicht umgekehrt der Angestellte seinem Chef. Es hieße nun allerdings den hochartifiziellen Charakter filmischer Wahrnehmung ignorieren, wollte man ihn auf Formen alltäglichen Interaktionsverhaltens reduzieren und die ästhetischen Strukturen und Konventionen filmischen Sehens so als 'Naturformen' menschlichen Wahrnehmens festschreiben. Das aber ist hier auch nicht gemeint. Vielmehr geht es darum, einen heuristischen Ansatzpunkt für die Beschreibung eines speziellen Effekts zu finden, den das Distanzverhalten der Kamera zeitigen kann, nämlich eben jenes Effekts der räumlich-körperlichen Nähe oder Distanz zwischen Wahrnehmungssubjekt und Figur, den jeder Kinogänger kennt. Und in dieser Hinsicht könnte man nun immerhin sagen, daß Großaufnahmen und sehr nahe Nahaufnahmen die in nordeuropäischen und anglo-amerikanischen Gesellschaften geltende zeremonielle Distanz deutlich unterschreiten und damit eine intime Beziehung des Erzählers zu seinen Figuren signalisieren, von der sich freilich erst 28 Ebd. 39; vgl. auch WATSON 1970; HALL 1966 und hier Kap. V.B. 29 V g l . GOFFMAN 1 9 8 6 , 7 2 .
30 Vgl. dazu das Kapitel »Über Ehrerbietung und Benehmen«, ebd. 54-105. 31 Ebd. 83.
Kapitel II: Kameraverhalten
77
aufgrund kontextueller, also interpretatorischer Befunde sagen ließe, ob sie, in der Sprache der Verhaltenspsychologie gesprochen, Ausdruck symmetrischer Beziehungen zwischen Ranggleichen oder asymmetrischer Beziehungen zwischen Rangverschiedenen ist: Ob sie 'sympathetischer' Vertrautheit entspringt, wie die Kamera sie beispielsweise in Michael Curtiz' »Casablanca« (USA 1942) mit lisa (Ingrid Bergman) pflegt, oder ob sie sich dem Umstand verdankt, daß der Erzähler seine potentielle Überlegenheit, seine Macht über seine Figuren nutzt, um einen Charakter zu analysieren, zu beurteilen oder wie in Staudtes 'Untertan' (s.o) - bloßzustellen, ist den Einstellungen selbst schwerlich anzusehen, läßt sich also aufgrund der Analyse abbildungstechnischer Verfahren nicht oder nur unzureichend klären. Immerhin aber scheint mir dieser Rekurs auf menschliches Interaktionsverhalten eine ausreichende heuristische Voraussetzung zu sein, um diese Frage überhaupt zu stellen. Sie ist möglicherweise geeignet, mehr oder minder gefühlsmäßigen Interpretationen des Kameraverhaltens eine gewisse Reflexionsbasis zu geben. So läßt sich etwa der Eindruck, daß die Kamera in Jean Renoirs »La grande illusion« (F 1937) stets respektvoll mit ihren Figuren umgeht, auch da, wo sie sie - wie die Aristokraten Boeldieu (Pierre Fresnay) und Rauffenstein (Erich von Stroheim) - der Kritik aussetzt, unter anderem damit begründen, daß sie ihnen selten 'zu nahe tritt', schon gar nicht in peinlichen Situationen: Der Film hat in der Tat ungewöhnlich wenige, nämlich insgesamt nur sieben Großaufnahmen von Figuren. Und der umgekehrte Eindruck, daß z.B. der filmische Erzähler von István Szabós »Mephisto« (1981) seinen Helden mit einer gewissen Geringschätzigkeit behandelt, hat unter anderem auch damit zu tun, daß er ihm - und zwar vorzugsweise in peinlichen Momenten - sehr nahe tritt, um ihn der Kritik, Lächerlichkeit oder Verachtung zu überantworten. Daß es Kamerablicke gibt, die dem Zuschauer selbst unangenehme oder gar peinigende Momente bereiten, hat nicht selten damit zu tun, daß die Kamera noch hinschaut, wo man sich in realen Interaktionssituationen schon längst höflich abgewendet hätte, vor allem aber auch damit, daß sie gerade in solchen Augenblicken auch die 'zeremonielle Distanz' überschreitet, den Zuschauer also gewissermaßen zu einer doppelten Verletzung realer Interaktionsregeln nötigt.
Resümee: Die Multifunktionalität von Einstellungsgrößen Die nachfolgende Tabelle (Abb. 3) faßt die Ergebnisse der funktionsanalytischen Überlegungen zusammen, indem sie die zwischen Weit- und Detailaufnahme sich erstreckende Skala der Einstellungsgrößen als unterschiedliche, mit entsprechenden Oppositionspaaren grob charakterisierte funktionale Skalen darstellt. Sie veranschaulicht die Multifunktionalität von Einstellungsgrößen und damit den Umstand, daß das Distanzverhalten der Kamera niemals
78
Kapitel II: Kameraverhalten
auf nur einen einzigen der hier entwickelten funktionalen Aspekte zurückgeführt werden kann, weil es sich hier immer schon um ein ganzes Bündel von Funktionen handelt, das - als ganzes - für die Funktionsbestimmung jeder Einstellung Geltung beanspruchen kann. Die Frage, welche dieser Funktionen bei einer bestimmten Einstellung die leitenden sind, läßt sich daher nur im Rekurs auf interpretatorische Operationen beantworten. Abb. 3 Einstellungsgrößen: Funktionale Aspekte
Einstellungsgrößen:
Weit
Detail
groß
klein > +
Bildobjekt 1 Objektgröße: Erkennbarkeit: - kleine Objekte: - große Objekte: 2 Objektbeziehungen:
—
— > Isolation > Verabsolutierung
Bildsubjekt 3 Blickfeld: Raumerfahrung: Wahrnehmung: 4 Interaktionsverhalten:
weit < + < extensiv < Distanz < Abstand
intensiv > Nähe > Intimität
indirekt
direkt
> eng
>_
Bildrezipient 5 Rezeptionsperspektive Wahrnehmungslenkung: Spezifikationsgrad: Vermi ttlungsfiinktion:
—
Detailinformation > Individualisierung
C. Standort und Blickwinkel: Ästhetische Strukturen und Funktionen von Kameraperspektiven Standorte und Blickwinkel der Kamera strukturieren die Beziehung zwischen Erzähler und Erzähltem auf zwei Ebenen und über drei Kameraachsen, zeigen daher ein hohes Maß an Variabilität, das durch die Kamerabewegungen zusätzliche Variationsmöglichkeiten hinzugewinnt. Hier soll es zunächst um die Positionen der unbewegten Kamera gehen: Aus dem Zusammenspiel von horizontalen und vertikalen Standorten und Winkeln ergibt sich eine Vielfalt von Blickpunkten, die deskriptiv und funktional je einzeln erfassen zu wollen ein
Kapitel II: Kameraverhalten
79
aussichtsloses Unternehmen wäre. Deshalb kann es hier nur um die Grundkonstituenten dieses filmischen Gestaltungsmittels gehen.
1.
Kategorien der Beschreibung
Die Varianzbreite der Kameraperspektiven ergibt sich aus den wechselnden Standorten auf horizontaler und vertikaler Ebene und aus den wechselnden Blickwinkeln, die durch das Drehen der Kamera um eine ihrer drei imaginären32 Achsen (Querachse, Längsachse, Vertikalachse) entstehen (vgl. Abb. 4): Der Kamerastandort auf horizontaler Ebene und die dadurch bzw. durch Drehungen der Kamera um ihre Vertikalachse entstehenden horizontalen Winkel (Schwenkwinkel), die die Blickachse der Kamera mit den Objekten bildet (vgl. Abb. 4C), entscheiden zum einen darüber, von welcher Seite die Dinge gesehen werden, und zum anderen über die Positionen der Objekte auf der Horizontalen des Bildes (rechts, links, Mitte usw.). Die Position der Kamera auf der Vertikalen und die durch Drehungen der Kamera um ihre Querachse (Neigungsachse) entstehenden vertikalen (Neigungs-) Winkel (vgl. Abb. 4A) entscheiden zum einen darüber, von welcher Höhe aus die Dinge gesehen werden, und zum anderen über die Positionen der Objekte auf der Vertikalen des Bildes (oben, unten, Mitte usw.). Der horizontale Schiefenwinkel schließlich, der sich durch das 'Rollen' der Kamera um ihre Blickachse, d.h. um ihre Längsachse ergibt (vgl. Abb. 4B), verschiebt die Horizontlinie der Bilder gegenüber der des Bildrahmens. Gemessen an der großen Varianzbreite der Kameraperspektiven kann das Inventar der sie beschreibenden Begriffe nur ein grobes Raster liefern. Es verfügt über zwei Gruppen von Kategorien: Die erste bezeichnet den Kamerastandort allgemein nach Maßgabe der Objektseite, die die Kamera wahrnimmt (von vorn, von hinten, von der Seite, von oben, unten usw.), versagt folglich immer dann, wenn das gezeigte Objekt gar keine definierbaren Seiten hat. Die zweite bezeichnet den Blickwinkel, mit dem die Kamera das Objekt erfaßt, d.h. die horizontalen bzw. vertikalen Winkel, die die Blickachse der Kamera mit den Objekten bildet. Mit Hilfe dieser beiden Kategorien läßt sich ein einigermaßen einheitlicher Sprachgebrauch erreichen, sofern der Standort der Kamera grundsätzlich mit Bezug auf das Objekt beschrieben wird (z.B. »das Brandenburger Tor von vorn«), der horizontale Blickwinkel aber grundsätzlich von der Kamera (vom Betrachterstandpunkt) her definiert wird (bei 32 Die normale Stativkamera bewegt sich um den Schwenkkopf. Die hier (in AnschluB an MONACO 1980, 89f.) aus Vereinfachungsgründen gesetzten Achsen sind insofern imaginär.
80
Kapitel II: Kameraverhalten
den vertikalen Blickwinkeln fallen objekt- und kamerabezogene Bestimmung zusammen). Die Mißverständnisse, die bei Beschreibungen filmischer Perspektiven häufig dadurch entstehen, daß zwischen kamera- und objektbezogenen Ortsangaben nicht klar geschieden wird, lassen sich so vermeiden. Auch Abb.4: Kameraachsen und -winkel
5
rf ^ A
Β
Querachse (Neigungsachse)
Längsachse/Blickachse (Schiefenachse)
+
3
V c
Vertikalachse (Schwenkachse)
•
- 0 -
•
ΙΛ
m
Neigungswinkel
A
φ Ä
s
In è à
Schiefenwinkel
Schwenkwinkel
Standortbeschreibung und Winkelbestimmung hängen selbstverständlich davon ab, wo der Bildfokus gesehen wird (vgl. S. 62f.). Diese Beschreibungsregeln sind unkompliziert zu handhaben, solange sie sich auf Aufnahmen einzelner Bildobjekte beziehen, wie sie die Schemazeichnungen zeigen. Bei komplexeren Bildausschnitten kann die Bestimmung der Perspektive erschwert werden, weil der Bildfokus dabei häufig weniger in
Kapitel II: Kameraverhalten
81
einem Einzelobjekt als vielmehr in den räumlichen Beziehungen zwischen Objekten liegt. In solchen Fällen kann es sinnvoll sein, mit einer weiteren Bezugsgröße zu arbeiten, nämlich mit der Handlungsachse: Sie ist die Linie, die die Aktionsrichtungen der Figuren angibt. Bei dem ersten Beispiel in Abb. 5 (I) liegt sie in der Blickrichtung der beiden einander gegenüberstehenden FiAbb.5 Handlungsachsen und Blickachsen
0 Blickachse
Handlungsachse
m
II Handlungsachse > «
1A guren, beim zweiten Beispiel (II) in beider Bewegungsrichtung. Die perspektivischen Verhältnisse ließen sich hier nun über die Beschreibung der Achsenverhältnisse klären, d.h. über die Bezeichnung des Winkels, den die Blickachse der Kamera mit der Handlungsachse bildet. Auch die Bestimmung der Achsenverhältnisse aber liefert nur grobe Anhaltspunkte und versagt, sobald komplexere Bewegungs- und Handlungsabläufe als die hier abgebildeten beschrieben werden sollen. Wo eine exakte Analyse der perspektivischen Ver-
82
Kapitel II:
Kameraverhalten
hältnisse erforderlich ist, kann daher, wie in vielen anderen Fällen auch, nur eine diskursive Beschreibung des Sachverhalts Abhilfe schaffen. Die vertikalen Perspektiven ergeben sich aus dem Grad, mit dem die Kamera um ihre Neigungsachse (vgl. Abb. 4A) nach oben oder unten gedreht wird (vgl. Abb. 6): Jede Neigung der Kamera nach unten liefert eine PerAbb. 6: Vertikale Standorte und Winkel
a-c: a: b: c:
Horizontalsicht Augenhöhe(Normalsicht) Bauchhöhe Fußhöhe
d,e: Vertikalsicht f,g: Auf-, Untersicht h,i: Vogel-, Froschperspektive
spektive der Aufsicht, deren Stärkegrad bedarfsweise expliziert werden kann (leichte/starke Aufsicht, Vogelperspektive). Und jede Drehung der Kamera nach oben liefert eine Perspektive der Untersicht, die ebenfalls je nach Stärkegrad differenziert werden kann (leichte/starke Untersicht, Froschperspektive). Der Begriff Horizontalsicht sei hier für die Bezeichnung der Fälle vorge-
Kapitel II: Kameraverhalten
83
schlagen, bei denen die Blickachse der Kamera mit einem vertikalen Winkel von ungefähr 90° auf das Objekt fallt (vgl. Abb. 6), also horizontal verläuft. Der Begriff beschreibt wohlgemerkt nur den Neigungswinkel (90°), nicht den Standort der Kamera auf vertikaler Ebene: Ein Blick auf die Füße einer Figur mit einem Neigungswinkel von ungefähr 90° wäre demnach als Horizontalsicht anzusprechen (vgl. Abb. 6c); die ungewöhnliche Position wäre dagegen über die Beschreibung des Standorts auf der Vertikalen (s.u.) zu explizieren. Diesem Begriff entsprechend seien die (eher seltenen) Kamerapositionen mit vertikalen Winkeln von 0° bzw. 180°, also genau senkrechte Perspektiven von oben oder unten, als Vertikalsicht bezeichnet (vgl. Abb. 6 I). Die Beschreibung des vertikalen Standorts ist - wie bei den horizontalen Positionen - sinnvoll nur mit Bezug auf das jeweilige Bildobjekt zu klären. Begriffe wie Augen-, Bauch-, Knie- oder Fußhöhe haben hier - mit Bezug auf abgebildete Figuren - ihren Platz, so etwa, wenn die Kamerasicht bei sitzenden Figuren geklärt werden soll (vgl. Abb. 6 II). Der häufig benutzte Begriff Normalsicht sollte der Horizontalsicht in Augenhöhe vorbehalten bleiben (vgl. Abb. 6 I/IIa).
2.
Kategorien der Funktionsanalyse
Der hohen Variabilität der Kameraperspektiven entspricht eine hohe Variabilität und Komplexität in funktionaler Hinsicht. Der Versuch, diese Funktionenvielfalt zu kategorisieren, hat deshalb nur Sinn, wenn dafür eine Abstraktionsebene gewählt wird, die diese Vielfalt aufzubewahren imstande ist. Es kann hier also nicht darum gehen, jede denkbare Perspektive funktional zu qualifizieren, sondern nur darum, Übersicht über das breite Feld funktionaler Varianzen zu gewinnen, ohne es durch normative Festschreibungen zu verengen oder zu simplifizieren. Das Analyseraster (S. 54-56) lenkt hier den Blick erstens auf die »Seiten« der Dinge und ihre Bedeutung für die Erkennbarkeit der Objekte (Kriterium 1), zweitens auf die Frage, wie Kameraperspektiven Positionen im Raum und deren Relationen, also das Vor-, Hinter-, Neben-, Unter- oder Übereinander der Dinge klären (Kriterium 2), drittens auf die Frage, wie Kameraperspektiven das Blickfeld des Bildsubjekts strukturieren (Kriterium 3), viertens welche Konsequenzen das für die Steuerung der Rezipientenperspektive hat (Kriterium 5), und schließlich auf die Frage, inwieweit Kameraperspektiven als Interaktionsverhalten des Bildsubjekts qualifiziert werden können (Kriterium 4).
84
Kapitel II: Kameraverhalten
Objekteigenschaften: Die »Seiten« der sichtbaren Welt Ein Mensch wird für uns nicht zur Person, solange wir ihn nur von hinten sehen; ein Haus meinen wir noch nicht vollständig 'identifiziert' zu haben, solange wir nur seine Rückseite kennen; an einem Buch interessiert uns zuerst das Titelblatt, an einer Blume die Blüte, an einer Teekanne die Seitenansicht, an einem Löffel die Draufsicht. Das heißt: Alle Dinge haben für uns Gesichter, bestimmte Seiten, an denen wir sie - als Individuen - erkennen und wiedererkennen, und deshalb halten wir die Perspektive, die den Blick auf diese Gesichter ermöglicht, in der Regel auch für die normale Wahrnehmungsperspektive. Die filmische Wahrnehmung paßt sich diesen Regeln der alltäglichen Wahrnehmung im Normalfall an. Die üblichen horizontalen Standorte und Blickwinkel der Kamera, der Umstand, daß die Kamera normalerweise an Stellen steht, von denen aus die Gesichter der Dinge zu sehen sind, hat zuerst und vor allem mit deren Bedeutung als Erkennungsmerkmalen zu tun, auf die die Kamera in Erfüllung ihrer referentiellen Funktionen beständig reagiert: Das Brandenburger Tor ist kaum zu erkennen, wenn die Kamera es exakt von der Seite, statt von vorn kadriert; der New Yorker Hafen erscheint Europäern als beliebiger Hafen, solange die Kamera nicht die Freiheitsstatue oder die Skyline von Manhattan mit ins Bild nimmt, usw. Folglich entsteht Erklärungsbedarf immer dort, wo die Kamera diese Anpassung an alltägliche, gewohnte oder konventionalisierte Wahrnehmungsperspektiven verweigert. Was für Standorte und Blickwinkel auf horizontaler Ebene gilt, gilt ähnlich auch für Standorte und Blickwinkel auf vertikaler Ebene. Die normale Perspektive alltäglicher Realitätswahrnehmung resultiert aus der durchschnittlichen Blickhöhe eines stehenden Menschen und den daraus sich ergebenden vertikalen Blickwinkeln: Der Kamerablick auf eine Figur aus Augenhöhe wird vom Zuschauer als normal, derselbe Blick aus der Frosch- oder Vogelperspektive dagegen als ungewöhnlich empfunden. Entsprechendes gilt für die aus dieser Blickhöhe resultierenden Verhältnisse von 'oben' und 'unten': Der Blick zum Dach eines Hauses, in eine Baumkrone, zu einem Berggipfel aus der Untersicht oder der Blick auf einen Käfer, auf eine Pflanze, einen Stein aus der Aufsicht entspricht alltäglicher Realitätswahrnehmung und wird deshalb als normal, deren Umkehrung dagegen in der Regel als ungewöhnlich empfunden, zumindest dann, wenn der Blickwinkel nicht motiviert ist, d.h. nicht durch realistisch begründete Standortveränderungen des Objekts (z.B. der Käfer auf einer Hand) oder des wahrnehmenden Subjekts (z.B. am Boden liegend, in einem Flugzeug sitzend usw.) erklärt wird. Das heißt nicht, daß sich die Bedeutung 'normaler' (oder realistisch motivierter) Perspektiven notwendig in referentiellen Funktionen erschöpft, wohl aber, daß alltägliche Wahrnehmungserfahrungen eine wesentliche Rolle für die Orientierung des
Kapitel II: Kameraverhalten
85
Zuschauers im dargestellten Raum, für die Erkennbarkeit der Dinge und ihrer Position im Raum spielen. Auch bei der Analyse und Interpretation von Kameraperspektiven hat demnach die Frage nach den referentiellen Funktionen am Anfang zu stehen, die Frage, welcher Art die räumliche Situation einer Szene ist und welche Anforderungen ihre Klärung an die Kamera stellt.33 Wo dieser Grundsatz ignoriert wird, fehlt die Kontrollinstanz, die vor interpretatorischen Fehleinschätzungen bewahrt, zu denen gerade Kameraperspektiven, die vertikalen Perspektiven zumal, besonders leicht verführen: Erst im Rekurs auf ihre referentiellen Funktionen sind weiterreichende Funktionen und deren Konstituenten präzise zu bestimmen, wobei auch hier, wie bei den Einstellungsgrößen, die Frage nach referentiellen Defiziten oder Redundanzen den wichtigsten heuristischen Ansatzpunkt für ihre Erkenntnis abgibt. Von referentiellen Redundanzen ist hier immer dann zu sprechen, wenn Standort und/oder Perspektive für die Erkennbarkeit des Objekts und seiner räumlichen Situierung irrelevant sind, eine Situation, die bei den horizontalen Blickwinkeln selten, um so häufiger aber bei den vertikalen Perspektiven entsteht: Bei einer aus der Froschperspektive aufgenommenen Figur etwa liefern die perspektivischen 'Verzerrungen' einen für die Erkennbarkeit der Figur irrelevanten Überschuß an Informationen, dessen Begründungsbedarf einen möglichen interpretatorischen Ansatzpunkt liefert. 34 Von referentiellen Defiziten ist hier immer dann zu sprechen, wenn 33 Ein Beispiel: In dem Chaplin-Film »Monsieur Verdoux« (USA 1944/46) versteckt sich der Heiratsschwindler Verdoux (Charles Chaplin) während seiner Hochzeitsparty mit Madame Grosnay in deren Gewächshaus, um das Zusammentreffen mit einer seiner anderen Angetrauten, mit der überraschend aufgetauchten Annabelle, zu verhindern. Die Kamera kadriert ihn dabei zunächst in halbnaher Einstellung und aus Augenhöhe. Als Annabelle plötzlich am Gewächshaus auftaucht, geht Verdoux, einen Magenkrampf vorgebend, ruckartig in die Hocke und kommt dadurch für die ihn verfolgende Kamera in die Aufsicht, die dann auch nach einem Schnitt in der darauffolgenden Nahaufnahme des jämmerlich Gekrümmten beibehalten wird. Beide Aufsichten haben lediglich referentielle Funktionen, klären die räumliche Situation (die Relation zwischen Annabelles Blickhöhe und Verdouxs Position), machen klar, daB Chaplin sich 'unten' befindet und so den gefurchteten Blicken Annabelles entzogen bleibt. Ein Perspektivenwechsel bei der zweiten Aufnahme hätte desorientierend gewirkt. 34 Vgl. z.B. die starke Untersicht, aus der die Kamera in Eric Rohmers Verfilmung der Kleist-Novelle »Die Marquise von O« (F/BRD 1975) den russischen Grafen (Bruno Ganz) zum ersten Mal ins Bild setzt. Die referentielle Redundanz dieser Perspektive resultiert aus der figurenperspektivischen Kameraführung, die die Wahrnehmungsperspektive der Marquise (Edith Clever) übernimmt, die, attackiert von den russischen Soldaten, am Boden liegt, während der Graf auf einem Wall steht. Der durch die Inszenierung der Darstellungsebene, durch Beleuchtung und Kostüm vor allem, wirkungsvoll unterstützte Informationsüberschuß des Bildes verweist darauf, daß es hier nicht nur darum geht, den äußeren Vorgang, den rettenden Eingriff des Grafen, zu referieren, den aus der äußerlich-räumlichen Sicht der Geretteten zu zeigen kein zwingender (referentieller) Grund vorliegt. Viel-
86
Kapitel 11: Kameraverhalten
die Kameraperspektive ihre referentielle Aufgabe, die Erkennbarkeit der Dinge herzustellen, nicht mehr erfüllt, etwa wenn sie eine Figur von hinten oder aus der Vertikalsicht aufnimmt und damit ihre Identifikation verhindert. Zu den augenfälligsten 'Verstößen' der Kamera gegen normale Wahrnehmungsbedingungen gehören Verschiebungen der Horizontale durch Drehungen ('Rollen') der Kamera um ihre Blickachse (vgl. Abb. 4B), die nur in besonderen Fällen referentiellen Notwendigkeiten folgen (Schiffahrt, Karussellfahrt u.ä.). Wo sie nicht um des bloßen Effekts willen eingesetzt werden, haben sie eine relativ konstante funktionale Tradition als Anzeiger einer aus dem Gleichgewicht geratenen Welt. Objektbeziehungen: Ansichten räumlicher Verhältnisse Kameraperspektiven haben maßgeblichen Anteil an der Erscheinungsweise räumlicher Beziehungen zwischen den Bildobjekten, klären ihre Positionen im Raum, ihr Neben-, Vor-, Hinter-, Über- oder Untereinander, und regulieren damit zugleich die Positionen der Handlungsachsen (vgl. S. 81f.) auf dem Bildausschnitt. Die alte Regel der Kameraleute, derzufolge die Kamera bei Schuß-Gegenschuß-Aufnahmen (etwa einer Gesprächsszene) nicht über die Handlungsachse springen darf, weil die Bewegungs- oder Blickrichtungen der Figuren dann verunklärt werden, 'seitenverkehrt' erscheinen, illustriert die Bedeutung der Kameraperspektiven für die Klärung der räumlichen Verhältnisse in einer Szene. Über diese referentiellen Funktionen hinaus bieten Kameraperspektiven aber auch ein nahezu unerschöpfliches Reservoir an Möglichkeiten, die räumlichen Beziehungen zwischen Dingen oder Figuren semantisch zu qualifizieren, und diese Möglichkeiten liegen hier weniger im Verstoß gegen die referentiellen Aufgaben der Kamera als vielmehr, weil diese referentiellen Aufgaben in vielen Fällen auf unterschiedliche Weise erfüllt werden können, schon in der Wahl einer dieser unterschiedlichen Positionen selbst. Ein einfaches, in fast jedem Film begegnendes Beispiel, die Situation zweier Figuren, die einander vis-à-vis gegenüberstehen, mag das illustrieren: Die Raumbeziehung zwischen beiden kann hier auf verschiedene Weise geklärt werden, so etwa durch eine rechtwinklig zur Handlungsachse stehende Kamera, die die Figurnehr gebt es darum, ihn innenperspektivisch zu vermitteln, nämlich den Umstand, daß der gräfliche Retter der Marquise, wie sie später sagen wird, »wie ein Engel vorgekommen« ist, optisch klarzumachen und in gelungener, komisch-theatralischer Weise ins Bild zu setzen: Die Untersicht, die den Grafen gegen einen unwirklichen, nächtlichen Horizont ins Gegenlicht setzt, das seinen weißen, einem Engelsgewand gleich wehenden Mantel durchflutet, gibt ihm in der Tat den Charakter einer überirdischen, 'von oben' herabgeschwebten 'Lichtgestalt', und das Schwert in seiner Rechten vervollständigt die ikonographische Anspielung.
Kapitel II: Kameraverhalten
87
ren im Profil zeigt (vgl. Abb. 5 I/A), oder auch durch eine Kamera, die, über die Schulter eines Dialogpartners blickend und sie im Anschnitt im Bildvordergrund zeigend, das Gesicht des anderen schräg von vorn kadriert ('Overthe-shoulder-shot', vgl. Abb. 5 I/B). Da die räumliche Situation in beiden Fällen hinreichend geklärt ist, hat die Entscheidung für die eine oder andere Position von vornherein eine eigene funktionale Signifikanz: Während die Kamera im ersten Fall beide Figuren gleich behandelt, gewichtet sie sie im anderen Fall unterschiedlich, indem sie die eine von schräg vorn kadriert und so ihr nonverbales (gfls. auch verbales) Verhalten stark betont, die andere dagegen zwar nur von hinten und im Anschnitt erfaßt, ihr aber dadurch, daß sie sich ihrer Perspektive stark annähert, ein spezifisches Gewicht gibt, indem sie sich gewissermaßen mit ihrer Wahrnehmungsperspektive solidarisiert. Diese unterschiedliche Gewichtung, deren je spezielle Qualifizierung durch die Möglichkeit, die jeweils sprechende oder aber die jeweils zuhörende Figur von vorn zu zeigen, eine zusätzliche Variable gewinnt, kann durch das konventionelle Schuß-Gegenschuß-Verfahren zwar gleichmäßig verteilt, nicht aber beseitigt werden. Deshalb gewinnt eine so dargestellte Beziehung auch eine andere Qualität als im ersten Fall: Dieser signalisiert, indem beiden Figuren je eine Bildhälfte eingeräumt wird, eine stabile Verteilung der Gewichte, eine Beziehung gleich starker Interaktionspartner, oder - wie Verhaltenspsychologen sagen würden - eine symmetrische, reziproke Beziehung ranggleicher Partner (vgl. S. 76), die erst durch Positionsveränderungen oder durch ein widersprechendes verbales und nonverbales Verhalten der Figuren in Frage gestellt werden könnte. Der 'Over-the-shoulder-shot' dagegen schafft ein perspektivisches Ungleichgewicht, und die Schuß-GegenschußMontage solcher Kamerablicke einen beständigen Wechsel ungleichgewichtiger Bilder, die der dargestellten Beziehung ein labilen Charakter zuweisen. Das scheint mir auch der Grund zu sein, warum diese Form der Schuß-Gegenschuß-Montage so stark konventionalisiert ist als Verfahren der Darstellung verbaler Auseinandersetzungen, von Situationen also, in denen sich erst entscheiden soll, auf welcher Seite das stärkere 'Gewicht' liegt, welcher von beiden Partnern sich durchsetzen wird. Ähnliche Aspekte ergeben sich bei Bildern, die zwei Figuren seitlich nebeneinander stehend, sitzend oder gehend zeigen: Es handelt sich hier um eine proxemische Interaktionssituation, die Verhaltenspsychologen als Ausdruck des gleichberechtigten Miteinander und der Kooperation, als Ausdruck eines reziproken Verhältnisses deuten.35 Die Kamera kann diese Qualität bestätigen, indem sie beide Figuren frontal kadriert (vgl. Abb. 5 II/C). Sie kann 35 Vgl. SCHEFLEN 1976, 42f.
88
Kapitel II: Kameraverhalten
sie aber auch durch eine seitliche oder gar Profilaufnahme (vgl. Abb. 5 II/A) entkräften, die den Akzent auf eine der beiden Figuren verlagert dadurch, daß sie sie in den Bildvordergrund nimmt, damit gegenüber der anderen hervorhebt und so das reziproke Miteinander verändert, nämlich das Nebeneinander in ein Hintereinander umdeutet, das Gleichgewicht also stört. Als Verfahren der Strukturierung von Objektbeziehungen eröffnen Kameraperspektiven dem filmischen Erzähler ein weites Feld an Möglichkeiten, auf der Darstellungsebene sich vollziehende Vorgänge explizit zu kommentieren, ein Aspekt, den schon Rudolf Arnheim nachdrücklich betont und mit besonderem Interesse verfolgt hat.36 Dabei spielen nicht nur die Beziehungen zwischen Figuren, sondern auch die Beziehungen zwischen Figuren und Dingen eine wesentliche Rolle: Wenn beispielsweise in Gustaf Gründgens' »Effi Briest«-Verfilmung (»Der Schritt vom Wege«, D 1939) die Kamera sich so in Innstettens Berliner Dienstzimmer postiert, daß die Symbole des preußischen Staates und damit der Ordnung, der Innstetten dient, ihn schier zu übermächtigen scheinen, ihn teilweise verdecken (wie der Preußenadler auf seinem Schreibtisch) oder überragen (wie die Porträts Bismarcks und des Kaisers an der Wand), dann wird damit Perspektive als Mittel expliziter Figurencharakterisierung in Funktion gesetzt.37 Die Strukturierung des Blickfeldes durch Perspektiven: Raumerfahrung und Reichweite der Wahrnehmung Kameraperspektiven entscheiden maßgeblich über den Grad der Tiefenwahrnehmung: Bei den beiden oben beschriebenen Möglichkeiten beispielsweise, eine Gesprächssituation zweier vis-à-vis gegenüberstehender Figuren zu referieren, entsteht im ersten Fall, bei der Profilaufnahme beider Gesprächspartner (vgl. Abb. 5 I/A), eine geringe Tiefenwahrnehmung, weil beide Figuren auf gleicher Höhe stehen, die Perspektive ihnen also auf der Tiefenachse des
36 Vgl. ARNHEIM 1979, 69-81.
37 Vgl. auch die wegen ihrer innovativen Kraft nicht zu Unrecht gerühmte (auf den italienischen Neorealismus der Nachkriegsjahre vorausweisende) Sequenz aus Luis Trenkers Film »Der verlorene Sohn« (D 1934), in der der Held Tonio Feuersinger (Luis Trenker) hungernd durch New York irrt und dabei verzweifelt in die Schaufenster von Lebensmittelläden, Cafés und Imbißstuben schaut: Indem die Kamera seine hungrigen Blicke nicht figurenperspektivisch (von außen), sondern vom Innern dieser Imbißstuben und Cafés aus registriert und dabei die Silhouetten von Braten, Würsten, Broten, Tassen mit dampfendem Kaffee usw. groß in den Bildvordergrund setzt, notiert sie nicht bloß den schier unerträglichen Hunger des Helden und die Objekte seiner Begierde, sondern konstituiert damit vor allem auch eine räumliche Opposition von Innen und Außen, die den Helden als Ausgestoßenen charakterisiert, macht klar, daß er in einem mehr als bloß räumlichen Sinn ausgeschlossen ist von denen, die 'drinnen' sitzen.
Kapitel II: Kameraverhalten
89
Bildes38 dieselbe Stelle zuweist. Der zweite Fall (Over-the-shoulder-shot, Abb. 5 I/B) erlaubt dagegen eine deutlich verstärkte Tiefenwahrnehmung, weil die Perspektive beiden Figuren zwei verschiedene, hintereinander gestaffelte Positionen auf der Tiefenachse zuweist, so daß der Eindruck von Raumtiefe entsteht. Die Kameraperspektive qualifiziert demnach die Raumerfahrung des Bildsubjekts nach dem Grad seiner Tiefenwahrnehmung: Starke Bildtiefen illusionieren die Erfahrung der Dreidimensionalität des Raumes, geringe Bildtiefen tendieren zur Reduktion der Raumerfahrung auf die Zweidimensionalität der Fläche. Daß Perspektiven, die die Bildtiefe betonen, einem auf eine möglichst umfassende Illusionierung der erzählten Welt gerichteten Erzählprogramm verpflichtet sind, während Perspektiven, die die Flächigkeit des Filmbildes hervorheben, eher darauf aus sind, diese Flächigkeit selbst - im Wege ihrer bildkompositorischen Strukturierung - in Funktion zu setzen und damit die Künstlichkeit der filmischen Illusion bewußt zu machen, ist eine naheliegende Annahme, die sich durch die Filmpraxis auch vielfach bestätigt sehen kann. Gleichwohl beschreibt sie keine den formalen Strukturen immanente Gesetzmäßigkeit, sondern eine filmästhetische Konvention. Die Vorstellung, daß flächige Bilder eher »expressionistisch«, raumtiefe Bilder dagegen eher »realistisch« sind, 39 daß flächige Aufnahmen für die färb- und formästhetische Strukturierung des Bildes besser geeignet sind als Aufnahmen mit starker Bildtiefe, ist seit der in den vierziger Jahren einsetzenden filmästhetischen Stilwende zumindest insofern obsolet geworden, als hier nun - unter Verwendung von Objektiven und Filmformaten, die starke Tiefenschärfen erzeugen Filme hervorgebracht wurden, die ein Höchstmaß an Bildtiefe mit einem Höchstmaß an bildkompositorischer Strukturierung verbinden. Wie das berühmteste Beispiel, »Citizen Kane« (USA 1940), nachdrücklich unter Beweis stellt, ist diese Verbindung geeignet, den Bildern eine hochgradige Künstlichkeit zu verleihen und damit gerade jenen »Expressionismus« zu erzeugen, den man eher den flächigen Bildern zuschreibt.40 Wie bei den Einstellungsgrößen, teilt sich auch die durch die Perspektive qualifizierte Raumerfahrung des Bildsubjekts in der Regel den Objekten selbst mit, kann zu einer Qualität der Objekte, ihrer wechselseitigen Beziehungen vor allem, werden und bietet sich damit zugleich als ein Mittel der Kommen38 Vgl. die Schemazeichnungen bei MONACO 1980, 174.
39 Vgl. ebd. 79. 40 DADEK 1968 , 39-52 stellt den 'Realismus' tiefenscharfer Bilder grundsätzlich in Frage: Dir »Gewinn an Räumlichkeit« sei mit hochgradig »unrealistischen«, artifiziellen Bildwirkungen verbunden, weshalb die Tiefenschärfe nicht nur als stilgeschichtlicher Ausdruck einer »Tendenz zu einem neuen Filmrealismus« (51), sondern »ebenso gut auch als ein Mittel expressiven Bildstils« einzustufen sei (52).
90
Kapitel II: Kameraverhalten
tierung an. Das zu zeigen, ist abermals »Citizen Kane« besonders geeignet, so z.B. die Streitszene zwischen Kane und seiner zweiten Ehefrau Susan im Kaminzimmer von »Xanadu«: Die Kamera kadriert hier die weit voneinander entfernt sitzenden Ehepartner abwechselnd in 'Over-the-shoulder-shots' und arbeitet dabei mit starker Tiefenschärfe, so daß die jeweilige Rückenfigur sehr groß im Vordergrund und die jeweils von vom kadrierte Figur sehr klein im Bildhintergrund erscheint und dabei durch die Tiefenschärfe in eine unwirkliche, übertriebene Ferne gerückt wird. Diese in die Tiefenebene des Bildes gelegte Distanz zwischen den beiden Streitenden fungiert hier als ein sinnfälliger Indikator ihrer inneren Distanz, der auf die wenig später folgende Trennung vorausweist: Zwischen beiden scheint sich ein unendlich weiter, leerer Raum zu erstrecken, der so selbst zum Zeichen der Leere avanciert, die das Eheleben der beiden in »Xanadu« beherrscht. Bei der korrespondierenden Einstellung, die das frostige Ende der ersten Ehe Kanes andeutet,41 wählt die Kamera die entgegengesetzte Perspektive, zeigt die Ehepartner, die sich an den Kopfenden eines langen Tisches gegenübersitzen, in einer zwar tiefenscharfen, durch die Perspektive gleichwohl flächig wirkenden Profilaufnahme, die beide am rechten bzw. linken Bildrand situiert. Diese Perspektive verlagert die Distanz zwischen beiden auf die zweidimensionale Bildebene und verzichtet damit darauf, sie räumlich erfahrbar zu machen. Ihre distanzierende Wirkung ist dadurch erheblich schwächer (und deshalb wird hier auch ein langer Tisch benötigt, der die Distanz zwischen den Figuren markiert). Kameraperspektiven entscheiden zugleich maßgeblich über die Reichweite der Blickfelder: Die potentielle Ubiquität der Kamera, die es dem filmischen Erzähler erlaubt, die die jeweils 'beste', vollständigste Wahrnehmung der dargestellten Vorgänge ermöglichende Perspektive zu wählen, gibt jedem Verzicht auf eine möglichst weitreichende Wahrnehmungsposition eine eigene Signifikanz. Deren funktionale Qualifikation wird ihr Augenmerk naheliegenderweise vor allem auf den adressatenbezogenen Aspekt, die Steuerung der Rezeptionsperspektive, legen (s.u.). Mit Bezug auf das Bildsubjekt steht sie in unmittelbarem Zusammenhang mit der Erzählsituation, die Kamerastandort und -blickwinkel und damit die Reichweite des Blickfeldes maßgeblich prädisponiert: Figurenperspektivische Erzählverfahren (in Ich- oder personalen Erzählsituationen) begründen, indem sie die Wahrnehmungsmöglichkeiten der Kamera auf das Wahrnehmungsfeld der Reflektorfiguren beschränken, eine Reduktion der perspektivischen Varianz und damit eine Einschränkung der Informationsvergabe, der die Kamera in auktorialen Erzählsituationen nicht un-
41 Vgl. Anm. 17.
Kapitel 11: Kameraverhalten 91 terliegt. Diese Sachverhalte werden an späterer Stelle (Kap. IV) näher zur Sprache kommen. Kameraperspektive und Rezipientenperspektive »Chaplin ist von seiner Frau verlassen worden, weil er ein Trinker ist. Da steht er nun mit dem Rücken zum Apparat vor einem Tisch, auf dem man das Bild der entwichenen Gattin sieht, zuckt mit den Schultern auf und ab, schluchzt also offenbar bitterlich. Und dreht sich im nächsten Moment um, da erklärt sich das Zucken der Schultern überraschend aus einem Cocktailmixbecher, den er mit beiden Händen schüttelt.«42 In dieser von Rudolf Arnheim beschriebenen Einstellung aus einer frühen Filmgroteske Chaplins verstößt die Kamera sichtlich gegen ihre referentiellen Funktionen: Sie wählt nicht eine für die Klärung des Sachverhalts optimale Position, sondern enthält dem Zuschauer eine für das Verstehen der Situation entscheidende Information vor, indem sie sich im Rücken der Figur postiert, führt ihn damit in die Irre und begründet so den komischen Effekt der Szene. Für die Selektion der zu vergebenden Informationen spielt, wie dieses Beispiel zeigt, die Wahl vor allem der horizontalen Standorte und Blickwinkel eine besondere Rolle, denn sie kann das Hinter- bzw. Voreinander der Körper im Raum für verschiedenste Zwecke ausnutzen, so auch für die Vorenthaltung von Informationen durch das Verbergen eines Dinges durch ein anderes. 43 Prinzipiell begründet jeder Kamerastandort niemals nur die Vergabe, sondern immer auch die Vorenthaltung von Informationen, weil jede Entscheidung für eine bestimmte 'Ansicht' der Dinge zugleich eine Entscheidung gegen andere mögliche 'Ansichten' ist. In ihr artikulieren sich folglich Präferenzen der filmischen Vermittlungsinstanz bei der Informationsvergabe und damit Techniken der Steuerung der Rezipientenperspektive: Eine Aufnahme der eben genannten Szene aus gleicher Entfernung, aber aus einer seitlichen Position, hätte zwar die Reichweite des Blickfeldes und damit die Menge der Informationen erhöht, der Szene aber vollständig ihre Komik genommen. 44 Das Beispiel zeigt zugleich, daß Kameraperspektiven als Funktionen der Informationsvergabe wesentlichen Anteil an der Relationierung von Figuren42 ARNHEIM 1979, 75.
43 Vgl. ebd. 75-79. 44 Die Komik der Einstellung liegt in der Erzeugung und nachfolgenden Destruktion einer bestimmten Zuschauererwartung: Durch ihre Position ruft die Kamera ein Klischee ab (der Verlassene ist unglücklich), das die Figur dann destruiert: Nicht deren Verhalten (das Trinken) ist komisch, sondern das des Erzählers, und der Zuschauer lacht deshalb auch weniger über Charlie, als vielmehr über den Erzähler und sich selbst, darüber, daB er der Kamera auf den Leim gegangen, ihrem Angebot gefolgt ist, die Situation klischeehaften Vorstellungen gemäß zu deuten.
92
Kapitel II: Kameraverhalten
und Zuschauerinformiertheit haben:45 Der Effekt der Einstellung beruht auf diskrepanter Informiertheit, und zwar in diesem Fall auf dem Informationsrückstand des Zuschauers gegenüber der Figur, deren gleichmütige Miene darum auch einen wirkungsvollen Kontrast zur Überraschung des Zuschauers erzeugt.46 Blickrichtungen und soziales Verhalten Wie die Entfernung zwischen Subjekt und Objekt der Wahrnehmung ist auch die die Formen von Kameraperspektiven begründende Gerichtetheit des Kamerablicks über die bisher erörterten funktionalen Aspekte hinaus als ein Faktor anzusprechen, der - als er selbst - der Beziehung zwischen Erzähler und Erzähltem je spezifische Akzente zu geben imstande ist. Und auch hier können Rekurse auf Formen menschlichen Interaktionsverhaltens behilflich sein, heuristische Ansatzpunkte für die funktionale Qualifizierung dieses Faktors zu finden. Am sinnfälligsten in dieser Hinsicht sind die vertikalen Blickwinkel, denn sie korrespondieren mit elementarsten Mustern menschlicher Interaktion:47 Dal) die lokalen Präpositionen 'oben' und 'unten' engstens mit Rangordnungsvorstellungen verkoppelt sind, zeigt nicht nur die Fülle entsprechender lexikalisierter oder verblaßter Metaphern, die die Sprachen kennen (unterliegen, übertrumpfen usw.), sondern auch der Restbestand von Ritualen der Unterordnung wie Verbeugung oder (Hof-) Knicks, deren Wurzeln nach Ansicht der Humanethologen tief in die Naturgeschichte zurückreichen und vermutlich - ebenso wie Knie- oder Fußfall - mit den Demutsgebärden vieler Tiere in einem naturgeschichtlichen Zusammenhang stehen.48 Selbst das Begrüßungsnicken wird seinem Ursprung nach als eine »zur Geste ritualisierte Verbeugung und damit der Unterwerfung« klassifiziert:49 »Man macht sich klein, 45 Vgl. dazu PFISTER 1982, 79-90. 46 Den umgekehrten Fall - mit ähnlicher Wirkung - mag ebenfalls ein Beispiel aus einem Chaplin-Film illustrieren: In »The gold rush« (USA 1925) trippelt Charlie auf einem schmalen, verschneiten Gebirgssteig seinem Ziel entgegen, ohne zu bemerken, was Kamera und Zuschauer bemerken, nämlich daß ihm dabei für kurze Zeit ein Bär folgt. Der Informationsvorsprung, den die Kamera hier den Zuschauern gewährt, sorgt für den »Kasperle, paß auf«-Effekt, der sich dann als unnötig herausstellt: Der Bär verläBt den Pfad an einer Wegzweigimg, und Charlie geht unverändert und unberührt von der Besorgnis, die den Zuschauer ergriffen hatte, seiner Wege. Die diskrepante Informiertheit erzeugt hier also in beiden Fällen eine bestimmte Zuschauererwartung, die dann durch das weitere Geschehen destruiert, im Lachen aufgelöst wird, in dieser Auflösung aber - und das ist ein ganz typisches Stilmittel Chaplins - selbst Gegenstand des Lachens wird. Vgl. KUCHENBUCH 1978, 38. 4
* Vgl. EIBL-EIBESFELDT 1984,189.
4
' EIBL-EIBESFELDT 1 9 8 5 , 1 9 8 .
Kapitel II: Kameraverhalten 93 und das ist genau das Gegenteil der Imponier- und Drohhaltung«, 50 in der Menschen sich 'groß machen', indem sie sich aufrichten, 'in die Brust werfen'. 5 1 Anordnung und Bau institutioneller Räume und Plätze (Thron, Kanzel, Katheder) stehen damit in direktem Zusammenhang: Sie garantieren dem jeweils Ranghöchsten eine erhöhte Position im Raum auch dann, wenn er von Natur kleiner geraten ist als seine Untergebenen, erlauben ihm, auf sie herabzublicken, und zwingen die Rangniederen, zu ihm aufzublicken. Das Herab- oder Aufblicken der Kamera kann unter Umständen in durchaus ähnlicher Weise soziale Rangordnungsbeziehungen artikulieren, und die in filmanalytischen Grundlegungen stereotyp wiederholten Verweise auf Über- bzw. Unterlegenheitsrelationen, die Auf- und Untersichten der Kamera herstellen können, lassen sich im Rekurs auf Ergebnisse der Humanethologie und Verhaltenspsychologie zumindest allgemein begründen. Wie bei der entsprechenden Betrachtung des Entfernungsverhaltens der Kamera ist freilich auch hier mit Nachdruck darauf hinzuweisen, daß 'Naturformen 1 menschlichen Interaktionsverhaltens als Rekursinstanzen für die Analyse filmästhetischer Strukturen nur bedingte Geltung beanspruchen können, daß ihr Status ein heuristischer ist und daß ihre Beiziehung einer sorgfaltigen interpretatorischen Legitimation im je konkreten Fall bedarf. Vor allem ist auch hier die vorgängige Abklärung der referentiellen Funktionen eine unverzichtbare Vorbedingung. Bevor Kamerablicke auf eine Figur aus Augenhöhe und in Horizontalsicht als Ausdruck symmetrischer Beziehungen oder Abweichungen von dieser 'Normalsicht' als Ausdruck asymmetrischer Beziehungen (zwischen Erzähler und Figur oder zwischen zwei Figuren) qualifiziert werden (vgl. S. 76), wäre folglich zuerst zu prüfen, ob und welchen referentiellen Erfordernissen die Perspektiven nachkommen, ob es Hinweise auf referentielle Redundanzen gibt, die auch hier die sicherste Legitimation für eine weiterreichende Qualifikation der Perspektive liefern. 52 Worauf nun aber solche Symmetrien oder Asymmetrien beruhen, d.h. welchen Kriterien oder Normen sie sich verdanken, ist selbstverständlich auch hier kein Problem der Filmanalyse, sondern der Filminterpretation. Als Ausdruck moralisch oder ideologisch begründeter Rangzuweisungen haben perspektivisch vermittelte Asymmetrien im Film eine lange (und selten gute) Tradition: Sie reproduzieren das schlichte Muster des 'Aufblickens' bzw. so Ebd. 201. 51 Vgl. SCHEFLEN 1976, 29 u. pass. 52 Vgl. das in Anm. 33 beschriebene Beispiel aus Chaplins »Monsieur Verdoux«, bei dem sich die Funktion der Aufsichten ohne Frage in der Klärung der räumlichen Situation erschöpfen. Vgl. dagegen die in Anm. 34 beschriebene Untersicht aus Eric Rohmers »Marquise von O«, deren deutliche referentielle Redundanz eine weitergehende Funktionszuweisung legitimiert.
94
Kapitel II: Kameraverhalten
'von oben Herabsehens' und erweisen sich - in dieser Funktion - nahezu regelmäßig als filmische Strukturelemente, die autoritäre Denkstrukturen zu bestätigen geeignet sind, weil sie moralische oder ideologische Normeifullungen bzw. Normverstöße mit autoritären Ordnungsvorstellungen koppeln.5* Solche Zusammenhänge zwischen autoritären Denkstrukturen und vertikalen Perspektiven lassen sich in einer ganzen Reihe von Filmgenres (z.B. im traditionellen Western), aber auch in ganz anderen Kontexten, etwa in der Werbung (in der Werbung für männliche Konsumartikel zumal) nachweisen. Und daß sie in der politischen Propaganda autoritärer Regime eine wichtige Rolle spielen, kann nicht verwundern. So ist es kein Zufall, daß in Propagandafilmen der NS-Ära Auf- und Untersichten in unzweifelhaft rangzuweisender Funktion ein zentraler und fester Bestandteil des Repertoires filmischer Darstellungsmittel sind.54 In Filmen von Hans Steinhoff etwa haben vertikale Perspektiven eine geradezu indexikalische Funktion, sind ein selten trügendes Zeichen dafür, welche Figuren die Erzählinstanz als Träger der gültigen Norm anerkannt wissen will: Wenn beispielsweise in dem Film »Robert Koch« (D 1939) Kochs Gegenspieler Virchow (Werner Krauss) im unmittelbaren Anschluß an ein (untersichtiges) 'Heldenbild' der Titelfigur (Emil Jannings) mit Bildern eingeführt wird, in denen die Kamera sich aus einer gleichbleibend starken Aufsicht, beginnend mit einer Nahaufnahme, sukzessive nach oben zurückweichend von der Figur distanziert, so daß diese nicht nur durch die Aufsicht degradiert, sondern zusätzlich auch immer kleiner und unscheinbarer wird, dann sind damit die Rangverhältnisse schon zu diesem frühen Zeitpunkt unzweideutig geklärt, obwohl Koch »der Handlung nach noch lange nicht die Bedeutung seines noch übermächtigen Gegners erlangt hat«,55 d.h.: Die Kamera macht hier nicht die aktuellen Machtverhältnisse 53 Wenn etwa Fred Zinnemann in »High Noon« (USA 1952) seinen Helden Kane (Gary Cooper) in einem Saloon mit den Bürgern von Hadleyville konfrontiert, die sich um die Unterstützung ihres Sheriffs im Kampf gegen den Revolverhelden Frank Miller henimdrükken, dann läßt er die Kamera regelmäßig zwischen leichten Untersichten (Kane) und leichten Aufsichten auf die Männer wechseln: Obwohl der Held hier abermals eine Niederlage einstecken muB und von den Männern keineswegs als Autorität anerkannt wird, weist die filmische Erzählinstanz ihm - als dem Träger der moralischen Norm des Films - eine erhöhte Position zu und zwingt dem Zuschauer so ihren bewundernden Aufblick zu ihm auf, degradiert andererseits die nicht normgerecht sich verhaltenden Männer durch die Aufsicht und nötigt den Zuschauer dazu, seinerseits auf sie 'herabzusehen'. So kann denn auch trotz der ständigen Mißerfolge des Helden kein Zweifel darüber entstehen, wer hier die wahre Autorität ist: Im Wechselspiel der Perspektiven manifestiert sich das tragende Ideologem des Films, das die Aufrechterhaltung gesellschaftlicher Ordnung einer Elite aufrechter, selbstloser Männer zuweist, die selbstgewiß und unanfechtbar von der trägen, eigensüchtigen Masse für Recht und Gesetz einstehen. 54 V g l . d a z u DENZER 1985, 122f.
55 Ebd. 123.
Kapitel lì: Kameraverhalten
95
zwischen den Kontrahenten, sondern die ideologische Norm zum Kriterium ihrer Rangordnung, antizipiert den späten Triumph des Helden und prädisponiert so die Rezipientenperspektive, macht dem Zuschauer klar, wo er die für ihn verbindliche Autorität zu suchen hat. Interpretatorische Befunde dieser Art beruhen nun aber selbstverständlich nicht allein auf der Analyse der vertikalen Perspektiven, sondern auf immanenten Kontextbezügen: Im Beispielfall werden sie gestützt durch die über sämtliche Kanäle der filmischen Informationsvergabe organisierte Perspektivenstruktur (vgl. Kap. VI) des Films, die hier eine geschlossene, nämlich konzentrisch auf die Bestätigung der Perspektive der Titelfigur angelegte ist. Das Beispiel verweist zugleich auf die heuristische Funktion, die die Frage nach der Beziehung zwischen aktueller Situation und Kameraverhalten für die ideologiekritische Interpretation von Auf- und Untersichten haben kann: Divergenz zwischen beiden, zwischen den aktuellen Machtverhältnissen und der Verteilung der Auf- und Untersichten, ist - wie im Beispielfall - ein recht verläßlicher Indikator für eine ideologische Funktionalisierung der Perspektiven. Konvergenz zwischen beiden läßt dagegen eine situationsadäquate Verwendung der Perspektiven erwarten.56 Bei den horizontalen Perspektiven sind solche griffigen Funktionszuweisungen nur bedingt möglich. Das liegt zum einen an dem ungleich größeren Variantenreichtum horizontaler Kameraperspektiven, zum anderen daran, daß die hier gewählte Rekursinstanz, das menschliche Interaktionsverhalten, soweit es die horizontalen 'Winkelverhältnisse' zwischen Interaktionspartnern betrifft, deutlich schwächer strukturiert und reglementiert ist als bei vertikalen Relationen. Verhaltenspsychologen betonen vor allem die sozialen Ein- oder Ausschließungsfunktionen solcher horizontalen 'Winkelverhältnisse', mit denen Interaktionspartner »das Ausmaß ihres 'Engagements'« füreinander sowie den »Grad ihrer 'Offenheit' oder 'Verschlossenheit' für Dritte« anzeigen:57 Zwei Menschen, die ein privates Gespräch führen und dabei nicht gestört sein wollen, gehen zumeist in die sog. 'Vis-à-vis-' oder in die noch intimere Vgl. z.B. Wolfgang Staudtes »Der Untertan« (DDR 1951), wo die Kamera, unbekümmert und (zu Recht) ganz unbesorgt um die autoritären Implikate ihrer (reichlich eingesetzten) vertikalen Perspektiven, den Helden und seine Mit- und Gegenspieler je nach Lage der Dinge wechselnd in kräftigen Auf- und Untersichten zeigt. Da sie diese Blicke zudem figurenperspektivisch motiviert, die Rangverhältnisse nämlich so reproduziert, wie sie sich für Diederich Heßling darstellen, gibt sie zugleich kund, daß sie selbst keine Normen anerkennt, die hierarchische Ordnungsstrukturen begründen könnten, macht klar, daB nicht sie, sondern Diederich Heßling die Welt als eine einzige große Ordnung von Oben und Unten erlebt, illustriert so den autoritären Charakter des Helden und gibt ihre Meinung dazu allenfalls in Übertreibungen, in extremen Auf- oder Untersichten ab, deren Verzerrungseffekte die verzerrte Weltsicht des Helden sinnfällig machen. 57 SCHEFLEN 1976, 39.
96
Kapitel II: Kameraverhalten
'Face-to-face-Position', um anderen zu signalisieren, daß sie unwillkommen sind, und schirmen diese Positionen oft noch zusätzlich dadurch ab, daß sie drohenden Störenfrieden halb den Rücken zukehren oder den ihnen zugewandten Arm wie eine Barriere anwinkeln.58 Wenn dagegen »kein Bedürfnis nach Privatheit besteht (...), so nehmen beide gewöhnlich eine größere Distanz zueinander ein und stehen 'offen 1 , in einem Winkel von 60 bis 90 Grad, so daß Dritte einbezogen werden können«.59 Für die Funktionsbestimmung von Kameraperspektiven lassen sich diese Einsichten allenfalls insofern auswerten, als sie Hinweise darauf geben, warum die intime Nähe, die geringe Aufnahmedistanzen zwischen Erzähler und Figur herstellen (vgl. S. 74-77), bei 'Face-to-face-Positionen' der Kamera, also bei frontalen Aufnahmen, intensiver zum Ausdruck kommt als bei seitlichen Aufnahmen: Die Kamera konfrontiert den Zuschauer sehr direkt mit der Figur, indem sie ihr voll ins Gesicht blickt, wie es Interaktionspartner in intimen (freundlichen wie feindlichen) Kommunikationssituationen zu tun pflegen. 60 Gerade weil nun aber die Beziehung zwischen Kamera und Figur nicht eigentlich eine der Interaktion ist (vgl. S. 75), also nicht, wenn man so will, auf beiderseitigem Einverständnis beruht, haben solche frontalen Nah- und Großaufnahmen häufig auch einen leicht indiskreten Akzent, weil sie sich eines Blickes bemächtigen, der in realen Interaktionssituationen normalerweise ein hohes Maß an gegenseitigem Engagement voraussetzt und daher - sofern er einseitig vollzogen (d.h. hier: nicht durch eine figurenperspektivische Erzählweise motiviert wird) sehr leicht den Charakter indiskreten Blickverhaltens gewinnt. Es ist wohl kein Zufall, daß die meisten Kameramänner bei Großaufnahmen eine leicht schräge Perspektive bevorzugen: Sie ist der Rolle des filmischen Erzählers als eines Beobachters zweifellos angemessener.
D. Bewegungsverhalten: Ästhetische Strukturen und Funktionen von Kamerabewegungen Einstellungsgrößen und Perspektiven werden durch Bewegungen der Objekte und/oder der Kamera innerhalb einer Einstellung verändert. Kamerabewegungen sind also zunächst, was ihre (möglichen) Resultate angeht, eine Funktion der eben behandelten kinematographischen Formen. Ihre Fähigkeit, Einstel5« Vgl. ebd. 39-48f. 59 Ebd. 40. 60 Wohlgemerkt spielt hier die Aufnahmedistanz eine zentrale Rolle: Bei größeren Aufnahmedistanzen verliert die frontale Perspektive diesen intimisierenden Effekt vollständig.
Kapitel II: Kameraverhalten
97
lungsgrößen und Perspektiven innerhalb einer Einstellung - ohne Schnitt also - zu wechseln, macht sie zu einem bevorzugten Mittel von Filmen, die dem Stilprinzip der »mise en scène« verpflichtet sind. 61 André Bazin feierte die »mise en scène« (im Film der 30er und 40er Jahre) als »realistische Wiedergeburt der Erzählung«, 62 die dem Kino den »Sinn für die Vieldeutigkeit der Wirklichkeit« zurückgegeben habe, 63 und stellte sie damit in einen qualitativen Gegensatz zur Montage, die eine »Abstraktion der Realität« bewirke 64 und damit Ausdruck eines eher 'expressiven' oder 'manipulativen' Erzählens sei. Bazins Thesen stehen in einem engen (von ihm selbst allerdings nicht deutlich gesehenen) Zusammenhang mit Grundproblemen modernen Erzählens und darin mit der Legitimitätskrise der mimetischen Künste in der Moderne überhaupt, die die literarische Diskussion (anknüpfend an kunsttheoretische Diskussionszusammenhänge des 19. Jahrhunderts) schon seit den zwanziger Jahren beschäftigte: Die Infragestellung der Repräsentationsidee des Wirklichen zog die Geltungsfähigkeit einer auf die Welt der Erscheinungen konzentrierten Nachahmung von Wirklichkeit grundsätzlich in Zweifel, ein Umstand, der, wie etwa Brecht feststellte, das auf die phototechnische Reproduktion der optischen Erscheinungswelt angewiesene Filmmedium in ganz besonderer Weise betrifft. 65 Bazins Plädoyer für die »mise en scène« als Stilprinzip filmischen Erzählens ist in diesem Horizont Plädoyer für die Aufrechterhaltung der Repräsentationsidee, für ein Realitätsmodell, das in der Welt der Erscheinungen deren 'Wesen' anzutreffen noch gewiß ist und daher ein erzählerisches Weltverhalten legitimieren kann, das Wirklichkeit in der Anschauung ihrer Erscheinungen erfassen und gültiger Sinndeutung zuführen zu können überzeugt ist. 66 Demgegenüber erweist sich ein die Montage zum Stilprinzip filmischer Welterfassung erhebendes Programm in dieser Perspek61 V g l . d a z u DADEK 1 9 6 8 , 2 6 1 - 2 7 0 .
62 BAZIN 1950-55, 43. 63 Ebd. 41. 64 BAZIN 1 9 4 8 , 143.
63 »Die Lage wird dadurch so kompliziert, daß weniger denn je eine einfache 'Wiedergabe der Realität' etwas über die Realität aussagt. Eine Photographie der Kruppwerke oder der AEG ergibt beinahe nichts über diese Institute. Die eigentliche Realität ist in die Funktionale gerutscht. (...) auch wer von der Realität nur das von ihr Erlebbare gibt, gibt sie selbst nicht wieder. Sie ist längst nicht mehr im Totalen erlebbar.« (Bert Brecht: Der Dreigroschenprozeß, in: B.B., Gesammelte Werke in 20 Bdn., Frankfurt/M. 1967, Bd. 18, 161f.). 66 So lobt Bazin etwa Jean Renoirs Filme der dreißiger Jahre als 'ruhmreiche' und 'prophetische' Ausnahmen (vom klassischen Montage-Film), weil sie sich bemühten, »über die Montage hinaus das Geheimnis einer filmischen Erzählform wiederzufinden, die alles ausdrücken kann, ohne die Welt zu zerstückeln, den Sinn zu enthüllen, der hinter den Wesen und den Dingen liegt, ohne die natürliche Einheit zu zerstören« (BAZIN 1950-55, 43; Hervorhebung von mir).
98
Kapitel II: Kameraverhalten
tive als Ausdruck eines Realitätsmodells, das die Erscheinungswelt als einen deren 'Wesen' gerade verschleiernden Scheinzusammenhang, als täuschende Fassade,67 verwirft und daher ihre 'Zerstückelung', die Destruktion der Oberflächenrealität und ihre veränderte, 'abstrakte' Reorganisation in der Montage, zum allein noch möglichen Prinzip filmerzählerischen Weltverhaltens erklärt. Diese immerhin potentielle Signifikanz der von Bazin (im Zeichen einer freilich normativen Filmkritik) berufenen Opposition übersehen Versuche, den strukturellen Gegensatz zwischen Kamerabewegung und Einstellungswechsel zu nivellieren und einer »freien Austauschbarkeit zwischen Montage und Kamerabewegung« das Wort zu reden:68 Der Umstand, daß Kamerabewegungen - zumindest auf referentieller Ebene - ein funktionales Äquivalent von Einstellungswechseln darstellen können, ist ja kein Argument gegen, sondern vielmehr für die ästhetische Relevanz des Formunterschieds. Gerade weil z.B. die Deixis einer einmontierten Detailaufnahme auch durch eine Ranfahrt bis zur Detaileinstellung erreicht werden kann, wird die Entscheidung für das eine oder andere zu einer ästhetisch relevanten und damit zu einem möglichen Indikator stilistischer Konzepte. Und nicht die auf vordergründige wirkungsästhetische Aspekte ausgehende Frage, ob ein und dieselbe Information durch einen Schnitt oder durch eine Kamerabewegung »nachdrücklicher«, »eindringlicher« oder »besser« vermittelt werden kann, 69 spielt dabei die entscheidende Rolle, sondern die Frage, welche weiteren, je spezifischen Informationen beide Formen transportieren können. Der Unterschied zwischen Kamerabewegungen und Einstellungswechseln ist mithin durchaus nicht irrelevant geworden, betrifft vielmehr fundamentale filmästhetische Strukturen.
1.
Kategorien der Beschreibung
Für die Beschreibung von Bewegungsformen der Kamera sind vor allem zwei Kriterien von Belang: Die Frage, ob Kamerabewegungen Objektbewegungen folgen oder freie Blickbewegungen vollziehen, begründet eine Unterscheidung, die hier - da die traditionelle Terminologie keine entsprechenden Oberbegriffe bereitstellt - mit den Begriffen objektgebundene vs. freie Kamerabewegung fixiert sei; und die Frage, ob die Kamera bei Bewegungen ihren Standort wechselt oder nicht, liefert die Unterscheidung zwischen Schwenks 67 Vgl. Th. W. Adorno: Form und Gehalt des zeitgenössischen Romans, in: Akzente 1 (1954) H.5, 410-416, hier 412.
68 Siegrist 1986, 164. 69
Ebd. 165.
Kapitel II: Kameraverhalten
99
und Fahrten. Weitere (untergeordnete) Kriterien der Beschreibung ergeben sich aus der Richtung und dem Tempo der Bewegungen sowie aus der Differenz von Stativ- und Handkamera. Von objektgebundenen Kamerabewegungen ist hier die Rede, wenn der Bewegungsakt der Kamera den Bewegungsakt seines Wahrnehmungsobjekts mitvollzieht, wenn also Bewegungsrichtung und Bewegungstempo der Kamera von Bewegungsrichtung und Bewegungstempo des Objekts bestimmt werden, und zwar nicht irgendeines Objekts, sondern des jeweils kadrierten Wahrnehmungsobjekts. Denn die Unterscheidung zwischen objektgebundenen und freien Kamerabewegungen bezieht sich nicht auf die Frage, die man in diesem Zusammenhang auch stellen könnte, ob eine Kamerabewegung über die Darstellungsebene explizit motiviert oder realistisch begründet wird oder nicht,70 sondern allein auf die Frage, ob sie sich der Bewegung ihres jeweiligen Wahrnehmungsobjekts anschließt oder nicht. Das Kriterium der Objektgebundenheit wird hier aus zwei Gründen als übergeordnetes Differenzkriterium favorisiert und dem Kriterium der Bewegungsform (Schwenk vs. Fahrt) vorgezogen. Zum einen ist es das für die Erfassung der durch Kamerabewegungen erzeugten formalen Bildstrukturen vorrangige: Bei objektgebundenen Kamerabewegungen gerät die Umgebung des sich bewegenden Objekts in Bewegung, während das Objekt selbst im Bild zu 'stehen' scheint und seine Erscheinungsgröße - idealiter - konstant bleibt;71 bei freien Kamerabewegungen dagegen kommt der gesamte Bildausschnitt in Bewegung, so daß die Objekte der Wahrnehmung entweder beständig wechseln oder (bei Ran- und Wegfahrten) ihre Erscheinungsgröße maßgeblich verändern. Zum anderen und vor allem ist die Differenz zwischen freien und objektgebundenen Kamerabewegun™ Explizit motiviert sind Kamerabewegungen, die ausdrücklich als Blickreaktionen auf spezielle optische oder akustische Signale ausgewiesen werden, wie z.B. Ranfahrten aufgrund eines optischen Signals aus dem Bildhintergrund oder Schwenks aufgrund eines akustischen Signals aus dem Off. Realistisch begründete Kamerabewegungen sind solche, bei denen der Bewegungsakt als Bewegungsakt nicht der Kamera, sondern eines Objekts glaubhaft gemacht wird: Eine Fahrt etwa, bei der die Kamera von einem beweglichen Objekt der Darstellungsebene (von einem Zug, einem Auto usw.) fortbewegt wird, sind keine objektgebundenen, sondern lediglich realistisch begründete Kamerabewegungen, wären objektgebundene erst dann, wenn sie dabei zugleich auch der Bewegung eines (anderen) Objekts gleichsinnig folgten. Die Frage, ob eine Kamerabewegung explizit motiviert bzw. realistisch beglaubigt ist oder nicht, hat weniger für die Erfassung formaler Bildstrukturen Relevanz als vielmehr für die Erfassung erzählperspektivischer Konzepte (vgl. Kap. IV). 71 Eine Ausnahme bilden Schwenks, die eine Objektbewegung in die Tiefe des Bildes oder umgekehrt verfolgen: Hier verändert die Objektbewegung die Aufhahmedistanz. Da solche Schwenks aber naheliegenderweise nur von kurzer Dauer sein können, weil Blickachse und Handlungsachse dabei einander rasch annähern, sind diese Veränderungen so gering, daß sie hier vernachlässigt werden können.
100
Kapitel II: Kameraverhalten
gen mit einer fundamentalen funktionalen Differenz verknüpft: Letztere legen, indem sie Richtung, Tempo und Reichweite ihrer Bewegungsakte vom Bewegungsobjekt beziehen, den Akzent auf das Erzählte, nicht auf den Erzählakt, signalisieren eine enge Bindung des Bildsubjekts an sein Wahrnehmungsobjekt, haben daher die Tendenz, die Differenz zwischen beiden durch ihre identifikatorische Wirkung zu entkräften; freie Kamerabewegungen dagegen legen, indem sie frei über den Raum verfügen, den Akzent in der Regel sehr deutlich auf den Erzählakt, signalisieren Ungebundenheit, unterstreichen daher die Differenz zwischen Subjekt und Objekt des Bildes, ein Umstand, der nicht zuletzt für die Bestimmung filmischer Erzählsituationen (Kap. IV) von einigem Belang ist. Schwenks - Bewegungen der stationären Kamera um eine ihrer drei imaginären Achsen (vgl. Abb. 4) - sind hinreichend genau zu beschreiben durch entsprechende Bezeichnungen der Schwenkrichtung (nach rechts, links, oben, unten, rechts/unten usw.). Für die Bezeichnung objektgebundener Schwenks sei hier der Begriff Begleitschwenk vorgeschlagen. Die Beschreibung des Schwenktempos - das gilt entsprechend auch für das Tempo von Fahrten - unterliegt subjektivem Empfinden, weshalb eine verbindliche Kategorisierung und Begriffsbildung hier wenig Sinn hat. Allenfalls bei auffällig langsamen oder raschen Schwenks dürften entsprechende beschreibende Zusätze konsensfähig sein. Für extrem rasche Schwenks ist der Begriff Reißschwenk in Gebrauch: Er sollte Fällen vorbehalten bleiben, bei denen das Bild für die Dauer des Schwenks so sehr verwischt wird, daß das Auge den dabei abgeschwenkten Raum nicht mehr erkennen kann. 72 Das der Produktionspraxis entliehene Vokabular für die Bezeichnung von Kamerafahrten erfüllt vor Ort seine Funktion, reicht aber für die Beschreibung der fertigen Bilder nicht aus und verdankt sich zudem heterogenen Kriterien, 73 ist daher zu ergänzen oder durch präzisere Begriffe zu ersetzen. Grundsätzlich ist hier zu bedenken, daß die Frage, in welche Richtung sich die Kamera bewegt, bei Fahrten keine Frage der Fahrtrichtung allein, sondern immer auch des Winkelverhältnisses zwischen Blickachse und Bewegungsachse der Kamera ist: Eine Fahrt wird zur Ran- oder Wegfahrt dadurch, daß die Blickachse der Kamera mit der Bewegungsachse der Kamera zusammenfällt (vgl. Abb. 7/A), zu einer 'seitlichen', nach rechts oder links gerichteten Fahrt dadurch, daß ihre Blickachse einen deutlichen Winkel mit der Bewegungsachse bildet (vgl. Abb. 7/B). Je nach Winkelverhältnissen gibt es denn auch eine Vielfalt von Kombinationsmöglichkeiten: Eine Fahrt mit 72 V g l . MONACO 1 9 8 0 , 159. 73
Begriffe wie »Verfolgungsfahrt« oder »Parallelfahrt« beispielsweise beschreiben nicht nur die Bewegungsrichtung, sondern auch die Perspektive ('von hinten', 'seitlich').
Kapitel II: Kamera verhalten
101
nur leicht von der Bewegungsachse abweichendem Blickwinkel wirkt noch wie eine Ran- oder Wegfahrt, hat aber, zumindest bei längerer Dauer, zur Konsequenz, daß die Objekte nicht, wie (idealiter) bei Ran- und Wegfahrten, 'konzentrisch' vom Bildmittelpunkt aus zum Bildrand (oder umgekehrt), sondern durchs Bild fließen. Das aber ist, wie sich zeigen wird (Kap. D.2.2), bei freien Kamerafahrten von einiger Bedeutung: Nur wenn Bewegungs- und Blickachse der Kamera zur Deckung kommen, also nur bei reinen Ran- und Abb.7: Freie Kamerafahrten
|~a| Ran- und Wegfahrt
1
I Β
2
«—< 4 3
3
2
#0 ÊO In fU H
1 2 3
i âft •0 eso
Passierfahrt
1
Iii 1
2
2
3
„äiÄß
3
Wegfahrten, kann die Kamera für die gesamte Dauer der Bewegung ein bestimmtes - das im Bildfokus befindliche - Objekt fixieren und kontinuierlich größer oder kleiner werden lassen (vgl. Abb. 7/A). Sobald beide Achsen divergieren, fließt die Gesamtheit des Blickfeldes in horizontaler, vertikaler oder diagonaler Richtung durch das Bildfeld, wechseln also beständig die Wahrnehmungsobjekte der Kamera (vgl. Abb. 7/B). Um diesen Unterschied zu markieren, sei für freie Kamerafahrten mit dem Begriff Passierfahrt ein neuer Terminus eingeführt, der dem herkömmlichen Begriffspaar Ran- und Wegfahrt als oppositiver Begriff gegenübergestellt sein soll: Letztere sind definiert durch die Kongruenz von Blick- und Bewegungsachse der Kamera und
102
Kapitel II: Kameraverhalten
durch die damit entstehende Möglichkeit, ein bestimmtes Objekt während der gesamten Fahrt zu fixieren. Passierfahrten dagegen sind definiert durch die Divergenz beider Achsen und sollen so heißen, weil die Kamera dabei ihre Objekte passiert, an ihnen vorbeifahrt und deshalb keines von ihnen für die gesamte Dauer der Fahrt fixieren kann (vgl. Abb. 7). Für die Kennzeichnung objektgebundener Fahrten (vgl. Abb. 8) sei - analog zum Begleitschwenk - die Bezeichnung Begleitfahrt als zusammenfassender Oberbegriff vorgeschlagen, weil die hier sonst üblichen Begriffe (Verfolgungsfahrt, Parallelfahrt etc.) Aspekte der Perspektive einbeziehen74 und damit, weil das Filmprotokoll die Perspektiven an anderer Stelle ohnehin erfaßt, unnötige Wiederholungen erzeugen. Zudem erfassen sie nur einen Teil der möglichen Perspektiven (Rücken- und Seitenansichten). Abb. 8: Begleitfahrten
Der Unterschied zwischen Stativ- und Handkamera75 spielt eine Rolle insofern, als die Handkamera in der Regel einen höheren Grad an Subjektivität zu vermitteln vermag als die Stativkamera. So kann sie etwa die Wahrnehmungsweise eines (z.B. gehenden oder laufenden, betrunkenen, müden etc.) Men74 Vgl. Anm. 73. 75 Vgl. MONACO 1980, 91-93. Techniken wie das »Steadycam.-System (ebd. 91) vereinigen die Vorteile der Handkamera (Beweglichkeit) mit denen der Stativkamera (ruhige Bildfuhrung).
Kapitel II: Kameraverhalten
103
sehen nachahmen und damit demonstrativ auf die Subjektivität der Wahrnehmung hinweisen, ein Fall, in dem die ausdrückliche Erwähnung des Kameratyps im Filmprotokoll von Belang ist. Mit der hier vorgeschlagenen Terminologie wird der herkömmliche Beschreibungsapparat vereinheitlicht und damit zugleich präzisiert: Die Begriffe erfassen die vier Grundformen der Kamerabewegung, den objektgebundenen Begleitschwenk (BS) und den freien Kameraschwenk (S), die objektgebundene Begleitfahrt (BF) und die freie Kamerafahrt (F) mit ihren Varianten Ranfahrt (RF), Wegfahrt (WF) und Passierfahrt (PF). In Verbindung mit der Bezeichnung der Bewegungsrichtungen und den im Filmprotokoll erfaßten perspektivischen Verhältnissen erlauben sie eine hinreichend genaue Beschreibung der Bewegungsformen,76 ermöglichen insbesondere eine präzisere Erfassung der in der Praxis häufig begegnenden Kombinationen verschiedener Formen innerhalb eines Bewegungsakts.
2.
Kategorien der Funktionsanalyse
Das augenfälligste Resultat vieler Kamerabewegungen, die Veränderung von Einstellungsgrößen und Perspektiven, ist für die Funktionsanalyse der Bewegungsformen von geringerem Belang als der Bewegungsakt selbst, als der Weg, den die Kamera dabei zurücklegt: Gerade weil die Veränderung von Einstellungsgrößen und Perspektiven auch durch einen Einstellungswechsel erreicht werden kann, liegt das wichtigere ästhetische wie funktionale Kriterium für die Analyse dieses filmischen Diskurselements in der Bewegung selbst, weniger in deren Resultaten, deren funktionale Aspekte bereits in den beiden vorhergehenden Kapiteln zur Sprache gekommen sind. An sie wird zwar dort anzuknüpfen sein, wo es darum geht zu zeigen, daß die Kamera die Funktionen von Einstellungsgrößen und Perspektiven durch Bewegungen in vielen Fällen nur raumzeitlich dynamisiert, also z.B. die Nähe einer Großaufnahme, indem sie sie über eine Ranfahrt erreicht, als Resultat eines Akts der Annäherung kenntlich macht und ihr damit einen veränderten Akzent gibt. Aber darin erschöpft sich das Funktionenspektrum von Kamerabewegungen nicht, weshalb hier noch einmal neu, den oben eingeführten fünf Kriterien
76 Freilich bleibt darauf hinzuweisen, daß die Identifikation der verschiedenen Bewegungsformen nicht immer zweifelsfrei möglich ist. Das gilt insbesondere fur die Unterscheidung von Begleitschwenks und Begleitfahrten aus geringen Aufhahmedistanzen, bei denen das Bewegungsobjekt den größten Teil des Bildes ausfüllt, so daß der umgebende Raum und damit die Richtung, in der er durch das Bild 'fließt', häufig schwer erkennbar sind.
104
Kapitel II: Kameraverhalten
folgend, bei dem Spezifikum dieses Diskurselements, der Bewegung selbst, anzusetzen ist. 2.1
Objektgebundene Kamerabewegungen: Begleitschwenks und Begleitfahrten
Um den Gang der Darstellung überschaubar zu halten, werden objektgebundene und freie Kamerafahrten im weiteren getrennt untersucht. Das ist zwar, aus der Sicht der Filmpraxis, eine künstliche Trennung, denn Bewegungsakte der Kamera zeigen sehr häufig Kombinationen beider Formen, findet darin aber zugleich auch seine Bestätigung: Nur so können die funktionalen Anteile beider Bewegungstypen am kinematographischen Erzählakt präzise identifiziert werden. Objekteigenschaften: Richtung, Tempo und Reichweite Die für objektgebundene Kamerabewegungen maßgeblichen Eigenschaften der Objekte ergeben sich naheliegenderweise aus deren Bewegungsverhalten, aus Richtung, Tempo und Reichweite der Objektbewegung, in deren Klärung folglich die grundlegenden referentiellen Funktionen von Begleitschwenk und Begleitfahrt liegen. Beide Formen zeigen einige signifikante Differenzen, darunter zunächst eine die Richtung der Objektbewegung betreffende. Da Begleitschwenks nur von Standorten aus möglich sind, bei denen Handlungsachse und Blickachse (vgl. Abb. 5) divergieren, können sie Bewegungen in die Bildtiefe nicht selbst vollziehen, sondern allenfalls - aus einem zunehmend spitzer werdenden Blickwinkel zur Handlungsachse - andeuten, und das auch nur für kurze Zeit, weil Blickachse und Handlungsachse hier einander sehr rasch annähern. Bewegungen in die Bildtiefe sind ein Spezifikum von Kamerafahrten. Aus der Frage, ob eine Objektbewegung, die als Bewegung in die Bildtiefe dargestellt werden soll, durch Begleitfahrt oder Begleitschwenk vermittelt wird, können daher allgemeine Rückschlüsse auf das Verhältnis des Erzählers zur Raumerfahrung des Objekts gezogen werden: Begleitfahrten machen diese Raumerfahrung zu ihrer eigenen, indem sie sie selbst vollziehen, während Begleitschwenks, bei denen die Kamera dem Objekt nur 'nachsehen' kann, diese Erfahrung bei dem Objekt belassen. Und da sich dabei, anders als bei einer Begleitfahrt, die Aufnahmedistanz kontinuierlich verändert, kommen bei der funktionalen Qualifikation dieser Alternative zugleich die für die Einstellungsgrößen relevanten funktionalen Kategorien ins Spiel. Eine weitere Differenz betrifft das Tempo der Objektbewegung: Bei der Begleitfahrt bewegt sich die Kamera ziemlich exakt im Bewegungstempo der Objekte. Beim Begleitschwenk dagegen ist das Schwenktempo nicht nur eine
Kapitel II: Kameraverhalten
105
Funktion des Objekttempos, sondern auch der Aufnahmedistanz: Mit zunehmender Entfernung vom Objekt reduziert sich das für die Verfolgung der Objektbewegung nötige Tempo des Schwenks gegenüber dem des Objekts. Aus der Aufnahmedistanz kann demnach auf referentielle Intentionen von Begleitschwenks geschlossen werden: Begleitschwenks aus großer Entfernung sind weniger auf die Vermittlung der Dynamik als vielmehr auf die Klärung der Form und Richtung einer Bewegung und ihres Raumzusammenhangs (Umgebung, Beziehung zu anderen Objekten, z.B. Abstand zwischen Verfolger und Verfolgten usw.) konzentriert. Der spezifische Effekt von Fahrten dagegen liegt allererst in der Dynamik einer Bewegung, weil die hier nicht nur das 'Auge', sondern den gesamten 'Körper' der Kamera erfaßt. Bei der Begleitfahrt bezieht die Kamera diese Dynamik von der des Objekts: Indem sie dessen Bewegungen mitvollzieht, legt sie »die Betonung vor allem auf die zentrale Stellung des Gegenstandes«,77 verweist daher weniger (wie bei freien Fahrten) auf die Dynamik ihrer eigenen Bewegung, als vielmehr auf die des Objekts, macht dessen Bewegungstempo erfahrbar, indem sie es selbst übernimmt. Beim Schwenk ist das anders, weil die Kamera hier die vom Bewegungsobjekt überwundene Distanz nur mit dem 'Auge' durchmißt. Das muß nicht bedeuten, daß Begleitschwenks der Dynamik einer Objektbewegung notwendig Abbruch tun. Sie erfassen sie nur anders. Ein rascher Begleitschwenk, der z.B. ein nah an der Kamera vorbeirasendes Auto verfolgt, vermittelt die Geschwindigkeit des Wagens gewiß nicht minder effektvoll als eine Begleitfahrt. Aber indem die Kamera sie nur mit den 'Augen' mitvollzieht, hält sie die Distanz zwischen Subjekt und Objekt, die die Begleitfahrt aufzuheben die Tendenz hat, aufrecht. Das dritte objektspezifische Element, die Reichweite einer Bewegung, liefert ein einfaches Differenzkriterium für Begleitschwenk und Begleitfahrt: Weil Schwenks eine begrenzte, Fahrten dagegen eine potentiell unbegrenzte Reichweite haben, bieten Begleitschwenks sich mehr für die Darstellung kurzer, Begleitfahrten dagegen für die Darstellung längerer, weiträumiger Bewegungsabläufe an. Wo diese Faustregel nicht realisiert ist, entsteht ein Begründungsbedarf, der der Interpretation von Kamerabewegungen unter Umständen brauchbare Ansatzpunkte liefern kann, denn solche Abweichungen sind zumeist Indikatoren spezifischer, über das bloße Referat hinausgehender Funktionen. Wo etwa die Kamera aus einem größeren Bewegungsablauf nur Ausschnitte liefert, indem sie sich auf Begleitschwenks beschränkt, oder wo sie umgekehrt für die Abbildung einiger weniger Schritte einer Figur den Aufwand einer Begleitfahrt betreibt, wird man mit solchen spezifischen FunktioN
MONACO 1 9 8 0 ,
189.
106
Kapitel II: Kameraverhalten
nen zu rechnen haben, deren Aufklärung freilich auch hier nicht Sache der Analyse, sondern der interpretatorischen Auswertung der Analysebefunde ist. 78 Objektbeziehungen: Die Neuregelung von Entfernungsverhältnissen Jede Objektbewegung ist per se ein relationales Element, denn mit jeder Bewegung regeln die Bildobjekte ihre Raumbeziehungen neu. Deshalb sind die im vorhergehenden Abschnitt behandelten Aspekte - Richtung, Tempo und Reichweite eines Bewegungsakts - immer auch schon relationale Qualitäten, geben an, auf welche Weise das Bildobjekt seine Raumbeziehungen neu regelt. Mit Bezug auf Kamerabewegungen, deren Thema nicht das Ziel einer Objektbewegung, sondern der Weg selbst ist, ist den im vorhergehenden Abschnitt angestellten Überlegungen daher auch wenig hinzuzufügen: In diesem Fall gewinnt die Beziehung des Objekts zu dem von ihm durchquerten Raum eigenes Gewicht, wie rituelle Bewegungsabläufe (z.B. das Abschreiten einer Ehrenformation) illustrieren. Für die Charakterisierung dieser Beziehung spielt das Bewegungstempo des Objekts und damit auch das der Kamera eine besondere Rolle, kann z.B. Sorgfalt oder Achtlosigkeit, Interesse oder Desinteresse, Ruhe oder Unruhe, womit eine Figur den von ihr passierten Raum wahrnimmt, anzeigen.
78 Als Beispiel mag hier eine der Einstellungen aus Jean Renoirs »La grande illusion« (F 1937) dienen, die den Kampf um die Festung Douaumont im ersten Weltkrieg in den Reaktionen der französischen Kriegsgefangenen und ihrer deutschen Bewacher spiegeln: Die Kamera nimmt zunächst groB ein zweisprachiges Plakat ins Bild, das den (kurzlebigen) Sieg der Deutschen meldet, fährt dann nach rechts und schaut der deutschen Wachmannschaft, die den Sieg in ihrer Stube trinkend und singend feiert, durchs Fenster zu, fährt weiter nach rechts zur Tür der Wachstube, durch die ein deutscher Wachsoldat singend ins Freie tritt, und folgt ihm mit einer Begleitfahrt ein kurzes Stück nach links, verläßt ihn dann aber mit einem Schwenk nach links/oben in dem Moment, da er unter dem Fenster vorbeigeht, aus dem die französischen Kriegsgefangenen mit bedrückter Miene dem Siegestaumel ihrer Bewacher zusehen. Mit der Begleitfahrt, um die es hier geht, betreibt die Kamera gewissermaßen einen 'unnötigen' Aufwand, denn um den Weg des Wachsoldaten zu erfassen, hätte auch ein Schwenk ausgereicht. Diese Redundanz zeigt an, daß der Vorgang selbst, der Weg des Wachsoldaten, hier nicht Gegenstand des Interesses, sondern nur der Vorwand ist, um von der Tür der Wachstube zum Fenster der Gefangenenstube zu gelangen, genauer: um Sieger und Besiegte in einer Einstellung zu erfassen und damit die unmittelbare räumliche Nachbarschaft beider, das Nebeneinander von Freude und Bedrükkung, sinnlich erfahrbar zu machen: Bei einem Schwenk, der zuerst den Wachsoldaten verfolgt und dann zu den Kriegsgefangenen aufgeblickt hätte, hätte der Erzähler - je nach Standort - entweder den Wachsoldaten oder die Kriegsgefangenen aus größerer Entfernung erfaßt, also beide mit unterschiedlicher Intensität registriert. Eben das aber hätte seinem Thema widersprochen, denn ihm geht es hier (wie in dem Film insgesamt) gerade darum, beide Seiten gleichermaßen intensiv zu studieren, beiden Seiten gerecht zu werden.
Kapitel II: Kameraverhalten
107
Bei Kamerabewegungen, deren Thema allererst das Ziel einer Objektbewegung ist, steht die Überwindung einer räumlichen Distanz im Vordergrund, liefert also die Entfernung, die Objekt und Kamera durch den Bewegungsakt überwinden, das wichtigste funktionale Kriterium. Dieses Kriterium erfaßt eine zentrale Funktion nicht nur objektgebundener, sondern aller Kamerabewegungen: die Vermittlung räumlicher Distanzverhältnisse. Was die Kamera, solange sie unbewegt bleibt, nur durch die Wahl ihrer Einstellungsgrößen und Perspektiven vermitteln kann - die Position der Objekte im Raum und die zwischen ihnen liegenden Distanzen - bringt sie durch Eigenbewegungen sinnlich in Erfahrung, d.h.: Kamerabewegungen thematisieren die Beziehungen zwischen den Dingen als Entfernungsbeziehungen, indem sie diese Entfernungen selbst durchmessen und als raumzeitliche - über das Verhältnis von Bewegungstempo und Bewegungsdauer79 - vermitteln. Beim Schwenk geschieht das, wie gesagt, nur mit den 'Augen', läßt sich das Bildsubjekt also auf den Raum nur optisch ein und betont damit seine Zuschauerrolle. Bei Fahrten dagegen begibt es sich mit dem ganzen 'Körper' in den Raum hinein, »er-fährt« ihn und damit die räumlichen Beziehungen zwischen den Objekten in einem ganz buchstäblichen Sinn. Objektgebundende Kamerabewegungen behandeln dieses Thema in spezifischer Weise, indem sie die Veränderung dieser Entfernungsbeziehungen zwischen den Dingen, den Vorgang der Neuregelung von Distanzverhältnissen in actu beschreiben. Daraus ergeben sich zugleich ihre Möglichkeiten, das Bewegungsverhalten des Bildobjekts näher zu charakterisieren: Sie liegen in der Vermittlung des Tempos, mit dem das Objekt seinem Ziel zustrebt, in der Klärung der (im Verhältnis von Bewegungstempo und Bewegungsdauer angezeigten) Entfernung, die es dabei überwindet, und in der Relation zwischen beiden. Alle weiteren Charakterisierungsverfahren aber bezieht die Kamera nicht aus ihren Bewegungsformen, sondern aus ihren Einstellungsgrößen und Perspektiven. Wie Kamerabewegung, Einstellungsgröße und Perspektive bei der Klärung der räumlichen Relationen eines Bewegungsablaufs zusammenspielen und welche semantischen Potenzen sie dabei entfalten können, sei hier an einem Beispiel aus Andrej Tarkowskijs »Nostalghia« (I 1983) illustriert: In einer un79
Befragt, warum die lange Szene in »North by Northwest« (USA 1959), in der Roger Thornhill (Cary Grant) in einer verlassenen Gegend von einem Flugzeug angegriffen wird, nicht nach dem Prinzip beschleunigter Montage geschnitten wurde, sondern aus gleichennaBen langen Einstellungen besteht, antwortete Hitchcock: »weil es in diesem Fall darum geht, nicht die Zeit zu gestalten, sondern den Raum. Die Dauer der Einstellungen dient dazu, die verschiedenen Entfernungen zu verdeutlichen, die Cary Grant zurücklegen rauß, um sich zu verstecken, und zu zeigen, daß er es gar nicht schaffen kann.« (TRUFFAUT 1982, 249; Hervorhebungen von mir).
108
Kapitel II: Kameraverhalten
gewöhnlich langen, fast neun Minuten dauernden Einstellung sieht man Gortschakow (Oleg Jankovsky) mit dem Versuch beschäftigt, eine brennende Kerze von dem einen Beckenrand eines entleerten Schwefelbades zum anderen zu tragen und damit ein Versprechen einzulösen, das er dem Sonderling Domenico (Erland Josephson) gegeben hatte.80 Die Kamera verfolgt geduldig den gesamten Vorgang, die zwei ersten, fehlschlagenden Versuche, die anschließenden Rückwege des Helden zum Ausgangspunkt und den dritten, schließlich erfolgreichen Versuch, mit sehr langsamen Begleitfahrten, die jeden Schritt Gortschakows, jedes Zögern und jedes raschere Vorwärtsgehen, minutiös mitvollziehen. Dabei nimmt sie eine seitliche Perspektive ein und schränkt den Bildausschnitt - mit einer Halbtotalen beginnend und mit einer Großaufnahme von Gortschakows Händen, die die Kerze auf den endlich erreichten Beckenrand stellen, endend - im Laufe der Einstellung (durch unmerkliche Ranfahrten) sukzessive ein, was zur Folge hat, daß das Ziel erst ganz zum Schluß ins Bild kommt: Die ganze lange Einstellung hindurch bleibt deshalb ungewiß, wie weit der Held noch von ihm entfernt ist. Die Distanz, die Gortschakow zurücklegen muß, bevor die Kerze verlöscht, wird so durch Begleitfahrt, Perspektive und Aufnahmedistanzen als der entscheidende Gegenspieler des Helden ins Bild gesetzt: Sie erscheint, weil die Bilder das Ziel des Weges vorenthalten und weil Gortschakow, um die Flamme zu erhalten, sehr langsam gehen muß, Figur und Kamera also kaum vorankommen, schier unüberwindlich, ein Effekt, den die Überlänge der (durch die beiden Fehlversuche gezielt ausgedehnten) Einstellung verstärkt. Das Kameraverhalten gibt so dem Vorgang ein Gewicht, das in einem kalkulierten Widerspruch zu der offenkundigen Sinnlosigkeit steht, die er auf referentieller Ebene hat. Dieser Widerspruch fungiert hier als Allegoriesignal (vgl. Kap. VII): Er weist den Zuschauer an, den 'eigentlich' sinnlosen Vorgang auf einen 'uneigentlichen' Sinn hin zu befragen. 81
80 Es handelt sich hier also um eine zielgerichtete Objektbewegung, deren Ziel ein unbewegtes ist. Wo dieses Ziel seinerseits in Bewegung ist, entsteht das klassische Grundmuster von Flucht und Verfolgung. 81 Indem die Kamera den sinnlosen Vorgang ernst nimmt, stellt sie das den Vorgang als sinnlos qualifizierende Vemunfturteil in Frage, konfrontiert dessen Norm mit ihrem Gegenteil, mit der Auflehnung gegen die Setzungen der instmmentellen Vernunft, die hier schon der Sinn selbst ist, ja sogar den alleräußersten Sinn hat: Die Verabschiedung der instrumentellen Vernunft als leitender Nonn menschlichen Handelns soll die Erlösung der Welt, soll eine neue Heilsgeschichte begründen, die Domenico zum selben Zeitpunkt in Rom mit seinem Opfertod einzuleiten glaubt.
Kapitel II: Kameraverhalten
109
Blickfeld: Paradoxe Dynamik Obwohl (besser: gerade weil) sich das Tempo objektgebundener Kamerabewegungen dem der Objekte verdankt, bewahren diese Objekte selbst - auch bei hohem Bewegungstempo - immer etwas Statisches. Das liegt daran, daß das Blickfeld der Kamera bei objektgebundenen Kamerabewegungen einen konstanten Fokus, das Bewegungsobjekt, hat. Die doppelte und gleichsinnige Bewegungsaktivität macht das sich bewegende Objekt paradoxerweise zum ruhenden Pol des Bildes: Es scheint im Bild zu stehen, während seine (statische) Umgebung in Bewegung gerät. Das Tempo des Bewegungsobjekts erschließt sich daher allererst aus dem Tempo, mit dem seine unbewegte Umgebung durch das Bild fließt, und nur in zweiter Linie aus seinen Bewegungsformen (schreiten, gehen, laufen usw.). Deshalb sind, wo es um die Dynamik des Bewegungstempos gehen soll, Vorder- und Hintergründe - und damit Einstellungsgrößen und Perspektiven - von erheblicher Bedeutung. So hält z.B. die Kamera bei den rasanten Begleitfahrten in John Fords »Stagecoach« (USA 1939), die den Indianerüberfall auf die fahrende Postkutsche zeigen, den (horizontal durchs Bild fliegenden) Erdboden im Bildvordergrund (und dazu die Bewegungsform, die weit ausgreifenden Beine der galoppierenden Pferde) nach Möglichkeit im Auge: Die weite, flache Wüstenlandschaft, die nur am Horizont von einem Gebirgszug begrenzt wird, gibt ihr keinen anderen Anhaltspunkt, der als Parameter des Tempos in Frage käme. 82 Objektgebundene Kamerabewegungen haben demnach, was die Strukturierung des Blickfeldes betrifft, im wesentlichen die Aufgabe, den Bildfokus, das Bewegungsobjekt, ' ruhigzustellen ' und den umgebenden Raum in Bewegung zu versetzen, indem sie durch die 'Mit-Bewegung' für weitestgehende Konstanz der gewählten Aufnahmedistanz und damit des Verhältnisses von Ruhe und Bewegung, von ruhigen und beweglichen Bildfeldern sorgt. Die Position dieser ruhigen und beweglichen Bildfelder auf dem Bildausschnitt ist allerdings schon nicht mehr ihre Sache, sondern Sache der Einstellungsgrößen und Perspektiven.
82 Entsprechendes gilt selbstverständlich nicht nur für die Vermittlung rascher Bewegungen. Vgl. z.B. in István Szabós »Mephisto« (UNGARN/BRD 1981) die Szene, in der Hendrik Höfgen (Klaus Maria Brandauer) um Barbara Bruckner (Krystyna Janda) anhält. Hier sorgt ein geschickt gewählter Hintergrund - ein lichter Laubwald - dafür, daß die langsam (von links nach rechts) mitfahrende Kamera die ruhige, bestimmte Vorwärtsbewegung vermitteln kann, mit der Barbara den rückwärts vor ihr hergehenden Höfgen regelrecht vor sich hertreibt: Die regelmäßigen, ruhigen perspektivischen Verschiebungen der Baumstämme hinter beiden 'verbünden' sich mit Barbara, betonen den regelmäßigen, ruhigen Charakter ihrer Bewegung (wie ihrer Gemütslage) und geben damit einen wirkungsvollen Kontrast zur (gestisch und sprachlich vermittelten) Ruhelosigkeit des Helden.
110
Kapitel II: Kameraverhalten
Deren Variation innerhalb einer Einstellung ist zudem nur durch Kombinationen mit freien Kamerabewegungen möglich.83 Rezipientenperspektive: Identifikatorische Effekte objektgebundener Kamerabewegungen Die Konstanz des Bildfokus bei Begleitschwenk und Begleitfahrt unterstreicht die enge Bindung der Wahrnehmung und Raumerfahrung an das Bewegungsobjekt und darin die Tendenz objektgebundener Kamerabewegungen, die Differenz zwischen Subjekt und Objekt der Wahrnehmung durch ihre identifikatorischen Wirkungen zu verschleiern (vgl. S. 100). Dieser Effekt teilt sich, da Bildkommunikation auf der Identifikation der Wahrnehmungsposition des Rezipierten mit der des Bildsubjekts beruht, dem Rezipienten mit: Objektgebundene Kamerabewegungen laden zu unmittelbarer Identifikation mit dem Bewegungsobjekt ein. Auf die Unterschiede, die in dieser Hinsicht zwischen Begleitschwenk und Begleitfahrt bestehen, wurde schon hingewiesen (vgl. S. 104f.): Bei Begleitschwenks, bei denen sich die Mit-Bewegung auf die Blickbewegung beschränkt, wahrt der Erzähler - und mit ihm der Zuschauer - insofern seinen Subjektstatus, als er die Differenz zwischen sich und dem Objekt in seiner stationären Position aufrechterhält. Bei Begleitfahrten gibt er - und mit ihm der Zuschauer - auch diesen Beobachterstandpunkt auf, überläßt sich ganz den Bewegungen seiner Objekte, weshalb die identifikatorischen Effekte hier deutlich stärker sind, wie jede klassische Verfolgungsjagd veranschaulichen kann: Der Zuschauer registriert das Tempo nicht als das der Kamera, sondern, weil die Kamera sich und damit ihn mit dem Tempo der Objekte identifiziert, als das der Bewegungsobjekte und darin als seine eigene, bangt um Verfolger oder Verfolgte, weil er die Geschwindigkeit - als zu langsame oder zu schnelle - 'am eigenen Leib' zu erfahren meint. Objektgebundene Kamerabewegungen als Interaktionsverhalten Über diesen identifikatorischen Gestus objektgebundener Kamerabewegungen hinaus kann die Frage, inwieweit das Bewegungsverhalten der Kamera das Erzählerverhalten als Interaktionsverhalten charakterisiert, nur vage Anhalts83 Die in der Praxis häufige Kombination mit freien Kamerabewegungen ist daneben auch dem Umstand geschuldet, daB objektgebundene Kamerabewegungen Gefahr laufen, ihre Dynamik rasch zu verbrauchen, eben weil der Bildfokus konstant bleibt: Ihre Kombination mit freien Schwenks oder Fahrten schafft nicht nur die Möglichkeit, den Bildfokus zu verlagern, sondern kann auch hochkomplexe Bewegungsbeziehungen erzeugen, die die Dynamik und Dramatik eines Bewegungsablaufs erheblich steigern (vgl. dazu die eben erwähnte Sequenz aus »Stagecoach« in der die Kamera ihre Begleitfahrten in mehreren Einstellungen mit freien Schwenks und Ranfahrten verbindet).
Kapitel II: Kameraverhalten
111
punkte liefern, zumal hier auch der Rekurs auf Ergebnisse der Verhaltenspsychologie und Humanethologie wenig hergibt: Was die Formen des Fortbewegungsverhaltens zweier Interaktionspartner angeht, kennt die Verhaltenspsychologie nur den schon erwähnten Fall des 'Seite-an-Seite-Gehens' zweier oder mehrerer Menschen, den sie, wo er »Folge ihrer Verbindung oder ihrer Kooperation in einer Rolle ist«, als Ausdruck des 'Miteinander' qualifiziert. 84 Der bei Begleitfahrten aus seitlicher Perspektive nicht selten entstehende Eindruck, daß sich die Kamera mit ihrem Bewegungsobjekt solidarisiert, indem sie in gleichsinnigem Tpmpo neben ihm herfahrt, mag mit dieser Ausdrucksvalenz des 'Miteinander' zusammenhängen, leidet aber keine generalisierende Festschreibung. Ähnliches gilt für den Eindruck neugierigen Nachspionierens, den eine Verfolgungsfahrt häufig erweckt, oder für den Eindruck respektvollen Zurückweichens, den eine vor dem Bewegungsobjekt herfahrende Kamera erzeugen kann: Alle diese Valenzen können eine Rolle spielen, lassen sich aber nur im je konkreten Fall und im Rekurs auf den aktuellen Kontext als heuristische Ansatzpunkte interpretatorischer Hypothesenbildung beiziehen. 2.2
Freie Kamerabewegungen
Anders als bei objektgebundenen Kamerabewegungen teilt sich die SubjektObjekt-Struktur filmischer Bilder bei freien Kamerabewegungen demonstrativ mit, weil sich die Subjektivität des Wahrnehmungsaktes hier im freien 'Umherschauen' und 'Umhergehen' im Raum expressiv artikuliert (vgl. S. 100). Dabei ist allerdings zu beachten, daß diese expressive Subjektivität nicht zwingend auf das Erzählsubjekt zurückweist, sondern auch - bei perspektivierenden Erzählverfahren - als die einer Reflektorfigur vermittelt sein kann (vgl. Kap. IV). 8 5 Weil der Bewegungsakt bei freien Kamerabewegungen nicht von Objektbewegungen prädisponiert wird, spielen die objektbezogenen Kriterien (1 und 2) hier auch eine geringere Rolle als die Subjekt- und adressatenbezogenen Kriterien (3 und 5), die daher zuerst und hier nun gemeinsam behandelt werden, weil sich die adressatenbezogenen Funktionen hier ganz unmittelbar aus den subjektbezogenen Funktionen ergeben.
84 SCHEFLEN 1 9 7 6 , 4 2 ; v g l . a u c h KENDON 1 9 7 9 ; GOFFMAN 1 9 7 1 .
85 Freie Kamerabewegungen haben also nicht zwangsläufig zur Folge, daß das Interesse, wie Monaco meint, auf den Erzählakt selbst oder gar »vom Thema zum Filmemacher« verlagert wird (MONACO 1980,189).
112
Kapitel II: Kameraverhalten
Blickfeld und Rezipientenperspektive: Verlagerung oder Bündelung der Wahrnehmung Freie Kamerabewegungen liefern fließende Bilder: Bei Schwenks und Passierfahrten fließt das gesamte Blickfeld flächig durch das Bild, bei Ran- und Wegfahrten, bestimmt durch die Kongruenz von Blick- und Bewegungsachse der Kamera, fließt es - idealiter - vom Fluchtpunkt der Bewegung aus 'konzentrisch' nach allen Seiten aus dem Bild heraus oder umgekehrt in das Bild hinein und erzeugt dadurch die Illusion einer räumlichen, in die Bildtiefe oder von ihr weg führenden Fließbewegung. Bei Schwenks und Passierfahrten bewegt sich die Kamera an den Dingen vorbei, so daß Veränderungen von Einstellungsgrößen und Perspektiven durch Position und Größe der passierten Objekte Zustandekommen; bei Ran- und Wegfahrten dagegen verändert die Kamera selbst die Aufnahmedistanz, so daß sich die Objekte sukzessive vergrößern bzw. verkleinern, je näher sie dem Bildrand bzw. dem Bildzentrum kommen. Schwenks und Passierfahrten haben einen ständig wechselnden Bildfokus und verlagern damit die Aufmerksamkeit ununterbrochen von einem Objekt zum anderen; 86 Ran- und Wegfahrten haben einen konstanten Bildfokus - im idealtypischen Fall den Bildmittelpunkt - und bündeln damit die Aufmerksamkeit. Diese formalen Differenzen verweisen auf funktionale Differenzen, die hier nun allererst unter dem adressatenbezogenen Aspekt, als Verfahren der Informationsvergabe, grob qualifiziert werden sollen. Schwenks und Passierfahrten liefern, weil sie beständig die Gegenstände der Wahrnehmung wechseln, ununterbrochen neue Informationen, verlagern die Aufmerksamkeit der Kamera und damit die des Zuschauers sukzessive von einem Gegenstand zum nächsten. Wo es nur darum geht, die Aufmerksamkeit von einem Objekt zu einem anderen zu verlagern, also zwei Bilder 86 Nur in einem speziellen Fall gleichen sieb Ran- und Wegfahrten den Passierfahrten an, dann nämlich, wenn das von ihnen fixierte Objekt so groß und/oder so weit entfernt ist, daß sie es gar nicht merklich vergrößern oder verkleinern können: Eine den Horizont fixierende Ranfahrt etwa gewinnt insofern den Charakter einer Passierfahrt, als der immer gleich weit entfernt erscheinende Bildfokus die Aufmerksamkeit nicht zu bündeln vermag, die sich hier deshalb auch auf die konzentrisch aus dem Bild fließenden Bildfelder am rechten, linken und unteren Bildrand verschiebt. In der Schlußsequenz von Fritz Langs »Das Testament des Dr. Mabuse« (D 1933), wo die Flucht des irren Professor Baum (Oskar Beregi) vor Kommissar Lohmann (Otto Wernicke) mit einer nächtlichen Auto-Verfolgungsjagd gezeigt wird, werden neben Passierfahrten auch solche Ranfahrten eingesetzt, die eigentlich keine mehr sind: Im Bildmittelpunkt liegt dabei nämlich das nächtliche Dunkel, in dem die Straße jenseits der Reichweite der Auto-Scheinwerfer in der Bildtiefe versinkt, so daß sich die Aufmerksamkeit ganz auf die untere Bildhälfte konzentriert, wo die von den Scheinwerfern erhellte Straße und die Straßenränder mit Begrenzungspfählen und Chausseebäumen in rasantem Tempo auf den vom Bildzentrum ausgehenden Fluchtlinien zu den Bildrändern fließen.
Kapitel II: Kameraverhalten
113
miteinander zu verbinden, wird sich das in der Regel in einem vergleichsweise raschen Tempo niederschlagen: An die Stelle des Schnitts tritt die zwei Bilder verbindende Bewegung, für die der abgeschwenkte oder passierte Zwischenraum nicht als er selbst, sondern lediglich für die Vermittlung der Lageverhältnisse und der Distanz zwischen beiden Objekten von Interesse ist. 87 Wo es dagegen um diesen abgeschwenkten oder passierten Raum selbst geht, darum, den Raum zu erkunden, wird die Kamera ein deutlich geringeres Tempo anschlagen, um die ständig wechselnden Gegenstände und ihre Positionen im Raum genauer wahrzunehmen und damit dem Zuschauer Gelegenheit zu geben, die immer neuen Informationen zu verarbeiten.88 Ran- und Wegfahrten haben ihren maßgeblichen funktionalen Aspekt in dem konstanten Bildfokus, der zur Folge hat, daß sie, im genauen Unterschied zu Schwenks und Passierfahrten, die Aufmerksamkeit im Fluchtpunkt ihrer Bewegung bündeln. Die 'konzentrisch' von der Bildmitte weg- oder zu ihr hinfließenden Linien konzentrieren die Wahrnehmung auf das im Bildfokus befindliche Objekt und machen dessen sukzessive Vergrößerung oder Verkleinerung zum beherrschenden Bildthema. Wie bei Schwenks und Passierfahrten gibt auch hier das Tempo Aufschluß darüber, ob es nur um die Verbindung zweier Bilder geht, für die der durchfahrene Raum selbst nur als Distanz interessiert, oder ob auch der Weg selbst zum Thema der Einstellung gehört. In beiden Fällen aber ist die Veränderung der Einstellungsgrößen das beherrschende Thema: 89 Ran- und Wegfahrten dynamisieren den Wechsel der 87 Vgl. das unten (S. 116) genannte Beispiel aus »Monsieur Verdoux*. 88 Ein illustratives Beispiel für eine solche »Erkundungsfahrt« findet sich in Jean Renoirs »La grande illusion« (F 1937). Sie leitet den Mittelteil des Films ein, der in dem unter Rauffensteins (Erich v. Stroheim) Befehl stehenden Kriegsgefangenenlager »Wintersborn« spielt, indem sie Rauffensteins Quartier - die Kapelle einer als Gefangenenlager dienenden Burg - sorgfältig in Augenschein nimmt. Beginnend mit dem Blick auf ein großes, in der Apsis bangendes Kruzifix, schwenkt sie langsam abwärts zu dem darunter befindlichen Altar, auf dem ein Bildnis Hindenburgs steht, dann weiter abwärts auf das direkt vor dem Altar stehende Feldbett des Majors, wendet sich dann schwenkend nach rechts, wo ein alter Kirchenstuhl steht, der einer spärlich wachsenden Geranie als Blumenbank dient, und fahrt dann langsam rückwärts, den (aufsichtigen) Blick in spitzem Winkel nach rechts gerichtet, an zwei diagonal durchs Bild ziehenden Tischen vorbei, auf denen die Dinge liegen, mit denen der Major sich umgeben hat: ein Sektkübel, Bücher (Casanova, Heine), das Bildnis einer Frau und dann eine lange Reihe von soldatischen Utensilien (Feldstecher, Säbel, Koppelzeug usw.). Schließlich erfaßt sie den Burschen des Majors, der mit den weißen Handschuhen seines Herrn beschäftigt ist, und verfolgt im weiteren mit Begleitschwenks dessen Bewegungen, bis sie mit ihm zu dem Tisch gelangt, an dem der - bis dahin nur akustisch präsente - Major selbst sitzt und sein Frühstück einnimmt. Die lange Erkundungsfahrt liefert, indem sie die Einrichtung des Raums und die Dinge, mit denen Rauffenstein sich umgibt, sorgfältig und ausgiebig registriert, eine präzise Charakterisierung der Figur. Vgl. aber den in Anm. 86 genannten Ausnahmefall.
114
Kapitel II: Kameraverhalten
Ausschnittgrößen und zeigen damit als kontinuierlichen Prozeß, was die Montage sprunghaft vollzieht. Die funktionalen Kategorien, die oben für die zwischen Total- und Detailaufnahme sich erstreckende Skala formuliert wurden, sind demnach für die Funktionsanalyse von Ran- und Wegfahrten heranzuziehen, darunter hier nun vor allem die aus den entsprechenden Kriterien 3 und 5 abgeleiteten (S. 69-74). Für Ranfahrten steht dabei die explikative Funktion, die mit der zunehmenden Annäherung zunehmende Differenzierung der Informationen, im Vordergrund: Ranfahrten schränken das Blickfeld sukzessive ein (Weite vs. Enge), intensivieren die Wahrnehmung (Extensität vs. Intensität), spezifizieren - vom Raumzusammenhang zum Einzelding voranschreitend (Übersicht vs. Detail information) - zunehmend ihre Informationen (hohçr vs. geringer Spezifikationsgrad) und kommen dabei unter Umständen auch von eher typisierenden zu individualisierenden Aussagen über ihre Objekte (Typisierung vs. Individualisierung). Für Wegfahrten gilt dasselbe in umgekehrter Abfolge. Eine der für Einstellungsgrößen benannten funktionalen Kategorien aber ist hier fehl am Platze: Die die Steuerung der Zuschauerwahrnehmung betreffende Opposition von direkter vs. indirekter Lenkung (S. 72) findet hier keine Entsprechung, denn die Lenkung der Wahrnehmung ist bei Ran- und Wegfahrten in jedem Fall gleichermaßen direkt. Das liegt an der Konstanz des Bildfokus, an der Zielgerichtetheit der Kamerabewegung: Bei einer Ranfahrt aus der Halbtotalen in die Nahaufnahme etwa hat die Kamera - sofern sie nicht zusätzlich schwenkt - ihr Zielobjekt von Anfang an im Blick, lenkt die Aufmerksamkeit des Zuschauers also auch schon bei halbtotaler Entfernung auf dieses Ziel und reduziert damit das Interesse für dessen Umgebung. Und umgekehrt hat sie bei einer Wegfahrt aus der Nahaufnahme in die Halbtotale den Gegenstand des Interesses so eindeutig definiert, daß er auch dann noch im Zentrum der Zuschauerwahrnehmung bleibt, wenn sich die Kamera schon in größerer Entfernung befindet. Das heißt nicht, daß der das Zielobjekt umgebende Raum funktionslos wäre (vgl. dazu den Abschnitt Objektbeziehungen'), sondern nur, daß die dezentrierende, die Zuschauerwahrnehmung auf das gesamte Bild gleichmäßig verteilende Funktion großer Bildausschnitte durch die bei Ran- und Wegfahrten entstehende Bündelung der Aufmerksamkeit weitestgehend entfällt. Objekteigenschaften: Motivierung freier Kamerabewegungen Freie Kamerabewegungen werden zwar nicht von den Bewegungen der Objekte, wohl aber von deren Größe und Lage im Raum prädisponiert, sind also immer auch den für Einstellungsgrößen und Kameraperspektiven erörterten
Kapitel II: Kameraverkalten
115
Voraussetzungen unterworfen, 90 die hier nicht eigens zu wiederholen sind (vgl. Kap. B.2, C.2). Besonders hinzuweisen ist dagegen auf die Rolle der Objekte als möglicher Auslöser explizit motivierter freier Kamerabewegungen. 91 Typische Motivationen dieser Art sind auffällige optische oder akustische Signale: Ein akustisches Signal aus dem Off, eine auffallige Form, Farbe, Bewegung usw. im Bildhintergrund können einen Schwenk oder eine Fahrt motivieren und diesen Bewegungen damit den Charakter reagierenden Wahrnehmens geben, der sie dem Charakter objektgebundener Kamerabewegungen insofern annähert, als er den 'auktorialen' Gestus abmildert, der freien Kamerabewegungen anhaftet (vgl. S. 100): Solchermaßen motivierte Bewegungen illusionieren einen ('eingeschränkten') filmischen Erzähler, der nicht planvoll, sondern ad hoc auf die Ereignisse zu reagieren, also die Geschichte als ganze noch nicht zu übersehen scheint, sondern seine Wahrnehmungstätigkeit wie ein neutraler Beobachter, der zufallig Zeuge eines Geschehens wird, von den Vorgängen leiten läßt.92 Einen besonderen Fall solcher Motivierung stellen figurenperspektivisch begründete Kamerabewegungen dar. Dabei registriert die Kamera in der Regel zunächst ein akzentuiertes, gerichtetes Wahrnehmungsverhalten der Reflektorfigur (Aufblicken, Aufhorchen, sich Umwenden etc.), um dann (zumeist nach einem Schnitt) die Blickbewegungen der Figur nachzuvollziehen (vgl. dazu Kap. IV.B). Objektbeziehungen: Explizite Relationierung Anders als Ran- und Wegfahrten, die in erster Linie die (Entfernungs-) Beziehung zwischen Subjekt und Objekt des Bildes betonen, sind Schwenks und Passierfahrten geeignet, Beziehungen zwischen den Objekten, zwischen Orten, Dingen, Figuren zu thematisieren. Ihre Unabhängigkeit vom Raumverhalten der Objekte verschafft ihnen eine Fülle von Möglichkeiten, solche 90 So setzt z.B. ein Schwenk, der von der Halbnahaufnahme einer Figurengruppe in die Großaufnahme einer außerhalb des Blickfeldes befindlichen Figur fuhren soll, einen präzise kalkulierten Standort voraus, der von den erforderlichen Aufnahmedistanzen zu beiden Objekten bestimmt wird. 91 Vgl. Arnn. 70. 92 Wo solches Kameraverhalten stilbildende Funktion hat, läßt es auf einen Erzähler schließen, der auf die Repräsentationskraft der sichtbaren Welt vertraut und deshalb in der Anschauung ihrer Erscheinungen, nicht in deren kommentierender Bearbeitung, seine Hauptaufgabe erblickt. Daß z.B. motivierte Kamerabewegungen in Jean Renoirs »La grande illusion« (F 1937) eine wesentliche Rolle spielen, ist denn auch ein deutlicher Indikator für die enge Bindung dieses Films an Erzählkonzept und Realitätsmodell des poetischen Realismus. Vgl. etwa die Szene in der Paketausgabe (im ersten Gefangenenlager): Sämtliche Kamerabewegungen sind hier entweder objektgebunden oder motiviert, lenken mithin die Aufmerksamkeit des Zuschauers von sich ab, um sie ganz auf die dargestellte Welt zu konzentrieren.
116
Kapitel Ii: Kameraverhalten
räumlichen Beziehungen herzustellen, wobei 'herstellen' hier ganz wörtlich zu nehmen ist, denn bei freien Kamerabewegungen geht es um Beziehungen, die nicht, wie bei objektgebundenen Kamerabewegungen, von den Objekten, sondern vom Erzähler hergestellt, von ihm 'gesehen' werden. Deshalb kann die Kamera hier auch Relationen zeigen, von denen die Figuren selbst nichts wissen: Die topischen Schwenks vom nichtsahnenden Passanten auf den hinter der nächsten Hausecke lauernden Räuber, von der einsamen Postkutsche auf die ihr auflauernden Banditen, die ihre Wirkung aus der Ahnungslosigkeit des potentiellen Opfers beziehen und den Zuschauern einen Informationsvorsprung einräumen, gehören hierher. Wie bei objektgebundenen Kamerabewegungen geht es dabei auch hier zunächst und grundsätzlich um Entfernungsbeziehungen: Der Schwenk vom ahnungslosen Opfer auf den Täter markiert die Distanzverhältnisse, aus denen sich die bedrohliche Situation ergibt. Jede durch Kamerabewegungen hergestellte Raumbeziehung ist allererst eine Beziehung der Distanz. Das heißt freilich nicht, daß sich ihr Inhalt darin erschöpft. Vielmehr eröffnet die Vermittlung solcher Distanzbeziehungen ein weites Feld für die Semantisierung des Raumes, die sich das Nebeneinander der Dinge im Raum für die Bedeutungskonstitution zunutze macht.93 Auch dabei spielt das Bewegungstempo eine maßgebliche Rolle, kann dem Bewegungsakt z.B. den Charakter eines ruhigen und genauen Notiznehmens oder auch - bei hohem Bewegungstempo - den Charakter einer expliziten, 'auktorialen' Deixis geben: Der rasche Schwenk beispielsweise, mit dem die Kamera in Chaplins »Monsieur Verdoux« (USA 1944/46) die gelähmten Beine der Frau erfaßt, die Verdoux (Charles Chaplin) so unvermutet herzlich umarmt, qualifiziert das Nebeneinander zweier Sachverhalte - die überraschend echte Herzlichkeit des Heiratsschwindlers und das Gebrechen der Frau - durch die ausgeprägte Deixis des Schwenks als moralischen Zusammenhang und erzeugt damit - für den Zuschauer ganz unverhofft - einen Widerspruch zwischen der Mitleidlosigkeit und Kälte, womit Verdoux seine diversen Frauen umbringt, und der Wärme, die er dieser Frau entgegenbringt. Die räumliche Nachbarschaft zwischen beiden Sachverhalten ist hier zunächst nur die technische Bedingung dafür, daß die Kamera diesen Zusammenhang benennen kann, ohne einen Schnitt machen zu müssen: Deiktische Kamerabewegungen dieser Art sind ein funktionales Äquivalent für die kommentierende Montage (vgl. Kap. 93 Vgl. etwa die oben (Anm. 88) erwähnte Passierfahrt aus Renoirs »La grande illusion«, mit der die Kamera Rauffensteins Quartier sorgfältig in Augenschein nimmt: Indem sie das räumliche Nebeneinander heterogener Dinge (Kruzifix und Altar, Hindenburg und Feldbett; Geranie und Sektkübel; Casanova und Heine) beschreibt, beschreibt sie zugleich den Zerfall des homogenen standesethischen Selbstentwurfs des Aristokraten, bringt das Nebeneinander heterogener Normen und Selbstdeutungsmuster der Figur im räumlichen Nebeneinander ihrer Requisiten sinnlich zur Anschauung.
Kapitel 11: Kameraverhalten
117
III.D.). Die grundlegenden ästhetischen Differenzen zwischen Kamerabewegung und Schnitt, von denen eingangs die Rede war, bleiben indes auch hier erhalten: Die Kamerabewegung postuliert den Zusammenhang der Dinge als einen den Dingen immanenten, indem sie ihn als einen räumlichen abbildet; die Montage formuliert ihn als einen abstrakten, mentalen, indem sie die Dinge neu 'zusammensetzt'. Ran- und Wegfahrten thematisieren, wie gesagt, in erster Linie die Beziehung zwischen Bildsubjekt und Objekt im Akt der Annäherung oder Distanzierung als Entfernungsbeziehung. Ihr Beitrag zur Explikation der räumlichen Relationen, in die sie ihr Zielobjekt eingebunden sehen, ergibt sich denn auch folgerichtig aus den diesbezüglichen Funktionen der Einstellungsgrößen (Kap. II.B.2): Ranfahrten isolieren ihr Zielobjekt sukzessive von ihren räumlichen Bezügen und verlagern den Schwerpunkt von Aspekten der Interaktion von Objekt und Raum auf solche der eher selbstbezüglichen Aktion. Wegfahrten dagegen integrieren ihren Bildfokus sukzessive in seine Umgebung und verlagern den Akzent entsprechend auf Aspekte der Interaktion von Objekt und Raum. Das Bewegungstempo gibt dabei unter Umständen Aufschluß über den Grad des Interesses an solchen Raumbezügen. Eigenbewegung: Explizite Thematisierung der Subjekt-Objekt-Relation filmischer Bilder Für eine auf menschliches Interaktionsverhalten (Kriterium 5) rekurrierende funktionale Qualifizierung freier Kamerabewegungen spielt das Bewegungstempo die herausragende Rolle. Bei Schwenks und Passierfahrten erschließt es sich in dieser Hinsicht als ein spezifischer Indikator für die Beziehung des Bildsubjekts zu dem von ihm abgeschwenkten oder durchfahrenen Raum. Daß ein rasches Tempo eher oberflächliches, ein langsames Tempo eher detailliertes Interesse an den passierten Objekten anzeigt, ist evident.94 Das Bewegungstempo ist demnach ein Gradmesser für die - wie auch immer geartete Bedeutung, die das Bildsubjekt seinen Wahrnehmungen beimißt, und liefert der Interpretation filmischer Bilder deshalb einen wesentlichen Ansatzpunkt. Über diesen allgemeinen Aspekt hinaus, bleibt die Funktionsbestimmung des Bewegungstempos im Horizont menschlichen Interaktionsverhaltens eine Sache der je kontextspezifischen Interpretation. Denn die Bedeutungsvielfalt, die sich in dieser Hinsicht aus dem Vergleich mit menschlichem Wahrnehmungs- und Bewegungsverhalten ergibt, läßt sich analysetheoretisch nicht 94 So signalisiert z.B. die oben (Anm. 88 und 94) erwähnte, sehr langsame und sorgfältig alle Dinge studierende Passierfahrt aus Renoirs »La grande illusion« aufmerksames Interesse, das bei einem zügigeren Tempo umschlagen würde in einen Gestus oberflächlichen Notiznehmens.
118
Kapitel II: Kameraverhalten
festschreiben. So können sehr langsame Bewegungen beispielsweise auch Zögern, Furcht (etwas anzuschauen), Vorsicht, Respekt und vieles andere konnotieren, rasche Bewegungen umgekehrt Neugier, Ungeduld, Schrecken, Begierigkeit usw. Daß Deutungen dieser Art, zumal sie sich nicht im Rekurs auf Ergebnisse der Verhaltenspsychologie und Humanethologie legitimieren können, umsichtiger Begründungen bedürfen, versteht sich von selbst. Deutlich einfacher sind solche Begründungen dort, wo die Kamerabewegungen figurenperspektivisch motiviert sind, weil hier die Wahrnehmungssituation der Figur, aus der sich das Bewegungstempo ableitet, in der Regel schon geklärt ist: Einfache äußere Umstände (die Figur geht zu Fuß, fahrt in einem Auto, ist in Eile, ist müde, verletzt, betrunken usw.) können das Bewegungstempo der Kamera hier ebenso motivieren wie psychische Befindlichkeiten der Figur (z.B. Interesse/Desinteresse, Angst, Ungeduld, Neugier, Erregung, Depression usw. usf.). Über Ran- und Wegfahrten ist, bezogen auf Aspekte des Interaktionsverhaltens, zunächst zu sagen, daß sie jene Funktionen dynamisieren, die für die Einstellungsgrößen erörtert wurden: Als Akte der Annäherung oder Distanzierung lassen sie sich gleichermaßen auf die entsprechenden Formen menschlichen Distanzverhaltens beziehen, von denen schon die Rede war (vgl. S. 74-77). Da sich dieses Distanzverhalten hier aber in actu vollzieht, ist das Tempo auch hier von besonderer Bedeutung. Anders als bei Schwenks und Passierfahrten, ist die Frage nach dem Grad des Interesses und der Aufmerksamkeit, die das Bildsubjekt seinen Objekten entgegenbringt, dabei allerdings von eher sekundärer Bedeutung, weil die Aufmerksamkeit hier in der Regel schon gebündelt, auf das im Bildfokus befindlichen Objekt gerichtet ist und damit immer schon ein spezifisches Interesse signalisiert. Das Tempo von Ran- und Wegfahrten expliziert vielmehr den Modus der Annäherung95 oder
95
Als Beispiel sei hier eine rasche Ranfahrt aus der Eingangssequenz von Gustav Ucickys Kleist-Verfilmung »Der zerbrochene Krug« (D 1937) genannt: In der ihr vorangehenden Einstellung sitzt der von der nächtlichen Prügelei zerschundene Dorfrichter Adam (Emil Jannings) schlaftrunken auf der Bettkante, entdeckt dann seine Wunden, begutachtet sie mit schmerzverzerrtem Gesicht und heftet dann plötzlich, nach vorn an der Kamera vorbeischauend, seinen Blick auf etwas, das außerhalb des Bildes liegt. Die Kamera wechselt in der nachfolgenden Einstellung in seine Perspektive, zeigt den Gegenstand seines Interesses, ein mit Brot, Wurst, Käse und einer Schnapsflasche beladenes Frühstückstablett, und fahrt dann sehr rasch aus der Halbnahen in die Detailaufhahme der Schnapsflasche. Das hohe Tempo dieser figurenperspektivisch motivierten Ranfahrt notiert keine äußere, sondern eine innere Bewegung, die Begierde des trinkfreudigen Dorfrichters, die er denn auch in der darauffolgenden Einstellung mit einem kräftigen Schluck aus der Flasche stillt.
Kapitel II: Kameraverhalten
119
Distanzierung. 9 6 Nun sind Annäherung und Distanzierung aber Verhaltensformen, die ein ganzes Bündel von Bedeutungen bergen, und folglich ist auch deren Tempo hochgradig vieldeutig, 97 ist also auch hier eine Sache der je kontextbezogenen Interpretation. 2.3
Scheinfahrten: Zoom
Seit ungefähr dreißig Jahren arbeitet die Kinematographie verstärkt mit Zoom-Objektiven (Transfokatoren), deren von der kurzen Brennweite des Weitwinkelobjektivs bis zur langen Brennweite des Teleobjektivs reichende Spannbreiten die Möglichkeit eröffnen, Ran- und Wegfahrten mit einer stationären Kamera zu simulieren. Zoom-Aufnahmen sind deshalb nicht selten - im Fernsehen zumal - Resultat pragmatischer Überlegungen, bloßer Ersatz für die zeit- und kostenaufwendigeren Fahraufnahmen. Zoomaufnahmen verändern die Bildwirkung beträchtlich, 98 darunter insbesondere die für Ranfahrten typische Illusion einer in die Bildtiefe führenden Bewegung. Denn der Zoom nimmt den Bildern die Tiefenwirkung, verflacht sie und gibt der scheinbaren Ranfahrt dadurch eine merkwürdige Distanz: »Wir scheinen uns in größere Nähe zu begeben, ohne wirklich näher zu kommen, und das ist verwirrend, da wir im wirklichen Leben keine solche Erfahrung zum Vergleich haben«. 99 Wenn also beim Zoom die Tiefenwirkung, die Entfernung zwischen Kamera und Objekt und die Größen- und Distanzverhältnisse zwischen den Objekten stark nivelliert bzw. 'verzerrt' werden, wird man davon auszugehen haben, daß er - sofern er nicht bloß als kostengünstige Vgl. die berühmte Szene aus Hitchcocks »Frenzy« (USA 1971), in der das Bannädchen Babs (Anna Massey) mit dem Gemüsehändler Bob Rusk (Barry Foster) in dessen Wohnung geht, ein für den Zuschauer höchst alarmierender Vorgang, denn zu diesem Zeitpunkt liegt schon die Annahme nahe, daß Rusk der gesuchte Frauenmörder sein könnte. Die Kamera begleitet beide von der Straße durchs Treppenhaus bis zur Wohnungstür, verharrt einen Moment und fährt dann sehr langsam denselben Weg mit rückwärts gerichtetem Blick zurück: durchs Treppenhaus, durch den Hauseingang bis zur gegenüberliegenden Straßenseite. Der Kontext gibt diesen (mit Passierfahrten kombinierten) Wegfahrten den Charakter entsetzten und doch (angezeigt durch Perspektive und Tempo) vom Ort des Verbrechens gebannten, nur mühsam von ihm wegfindenden Zurückweichens, mit dem der Erzähler kundgibt, daß sich hinter der Wohnungstür mutmaßlich etwas 'unnennbar' Grauenhaftes abspielt, das zu zeigen er sich außerstande sieht. 97 Wer sich einem Ort oder einem Menschen schnell oder langsam annähert bzw. sich schnell oder langsam von ihm entfernt, kann Böses oder Gutes im Sinn haben, Sehnsucht oder Zorn, Respekt oder Widerwillen, Freude oder Angst empfinden, ruhig oder ungeduldig sein usw. 9« Vgl. MONACO 1 9 8 0 , 1 8 8 , 190f.
99 Ebd. 188. - Dennoch ist es in vielen Fällen, vor allem bei kurzen Einstellungen, sehr schwierig zu entscheiden, ob gezoomt oder gefahren wurde (vgl. dazu die Abbildung ebd. 190).
120
Kapitel II: Kameraverhalten
ger Ersatz von Fahrten fungiert - immer da eingesetzt wird, wo es dem Bildsubjekt um Effekte geht, die sich gerade aus diesen Defiziten des Zooms gegenüber echten Fahrten ergeben, so etwa um die distanzierende Wirkung des flächigen Bildes, das die Kamera und damit den Zuschauer gewissermaßen aus dem Raum der erzählten Geschichte ausschließt, um die Unwirklichkeit der Annäherung oder Entfernung, die von erheblicher Wirkung sein kann,100 um die bildkompositorischen Effekte des flächigen Bildes und deren wirkungsvolle Variation (vor allem durch schnelle Zooms)101 oder auch nur um die Möglichkeit, in hohem Tempo zu 'fahren', ohne dabei Vibrationen in Kauf nehmen zu müssen.102 Wo der Zoom nur deshalb der Fahrt vorgezogen wird, weil er billiger ist, ist er insofern aufschlußreich, als er damit in direkte Opposition zur Montage tritt, die als billigere Alternative zur Kamerafahrt ihrerseits keine geringe Rolle spielt: Der Zoom kann unter solchen Umständen ein Mittel sein, Schnitte zu vermeidend verweist also auf das Interesse des filmischen Erzählers, die Kontinuität von Raum und Zeit einer Szene zu betonen.
E. Einstellungslänge Die Dauer der Einstellungen spielt nicht nur für Fragen der durch die Montage geregelten Bildrhythmik und Zeitstrukturierung eine Rolle, sondern ist als potentiell eigenständige Variable des Kameraverhaltens anzusprechen, als das sie hier grob skizziert sei. Sie ist eine relative Größe: Eine Einstellung von fünf Sekunden Länge kann unter Umständen 'lang', eine Einstellung von zwanzig Sekunden dagegen 'kurz' erscheinen.104 Das liegt an der wechseln-
100 Vgl. das von SIEGRIST 1986, 172 zitierte Beispiel aus »Little Big Man« (USA 1970), wo Sunshine (Amy Eccles) um ihr Leben rennt, dabei aber - wie der Zoom suggeriert - nicht vorwärtszukommen scheint. ιοί Vgl. die bei MONACO 1980, 77 abgebildete Standvergrößerung aus Jean-Luc Godards »Loin de Vietnam« (F 1967), wo der schnelle Zoom die Flächen und Linien des Bildes so sehr verwischt, daß sie vom Bildzentrum aus 'auseinanderzuspritzen' scheinen. 102 Vgl. weitere Überlegungen zu potentiellen semantischen Funktionen von Zooms bei SŒGRIST 1986, 17 I f . 103 v g l . BAWD EN 1981, Bd. 3 , 7 8 0 .
104 Das übersehen FAULSTICH/FAULSTICH (1977), wenn sie das Kriterium der Kürze oder Länge einer Einstellung aus der durchschnittlichen Einstellungslänge des jeweiligen Films ableiten. Erst bei der Klassifikation der solchermaßen als 'lang' bestimmten Einstellungen (die 'kurzen' Einstellungen werden summarisch als Mittel des Spannungssteigerung qualifiziert) führen sie das Kriterium der Relation von Dauer und Komplexität der Einstellung
Kapitel II: Kameraverhalten
121
den Korrelation zwischen Dauer und Komplexität der Bilder, die hier denn auch das maßgebliche Kriterium einer allgemeinen Funktionsbestimmung liefert: 105 Setzt man für den Normalfall referentiellen Abbildungsverhaltens eine recht genaue Korrelation zwischen der Länge einer Einstellung und der Komplexität des abgebildeten Sachverhalts an, geht also davon aus, daß die Einstellung im Normalfall so lange dauert, wie Bildsubjekt/Rezipient brauchen, um die wesentlichen Informationen des Bildes (und des Tonkanals) zu rezipieren, dann entsteht ein Begründungsbedarf immer dann, wenn diese Dauer unter- oder überschritten wird. Unterschreitungen der für die ausreichende Rezeption eines Bildes notwendigen Einstellungsdauer erzeugen referentielle Defizite, deren potentielle Funktionen außerordentlich vielfältig und zudem kontextabhängig sind, hier deshalb auch nicht systematisch zu erfassen sind. Sie lassen sich zunächst und allgemein als das Wahrnehmungsverhalten eines Bildsubjekts beschreiben, das sich scheut, seinen Gegenstand genauer in Augenschein zu nehmen, ein Gestus, der insbesondere bei figurenperspektivischen Abbildungsverfahren als Nachahmung figuralen Blickverhaltens eine Rolle spielt.106 Ähnliche Funktionen können verkürzte Einstellungen für die Vermittlung von Innerlichkeit übernehmen: Extrem kurze Einstellungen können beispielsweise das plötzliche 'Aufblitzen' eines Gedankens, einer Erinnerung u.ä. visualisieren. Derselbe Sachverhalt läßt sich freilich auch als Akt einer kalkulierten Reduktion der Bildinformationen kategorisieren, die es darauf anlegt, den Bildgegenstand nur zu 'nennen', ihn nicht als individuelles Einzelding zu würdigen, sondern nur typisierend zu identifizieren. In diesem Gestus bloßer 'Benennung' liegt eine der Möglichkeiten des Films, die Vor-Begrifflichkeit der Bildersprache (vgl. Kap. I.A.2) zu kompensieren: Die Verkürzung kann unter bestimmten Umständen signalisieren, daß es hier nicht um dieses individuelle Ding selbst, sondern um den 'Begriff von ihm gehen soll. In der Regel wird dieses Signal allerdings erst durch die Häufung mehrerer solcher kurzen Einstellungen, also durch die Montage, verständlich und fungiert dabei zumeist als metalogisches Signal (vgl. Kap. VII.B.2), das den Rezipienten auf uneigentliche Bildbedeutungen hinweist (vgl. auch Kap. III.D). 107 ein (75), ohne zu sehen, daß dieses Kriterium die vorgängige, chronometrischen Weiten folgende Klassifikation von 'lang' und 'kurz' widerlegt. 105 Vgl. dazu den Abschnitt über »Tempo und Rhythmus« bei REISZ/MILLAR 1988, 162-166. 106 So reproduzieren z.B. in »The Graduate« (USA 1967) extrem kurze Nah-, Groß- und Detailaufnahmen die scheuen Blicke des Benjamin (Dustin Hoffmann) auf Mrs. Robinsons nackten Körper. 107 in Wsewolod Pudowkins »Desertir« (UDSSR 1933) endet beispielsweise die Szene, in der die streikenden Hamburger Hafenarbeiter von der Polizei zusammengeschossen werden, mit einer z.T. im Wirbelschnitt gearbeiteten Montage von extrem kurzen Aufnahmen des
122
Kapitel 11: Kameraverhalten
Überschreitungen der für die Rezeption eines Bildes nötigen Einstellungslänge erzeugen referentielle Redundanzen, deren potentielle Funktionen ihrerseits außerordentlich vielfältig und aufgrund ihrer Kontextbedingtheit einer systematischen Erfassung nicht zugänglich sind. Sie lassen sich zunächst und allgemein als das Wahrnehmungsverhalten eines Bildsubjekts beschreiben, das sich von seinem Wahrnehmungsobjekt nicht 'losreißen' kann, ein Gestus, der ebenfalls eine besondere Rolle bei figurenperspektivischen Bildern spielt als Vermittler figuralen Blickverhaltens und darin von Innerlichkeit (z.B. verlangsamter Wahrnehmung oder Erinnerung, Fassungslosigkeit, innerer Ruhe u.v.m.). Vor allem aber spielen überlängte Einstellungen - ebenso wie verkürzte - eine zentrale Rolle für die Vergabe metalogischer Signale und damit für die Konstitution uneigentlicher Bilderrede (vgl. Kap. VII): Ihre auffälligen referentiellen Redundanzen operieren mit der Erwartungshaltung pragmatischen Textverstehens, das ein hinreichend genau wahrgenommenes Ding als 'verstanden' kategorisiert und deshalb den insistierenden Kamerablick als Infragestellung dieses Verstehens erfahrt. Das heißt: Die Überlänge erzeugt beim Zuschauer Unsicherheit darüber, ob er das Bild richtig verstanden hat und bewegt ihn damit zur Suche nach weiteren Bedeutungen des Bildes. 108
feuerspeienden Rohrs eines Panzerfahrzeugs, fallender Arbeiter und (etwas längeren) Aufnahmen eines alten Arbeiters, der wahnsinnig vor Zorn auf den Panzer zuläuft. Diese Schnittechnik dient nicht nur der Rhythmisierung, die das hochdramatische Geschehen zusätzlich markiert. Gibt schon die extreme Verkürzung der Bilder selbst kund, dafl es hier nicht nur um dem Vorgang als solchen geht, so nötigt die Häufung dieser extrem verkürzten Bilder vergleichbaren Inhalts den Zuschauer, vom erzählten Einzelfall zu abstrahieren und das Allgemeine des Vorgangs 'auf den Begriff zu bringen' : Ohnmacht und Leid der Vielen, Macht und Mitleidlosigkeit des (mit dem einzelnen Panzerfohrzeug apostrophierten) Einen, Menschlichkeit hier, kalte Anonymität dort, ios So nötigt z.B. in Tarkowkijs »Nostalghia« (I 1983) ein langer Kamerablick auf Domenicos (Erland Josephsons) Hände, die Gortschakow (Oleg Jankovsky) Brot und Wein reichen, dazu, die uneigentliche (sakramentale) Bedeutung des Vorgangs zu entschlüsseln, und verschafft sich damit zugleich die Möglichkeit, Gortschakows Blindheit zu verdeutlichen: Der Held reagiert, Domenico mit dem Wein zuprostend, ganz 'pragmatisch' auf den eucharistischen Akt, nämlich wie auf eine freundliche Bewirtung, bleibt also der referentiellen Bedeutung des Vorgangs verhaftet, über dessen allegorische Bedeutung die Kamera ihre Zuschauer soeben aufgeklärt hat.
Kapitel III Montage: Verfahren der filmischen Textbildung
A. Vorüberlegungen Die Filmtheorie räumt der Montage traditionsgemäß eine deutliche Vorrangstellung vor den übrigen Konstituenten filmischer Kommunikation ein, vor der Kameraarbeit zumal. Der Grund für diese Gewichtung ist weniger in der Sache selbst als vielmehr in filmtheoretischen Denktraditionen und den in ihnen virulenten ästhetischen Normen zu suchen: Wie schon im Jahrhundert zuvor die Photographie, so stand auch der Film seit seinen Anfängen im Bann und unter dem Legitimationsdruck eines Kunstbegriffs, der der mechanischen Reproduktion von Welt keinen Kunstcharakter zuerkennen wollte. Der Verweis auf die in der Montage geleistete 'kompositorische' Arbeit lieferte lange Zeit (und z.T. noch heute) das entscheidende legitimatorische Argument, das, indem es einen die Reproduktion übersteigenden Vorgang der 'originalen' künstlerischen Komposition und in deren 'Originalität' zugleich ein sie hervorbringendes künstlerisches Subjekt postulierte, den Kunstcharakter des Films sicherstellen sollte. Dieser implizit legitimatorischen Argumentation und dem ihr immanenten Kunstbegriff ist filmtheoretische Reflexion seit den frühen Tagen des Kinos verpflichtet. So verstieg sich etwa Pudowkin zu der Behauptung, »daß jeder Gegenstand, der nach einem bestimmten Gesichtspunkt aufgenommen und dem Zuschauer auf dem Bildschirm gezeigt wird, tot ist, auch wenn er sich vor der Kamera bewegt hat«, und betrachtete das bei den Dreharbeiten gewonnene Filmmaterial als bloße photographische »Naturkopie«, als »Rohmaterial«, aus dem erst »durch den Aufbau, die Montage, die eigentliche Bewegung in der Komposition der verschiedenen Einstellungen entsteht«, 1 ein Diktum, das nach den form- und funktionsanalytischen Untersuchungen des letzten Kapitels (II) keiner gesonderten Widerlegung mehr bedarf. Gleichwohl hat diese Überschätzung der Montage eine bis heute wirksame filmtheoretische Tradition gestiftet: Seit die Protagonisten des frühen russischen Kinos die weitreichenden Möglichkeiten der Montage, ihre Funktion für das »Aufdecken und Aufklären von Zusammenhängen zwischen Erschei-
i
pudowkin 1961, 9.
124
Kapitel ill: Montage
nungen des realen Lebens«2 erkannten und sie - als das »stärkste Kompositionsmittel« des Films3 - zur »Grundlage der Filmkunst«4 und »Schöpferin filmischer Wirklichkeit«5 erhoben, sah und sieht sich die Filmtheorie in ihrer Hoch- und Überschätzung der Montage legitimiert,6 die mit einer Unterschätzung der übrigen kinematographischen Gestaltungsmittel einhergeht. Einsprüche gegen solche Bindung an eine frühe Phase der filmischen Theoriebildung (und deren Kunstbegriff) vermochten dagegen wenig: Daß, seit die Kamera beweglich wurde, das »Aufdecken und Aufklären von Zusammenhängen zwischen Erscheinungen des realen Lebens« durchaus kein Privileg der Montage mehr ist, hatte Bazin schon in den fünfziger Jahren nachdrücklich ins Bewußtsein gerückt und an Filmen illustriert,7 die Pudowkins Verdikt über die »vielen naiven Regisseure«, die die Aufnahme mit bewegter Kamera für einen »Ersatz der Montage« halten,8 ebenso als Resultat einer historisch gebundenen Perspektive enthüllen wie die sie perpetuierende Filmtheorie.
1.
»Filmsyntax«
Mit der Hoch- und Überbewertung der Montage entstand auch die Metapher des »Filmsatzes« und der »Syntax des Films«. Seit die frühen Theoretiker des Kinos diese beiden Begriffe in die Diskussion brachten,9 ist die Vorstellung, es handele sich bei der - zweifellos als Textbildungsverfahren anzusprechenden - Montage filmischer Einstellungen um einen den Satzbildungsverfahren der Wortsprache vergleichbaren Vorgang und folglich bei den Regeln, denen die Montage folgt, um ein syntaktisches Regelsystem, fester Bestandteil der filmtheoretischen Reflexion, den die neuere Filmsemiotik zu der Behauptung radikalisiert hat, die »Syntax« sei überhaupt die »zentrale Komponente einer Theorie der filmischen Formen«, ihre Rekonstruktion daher die vordringliche
2
PUDOWKIN 1 9 7 9 , 8 0 .
3
EISENSTEIN 1 9 3 4 , 6 1 .
4
PUDOWKIN 1 9 6 1 , 7 .
S
E b d . 11; v g l . EISENSTEIN/PUDOWKIN/ALEXANDROW 1 9 2 8 , 4 2 ; EISENSTEIN 1 9 2 6 , 1 3 8 .
6
Vgl. z.B. die ausdrücklichen Rekurse auf die diesbezügliche filmtheoretische Tradition bei MÖLLER 1 9 8 6 , 4 - 7 8 .
Ν
V g l . BAZIN 1 9 5 0 - 5 5 ; BAZIN 1 9 4 8 .
8
PUDOWKIN 1 9 7 9 , 8 3 .
9
Vgl. unter vielen VERTOV 1922, 21f., der dabei mehr an einen musikalischen »Satz« dachte; PUDOWKIN 1961, 8; EISENSTEIN 1934, 61; EJCHENBAUM 1927, 30ff., der so weit ging zu sagen, Totaleinstellungen seien »eine Art 'Umstandsbestimmung des Ortes oder der Zeit'«, während »Vordergrundeinstellungen« und Großaufnahmen »eine Art Subjekt und Prädikat des Filmsatzes« seien (31).
Kapitel III: Montage
125
Aufgabe der Filmwissenschaft. 1 0 Diese Analogisierung von Satzbildungsverfahren und Textbildungsverfahren rekurriert auf Modelle der Textlinguistik und »Erzählgrammatik« aus den sechziger und frühen siebziger Jahren, die von der Arbeitshypothese ausgingen, daß Textstrukturen ähnlichen Prinzipien folgen wie Satzstrukturen, daß es also möglich sein müßte, Satzgliedern vergleichbare Texteinheiten zu isolieren und aufgrund definierbarer syntagmatischer Verknüpfungsregeln als »Paradigmen« zu klassifizieren. Bilderfolgen und Sätze Dazu ist hier nun zunächst mit Bezug auf die besonderen Voraussetzungen kinematographischer Sprechakte an die im Eingangskapitel dargelegten Einsichten zu erinnern, denenzufolge ikonische Zeichen nicht syntaktisch organisiert sind, weil sie aufgrund ihrer nicht-klassifikatorischen Natur keine prädikativen Strukturen bilden können (vgl. S. 11-23). Eben deshalb kann auch die Verbindung mehrerer Bilder nicht syntaktischen Kombinationsregeln unterliegen: Wenn Bildern die prädikative Struktur wortsprachlicher Aussagen fehlt, dann haben auch Folgen mehrerer Bilder nicht die Möglichkeit, prädikative Strukturen zu bilden, d.h. ein Bild kann nicht (weder im grammatischen noch prädikatenlogischen Sinn) 'Prädikat' eines zweiten sein, es sei denn, es gelten konventionalisierte, außerhalb der Bilder selbst getroffene Verabredungen. 1 1 Das heißt: Bilder haben keinen grammatischen 'Zeichensatz', der die syntagmatischen Relationen zwischen den Einheiten reguliert, wie das bei sprachlichen Sätzen der Fall ist (vgl. S. 19f.). Eben das aber setzt die »Filmsyntax« voraus. 1 2 Das Zeichen, das den Zusammenhang zwischen beiden Bildern herstellt, ist stattdessen ein viel primitiveres und vollkommen unspezifisches: Es ist die 10 MÖLLER 1 9 8 6 , 3 5 2 .
' 1 Die Großaufnahme eines Mannes, der irgendwobin blickt, und das daran anschließende Bild eines Tellers Suppe auf einem Tisch (vgl. PUDOWKIN 1961, 198f.) ergeben einen Zusammenhang, den man zwar zusammenfassend mit dem Satz »Ein Mann blickt auf einen Teller Suppe« übersetzen könnte, der aber von den Bildern selbst nicht in dieser Weise, d.h. nicht in der Form einer - prädikatenlogisch gesprochen - mehrstelligen Prädikation (blicken, Teller Suppe) oder einer - grammatisch gesprochen - syntaktischen Organisation (Nominal-/Verbal-/ Präpositionalphrase) vermittelt wird. Denn zum einen sind das »prädizierte« Subjekt (Mann) und die erste »Prädikation« (blicken) bzw. »Nominal-« und »Verbalphrase« nicht segmentierbar (vgl. S. 19f.), und zum anderen hat die zweite Einstellung, die die zweite »Prädikation« bzw. die »Präpositionalphrase« (Teller Suppe) zeigt, keine Möglichkeit, sich als Prädikation des vorhergehenden Bildes bzw. als »Präpositionalphrase« der vorhergehenden beiden »Phrasen« auszuweisen: Es kann die Präposition »auf« nicht formulieren. Diese »Präposition« bildet sich vielmehr im Bewußtsein des Zuschauers, im Text selbst aber, in den Bildern, ist sie nicht zu finden. (Das Beispiel entstammt den vielzitierten »Kuleschow-Experimenten«). 12 Vgl. beispielhaft WULFF 1984, 12f.; MÖLLER 1984.
126
Kapitel III: Montage
bloße Aufeinanderfolge der Bilder. Sie ist es, die im Zuschauer die Erwartung eines sinnvollen Zusammenhangs erzeugt. Dieses Zeichen aber ist immer dasselbe und deshalb semantisch völlig indifferent: Sieht man hier zunächst ab von den wenigen und groben Mitteln seiner näheren Bestimmung durch die verschiedenen (und erheblichen Bedeutungsschwankungen unterliegenden) Blendenformen (Auf-, Ab-, Überblende etc.), so sagt die bloße Aufeinanderfolge von Einstellungen lediglich aus, daß (vermutlich) ein Zusammenhang zwischen den Bildern besteht, nicht aber, wie dieser Zusammenhang beschaffen ist. Es ist vielmehr der Zuschauer, der infolge seiner Sinnerwartung diesen Zusammenhang zu rekonstruieren beginnt, sobald er Folgen von Bildern sieht, und er rekonstruiert diesen Zusammenhang, indem er die in den Bildern nacheinander vergebenen Informationsmengen aufeinander bezieht. Die Situation ist hier dieselbe, wie sie bei der Aneinanderreihung wortsprachlicher Sätze, bei der Bildung sprachlicher Texte entsteht. Die Aufeinanderfolge mehrerer Sätze erzeugt wie die Aufeinanderfolge mehrerer Bilder die Erwartung, daß diese Sätze etwas miteinander zu tun haben, einen Zusammenhang bilden. Aber auch hier ergibt sich dieser Zusammenhang nicht oder nur bedingt aus grammatischen Zusammenhangsbildungen, sondern aus der auf Sinnbildung gerichteten Rekonstruktionsarbeit des Rezipienten. Für diese Rekonstruktionsarbeit liefern sprachliche wie filmische Texte eine Reihe von Orientierungshilfen, nämlich kontextbildende, »transphrastische« Zeichen, die die Sätze/Einstellungen miteinander verknüpfen können. Bei sprachlichen Texten sind das vor allem die sog. pronominalen Verkettungen, die anzeigen, daß noch immer von derselben Person oder Sache die Rede ist, oder sog. syntagmatische Substitutionen, die dieselbe Sache wechselnd bezeichnen. Sprachliche Verknüpfungen dieser Art liefern nun aber nicht schon den gesuchten Zusammenhang zwischen den Sätzen selbst, sondern bloß Orientierungshilfen zu dessen Rekonstruktion, können sogar vollständig wegfallen, ohne daß damit der Sinnzusammenhang, den die Sätze bilden, gefährdet ist,13 ein unzweifelhaftes Indiz dafür, daß das Verstehen eines Textes als Sinneinheit eines vom Rezipienten zu leistenden »textüberschreitenden Entwurfs« bedarf. 14 Im Film gibt es ähnliche als Verkettungshinweise fungierende Zeichen, doch sind sie hier - auf optischer Ebene wohlgemerkt sehr viel gröberer Natur, beschränken sich nämlich letztlich auf eine Grundfigur, die Grundfigur der Rekurrenz (Nicht-Rekurrenz) bestimmter Bildelemente, die über das Wiedererkennen (Nicht-Wiedererkennen) wiederkehrender (neuer) Bildelemente den Schluß ermöglichen, daß die neue Einstellung immer noch (nicht mehr) denselben Raum, dieselbe Person, denselben Zeitraum 13 Vgl. das Textbeispiel bei STŒRLE 1979a, 172f. 14 FRANK 1 9 8 2 , 140.
Kapitel III: Montage
127
usw. erfaßt. Und wie bei sprachlichen Satzverknüpfungen sind auch solche bildlichen Verknüpfungen nicht schon der gesuchte Zusammenhang selbst, sondern liefern nur ein Gerüst orientierender Daten für dessen Rekonstruktion. Denn »was einen Text (qua Text) zur Einheit verhält, ist nicht das System der ihn konstituierenden Zeichen und Verknüpfungsregularitäten, sondern sein Sinn, d.h. die integratorische Ordnung, die in dem organischen Zusammenspiel und in der individuellen Anordnung der ihn aufbauenden Sätze am Werk ist«.15 Textkohärenz und »Textgrammatik« Dieser Sinn, der die Einheit des Textes konstituiert, erschließt sich aus den Beziehungen zwischen den in Sätzen oder Bildern vergebenen Informationsmengen, das heißt: Die Beziehungen, die der Rezipient im Verstehensprozeß zwischen den Sätzen (Einstellungen) eines Textes (Films) herzustellen sucht, sind keine zeichenstrukturellen, betreffen nicht Beziehungen zwischen Zeichen, sondern Beziehungen zwischen den bezeichneten Sachverhalten selbst. Deren Erschließung rekurriert entsprechend nicht auf grammatisch-syntaktische Regeln, sondern auf Wissen und Erfahrung (mit Wirklichkeit, mit anderen Texten), auf allgemeine (z.B. kausal-) logische Kategorien, auf Denktraditionen, Wertnormen u.v.m., schließlich auch auf 'Phantasie' und Assoziationsfähigkeit, die die Leerstellen zwischen den Sätzen oder Bildern im Rezeptionsprozeß beständig aufzufüllen gefordert sind: Texte, erzählende zumal, setzen bei ihren Rezipienten Vorwissen über mögliche Zusammenhänge zwischen den in Sätzen oder Einstellungen kommunizierten Sachverhalten beständig voraus und verlangen, wo dieses Vorwissen versagt, die Bereitschaft, diese Sachverhalte unter Zuhilfenahme ihrer 'Vorstellungskraft' zu einer Einheit zu fügen. 16 Die Annahme, diese Operationen würden sämtlich vom Text selbst über ein ihm inhärentes 'syntaktisches' Regelsystem initiiert und gesteuert (weshalb dogmatische Textstrukturalisten auch überzeugt sein müssen, daß jeder Text nur eine - die 'wahre' - Interpretation zuläßt),17 bezeichnet den grundlegenden »Kurzschluß der Übertragung des linguistischen - auch des pragmatisch revidierten - Grammatikmodells auf Texte«: Sie verkennt, »daß die Kohärenzkriterien niemals durch den Text selbst, sondern stets durch eine
15 FRANK 1 9 7 7 , 2 7 4 .
16 Das ist, worauf Manfred Frank hinweist, schon bei der alltäglichen Kommunikation der Fall: »Schon der Zusammenhang unserer Äußerungen im alltäglichen Diskurs ist in den wenigsten Fällen semantisch-syntaktisch evident«, sondern verlangt vom Kommunikationspartner »Hintergrundwissen oder divinatorische Phantasie, kraft deren er den Zusammenhang herstellen wird« (FRANK 1982, 140). 17 Vgl. ΤΓΓΖΜΑΝΝ 1989, 24f.
128
Kapitel III: Montage
niemals mechanisierbare interpretatorische 'Divination' des Lesers gestiftet werden.«18 Daß die »Verknüpfung der Sätze zu Texten (...) nicht denselben formal beschreibbaren Regeln (unterliegt) wie die Verknüpfung der Satzelemente zu Sätzen, sondern Regeln der Sprachverwendung (folgt), die grundsätzlich andere als sprachliche Regeln sind«,19 ist auf strukturalistischer Seite durchaus gesehen worden. Gleichwohl hat sich die »Textgrammatik« bei ihren Versuchen, diese »grundsätzlich andere(n)« Regeln der Textbildung zu rekonstruieren, nicht vom Syntaxmodell zu lösen vermocht, blieb nämlich stets darauf gerichtet, die in Sätzen vergebenen Informationsmengen und ihre innertextuellen Beziehungen als Konstituenten eines quasi-syntaktischen Systems, d.h. erstere als Elemente und letztere als paradigmatische bzw. syntagmatische Relationen zu bestimmen. Diese die Grenze zwischen Kommunikationsmedium und Kommunikationsgegenstand, zwischen Zeichen und Referenten überschreitende Extrapolation der strukturalen Linguistik20 hat naheliegenderweise zur Folge, daß man es hier nun nicht mehr - wie beim sprachlichen Zeichensystem - mit (im je synchronen Schnitt) endlichen Mengen von Elementen und Elementrelationen (vgl. S. 12) zu tun haben, sondern mit potentiell unendlichen Mengen, so etwa bei narrativen Texten mit der Gesamtheit alles dessen, was sich aus menschlicher Sicht auf dieser Erde ereignen kann, und mit der Gesamtheit aller möglichen (kausal-, handlungs-, chronologischen etc.) Verknüpfungen dieser vielen möglichen Ereignisse. Deshalb müssen sie, um das 'textgrammatische' System überhaupt beschreibbar zu machen, diese unendliche Menge von Elementen (z.B. Ereignisse, Handlungen) und Elementrelationen (z.B. handlungslogische Voraussetzungen und Folgen) in eine endliche umwandeln. Nicht zufällig gingen denn auch alle Anstrengungen der »Erzählgrammatik« darauf aus, die Fülle möglicher Ereignisse, die Gegenstände erzählender Texte werden können, auf eine überschaubare Anzahl zu reduzieren: Um sie als »grammatische« Einheiten postulieren zu können, müs18 FRANK 1 9 8 2 , 140. 19 STŒRLE 1 9 7 5 , 8 .
20 Sieht man ab von der sog. 'transphrastischen Analyse', die sich auf systemimmanente, sprachliche Strukturen der Zusammenhangsbildung zwischen Sätzen beschränkt, beziehen sich die Methoden und Begriffe der übrigen textstrukturalistischen und textsemiotischen Ansätze sämtlich nicht mehr auf Zeichensysteme, sondern auf die über Zeichensysteme vermittelten Sachverhalte selbst. Sie vollziehen damit die Erweiterung des 'semiotischen Feldes' (Eco) auf 'Systeme', die »auf den ersten Blick nichts mit Kommunikation zu tun (haben), außer in dem Sinn, daß ihre Elemente mögliche Inhalte verbaler, visueller, gestueller usw. Kommunikation werden« (ECO 1972, 25). - Eco faßt diese Systeme unter dem Begriff der »kulturellen Codes« und bestimmt sie als »Phänomene, die nur schwer als Zeichensysteme im engeren Sinn und ebensowenig als Kommunikationssysteme zu definieren« sind, sondern als »Verhaltens- und Wertsysteme« (ebd.).
Kapitel Iii: Montage
129
sen die in individuellen Texten erzählten Ereignisse außerordentlich hochgradigen Abstraktionen unterworfen, nämlich so lange und so stark verallgemeinert werden, bis sie mit den in anderen j e individuellen Texten erzählten Ereignissen vergleichbar sind und damit als 'erzählgrammatische Paradigmen' klassifiziert werden können. 2 1 Und entsprechend müssen die möglichen Voraussetzungen und Folgen dieser zu Paradigmen abstrahierten Ereignistypen, ihre syntagmatischen Relationen, die darüber entscheiden, an welchen Stellen dieses oder jenes 'Paradigma' erscheinen kann und an welchen nicht, auf außerordentlich allgemeine Regularitäten zurückgeführt werden, damit sie positiv, eben als endliches Verzeichnis syntagmatischer Kombinationsregeln formuliert werden können. 2 2 Daß so zuletzt »der Gewinn an wissenschaftlicher Strenge durch eine ungeheure Verarmung an Sinnverstehen erkauft wird«, ist eine unvermeidliche F o l g e , 2 3 wobei noch zu fragen bleibt, ob die Methoden,
21 Die erzählgrammatische 'Paradigmatic führt deshalb auch in die Problemzone jeder Klassifikation, die immer dort beginnt, wo entweder zu wenige oder zu viele Klassifikationskriterien zur Anwendung kommen, denn die Klassifikation ist ein 'schwach strukturiertes System', dessen Nachteile zweifellos darin zu sehen sind, daß es »bei der Annahme einer geringen Merkmalsmenge wenig über die Eigenschaften des dergestalt klassifizierten Objekts aussagt, bei deren zunehmender Erweiterung aber auf eine abnehmende Zahl von Texten [in diesem Fall: textbildenden 'Paradigmen') zutrifft.« (HEMPFER 1973, 137). Für die »Erzählgrammatik« stellt sich das erstgenannte Problem: Wenn man die Gesamtheit alles dessen, was sich auf dieser Erde zutragen und folglich Gegenstand des Erzählens werden kann, klassifizieren will, dann muß man einen außerordentlich hohen Abstraktionsgrad wählen, um überhaupt zu überschaubaren Klassenbildungen zu kommen. Und so ist denn auch das. was sich in den Augen der Erzählgrammatiker auf dieser Erde ereignen kann, am Ende nicht mehr besonders viel. Vgl. etwa Bremonds Grundopposition »amélioration vs. dégradation« (BREMOND 1964; 1966) oder Todorovs 'erzählgrammatische Paradigmen': »Y schadet X«, »X attackiert Y« usw. (TODOROV 1973, 143). 22
Bei genauerem Zusehen zeigt sich rasch, daß es sich dabei tun »Textbildungsregeln« handelt, die allgemeinen menschlichen Erfahrungssätzen entstammen, nämlich denen der Kausalität und der Chronologie (vgl. z.B. Todorovs »erzählgrammatisches Syntagma«: »Y schadet X + X attackiert Y - > Y schadet nicht mehr X«;TODOROV1973, 143). Die aufwendigen Operationen, mit denen die »Erzählgrammatik« auf induktivem Wege - durch ihre Abstraktionsarbeit an individuellen Texten - 'syntagmatische Regeln' mühsam ausfindig zu machen suchte, führten deshalb am Ende zu ebenso hochgradig unspezifischen Erkenntnissen wie ihre 'Paradigmatik' (vgl. Anm. 21): Sie sagen nämlich zuletzt nicht mehr aus, als daß jedes Ereignis bestimmte logisch-kausale Voraussetzungen haben muß und daß diese Voraussetzungen folglich diesem Ereignis zeitlich vorausgehen müssen, wenn sie denn Voraussetzungen sind, daß also jedes Ereignis aufgrund seiner Kausalität einen bestimmten Platz im chronologischen Nacheinander hat. 23 FRANK 1982, 147. - Daß es beispielsweise in der Weltliteratur von ihren Anfängen bis in die Gegenwart eine unendliche Vielzahl von Ereignissen gibt, die sich auf das Todorovsche Muster »Y schadet X« (vgl. Anm. 22) reduzieren lassen, ist eine hochgradig unspezifische Erkenntnis, die zu der Frage, welche Funktion ein solches 'Paradigma' im Rahmen eines erzählerischen Weltentwurfs übernimmt, nichts beizutragen hat. Die Erzählgramma-
130
Kapitel III: Montage
die dabei zur Anwendung kommen, dieser den Maßstäben exakter Wissenschaften nacheifernden Vorstellung von »wissenschaftlicher Strenge« wirklich genügen. 24 Zu fragen bleibt auch, ob der Preis für diese Art wissenschaftlicher Strenge wirklich nur »Verarmung« an Sinnverstehen oder nicht auch unter Umständen sogar Verhinderung von Sinnverstehen ist.25 tik verliert damit in der Tat die »lebendige Mitte des Zusammenhangs von Sprache und Rede und ihre Bestimmung zur Weltaneignung« aus dem Blickfeld (STŒRLE 1985, 345). M Die Abstraktionsarbeit, die der Bestimmung syntagmatischer Verknüpfungsregularitäten zwischen Geschehenseinheiten (vgl. Anm. 22) und der paradigmatischen Klassifikation dieser Geschehenseinheiten (vgl. Anm. 21) vorausgeht, beruht auf Verstehensprozessen, die nicht als solche identifiziert und problematisiert werden: Wie etwa die praktische Exemplifizierung des Verfahrens bei Todorov (TODOROV 1973) zeigt, werden die 'erzählgrammatischen' Paradigmen nicht durch die klassischen strukturalistischen Operationen (Segmentieren, Substituieren, Klassifizieren), sondern durch hermeneutische Operationen gewonnen, beruhen demnach auf Voraussetzungen, die den theoretischen Ansprüchen der »Erzählgrammatik« unmittelbar widerstreiten, eine Beobachtung, die ähnlich und wohl nicht zufallig auch schon bei der Auseinandersetzung mit Ecos Theorem der »ikonischen Aussage« gemacht wurde (vgl. S. 9f.). Bremonds 'narrativer Zyklus' etwa, der eine zyklische Abfolge von immergleichen 'Paradigmen', nämlich von Zuständen des Mangels, behoben durch Prozesse der 'Verbesserung' (amélioration), und Zuständen der Befriedigung, behoben durch Prozesse der 'Verschlechterung' (dégradation) oder umgekehrt als narrative Fundamentalstruktur postuliert (vgl. BREMOND 1964; 1966), setzt Kategorien (Befriedigung/Mangel, Verbesserung/Verschlechterung) als strukturelle Kategorien an, die nicht mit strukturalistischen Methoden, sondern im Wege einer Abstraktion je konkreter Interpretamente gewonnen wurden und die entsprechend auch nicht im Rekurs auf strukturalistische Methoden angewendet werden können: Aufgrund welcher Voraussetzungen - wenn nicht hermeneutischer - soll beispielsweise entschieden werden, ob die Ehescheidung in Fontanes »Effi Briest« für Innstetten eine 'Verbesserung' oder eine 'Verschlechterung' ist? Was soll man stärker veranschlagen: Den Umstand, daß Innstetten durch die Ehescheidung seine gesellschaftliche Stellung und Reputation aufrechterhalten kann ('Verbesserung'), oder den Umstand, daß er dafür seiner Liebe zu Effi entsagen muß ('Verschlechterung')? Daß diese Entscheidung in Wahrheit gar nicht getroffen werden kann, weil die Alternative von heteronomem und autonomem Handeln hier schon gar keine mehr ist (vgl. Anm. 25), weist zudem darauf hin, daß diese binären handlungslogischen Kategorien, die solche interpretatorischen Entscheidungen verlangen, aufgrund ihres hohen Abstraktionsbedarfs am Ende so primitiv sind, daß sie für die Analyse komplexer Texte unbrauchbar werden. 25 Das digitale Schema Bremonds etwa (vgl. Anm. 24) scheint mir durchaus geeignet, die Funktion von Geschehenseinheiten für den erzählerischen Weltentwurf und damit für die Sinnstruktur komplexer Texte völlig zu verfehlen, weil es nur alternative Funktionsbestimmungen zuläßt, die der Text selbst aber unter Umständen gar nicht vorsieht. In dem in Anm. 24 angesprochenen Fall des »Effi Briest«-Romans hätte eine Kategorisierung der Ehescheidung als 'Verbesserung' von Innstettens Lage ebenso katastrophale Folgen wie deren Kategorisierung als 'Verschlechterung', weil diese Alternative genau das, worum es bei dieser Figur (wie bei der »Syntagmatik« dieses Romans Uberhaupt) geht, nicht erfassen kann, den Umstand nämlich, daß die Subjekte hier gar nicht mehr in der Lage sind, ihre Situation zu 'verbessern' oder zu 'verschlechtern'. Gleichgültig, ob Innstetten heteronom (normengerecht: Duell und Scheidung) oder autonom (normenwidrig: Fortsetzung der
Kapitel III: Montage
131
Das grundsätzliche Problem aller dieser Versuche aber, über die größte Einheit der traditionellen Linguistik, den Satz, mit linguistischen Mitteln hinauszugelangen, scheint mir darin zu liegen, daß das linguistische Strukturmodell hier nicht nur über die Satzgrenze, sondern auch über die Grenze zwischen Kommunikationsmedium und Kommunikationsgegenstand, zwischen Zeichen und Referenten, hinaus extrapoliert wird. Die Reduktion aller denkbaren Aussagen über Welt auf ein hochgradig simplifizierendes (immerhin nur zwei Elementrelationen kennendes) System und die Einforderung dieses Systems als universalen, alle Verständigung über Welt steuernden Regelsystems hat zur Folge, daß an Texten nur noch »das im allgemeinen Erwartbare, nur das konventionell Gebundene« erfaßt wird und »die individuellen, d.h. innovativen Intentionen (...) durch die Maschen des Modells (fallen)«, 26 impliziert mithin zugleich und vor allem die Festschreibung bestimmter (konventioneller) Wirklichkeitsmodelle: Die in den textgrammatischen 'Paradigmen' und 'Syntagmen' kondensierten Weisen, Wirklichkeit wahrzunehmen und zu verstehen, geraten, indem sie den Status eines aller Kommunikation zugrundeliegenden Regelwerks gewinnen, zu normativen »Sprachregelungen«, die alles Reden über Welt regulieren. Damit aber gerät am Ende das, was allein die Produktion und Rezeption von Texten verlohnt, zur Regelwidrigkeit, ihre Fähigkeit nämlich, gegen diese »Sprachregelungen« zu opponieren, neue »Sprachregelungen« vorzuschlagen, im Entwurf neuer Texte Wirklichkeit neu zu entwerfen. Der einst als 'revolutionär' gefeierte Gedanke, »daß der 'Inhalt' der sprachlichen Kommunikation seinerseits gegliedert, einer beschreibbaren Struktur unterworfen ist«,27 enthüllt in dieser Sicht eine eher innovationsfeindliche Potenz.
2.
Textkohärenz und Textschema
Die vorstehenden Überlegungen bestreiten nicht, daß Texte zu wesentlichen Teilen durch konventionalisierte »Sprachregelungen« über Wirklichkeit strukturiert sind, sondern nur, daß man mit diesen (von den Texten als Vorverständnis vorausgesetzten) »Sprachregelungen« schon jene Strukturierungsverfahren in der Hand hat, mit denen Texte Sinn erzeugen, d.h. daß sich aus diesen »Sprachregelungen« schon die Sinnstruktur von Texten und damit das ab-
Ehe) handelt, er kann 'Befriedigung' nur um den Preis eines 'Mangels' erlangen, kann also in beiden Fällen weder eine 'Verbesserung' noch eine 'Verschlechterung' herbeiführen, sondern immer nur beides. 26 FRANK 1 9 8 2 , 140. 27 STŒRLE 1 9 7 5 , 2 0 2 .
132
Kapitel III:
Montage
leiten läßt, was ihre Kohärenz und kommunikative Funktionen ausmacht. Mit dieser - freilich entscheidenden - Einschränkung sind bestimmte Ergebnisse der strukturalen Literaturwissenschaft durchaus geeignet, der Reflexion über Texte und Textbildungsverfahren neue Impulse zu geben. Einer dieser Impulse, der hier aufgenommen werden soll, ging von dem aus der Sprechakttheorie abgeleiteten Verständnis von Texten als sprachlichen Handlungen und dem Versuch aus, diese sprachlichen Handlungen auf bestimmte Sprachhandlungsschemata, auf Textschemata, zurückzuführen: 28 Den Begriff des Sprechakts auf Texte anwendend, versteht Karl-Heinz Stierle Texte als sprachliche (daher mittelbare, 'symbolische') Handlungen und darin als Versuche, Wirklichkeit - mittelbar - zu verändern:29 Texte organisieren Sachverhalte der Wirklichkeit nach Maßgabe konventionalisierter Sprachhandlungsschemata zu Sachlagen,30 zu denkbaren Wirklichkeitszusammenhängen, und postulieren die Konsensfähigkeit dieser Sachlagen, d.h. sie fordern ihre Rezipienten auf, diese Sachlagen als gültige Aussagen über Wirklichkeit, als konsensfähige Modelle von Wirklichkeit anzuerkennen (und sich gfls. zukünftig diesem Modell von Wirklichkeit entsprechend zu verhalten). Die Sprachhandlungsschemata, denen sie dabei folgen und die Stierle Textschemata nennt, sind konventionelle Modelle von Wirklichkeitszusammenhängen, von denen Stierle drei besonders hervorhebt: Narration, Deskription und Klassifikation, die eine mehr von zeitlichen, mehr von räumlichen oder mehr von systematischen Ordnungskriterien bestimmte Modellierung von Wirklichkeit entwickeln.31 Gegen die Annahme solcher Modellierungsprinzipien ist nichts einzuwenden, solange nicht behauptet wird, daß diese Modellierungsprinzipien, wie Stierle meint, schon die Einheit des Textes gewährleisten. Was sie gewährleisten, ist nicht die Einheit des Textes als eines kohärenten Sinnentwurfs, sondern die Einheit der Sprachhandlung: Ein Text ist als zusammenhängender Sprechakt (statt als Anhäufung vieler Einzelsprechakte) für den Empfänger allererst daran zu erkennen, daß er einen leitenden 'Gesichtspunkt' hat, unter dem er seine Aussagen über Wirklichkeit organisiert. Dieser leitende 'Gesichtspunkt' stiftet noch nicht den Sinnzusammenhang des Textes, sondern nur den Zusammenhang der sprachlichen Handlung, nämlich das, was dem Empfänger signalisiert, daß er sich zu dieser sprachlichen Handlung erst an28 Vgl. STIERLE 1975, 1979a, 1979b. 29 Vgl. STIERLE 1975, 14-48; STIERLE 1979a, 174f. 30 Unter »Sachlage« versteht STIERLE (1979a, 182) das sprachlich organisierte »Schema eines denkbaren Wirklichkeitszusammenhangs« (im Unterschied zum »Sachverhalt«, der diesen Wirklichkeitszusammenhang selbst meint). 31 Vgl. die Klassifizierung dieser Sprachhandlungsschemata ebd. 183-186.
Kapitel III: Montage
133
gemessen verhalten kann, wenn er sie als ganze rezipiert hat, gewährleistet also ein angemessenes Empfängerverhalten. Ein Text, der eine Menge von Aussagen über Realität etwa nach zeitlichen 'Gesichtspunkten' zu einem Wirklichkeitszusammenhang (zu einer Geschichte) organisiert, ist ein kohärenter Sprechakt insofern, als seine einzelnen Propositionen dadurch als Teile eines Sprechakts (und nicht mehrerer Sprechakte) erkannt werden können, dessen illokutive Funktion damit zugleich insoweit geklärt ist, als der Empfänger daraus die Anweisung bezieht, den Sprecher nicht zu unterbrechen, bevor er zu Ende erzählt hat. Mehr aber besagt dieses Sprachhandlungsschema nicht, das heißt: Aus der bloßen Wahl und konsequenten Befolgung etwa des Sprachhandlungsschemas »Erzählen« kann weder ersehen werden, ob der durch zeitliche Gesichtspunkte organisierte Sachzusammenhang auch einen Sinnzusammenhang ergibt, noch welche Struktur dieser Sinnzusammenhang hat. Was einen narrativen Text erst zu einem kohärenten Text und gfls. zu einem innovatorischen Akt, zu einem neuen Wirklichkeitsentwurf macht, ist in seinem Sprachhandlungsschema also gerade nicht aufbewahrt. 32 Was Stierle schon als Einheit des Textes postuliert, beschreibt diesen Überlegungen zufolge also nur das, was einen Sprechakt als zusammenhängende sprachliche Handlung kenntlich macht und den Empfanger zu entsprechendem Rezeptionsverhalten anhält. Eben darin liegt aber auch die Brauchbarkeit des Modells, das die erzählgrammatischen Implikate keineswegs erzwingt, die Stierle selbst mit ihm verbunden hat.33 Vielmehr taugt es gerade mit Blick auf die semantischen Festschreibungen der »Erzählgrammatik« als konkurrierendes Modell, das, wo letztere mit ihren handlungslogischen Paradigmen und Syntagmen ein die Redegegenstände festlegendes Regelwerk formuliert, stattdessen ein die Redeweise betreffendes, daher semantisch noch weitestgehend leeres Regelwerk setzt, das es erlaubt, hochgradig generalisierte Schemata und damit Organisationskriterien als allgemeine strukturbildende Kategorien anzusetzen, die von semantischen Festlegungen noch frei sind. Die regelhaften, allen Texten desselben Textschemas gemeinsamen Strukturen können auf dieser Grundlage in den Organisationskriterien verortet werden, die dieses Textschema definieren: in der zeitlichen, räumlichen oder systematischen Organisation von Aussagen über Wirklichkeit. Die Frage nach den Verfahren filmischer Textbildung wird sich an diesen Organisationskriterien orientieren: Die folgenden Kapitel sollen klären, unter 32 Der Umstand, daß erzählerische Innovation seit Jahrhunderten im Rahmen des narrativen Sprachhandlungsschemas stattfindet, verweist darauf, daß Erzähltexte, um etwas Neues zu sagen, um Wirklichkeit neu zu entwerfen, nicht notwendig gegen Erfahrungssätze der Chronologie und handlungslogischen Kausalität verstoßen müssen. 33 Vgl. STIERLE 1975, 14-48 und vor allem 186-219.
134
Kapitel ill: Montage
welchen Voraussetzungen Filme narrative, deskriptive und systematische Texte bilden können und welche Funktionen diese Textbildungen im Erzählfilm übernehmen.
B. Grundformen filmischer Textbildung: Voraussetzungen der narrativen, deskriptiven und systematischen Montage Die Sprachhandlung 'Erzählen' bestimmt Stierle als Organisation von »Sachlagen unter dem übergreifenden Gesichtspunkt der Abfolge und des zeitlichen Zusammenhangs«.34 Das heißt nicht, daß im Rahmen narrativer Texte nicht auch deskriptive oder systematische Textschemata realisiert werden können, wohl aber, daß die Organisation zeitlicher Zusammenhänge das dominante Strukturierungskriterium darstellt. Im Sinne der eben angestellten Überlegungen sind also die regelhaften, allen narrativen Texten gemeinsamen Strukturen in den Formen der zeitlichen Organisation von Aussagen über (fiktive) Wirklichkeit zu suchen. Mit Bezug auf filmisches Erzählen stellt sich folglich zuerst die Frage, wie die Abfolge von mehreren Einstellungen überhaupt einen zeitlichen Zusammenhang stiften kann, und daraus werden sich dann zugleich Einsichten in filmische Möglichkeiten der deskriptiven und systematischen Textbildung ergeben. Die Möglichkeiten sprachlicher Zusammenhangsbildungen - über Dialog, Erzählerstimme, Schriftinserts - spielen dabei keine Rolle, denn hier geht es darum zu sehen, wie mit Bildern zeitliche (räumliche, systematische) Zusammenhänge hergestellt werden können. Zeit im Film Zeit ist nicht zu sehen. Und Bilder verfügen nicht über Begriffe, folglich auch nicht über die zeitlichen Begriffe, die die Wortsprache kennt. Unbewegte Bilder können deshalb nur Zustände, keine Zeitverläufe bezeichnen (allenfalls implizieren). Durch die Aneinanderreihung mehrerer unbewegter Bilder entstehen Bildergeschichten (vgl. Comics etc.), d.h. Folgen von Zustandsbezeichnungen, die einen zeitlichen Verlauf zwar implizieren, aber ihrerseits nicht bezeichnen können. Die filmische Einstellung ist demgegenüber zunächst im Vorteil, weil sie selbst verzeitlicht ist, einen kontinuierlichen raumzeitlichen Ausschnitt erfaßt. Bei der Aneinanderreihung mehrerer solcher raumzeitlicher Ausschnitte (Einstellungen) aber entsteht hier im Prinzip dieselbe Situation: Ebensowenig wie Bildergeschichten können filmische Einstellungen ihren zeitlichen Zusammenhang benennen, können ihn vielmehr eben34 STIERLE 1979a, 184.
Kapitel III: Montage
135
falls nur implizieren. Wie bei Bildergeschichten die Aneinanderreihung von Einzelbildern in Leserichtung von links nach rechts, so impliziert die Aneinanderreihung von Einstellungen in zeitlicher Folge zunächst einen wie auch immer gearteten Zusammenhang der darin abgebildeten Vorgänge. Dieses Implikat bedarf aber weitergehender Präzisierungen: Die bloße Aufeinanderfolge selbst erzeugt lediglich die Bereitschaft des Rezipienten, einen Zusammenhang zwischen den Bildern herzustellen, gibt aber noch keine Auskunft darüber, ob dieser Zusammenhang zeitlicher, räumlicher oder systematischer Natur ist. Das zeitliche Nacheinander filmischer Einstellungen legt zwar als erstes einen ebenfalls zeitlichen Zusammenhang nahe, doch bedarf es zweifellos zusätzlicher Vereindeutigungen dieser Annahme. Die Frage ist daher, mit welchen Mitteln, genauer: mit welchen bildspezifischen Mitteln solche Vereindeutigungen Zustandekommen. Zeit ist nicht zu sehen, aber unsere alltägliche Zeiterfahrung beruht zu einem erheblichen Teil auf visuellen Wahrnehmungen: Es gibt eine Fülle visueller Zeichen, die wir als Indices für das Vergehen von Zeit verstehen, weil sichtbare Dinge ihre visuelle Erscheinung verändern können. Die einfachste Form der visuellen Zeitwahrnehmung ist die Bewegungswahrnehmung, d.h. die Wahrnehmung von sukzessiven Veränderungen der räumlichen Umgebung eines Dinges: Der lOOm-Läufer, der eben noch in den Startblöcken hockte, ist wenig später schon am Ziel, und die Zeit, die er dazu brauchte, wird in diesem Fall sogar exakt gemessen. Aber auch die veränderte Physiognomie der Dinge selbst sind Zeit-Zeichen: Die sprichwörtliche Blume, die »gestern« noch in voller Blüte stand und »heute« verwelkt ist, indiziert das Vergehen von Zeit durch die Veränderung ihrer Erscheinung. Daneben gibt es periodisch wiederkehrende Zeit-Zeichen: Die Veränderung von Lichtverhältnissen zeigt den Wechsel von Tages- und Nachtzeiten an, die Veränderung der Flora den Wechsel der Jahreszeiten. Für diese wie für alle visuellen Zeit-Indices gilt dieselbe paradoxe Bedingung: Sie beruhen auf der Wahrnehmung von Veränderungen des Identischen, auf dem Wiedererkennen eines Dinges als es selbst und der Wahrnehmung dessen, was sich an ihm oder an seiner Umgebung verändert hat. Für die Vermittlung zeitlicher Zusammenhänge zwischen filmischen Einstellungen gelten dieselben Bedingungen: Grundlage sind auch hier rekurrente Bildelemente, die das Wiedererkennen eines Dinges, einer Figur, eines Schauplatzes ermöglichen, und deren je spezifische Kombination mit neuen, nichtrekurrenten Bildelementen. Aus dem Zusammenspiel rekurrenter und nicht-rekurrenter Bildelemente ergeben sich die Möglichkeiten, zeitliche Beziehungen zwischen Bildern darzustellen. Art und Grad der Veränderungen erlauben Rückschlüsse auf das Zeitmaß, das zwischen den Bildern vergangen ist, wobei
136
Kapitel III: Montage
eine Fülle alltäglicher Erfahrungen sowie kulturelles, technisches, geographisches usw. Wissen aktiviert wird: Daß kleinräumige Bewegungen - ein Augenschwenk, ein Lächeln, eine Geste - eine sehr geringe Zeitspanne, großräumige Bewegungen - Gehen, Laufen, Fahren usw. - dagegen größere ZeitRäume in Anspruch nehmen, daß Alterungsprozesse etwa bei einem Apfel rascher verlaufen als bei einem Menschen u.v.m., sind Erfahrungssätze, auf die jeder Filmbetrachter bei der Rekonstruktion der zeitlichen Beziehungen zwischen zwei Einstellungen beständig rekurriert. Und daß er zwischen zwei aufeinanderfolgenden Einstellungen, deren erste eine Figur in Hamburg und deren zweite dieselbe Figur in New York zeigt, ein größeres Maß an Zeit vergangen glaubt als zwischen zwei Einstellungen, die die Figur zuerst in Hamburg und dann in Berlin zeigen,35 beruht auf seiner Kenntnis der unterschiedlichen Distanzen und damit der Zeit, die die Wege vom einen zum anderen Ort beanspruchen. Wissens- und Erfahrungssätze dieser Art spielen eine erhebliche Rolle für die Rekonstruktion der Zeitstruktur narrativer Texte. Rekurrenztypen Wie das Zusammenspiel von rekurrenten und variierten Bildelementen zeitliche Beziehungen zwischen Einstellungen zu stiften vermag, zeigt die nachfolgende Tabelle (Abb. 9). Sie repräsentiert eine grobe Typologie filmischer Rekurrenzmuster, die von zwei großen Rekurrenz- bzw. Varianzbereichen ausgeht, nämlich von dem der Figuren36 und dem ihrer Umgebung, des Schauplatzes. Nach Maßgabe der Frage, welches dieser beiden Grundelemente in einer Einstellung rekurriert bzw. differiert, lassen sich zunächst vier Kombinationsmöglichkeiten unterscheiden: I. Rekurrenz von Schauplatz und Figuren; II. rekurrente Figur(en), differenter Schauplatz; III. rekurrenter Schauplatz, differente (oder ganz fehlende) Figur(en); IV. Differenz von Schauplatz und Figur(en). Rekurrenz meint dabei zunächst nur Rekurrenz derjenigen Merkmale, die für das Wiedererkennen einer Figur oder eines Schauplatzes erforderlich sind37 und die noch keine präzisen Zeitbezüge herzustellen 35 »Je ferner der Schauplatz (...), um so mehr Zeit empfinden wir als verstrichen« (BALAZS 1980, 107). Dieser Effekt ist zeit- und kulturabhängig, hängt mit dem Raumzeitgefllhl einer Epoche und Kultur zusammen, das maßgeblich durch die technischen Möglichkeiten bestimmt wird: Im Zeitalter des Propellerflugzeugs indizierte ein von Europa nach Amerika führender Schauplatzwechsel zweifellos einen größeren Zeitsprung als heute. 36 Unter Figuren werden hier Handlungsträger, also die für den Fortgang der Geschichte relevanten Akteure verstanden; Statisten werden als Bestandteil des Schauplatzes gefaßt. 37 Mit Bezug auf den Schauplatz ist der Rekurrenzbegriff sehr weit gefaßt, meint nicht notwendig Rekurrenz exakt derselben Merkmalsmengen: Bei Einstellungen, die z.B. in einer Straße spielen, mögen die Hintergründe in jedem Bild wechseln; worauf es ankommt, ist die Rekurrenz von Merkmalen, die den Schauplatz als immer noch denselben - als dieselbe Straße, dasselbe Zimmer, dieselbe Landschaft etc. - zu erkennen ermöglichen.
Kapitel ¡II: Montage
137
vermögen. Diese ergeben sich vielmehr erst aus spezifischeren Rekurrenzen bzw. Varianzen innerhalb dieser beiden großen Bereiche, aus ihrem Erscheinungsbild nämlich, d.h. aus Rekurrenzen bzw. Varianzen im Bereich von Maske, Kostüm, Requisite u.a. bei den Figuren sowie Tages- und Jahreszeit, Zustand, Einrichtung u. a. beim Schauplatz. Zu I: Einstellungen, in denen sowohl die Figur(en) als auch ihre Umgebung rekurrieren, können unterschiedlichste Zeitbezüge aufweisen, die sich nach Art und Grad der Veränderung ihrer Erscheinung bemessen. Wo diese Veränderungen solche sind, die nur geringe Zeitspannen erfordern, wo etwa das Erscheinungsbild von Figuren nur durch mimisches und gestisches Verhalten oder durch Positionsveränderung im Raum variiert ist, implizieren sie ein sukzessives Voranschreiten der Zeit (Typ la, lb). Allerdings ergibt die bloße Aneinanderreihung solcher Einstellungen noch keinen kontinuierlichen Zeitverlauf: Um eine filmische Szene (vgl. Kap. C.l) zu montieren, bedarf es sorgfältiger Anschlüsse, die die Veränderungen als Prozeß, als raumzeitliches Kontinuum zu vermitteln in der Lage sind dadurch, daß die neue Einstellung dort ansetzt, wo die vorhergehende endete, indem sie z.B. die Figur exakt an der Position im Raum zeigt, an der sie sich am Ende der vorhergehenden Einstellung befand, oder indem sie die Fortsetzung einer in der vorhergehenden Einstellung begonnenen Bewegung aus veränderter Perspektive erfaßt (la). 38 Anschlußfehler, die hier nicht selten unterlaufen, werden bis zu einem gewissen Grad durch den (kontinuierlichen) On-Ton vertuscht, der in manchen Fällen ohnehin das zuverlässigere Indiz zeitlicher Kontinuität ist. Geringere Schwierigkeiten bereiten szenische Anschlüsse, wenn das rekurrente Material nach einer einführenden, Überblick schaffenden Einstellung in wechselnden differenten Teilmengen repetiert oder - in Schuß-Gegenschuß-Montagen - im regelmäßigen Wechsel zweier differenter Teilmengen alternierend angeordnet wird (Typ lb). 39 Die Rekurrenz von Schauplatz und Figuren legt einen kontinuierlichen Zeitverlauf nahe, und deshalb bedarf es besonderer Zeichen, wenn zwischen den Einstellungen Zeit gerafft werden soll (Typ 2-4), d.h. es bedarf solcher 'Veränderungen des Identischen', deren Art und Grad Auskunft über das Maß der zwischen den Bildern vergangenen Zeit gibt. Diskontinuierliche Bewegungsabläufe zeigen minimale Zeitsprünge an, sofern Schauplatz und Figuren 38 Vgl. dazu die Darstellung der produktionstechnischen Grundregeln der Montage bei
REISZ/MILLAR 1988, 147-170. 39 Da die einzelnen Teilrekurrenzen sich hier wechselseitig unterbrechen, jede fur sich also zeitversetzt erscheint, gewinnen Veränderungen (z.B. von Standort, Mimik, Gestik oder Körperhaltung), die bei einer summarisch repetierenden Montage diskontinuierliche Bewegungsabläufe, Bildsprünge, verursachen würden, Plausibilität durch die mit dem GegenschuB verstreichende Zeitspanne.
138
Kapitel 111: Montage Abb. 9: Relcurrenztypen und Zeitbezüge Schauplatz hιgur dînèdittèrekurrent rekurrent Erscheinungsbild* rent Erscheinungsbild** rent Re- unverändert verunverändert verZeitändert ändert kurrenz- Bewegungen Bewegungen bezttge typ konti- diskonti- disnuier- kontinuier- kontilich nuierlich nuierlich lich Kontinuität I la X X X lb X Diskontinuität 2 X X X 3a X 3b X X X 4 X 11 5 X X 6 X X Kontinuität U1 7 X X 8 X Diskontinuität X*** X 9 X keine Figuren 10 X keine higuren Kontinuität 11 χ oder χ IV 12 undetimert X 1 1 I X 1
*
ohne/mit signifikante(n) Veränderungen der Tages-, Jahres- oder historischen Zeit, des Zustands (bei Gebäuden), der Einrichtung usw. ** ohne/mit signifikante(n) Veränderungen von Maske, Kostüm etc. " • i d e n t i s c h e r oder ähnlicher Bildausschnitt la Szenische Montage: das rekurrente Material wird in wechselnden Perspektiven repetiert l b Szenische Montage: das rekurrente Material wird (nach einem einleitenden Überblick über Gesamtkonfiguration und Schauplatz) im Wechsel differenter Teilmengen repetiert, gfls. im regelmäßigen Wechsel zweier differenter Teilmengen (alternierende szenische Montage) 2 Aussparung minimaler Zeitspannen (selten) 3a Aussparung geringer Zeitspannen im Rahmen einer tageszeitlichen Einheit 3b Aussparung von Zeitspannen, die das unveränderte Erscheinungsbild der Figur zuläBt 4 Aussparung von Zeitspannen unterschiedlichster Größenordnungen, die sich nach dem Grad der Veränderung von Schauplatz und Figur bemessen 5 Aussparung von Zeitspannen, die das unveränderte Erscheinungsbild der Figur zuläßt; die für den Ortswechsel benötigte Zeit, die sich u.U. aus dem Charakter des neuen Schauplatzes erschließen läßt, liefert zusätzliche temporale Informationen. 6 Aussparung von Zeitspannen unterschiedlichster Größenordnungen, die sich nach dem Grad der Veränderung der Figur bemessen 7 Szenische Montage: Wechselnde Raumausschnitte mit wechselnden Figuren ohne einleitenden Überblick über Gesamtkonfiguration und Schauplatz (vgl. lb); Kontinuität wird allererst durch den On-Ton angezeigt; erscheint selten allein, sondern zumeist in Kombination mit lb; auch als Verfahren der Vermittlung totaler Konfìgurationswechsel 8 Aussparung geringer Zeitspannen im Rahmen einer tageszeitlichen Einheit, mindestens der Zeit, die für den Figurenwechsel erforderlich ist (unübliche Verbindung) 9 Aussparung von Zeitspannen unterschiedlichster Größenordnung, die sich nach dem Grad der Veränderung des Schauplatzes bemessen (seltene Verbindung) 10 Aussparung von Zeitspannen unterschiedlichster Größenordnung, die sich nach dem Grad der Veränderung des Schauplatzes bemessen; fungiert als explizites Raffungssignal; gewöhnlich als Eröffnung einer neuen Sequenz eingesetzt 11 Kontinuität der Wahrnehmung des Bildsubjekts; Diskontinuität der Bewegungen zeigt Diskontinuität des 'Umherblickens' des Bildsubjekts, keine zeitliche Diskontinuität an; Funktion: Deskription, gfls. auch vergleichende Montage 12 Aufgrund optischer Informationen zeitlich nicht defìmerbare Beziehung; Funktionen: Eröffnung oder Wiederaufnahme eines neuen Erzählstranges, gfls. auch vergleichende Montage
Kapitel III: Montage
139
ansonsten keine zeitrelevanten Veränderungen aufweisen, ein Verfahren, mit dem die »Nouvelle vague« die klassische szenische Montage (la, lb) zu verabschieden suchte (Typ 2). 40 Veränderungen des Schauplatzes (mit Hilfe tages- oder jahreszeitlicher Indices oder anderer zeitrelevanter Zeichen wie z.B. Alter und Zustand bei Gebäuden, Inneneinrichtungen usw.) und/oder Veränderungen der Figuren (Variationen im Bereich Maske, Kostüm, Requisite; veränderte Tätigkeiten usw.) indizieren dagegen Raffungen höheren Grades. Veränderungen in nur einem der beiden Bereiche verweisen in der Regel auf vergleichsweise geringe Zeitsprünge: Ein zeitlich unveränderter (d.h. ohne markante tageszeitliche Verschiebungen rekurrierender) Schauplatz erlaubt auf seiten der Figuren auch nur geringe Veränderungen, nämlich solche, die innerhalb einer tageszeitlichen Einheit denkbar sind wie z.B. Kostümwechsel oder Wechsel der Tätigkeit (Typ 3a). In Maske und Kostüm unveränderte Figuren erlauben umgekehrt auf seiten des Schauplatzes ebenfalls nur geringe Veränderungen, nämlich solche, die das unveränderte Erscheinungsbild der Figur plausibel machen (Typ 3b).41 Veränderungen in beiden Bereichen können Zeitsprünge unterschiedlichster Größenordnung - von Stunden, Tagen, Wochen, Monaten bis zu Jahren - indizieren (Typ 4). 42 Zu II: Einstellungen, in denen eine oder mehrere Figuren das rekurrente Bildelement sind, während der Schauplatz verändert ist, stellen in jedem Fall zeitliche Diskontinuität her, denn sie implizieren einen (ausgesparten) Bewegungsvorgang und folglich einen Zeitsprung. Unvermittelte Ortswechsel dieser Art werden häufig durch die Kamera überbrückt, sei es dadurch, daß die Figur aus dem Bild geht und die Kamera noch einige Zeit am Ort verweilt, 40 Vgl. z.B. Jean-Luc Godards »A bout de souffle« (F 1960): Anzeiger der (minimalen) zeitlichen Ellipsen ist hier die Diskontinuität der Bewegungsabläufe, die von Bild zu Bild sprunghafte Veränderung von Standort und Körperhaltung der Figuren. Obwohl sich diese Technik nicht durchsetzte, war sie doch geeignet, Arnheims generelles Verdikt über diese Möglichkeit der Montage (»Unverwendbar!«) als historisch bedingtes Urteil zu enthüllen (ARNHEIM 1979, 119): Die Verständlichkeit des Films leidet unter dieser Schnittechnik ganz offenkundig nicht. 41 Die Rekurrenz von Maske und Kostüm ist für sich allein noch kein verläßliches Indiz für den Grad der Zeitraffung, weil sie sich mit einem Zeitsprung von wenigen Stunden ebenso verträgt wie mit einem Zeitsprung von mehreren Tagen. In Verbindung mit einem rekurrenten, zeitrelevant veränderten Schauplatz aber ist sie normalerweise Indiz für geringere Zeitsprünge (Stunden). 42 So erstreckt sich z.B. die weiter oben schon beschriebene Sequenz aus »Citizen Kane«, die die Entwicklung der ersten Ehe des Helden zusammenfallt (vgl. Kap. II, Anm. 17), über mehrere Jahre: Der Schauplatz bleibt ebenso wie die Tageszeit identisch, die einzige, allerdings gewichtige Veränderung betrifft den zuletzt sehr viel längeren, die Eheleute voneinander distanzierenden Tisch; auch die Figuren bleiben dieselben, aber Kostüm und Maske (und die aus Reißschwenks bestehenden Einstellungskonjunktionen) verweisen auf bildlicher Ebene - auf die Zeitspannen, die zwischen den Bildern vergehen.
140
Kapitel III: Montage
sei es dadurch, daß sie der Figur gewissermaßen vorauseilt, sich schon auf den neuen Schauplatz begibt und sich dort umsieht, bevor die Figur ihn erreicht, und so die damit verstreichende Zeit als die Zeit zu illusionieren sucht, die die Figur für den Ortswechsel brauchte.43 Eine nähere Bezeichnung des zwischen den Bildern verstrichenen Zeitmaßes übernehmen auch hier die spezifischen raumzeitlichen Indices, in diesem Fall die Rekurrenzen bzw. Differenzen im Erscheinungsbild der Figuren (Kostüm, Maske, Requisite, Tätigkeiten usw.). Zu III: Einstellungen, bei denen der Schauplatz das rekurrente Bildelement ist, die Figuren dagegen andere sind, sind in der Regel nur ein besonderer Fall der szenischen Montage (Typ 7): Wo eine Szene nicht mit einer Überblick schaffenden Einstellung eingeleitet und dann in Teilrekurrenzen zerlegt wird (Typ lb), sondern mit einer Folge von Teilausschnitten (mit wechselnden Figuren) eröffnet wird, weist - abgesehen vom Tontrakt - allein die Rekurrenz von Merkmalen des Schauplatzes auf zeiträumliche Kontinuität hin. 44 Eine weitere Funktion dieses Rekurrenztyps (7) kann darin liegen, die zeitliche Kontinuität totaler Konfigurationswechsel anzuzeigen,45 bei denen das gesamte Personal ausgetauscht wird (X verläßt ein Zimmer/Y betritt das Zimmer durch eine andere Tür, steigt durchs Fenster ein u.ä.). 46 Einen Zeitsprung (Typ 8) könnten solche Verbindungen (unveränderter Schauplatz, differente Figuren) nur dann anzeigen, wenn der Raumausschnitt derselbe oder dem vorhergehenden zumindest sehr ähnlich ist, so daß klar wird, daß zwischen den Bildern mindestens die Zeit vergangen ist, die zum Austausch der Figuren nötig war. Solche Einstellungsverbindungen sind wenig plausibel und deshalb auch unüblich, denn sie wirken, weil sie keinen Aufschluß über die Art der zeitlichen Beziehungen geben, desorientierend, zumindest dann, wenn sie durch einen einfachen Schnitt verbunden sind. Deshalb begegnen sie, wenn überhaupt, meist mit Blendenverbindungen, die einen unbestimmten Zeitsprung andeuten (X verläßt einen Raum durch eine Tür - Überblende - dieselbe Tür, durch die Y den Raum betritt). Größere 43 V g l . REISZ/MILLAR 1 9 8 8 , 155.
44 In Extremfällen, etwa bei einer Folge von Nah- oder Großaufnahmen, die keine sicheren Rückschlüsse auf räumliche Zusammenhänge zulassen, ist es u.U. sogar allein der OnTon, der zeitliche Kontinuität anzuzeigen vermag. 43 Zu den Begriffen »Konfiguration« bzw. »Konfigurationswechsel« vgl. Kap. C.2.2.1. 46 Voraussetzung dafür ist eine Situation, die wechselnde Raumausschnitte erforderlich macht, weil es andernfalls keine Motivation für einen Schnitt gibt. Wenn beispielsweise eine Figur einen Raum verläßt und eine neue ihn gleich anschließend durch dieselbe Tür betritt, wird die Kamera auf die Tür gerichtet bleiben und den Konfigurationswechsel in einer Einstellung vermitteln; ein Schnitt würde hier desorientierend wirken, weil er keinen Aufschluß über die zeitlichen Beziehungen gibt; vgl. den im folgenden beschriebenen Fall (Typ 8).
Kapitel III: Montage 141 Zeitsprünge, die das Erscheinungsbild des Schauplatzes verändern, erlauben durch entsprechende raumzeitliche (tages-, jahreszeitliche usw.) Indices - präzisere Informationen über die zwischen den Bildern verstrichene Zeit (Typ 9). Auch diese Verbindung begegnet relativ selten: Perspektivierende Rückgriffe, z.B. Erinnerungen einer Figur, die an den Ort eines vergangenen Geschehens zurückkehrt, können auf diese Weise eingeleitet sein. Häufiger begegnen dagegen identische Raumausschnitte eines rekurrenten, zeitlich signifikant veränderten Schauplatzes ohne Figuren, die einen - oft durch Überblendung zusätzlich markierten - tages- oder jahreszeitlichen oder auch historischen Zeitsprung vermitteln (dem Bild einer Straße, eines Hauses, einer Landschaft usw. im Sommer folgt das Bild derselben Situation im Winter usw.). Die Funktion solcher Einstellungsverbindungen erschöpft sich zumeist in der Verknüpfung zweier Szenen oder Sequenzen (Typ 10). Gewichtigere Funktionen vermögen verschiedene Ausschnitte eines Schauplatzes zu übernehmen, auf dem noch keine Figuren agieren (Typ 11): Sie konstituieren deskriptive Bilderfolgen, deren Aufgabe die Introduktion eines für die Geschichte zentralen Schauplatzes ist und bei denen folglich weniger zeitliche als vielmehr räumliche Beziehungen das maßgebliche Prinzip der Bildabfolge sind. Die weiter oben schon erwähnten Formen der 'establishing shots' (eröffnende Totale und nachfolgende Differenzierungen mit sukzessive verkleinerten Ausschnitten oder umgekehrt) gehören hierher, sofern sie nicht bereits die Akteure ins Bild setzen und damit der narrativen Funktion schon unterworfen sind. Dabei verlieren die zeitlichen Beziehungen an Bedeutung: Das Nacheinander der Bilder (wie auch die zumeist kontinuierliche Sukzession im Tontrakt) impliziert ein Nacheinander der gezeigten Sachverhalte, doch ist die Frage, ob es sich um nacheinander oder gleichzeitig ablaufende Vorgänge handelt, für das Verstehen solcher Einstellungsfolgen unerheblich. Worauf es vor allem ankommt, ist die über visuelle Rekurrenzen vermittelte Einheit des Ortes, die die Deskription verlangt. Derselbe Formtyp kann unter Umständen auch dem Prinzip des Vergleichs (und damit des systematischen Textschemas) unterworfen werden, indem Details eines Raumganzen analogisierend oder kontrastierend nebeneinander- oder gegenübergestellt werden mit dem Ziel, Abstraktionen - Begriffe bzw. antithetische Begriffspaare - bildsprachlich zu artikulieren (vgl. Kap. D.2). Zu IV: Einstellungen, die keine rekurrenten Bildelemente zeigen (Typ 12), sind außerstande, zeitliche und räumliche Beziehungen zu den vorhergehenden Bildern mit optischen Mitteln zu artikulieren. Die räumliche wie zeitliche Beziehungslosigkeit ist ihr hervorragendes Merkmal. Zeitliche Zusammenhänge können hier denn auch allenfalls über die sprachliche Informationsvergabe gestiftet werden. Dieser Rekurrenztyp steht am Beginn jedes Films und eröff-
142
Kapitel III: Montage
net innerhalb des Films gewöhnlich neue Erzählstränge bzw. nimmt liegengelassene Erzählstränge wieder auf. Die über die sprachliche Informationsvergabe geklärten zeitlichen Beziehungen werden auf bildlicher Ebene zumeist erst in dem Moment erkennbar, da der neue Erzählstrang mit einem anderen verkoppelt wird, d.h. Bildelemente beider Erzählstränge gemeinsam rekurrieren. 47 Nicht zufallig spielen nicht-rekurrente Einstellungen für vergleichende Einstellungsfolgen (und damit für Formen systematischer Textbildung im Film) eine erhebliche Rolle. Denn die räumliche wie zeitliche Beziehungslosigkeit der Bilder zwingt den Rezipienten zu der Frage nach einer anders denn zeitlich oder räumlich gearteten Beziehung, die sich erst über den abstrahierenden Vergleich der Bilder und mit den daraus sich ergebenden Begriffen herstellt. Die vielzitierte Montage in Eisensteins »Streik« (UDSSR 1924), bei der das Gemetzel, das die Polizei unter den Arbeitern anrichtet, von Bildern unterbrochen wird, die eine Schlachtszene in einem Schlachthof zeigen, bezieht ihren Effekt aus der zeitlichen wie räumlichen Beziehungslosigkeit der Bilder, die zum abstrakten Vergleich nötigt. Narrative, deskriptive und systematische Montage Die Typologie filmischer Rekurrenzmuster hat gezeigt, daß die Rekurrenztypen 1-7 die filmische Narration maßgeblich konstituieren, während sich die Funktion der übrigen Rekurrenztypen für die Narration im wesentlichen auf die Introduktion eines Konfigurationswechsels (8-9) und auf die Verknüpfung oder Eröffnung von Erzählphasen oder Erzählsträngen (10, 12) beschränkt. Ihre Bedeutung liegt darüber hinaus und vor allem in der Konstitution von Formen deskriptiver und systematischer Textbildung: Rekurrenztyp 11 bezeichnet vor allem Möglichkeiten der deskriptiven Kontextierung (vgl. Kap. D.l), nicht zu verwechseln mit deskriptiven Funktionen, die im Prinzip jedes Filmbild übernehmen kann: Worum es geht, ist die Funktion der Montage, die als rein deskriptive nur bei diesem Rekurrenztyp zum Zuge kommen kann. Wie in sprachlichen Erzähltexten bleibt freilich auch im Film die deskriptive Kontextierung normalerweise der narrativen untergeordnet: Sie erscheint in der Regel, wie noch gezeigt wird, als Teil narrativer Sequenzen. Eine auf vergleichende Rezeption zielende Organisation von Bildern dieses wie auch des Rekurrenztyps 12 eröffnet Möglichkeiten der systematischen Textbildung (vgl. Kap. D.2): Der Vergleich ist die Grundoperation jeder Vgl. z.B. das Grundmuster vieler Kriminalfilme: Eizählstrang 1: die Vorbereitung und Durchführung der Tat und die Flucht des Täters; Erzählstrang 2: der Kriminalinspektor wird mit der Aufklärung des Falles beauftragt; erste Verkoppelung z.B.: der Kriminalinspektor am Ort der Tat.
Kapitel III: Montage
143
Klassifikation, die das systematische Textschema begründet. Die Montage von Bildern, deren Zusammenhang sich erst über den Vergleich und eine daraus abgeleitete abstrahierende Begriffsbildung ergibt, ist ein filmischer »Ersatz« für Verfahren der Klassifikation. Im Rahmen narrativer Filme ist ihr Status dem expliziter Erzählerkommentare in sprachlichen Erzähltexten vergleichbar (die ja ihrerseits nicht selten das systematische Textschema realisieren). Formen der systematischen, begrifflichen Montage können, wie noch zu zeigen sein wird, auch selbst verzeitlicht sein, d.h. Narration und Klassifikation können ebenso wie Narration und Deskription als Funktionseinheit erscheinen, wobei die Narration in beiden Fällen das dominante Kriterium der Organisation der Bilder ist. Formale und thematische Rekurrenzen Ein zeitlich völlig indifferentes und daher in unterschiedlichsten Funktionen einsetzbares Kontextierungsmittel sind Rekurrenzen im Bereich von Bild- und Bewegungsformen sowie im Bereich von Bildthemen. Auf sie wies bereits Arnheim hin und klassifizierte sie - in Abgrenzung von zeitlichen und räumlichen Beziehungen zwischen Filmbildern - als »inhaltliche Beziehungen«.48 Solche Rekurrenzen sind auffallige Kontextierungssignale, die auf Sinnbeziehungen zwischen Einstellungen eigens hinzuweisen und damit die Funktion impliziter oder expliziter Erzählerkommentare zu übernehmen in der Lage sind. Formale und thematische Rekurrenzen sind naheliegenderweise nicht immer klar zu trennen. Wenn etwa Chaplin am Beginn von »Modern Times« (USA 1936) Bilder einer zur Arbeit eilenden Menschenmenge mit dem Bild einer Schafherde konfrontiert, dann sind die Rekurrenzen formaler wie thematischer Natur: In formaler Hinsicht rekurriert das Muster einer eilig in dieselbe Richtung sich bewegenden Menge, in thematischer Hinsicht das Thema des willenlosen Getriebenseins einer von unsichtbarer Hand dirigierten Masse. Weil formale und thematische Rekurrenzen mit Bezug auf Zeit und Raum des Erzählten indifferente Zeichen sind, spielen sie natürlich eine besondere Rolle für die systematische Montage. Wenn Arnheim bei formalen (»Beziehungen der Form«) wie thematischen Rekurrenzen (»Beziehungen des inhaltlichen Sinns«) parallele und kontrastive Rekurrenzen unterscheidet,49 so beschreibt er damit die beiden wichtigsten Grundformen der systematischen Montage (vgl. Kap. D.2). Gleichwohl spielen formale und thematische Rekurrenzen auch im Rahmen der narrativen Montage eine nicht zu unterschätzende Rolle und erweisen sich dort, sofern sie nicht den Status einer bloß äußerlichen Überleitungsfigur haben, als Formen der impliziten Kommentierung 48 ARNHEIM 1 9 7 9 , 1 1 9 f .
49 Ebd.
144
Kapitel III: Montage
und Deutung des Erzählten. Die Überblende von dem württembergischen Wappen am Stuttgarter Schloß auf das Firmenschild des Kaufmanns Süß Oppenheimer im Frankfurter Judenghetto in Veit Harlans »Jud Süß« (D 1940) kombiniert beispielsweise die zwei Bilder zusätzlich durch formale Rekurrenz (die ovale Form von Wappen und Firmenschild). Die Überblende markiert einen über den zwischen beiden Bildern liegenden Zeitsprung, Schauplatz- und Konfigurationswechsel hinausreichenden Zusammenhang, und die formale Rekurrenz gibt näheren Aufschluß über diesen Zusammenhang: Es geht hier offensichtlich um den Beginn einer Integration zwischen dem Staat Württemberg und dem Kaufmann Oppenheimer, über deren Art die folgenden Bilder dann auch Auskunft geben.
C. Narrative Montage: Strukturen filmischen Erzählens Die bei der Sichtung typischer Rekurrenzmuster sichtbar gewordenen Möglichkeiten einer zeitlichen, räumlichen oder systematischen Kontextbildung im Film und damit der spezifisch filmischen Realisierung narrativer, deskriptiver oder systematischer Textschemata begründet das weitere Vorgehen: Formen und Funktionen der narrativen, deskriptiven und systematischen Montage werden hier nacheinander untersucht, wobei die narrative Montage naheliegenderweise im Mittelpunkt und deshalb hier auch am Anfang steht.
1.
Die Segmentierung des filmischen Diskurses
Die Segmentierung des filmischen Diskurses50 ist der gegenwärtig wohl meistdiskutierte Arbeitsschritt der Filmanalyse. Der Begriff hat dabei allerdings keine klare Bedeutung, fungiert eher als allgemeiner Begriff, der alles das meint, was mit der Rekonstruktion einer wie auch immer gearteten Ordnung' des filmischen Diskurses zusammenhängt. Die Ordnung' des Untersuchungsgegenstandes, die Beschreibung seiner Struktur, ist eine fundamentale Voraussetzung jeder wissenschaftlichen Operation, also auch der Analyse von Texten. Und wie bei jedem Untersuchungsobjekt gibt es auch bei Texten verschiedene Möglichkeiten der Ordnung und entsprechend verschiedene Ordnungskriterien, die eine Funktion der jeweils verfolgten Fragestellung sind: so Der Begriff Diskurs meint hier - im Sinne der strukturalistischen Unterscheidung von 'histoire' und 'discours' - »die konkrete sprachliche Realisierung des Erzählten« (LUDWIG 1985, 75), den »Text der Geschichte« (STIERLE 1975, 49-55).
Kapitel III: Montage
145
Einen Erzählfilm kann man nach technisch-quantitativen Kriterien ordnen, indem man Zahl, Länge und Konjunktionen der Einstellungen notiert, und erhält dann ein Bild seiner schnitttechnischen und rhythmischen Ordnung; man kann ihn nach seinen Schauplätzen ordnen und erhält dann ein Bild seiner räumlichen Organisation; man kann ihn nach Figuren und Konfigurationen ordnen und erhält dann ein Bild seiner konfigurativen Struktur; man kann ihn nach zeitlichen Kriterien ordnen und erhält dann ein Bild seiner Zeitstruktur; man kann ihn nach handlungslogischen Kriterien ordnen und erhält dann ein Bild seiner handlungslogischen Ordnung. Alle diese Ordnungen interferieren miteinander, aber keine ist mit den anderen kongruent. Die Segmentierung des filmischen Diskurses hat es demnach mit verschiedenen Segmentierungsebenen und mit entsprechend verschiedenen filmanalytischen Erkenntniszielen zu tun, ein Umstand, dem hier mit der je gesonderten Diskussion der zeitlichen (Kap. 2.1) sowie der technischen, konfigurativen und räumlichen (Kap. 2.2) und schließlich der handlungslogischen Struktur von Filmen (Kap. 2.3) Rechnung getragen wird. Christian Metz ' »große Syntagmatik« Jeder Versuch, den filmischen Diskurs auf eine einzige Ordnung zurückzuführen, bringt die Vielzahl der eben genannten Ordnungsebenen notwendig zum Verschwinden und damit zugleich das Bewußtsein für die (vom Erkenntnisziel geleiteten) Perspektivität jeder Ordnung des Untersuchungsgegenstands. Dies ist der Fall bei dem wohl prominentesten Modell filmischer Segmentierung, bei der »großen Syntagmatik« von Christian Metz,51 die eben jene Vielzahl möglicher Ordnungsebenen ignoriert, indem sie eine universale Ordnung des filmischen Diskurses postuliert. Dies gelingt nur um den Preis logischer Inkonsequenzen: Die acht 'großen Syntagmen' (vgl. Abb. 10) ergeben sich aus binären Oppositionen, die sich, wie schon Kuchenbuch feststellte, 52 einem ständigen Wechsel der Differenzkriterien verdanken.53 Das wäre 51 METZ 1966/67, 165-198. Metz' Syntagmatik ist zwar in den vergangenen Jahren ausgiebiger, z.T. sogar heftiger Kritik unterzogen worden (vgl. z.B. KUCHENBUCH 1978, 41-45; SCHNEIDER 1981, 206-215; MÖLLER 1986, 164-343), aber da diese kritischen Auseinandersetzungen letztlich 'systemimmanent' bleiben, das Modell mit immer neuen Korrekturversuchen, mit Ergänzungen oder Umgruppierungen bearbeiten, im Prinzip also an ihm festhalten (vgl. z.B. SCHNEIDER 1981, 213-215; MÖLLER 1986, 192-291, 314ff.), haben sie bislang wenig daran ändern können, daß die »große Syntagmatik« in der praktischen Filmanalyse nach wie vor als autoritatives Modell fungiert (vgl. z.B. SCHULZ/WALDMANN 1985, 332f.). 52 V g l . KUCHENBUCH 1 9 7 8 , 4 2 .
33 Das hat Metz' Syntagmatik freilich mit vielen früheren und späteren 'Montagetabellen' gemeinsam, vgl. etwa PUDOWKIN 1961, 65-79; ARNHEIM 1979, 116-120; KUCHENBUCH 1978, 40f.; FAULSTICH 1980, 125-139.
146
Kapitel 111: Montage
zu verschmerzen, wenn diese Oppositionen nicht - in vager Anlehnung an Denkmodelle der Konstituentenstrukturgrammatik - als Knotenpunkte eines Stemmas postuliert würden, denn dadurch avancieren sie zu Kriterien einer sukzessiven Ausgliederung von disjunkten Teilmengen (sog. »autonomen Segmenten«) aus der Gesamtmenge 'Film': Weil auf jeder Ebene des Stemmas jeweils nur eine der binären Oppositionen zugelassen werden kann, um das digitale Schema der sukzessiven Ausgliederung von Teilmengen einzuhalten, Abb. 10: Christian Metz: Tabelle der »großen Syntagmen« Autonome Segmente Syntagmen
1. autonome Einstellung
a-chronologische Syntagmen 2. paralleles Syntagma
chronologische Syntagmen
3. Klammeningssyntagma
narrative Syntagmen
lineare Syntagmen
ι
1
Sequenzen 7. Sequenz durch Episoden
4. deskriptives Syntagma
5. alterniertes Syntagma
1 6. Szene
8. gewöhnliche Sequenz
weil aber diese Oppositionen von Ebene zu Ebene wechseln, kommen an den Endknoten des Stemmas schließlich Einheiten zu stehen, die gar keine disjunkten Mengen sein können. Der ständige Wechsel der Klassifikationskriterien führt zwangsläufig zu hierarchischen oder Kreuzklassifikationen, so daß die an den Endknoten des Stemmas verzeichneten Teilmengen fast alle selbst wieder Teilmengen anderer Teilmengen sein können, also keineswegs »autonome« Segmente sind, sondern größtenteils im Verhältnis der Überlappung oder der Inklusion stehen. 54 Das binäre Schema zwingt Metz dazu, Merk-
54
So sind etwa die ausschließlich als a-chronologische Syntagmen zugelassenen Formen des filmischen Vergleichs (»paralleles Syntagma«, »Syntagma der zusammenfassenden Klammerung«) nicht an die A-Chronologie gebunden, können auch als narrative Syntagmen begegnen (vgl. Kap. D). Dasselbe gilt für das »deskriptive Syntagma«, dessen Opposition zu den narrativen Syntagmen keineswegs zwangsläufig ist. Die als Alternative zum »alternierten Syntagma« und zu den »Sequenzen« ausgesonderte »Szene« ist der Grundbaustein ihrer Opponenten: Jedes narrative Syntagma besteht aus szenischen Einheiten, seien diese nun aus mehreren Einstellungen szenisch montiert oder in »autonomen« Einstellungen (Sequenz-Einstellungen) präsentiert, die selbst eine szenische Einheit darstellen (die Metz
Kapitel III: Montage
147
male, die gemeinsam ein Syntagma charakterisieren können, als oppositive Merkmale zu postulieren. Motor dieser logischen Fehler ist die der Modellbildung vorausliegende Identifikation syntaktischer und textueller Strukturen. Die Bestimmung der acht 'großen Syntagmen' versteht sich als eine »zunächst empirische und rein induktive Klassifizierung«, die dann »im nachhinein aus einem deduktiven System entwickelt« werden soll.55 Dieses »deduktive System« wird im assoziativen56 Rekurs auf Denkmodelle der Konstituentenstruktur- und Transformationsgrammatik gewonnen, der das klassifikatorische Stemma unter der Hand zu einem Konstituentenstrukturbaum mutieren läßt, den Metz dann »im nachhinein« auch noch als transformationsgrammatischen Befund postuliert, nämlich als Beschreibung der erzählgrammatischen »Tiefenstruktur« filmischer Narration schlechthin.57 Auf diesem Wege werden die »großen Syntagmen«, die ja lediglich Teilmengen einer Gesamtmenge sind, unvermutet in Elemente eines Systems und ihre Gesamtmenge in dieses System selbst umdefiniert. Die »zunächst empirische und rein induktive« Klassenbildung wird also »im nachhinein« als Ergebnis taxonomischer Verfahren hingestellt, die 'Syntagmen' nun als 'Paradigmen', als Klassen textbildender Einheiten, postuliert, deren Kombination dann eine Gesamtstruktur, den Film, hervorbringen soll.58 Es handelt sich hier um eine einfache Umbenennung der Ergebnisse intuitiver Klassifikationsverfahren in strukturalistische Größen, denn weder die Seg-
55 56
57
58
aber nicht als Szenen kategorisiert, sondern, weil sie nur aus einer Einstellung bestehen, als »autonome Einstellungen« eigens ausgliedert). METZ 1966/67, 170. Die Ähnlichkeit des Metzschen Stemmas mit einer Darstellung der Konstituentenstruktur von Sätzen erschöpft sich in der digitalen Organisation und in dem Umstand, daß in beiden Fällen an den Knoten jeweils Klassen von satz- bzw. (behauptetennaBen) textbildenden Einheiten, Paradigmen, zu stehen kommen. Daß die für die Konstituentenstruktur definitorischen Dominanz- und Präzedenzrelationen zwischen den Knotenpunkten hier durch willkürlich gewählte klassifikatorische Relationen ersetzt sind, scheint Metz ebensowenig zu bemerken wie den Umstand, daß er keinerlei Aussagen über die Basisregeln (Phrasenstrukturregeln, Subkategorisierungsregeln, Lexikon) machen kann, die die »Entscheidungen« des Filmemachers (vgl. Anm. 57) leiten. Es handelt sich also auch hier, wie so oft in der Filmsemiotik, um einen bloß metaphorischen Gebrauch linguistischer Begriffe. Die »große Syntagmatik« sei, so Metz, in der Lage, die »Tiefenstruktur der Entscheidungen, vor die sich ein Filmemacher für jede einzelne 'Sequenz' seines Films gestellt sieht«, abzubilden (METZ 1966/67, 170). »Die hier dargestellten Syntagmen bilden zusammen gleichzeitig auch eine Paradigmatik. Denn die Einheiten, zwischen denen der Filmautor für jede 'Sequenz' seines Films wählen kann, sind genau die vorhandenen Typen der syntagmatischen Anordnung, und deren Zahl ist begrenzt. Man hat es also zu tun mit Paradigmen von Syntagmen« (ebd. 187).
148
Kapitel III: Montage
mentierung noch die Klassifizierung sind Ergebnisse strukturalistischer Operationen.59 Einstellung, Szene und Sequenz als quantitative und qualitative Größen Seit je werden beim Film drei Segmenttypen - Einstellungen, Szenen und Sequenzen - unterschieden und als quantitative Größen verstanden: Szenen bestehen aus mehreren Einstellungen, Sequenzen aus mehreren Szenen, Filme aus mehreren Sequenzen. Das impliziert zugleich die klare Hierarchie: Film Sequenzen - Szenen - Einstellungen. Diese quantitative Hierarchisierung leuchtet nur auf den ersten Blick ein, denn tatsächlich verdankt sich die Unterscheidung der drei Segmenttypen anderen und differenten Kriterien: Die Einstellung ist ein technisch (durch den Filmschnitt), die Szene ein zeitlich und die Sequenz ein unterschiedlich und ungenau definiertes Segment, das aber in der Regel als eine - irgendwie - semantisch-logische Einheit verstanden wird. Deshalb sind Einstellungen, Szenen und Sequenzen auch nicht hierarchisch aufeinander zu beziehen, denn technisch definierte Segmente können immer auch und zugleich zeitliche oder semantisch-logische Einheiten sein, d.h. Einstellungen können den Status einer Szene und Szenen (also auch Einstellungen) den Status einer Sequenz haben. Die Begriffe sind also doppeldeutig· Die filmische Szene sei hier, filmtheoretischer Tradition folgend (und im Unterschied zum dramentheoretischen Begriffsverständnis), als ein durch zeiträumliche Kontinuität definiertes Segment bestimmt, dessen Anfang und Ende also durch zeitliche Diskontinuität markiert sind. Das Verhältnis der technischen Grundeinheit, der Einstellung, zur Szene kann folglich problemlos bestimmt werden, weil Einstellungen der Einheit von Ort und Zeit unterworfen sind und sich daher auch zeitlich definieren lasse Die als »Paradigmen« postulierten Einheiten sind nicht aufgrund struktureller Klassifikationskriterien, nämlich nicht aufgrund syntagmatischer Relationen zustandegekommen und sind eben deshalb auch keine Paradigmen, also keine Klassen von Elementen, deren gemeinsames, klassenbildendes Merkmal die gleiche syntagmatische Umgebung und daher die wechselseitige Substituierbarkeit an gleicher syntagmatischer Stelle wäre. Vielmehr sind sie Resultat jener heterogenen binären Oppositionen, die sich nicht auf die syntagmatische Umgebung der Segmente beziehen, sondern vielmehr auf unterschiedliche Merkmale ihrer Erscheinungsform, auf ihre quantitative Ausdehnung (die Anzahl der Einstellungen oder Szenen) und ihre innere Organisation (zeitlich vs. nicht zeitlich, gleichzeitig vs. sukzessiv, stark vs. schwach raffend, linear vs. alterniert). Über die syntagmatische Umgebung der »autonomen« Segmente und damit über das, was die Behauptung ihrer »Autonomie« begründen könnte, sagt diese »Syntagmatik« nichts aus, d.h. sie kann die syntagmatischen Relationen, aufgrund deren die Segmente allein als strukturelle Einheiten gelten könnten, nicht bezeichnen, eben weil diese Relationen hier überhaupt keine Rolle spielen, also weder als Segmentierungs- noch als Klassifikationskriterien fungieren.
Kapitel III: Montage
149
sen: Eine Einstellung hat immer dann den Status einer Szene, wenn zwischen ihr und den beiden sie umgebenden Einstellungen die Beziehung zeitlicher Diskontinuität herrscht. Die filmische Sequenz sei hier mit allem Nachdruck von quantitativen und zeitlichen Konnotationen freigehalten und als ausschließlich handlungslogisch definiertes Segment bestimmt, dessen Anfang und Ende durch noch zu explizierende handlungslogische Kategorien, durch die Ausgangs- und Endsituation einer Handlung, markiert sind (vgl. C.2.3). Einstellungen und Szenen sind daher keine 'Bestandteile' von Sequenzen, sondern Einheiten einer anders gearteten, eben der technischen bzw. zeitlichen Ordnung des filmischen Diskurses. Daß sie - in der handlungslogischen Ordnung - zugleich den Status von Sequenzen haben können, sobald ihre technisch bzw. zeitlich definierten Segmentgrenzen mit handlungslogisch definierten zusammenfallen, ändert daran nichts.
2.
Formen der narrativen Strukturierung
Im weiteren sind nun die verschiedenen Ordnungen' des narrativen Diskurses, von denen oben die Rede war, und damit die verschiedenen Möglichkeiten seiner Segmentierung sowie deren - im einzelnen sehr unterschiedliche interpretationsmethodische Relevanz zu klären. Alle diese 'Ordnungen', das wurde schon betont, zeigen untereinander Interferenzen, sind aber nicht, wie die Metzsche Syntagmatik das versucht, zur Deckung zu bringen. Vielmehr schafft ihre klare Differenzierung überhaupt erst die Voraussetzung, ihre Interferenzen zu erkennen, und damit, wie sich zeigen wird, aufschlußreiche Einblicke in die Zusammenhänge zwischen Diskursstruktur und Sinnstruktur zu gewinnen. 2.1 Zeitliche Strukturierung: Organisationsformen der Zeitstruktur im Film Die Typologie filmischer Rekurrenzen hat gezeigt, daß und mit welchen Mitteln im Film zeitliche Beziehungen zwischen Bildern, Beziehungen der zeitlichen Kontinuität oder Diskontinuität, hergestellt werden können, aufgrund welcher Voraussetzungen also auch im Film - wie in jedem narrativen Text Zeit in doppelter Gestalt und auf zwei Zeitachsen erscheint, auf der Zeitachse der 'Geschichte' als Zeit des Erzählten und auf der Zeitachse des Diskurses als Zeit des Erzählens. Die Relation zwischen beiden beschreibt die Zeitstruktur erzählender Texte: Die Analyse der Beziehung zwischen Erzählzeit (Filmzeit) und erzählter Zeit (gefilmter Zeit) gibt Aufschluß über den erzählerischen Akt der zeitlichen Organisation des Erzählten, und zwar in doppelter
150
Kapitel III: Montage
Hinsicht: Sie gibt Aufschluß über die Beziehung der zeitlichen Ausdehnung beider Zeitachsen, d.h. über den Grad der Raffung oder Dehnung der erzählten Zeit im Akt des Erzählens und über die Beziehung der beiden Chronologien des Erzählten und Erzählens, d.h. über die Anordnung der erzählten Chronologie auf der Zeitachse des Erzählens. Die Organisationsformen der Zeitstruktur sind beim Film im Prinzip dieselben wie bei sprachlichen Erzähltexten, sind hier deshalb nur mit Bezug auf ihre besonderen medienspezifischen Bedingungen zu rekapitulieren. Szenisches Erzählen Anders als sprachliches Erzählen vollzieht sich filmisches Erzählen im Wege der szenisch-dramatischen Präsentation des Erzählten (vgl. Kap. I.C.2). Seine conditio sine qua non ist daher das, was man 'zeitdeckendes Erzählen' nennt: Der präsentische Modus filmischer Rede bringt es mit sich, daß die filmische Narration nur zustandekommt, indem sie von einem zeiträumlichen Kontinuum zum nächsten, von Szene zu Szene also, voranschreitet. Möglichkeiten, die Zeitstruktur anders denn als Kongruenz von Erzählzeit und erzählter Zeit zu organisieren, bestehen daher nur zwischen den Szenen. Voraussetzung für die Rekonstruktion der Zeitstruktur von Filmen ist daher die Zerlegung des filmischen Diskurses in seine szenischen Einheiten. Die Organisation der zeitlichen Beziehungen zwischen diesen Einheiten ist der eigentliche Gegenstand der zeitstrukturellen Analyse. Raffung und Dehnung Weil Zeitraffung im Film stets nur zwischen Szenen stattfinden kann, unterliegt sie besonderen Bedingungen. Der filmische Erzähler hat, anders als der sprachliche Erzähler, keine genuin optische Möglichkeit, einen Vorgang abstrahierend zusammenzufassen, eben weil seine Sprache nicht-klassifikatorischer Natur ist (Kap. I.A). 60 Raffung vollzieht sich im Film also stets in mehr 60 »Auf dem Wiener Hauptbahnhof angekommen, ging er sofort in die Stiftgasse, um Harry wiederzusehen«: Dieser einfache Vorgang, den die Sprache in einem einzigen Satz zusammenfassen kann, verlangt, soll er filmisch vermittelt werden, einen erheblich größeren Aufwand und 'verbraucht' damit auch mehr Erzählzeit. Weil die Bildersprache keine klassifikatorischen 'Vokabeln' hat, kann sie diesen Vorgang nur vermitteln, indem sie ihn zumindest in seinen konstitutiven Teilen - szenisch vorführt. Der Satz beschreibt die Anfangsszenen von Carol Reeds »Der dritte Mann« (GB 1949), in denen Holly Martins' (Joseph Cotton) Ankunft in Wien und sein Weg zum Haus seines Freundes Harry Lime erzählt werden: Der Film braucht dafür, obwohl er für seine Exposition eine Erzählerstimme zuhilfe nimmt, die seinen Bedarf an expositorischen Szenen erheblich senkt, drei Szenen. Die erste zeigt Holly Martins in dem einfahrenden Zug, die zweite am Bahnhof im Gespräch mit einem Besatzungspolizisten, der seinen Paß kontrolliert, die dritte vor und in Harry Limes Haus.
Kapitel 111: Montage 151 oder weniger großen Sprüngen von Szene zu Szene, und das heißt zugleich, daß sie stets ein Akt der vollständigen Aussparung von Zeitspannen der Geschichte ist, weil es keine bildsprachlichen Möglichkeiten gibt, einen Vorgang zu 'nennen', ohne ihn bzw. Teile davon szenisch zu zeigen. Was bildlich nicht 'genannt', gezeigt wird, geht vollständig verloren, kann allenfalls über wortsprachliche Vermittlungswege nachgetragen werden.61 Fieldings Wort, wonach raffendes Erzählen »unwichtige Zeitspannen« der Geschichte zu übergehen bestimmt ist,62 trifft für den Film noch sehr viel konsequenter zu als für sprachliche Erzähltexte: Letztere haben eine Fülle von Zwischenstufen zwischen vollständiger Aussparung und szenischer, zeitdeckender Darstellung, im Film aber ist jede Raffung eine Auslassung, ist mit dem vollständigen Verzicht auf eine bildliche Bezeichnung des ausgesparten Vorgangs verbunden. Möglichkeiten, die erzählte Zeit zu dehnen, sind im Film begrenzt, weil die Kamera, solange sie läuft, dem Gesetz der zeiträumlichen Einheit unterworfen ist. Sieht man ab von den technischen Mitteln der Zeitlupe und der Standkopierung (freeze frame), die in der Lage sind, das Gesetz der Einheit der Zeit in der Einstellung aufzuheben, könnte man allenfalls dort von Zeitdehnungen sprechen, wo die Kamera Vorgänge zeigt, die mutmaßlich schneller ablaufen, als sie sie zeigen kann. Gemeint sind mentale, psychische Vorgänge wie Gedanken, Erinnerungen, Träume, Visionen usw., die die Kamera nur im 'objektiven' Zeitmaß darstellen kann, weil sie an ihr chronometrisches Zeitmaß von 24 Bildern pro Sekunde gebunden ist. Ähnliches gilt für subjektive Zeiterfahrung, für deren Darstellung der Film letztlich kein geeignetes Mittel, sondern nur grobe Surrogate (Zeitlupe, Zeitraffer) hat. Phasenbildung Aus dem »einfachen Vergleich von erzählter und Erzählzeit«,63 ergibt sich die zeitstrukturelle Organisation von Filmen, soweit sie die Ausdehnung der beiden Zeitachsen des Erzählens und des Erzählten betrifft. Da der Film immer nur in zeitdeckenden Einheiten erzählen kann, beschränkt sich der Vergleich von erzählter und Erzählzeit hier auf die Quantifizierung der ausgelassenen 61 Holly Martins Weg vom Wiener Bahnbof zum Haus seines Freundes (vgl. Anm. 60), geht im Film vollständig verloren: Der Zuschauer erschließt ihn aus den sprachlichen Informationen des Off-Erzählers, aus Martins' Dialog mit dem Militärpolizisten und aus den Rekurrenzen und Differenzen der Bilder, in den Bildern selbst aber ist er nicht präsent. 62 LÄMMERT 1 9 6 8 , 8 3 .
63 Ebd. - Dieser Vergleich ist beim Film (und häufig auch bei Eizähltexten) so 'einfach' freilich gar nicht immer durchzufühlen, denn er setzt voraus, daß die zeitlichen Verhältnisse des Erzählten präzise expliziert werden, was in vielen Filmen (ebenso in vielen Erzähltexten) durchaus nicht immer der Fall ist.
152
Kapitel 111: Montage
Zeitspannen. Das zeitstrukturelle Grundmuster ist also klar und bei jedem Film dasselbe: Es zeigt eine Kette unterschiedlich langer szenischer Einheiten, die durch unterschiedlich starke Zeitsprünge getrennt sind. Möglichkeiten, diese Kette gleichrangiger Einheiten zeitlich zu strukturieren, ergeben sich aus der Quantität der Zeitsprünge, aus den Raffungsgraden. Starke Zeitsprünge zeigen mehr oder weniger markante zeitliche Schnittstellen an, während geringe Raffungsgrade einen engen zeitlichen Zusammenhang zwischen den Szenen und damit zeitliche Fokusbildungen indizieren, die hier Zeitphasen genannt seien:64 Zeitphasen sind Folgen mehrerer zeitlich eng zusammenhängender Szenen, betreffen also Zeitabschnitte der Geschichte, in denen sich 'viel' ereignet, und gemäß dem Fieldingschen Diktum muß es sich bei diesen 'vielen' Ereignissen um solche handeln, die der Erzähler für 'wichtig' hält, denn sonst würde er sie aussparen. Deutlich ausgeprägte Zeitphasen, zeitlich dichtgedrängte Folgen 'wichtiger' Ereignisse indizieren demnach entscheidende Entwicklungsphasen und/oder Wendepunkte der Geschichte, die die Ausführlichkeit des Erzählens begründen. Die Wechsel von stärkeren zu geringen und von geringen zu stärkeren Raffungsgraden markieren Anfang und Ende der Zeitphase durch den Wechsel des Erzählrhythmus. Über die semantischen Funktionen solcher Rhythmuswechsel kann die Rekonstruktion der Zeitstruktur selbst natürlich noch nichts aussagen, wohl aber kann sie der Interpretation damit einige Vorgaben machen, indem sie ihr die interpretatorische Begründung ihrer Befunde zuweist. Raffungsarten: Sukzessive und thematische Raffung Die Unterscheidung zwischen unterschiedlichen Raffungsarten, zwischen sukzessiver und thematischer Raffung, die Eberhard Lämmert im Anschluß an Günther Müller für wortsprachliche Erzähltexte getroffen hat,65 läßt sich auch auf Filme anwenden. Die sukzessive Raffung ist eine »in Richtung der erzählten Zeit fortschreitende Aufreihung von Begebenheiten«, ihre »Grundformel (...) ist das: 'Dann ... und dann . . . V 6 6 Die thematische Raffung faßt einen größeren Zeitraum dadurch zusammen, daß sie nach thematischen Gesichts-
64 Lämmert (ebd. 73ff.) spricht hier von Erzählphasen und verlagert den Akzent damit auf den Erzählakt. Da aber die zeitliche Konzentration von Szenen zunächst ja nur besagt, daß die in ihnen erzählten Vorgänge auf der Zeitachse der Geschichte nah beieinander liegen, aber noch nichts darüber aussagt, was diese Vorgänge miteinander zu tun haben, wird hier der unverfänglichere und auf die Ebene der Geschichte weisende Begriff Zeitphase vorgezogen. 65 Ebd. 83f. 66 Ebd. 83.
Kapitel III: Montage
153
punkten ausgewählte Ereignisse der gerafften Zeitspanne präsentiert.67 Thematische Raffung meint also die erzählerische Komprimierung eines Zeitraumes durch die Darstellung von Ereignissen, die zwar im Verhältnis der chronologischen Sukzession stehen können und deren Sukzession dann ihre Anordnung auf der narrativen Achse bestimmt, deren Auswahl aber nicht dem Kriterium der Sukzession, sondern einem inhaltlichen, nicht-zeitlichen tertium comparationis, dem 'Thema', folgt, das diese Ereignisse miteinander verbindet. 68 Verdeckte Raffung: Alternierende Szenenverknüpfung Ein besonderes Verfahren der Raffung ermöglicht die alternierende Montage zweier Szenenfolgen (nicht zu verwechseln mit der alternierenden innerszenischen Montage, vgl. Rekurrenztyp lb), bei der sich das Kriterium der Alternation oder, besser, der abwechselnden 'Wiederkehr' allererst aus figuralen Rekurrenzen ergibt: Die Montage verknüpft hier zwei Szenenfolgen, die, jede für sich, durch figurale Rekurrenzen verbunden sind, Szenenfolgen also, die, würde man sie entflechten und jede für sich zusammenfügen, einer der in den Rekurrenztypen 2-6 repräsentierten Szenenverbindungen zuzurechnen wären, wobei sich die zwischen diesen Szenen ausgelassenen Zeitspannen - das geht aus ihrer Verflechtung schon von selbst hervor - im Rahmen vergleichsweise kleiner Zeiteinheiten bewegen, nämlich nicht über Gebühr größer sein dürfen als der jeweils eingeflochtene Part der zweiten Szenenfolge. Daß sie aber größer sein können, verweist auf die Besonderheit dieses Verfahrens, die darin besteht, daß eventuelle Raffungsakte hier nicht als Raffungsakte spürbar werden: Die ineinander geschobenen Szenen werden als Fragmente zweier gleichzeitig ablaufender Vorgänge A und Β verstanden und die eingeschobenen Szenen des Vorgangs A daher als Unterbrechungen des 67 Lämmert sieht für diesen Typ zunächst nur die Möglichkeit vor, entweder iterative, also periodisch (z.B. im tages- oder jahreszeitlichen Rhythmus) wiederkehrende Ereignisse oder durative, den gesamten Zeitraum andauernde Zuständlichkeiten zum Thema der Raffung zu machen (ebd. 84), spricht wenig später aber selbst allgemeiner von thematischer Raffung (ebd. 86), ein Begriff, der mir den Sachverhalt, mit Blick auf den Film zumal, angemessener zu erfassen scheint, weil er das Thema, das die Raffung leitet, nicht präjudiziell. Iterative und durative Raffungen sind demnach nur eine Spielart der thematischen Raffung. 68 Orson Welles' Film »Citizen Kane« (USA 1940) bietet für die Illustration zeitstruktureller Organisationsformen im Film eine reichhaltige Quelle, so auch fur thematische Raffungsformen. Die hier schon mehrfach erwähnte Bilderfolge, die die Entwicklung der ersten Ehe des Helden am Beispiel zeitlich weit auseinanderliegender Frühstiicksszenen darstellt (vgl. Kap. II, Anm. 17), ist eine filmische Form thematischer und darin iterativer Raffung: Das tertium comparationis dieser Szenen, das Thema der Raffung, ist ein iteratives, nämlich die wiederkehrende Situation des gemeinsamen Frühstücks der Eheleute, in der sich das banale Schicksal dieser Ehe spiegelt.
154
Kapitel III: Montage
Vorgangs Β und umgekehrt empfunden. Das schafft die Illusion, als verstreiche die mit der jeweils eingeschobenen Szene des Vorgangs A vergehende Zeit simultan auch im Vorgang Β und als schalte sich die Kamera bei ihrer Rückkehr zum Vorgang Β nach eben dieser Zeitspanne wieder in das Geschehen ein. Daß hier unter Umständen sehr viel mehr Zeit vergangen ist, wird durch dieses Verfahren kaschiert, so daß der Eindruck eines über die Szenenwechsel hinausreichenden kontinuierlichen Flusses der Zeit entsteht.69 Wo dieses Verfahren Szenen ein und derselben Sequenz verknüpft, sei hier von alternierender Szenenverknüpfung gesprochen. Metz sieht dafür den Begriff des »alternierten Syntagmas* (vgl. Abb. 10, Nr. 5) vor und schließt damit die Möglichkeit aus, daß die solchermaßen alternierend montierten Szenenfolgen unter Umständen auch den Status von (zwei verschiedenen) Sequenzen haben können, ein Fall, der hier alternierende Sequenzverknüpfung genannt sei (vgl. dazu Kap. C.2.3.2). Wenn man den Begriff des »alternierten Syntagmas« aus dem Metzschen System herausnimmt, also seine Opposition zum Sequenzbegriff tilgt, kann man ihn als allgemeinen Oberbegriff für beide Formen der alternierenden Montage beibehalten.70 Zeitebenen: Rücksendungen und Vorgriffe Unterbrechungen der linear-chronologischen Sukzession des Erzählten markieren Wechsel der Zeitebene, sprunghafte Wechsel von der Ebene der erzählten Gegenwart auf vergangene bzw. zukünftige Ereignisse der erzählten Vgl. REISZ/MILLAR 1988, 155. - Besonders beliebt ist dieses Verfahren, um Wege, die in einer der beiden Szenenfolgen zurückgelegt werden, abzukürzen, vor allem dann, wenn sie auf den Schauplatz der zweiten Szenenfolge fuhren: Das filmische Erzählmuster der »herannahenden Rettung« (oder auch der herannahenden Gefahr) hat schon Griffith in seinen frühen Kurzfilmen auf diese Weise montiert (vgl. z.B. »The Lonedale Operator«, USA 1911). 70 Die zeitlichen Verhältnisse altemierter Syntagmen charakterisierend, bemerkt Metz, hier würden »zwei oder mehr Ereignis-Serien so dargestellt, daß innerhalb jeder Serie die zeitlichen Beziehungen der Konsekution eingehalten werden, aber zwischen den en bloc aufgenommenen Serien Simultaneity herrscht« (METZ 1966/67, 177). Das ist ein Widerspruch in sich, denn die zweite Bestimmung schließt die erste aus: Wenn die Bilder beide Ereignisserien wirklich ohne Auslassungen, also wirklich exakt gleichzeitig ablaufende Vorgänge zeigen sollen, dann müßte die Kamera bei jeder Alternation zu dem Zeitpunkt zurückspringen, an dem sie die Szene zuvor verlassen hatte, und das wäre ein mit dem präsentischen Modus filmischer Rede unverträglicher Akt, der beim Rezipienten für erhebliche Desorientierung sorgen würde. Tatsächlich gehorcht auch die alternierende Montage szenischer Einheiten dem Prinzip der Sukzession: Die Kamera wechselt im Voranschreiten der Zeit zwischen den Ereignisserien hin und her, muß also jeweils Teile der einen Serie auslassen, während sie Teile der anderen zeigt. Nur so kann die Narration vom Fleck kommen, und nur so kann, was Metz übersieht, eizählte Zeit unmerklich gerafft werden: Die alternierende Montage von Szenen schafft die Möglichkeit, erzählte Zeit zu unterschlagen.
Kapitel III: Montage
155
Geschichte. Solche Zeitebenenwechsel unterliegen im Film besonderen Bedingungen, zumindest dann, wenn sie auf bildlichem Wege, ohne wortsprachliche Erzählmittel (Off-Erzähler usw.), vollzogen werden sollen: Weil das Tempus filmischer Rede das Präsens ist, weil in den Bildern die zeitliche Koinzidenz von Erzählen und Erzähltem herrscht, ist die Erzählgegenwart immer auch die Gegenwart der erzählten Geschichte, kann die Montage auch immer nur beide gemeinsam auf der Zeitachse vor- oder rückwärts versetzen. Erzählte und Erzählgegenwart können nicht auseinandergelegt werden (vgl. S. 33f., 41f): Die Kamera kann den Zeitpunkt ihrer Wahrnehmungen nicht anders denn als Gegenwart bezeichnen, hat keine Möglichkeit, sie als Vergangenes oder Zukünftiges auszuweisen, d.h. es gibt kein bildsprachliches Zeichen für Vergangenheit oder Zukunft. Daraus ergibt sich die erzähllogische Konsequenz, daß Ereignisse, die vom Standpunkt der aktuellen Erzählgegenwart aus in der Vergangenheit oder in der Zukunft liegen, mit bildlichen Mitteln nur erzählt werden können, wenn der zurück- oder vorausgreifende Erzählakt aus der Erzählgegenwart abgeleitet wird dergestalt, daß Rückwendung oder Vorgriff als ein in der Erzählgegenwart sich vollziehender mentaler Akt (der Erinnerung, der Vorausschau etc.) motiviert werden. Das heißt zugleich, daß Rückwendung oder Vorgriff, sofern sie nicht durch wortsprachliche Erzählmittel eingeführt werden sollen, in szenische Einheiten eingelagert werden müssen, weil anders die Rückkehr zur Erzählgegenwart bildlich nicht plausibel gemacht werden kann: Nur indem die Kamera nach einer Rückwendung oder nach einem Vorgriff - gleichgültig, wie lange diese dauerten - zu der Szene zurückkehrt, die sie, durch sie motiviert, verlassen hatte, kann sie klarmachen, daß sie sich wieder auf der Ebene der Erzählgegenwart befindet. Rückwendungen beruhen auf der Fingierung von Erinnerungsakten, und zwar in den weitaus meisten Fällen von Erinnerungsakten der Figuren, so etwa auf Gesprächssituationen, in denen eine Figur sich an zurückliegende Ereignisse erinnert, die die Kamera dann filmisch vermittelt, indem sie das Erinnerte, häufig eingeleitet durch eine signifikante Blendenverbindung (meistens durch eine Überblende), szenisch präsentiert, um dann am Ende wieder zu der Ausgangssituation, dem Gespräch, zurückzukehren und im chronologisch-sukzessiven Erzählen fortzufahren. 71 Ähnlich wie die einen zweiten Er71 Ein Schulbeispiel für die Möglichkeiten des Films, mehrere Zeitebenen miteinander zu vermitteln und den narrativen Diskurs damit über markante Unterbrechungen der chronologischen Sukzession zu strukturieren, ist Orson Welles' »Citizen Kane«. Er erzählt seine Geschichte, die Lebensgeschichte des Charles Foster Kane, nicht chronologisch-sukzessiv von Anfang bis Ende, sondern rekonstruiert sie - nach Kanes Tod - aus den Erinnerungen von Menschen aus Kanes Umgebung und motiviert diese Rekonstruktionsarbeit mit einer Rahmengeschichte, die die Spurensuche eines Reporters erzählt, der Zeugen des Kaneschen Lebens in Interviews befragt. Die Interviews des Reporters Thompson konstituieren
156
Kapitel III: Montage
Zähler fingierenden Erzählakte in sprachlichen Erzähltexten (z.B. in Rahmenerzählungen) zeigen figurenperspektivisch motivierte Rückwendungen im Film besondere zeitliche Beziehungen zwischen den beiden Zeitebenen, in denen sich die erzähllogischen Konsequenzen der präsentischen 'Rede' der Kamera spiegeln: In erzähllogischer Sicht hat das in solchen Rückwendungen präsentierte Bildmaterial nicht den Status des erinnerten Geschehens selbst, denn die Kamera 'sieht' hier nicht dieses Geschehen, sondern das, was die Figur - sich erinnernd - vor ihrem inneren Auge sieht. Das heißt: Das in Rückwendungen präsentierte Bildmaterial hat den Status mentaler Erinnerungsbilder, einer in der Jetztzeit des Erzählens sich ereignenden inneren Bilderschau der Figur. 72 Insofern liegt in erzähllogischer Hinsicht eigentlich gar keine Unterbrechung der chronologischen Sukzession vor, denn die Bilder zeigen das Erinnerte als das in der Jetztzeit des Erzählens Vergegenwärtigte. Der Erinnerungsvorgang führt auf die Ebene der Vorzeithandlung, ist aber selbst Bestandteil der Gegenwartshandlung: Die Zeitdauer der Erinnerungsbilder ist die des Erinnerns und zugleich die des Erinnerten. Figurenperspektivisch motivierte Rückwendungen wechseln also die Zeitebene und die Realitätsebene (s.u.), indem sie das Gezeigte als innere Bilderschau der Figur ausweisen, und eben das gibt ihnen die Möglichkeit, die Zeitebene zu wechseln, ohne die zeitliche Kontinuität der den Ebenenwechsel motivierenden Szene zu unterbrechen.73 Vorgriffe, d.h. explizite Informationen über zukünftiges Geschehen, sind im Film durchaus möglich, kommen in der Praxis aber selten vor, und das die Ebene der Erzählgegenwart, die kurz nach Kanes Tod anzusiedeln ist. Aus den Erinnerungen der Interviewpartner, die nach Überblenden in Rückwendungen szenisch präsentiert werden, ergibt sich die Binnengeschichte, Kanes Lebensgeschichte, die in Ausschnitten und in wechselnden Perspektiven erzählt wird. Was hier die Struktur des gesamten Films bestimmt, begegnet in anderen Filmen gewöhnlich nur als Mittel, eine vor dem Erzählbeginn liegende Vorzeithandlung (Lämmert), zumeist ebenfalls motiviert über die Erinnerung einer Figur, nachzutragen. 72 im Film entsteht daraus ein erzähllogisches Problem: Die Einführung der Rückwendung als Erinnerungshandlung einer Figur verlangt eigentlich den Wechsel der Kamera in die Ich-Erzählsituation (vgl. Kap. IV), was jedoch in praxi so gut wie nie geschieht. In der Regel präsentiert die Kamera die Erinnerungsbilder vielmehr aus der auktorialen Außenperspektive, so daß die sich erinnernde Figur selbst weiterhin als Objekt, nicht als Subjekt des Erinnerungsakts figuriert und deshalb auch selbst in den Bildern erscheint. Dadurch aber wird die Sprechsituation verunklärt, weil die Figur ihren Status als Subjekt des erinnernden Sprechens verliert, sobald die Kamera ihre Erinnerungen in Bilder umsetzt. 73 Wo Rückwendungen als Erinnerungsakte des Erzählers und dabei ohne Zuhilfenahme sprachlicher Erzählmittel eingefühlt werden sollen, werden sie, damit der Konnex zur Ebene der Erzählgegenwart nicht verlorengeht, meistens ebenfalls in eine Szene eingelagert, etwa in Gesprächsszenen, die sich auf Zurückliegendes beziehen und die der Erzähler dann als Anlaß für seinen 'Rückblick' benutzen kann.
Kapitel III: Montage
157
nicht ohne Grund, denn sie bereiten einige Komplikationen. Da sich die präsentische 'Rede' der Kamera nicht, wie die Sprache, auf allgemeine Andeutungen des Zukünftigen beschränken, sondern Vorgriffe nur vollziehen kann, indem sie das zukünftige Geschehen selbst - oder doch wenigstens Teile davon - zeigt, handelt es sich dabei immer um Vorwegnahmen zukünftigen Geschehens, und der präsentische Modus filmischer Rede hat zur Folge, daß sich die Erzählgegenwart damit in die Zukunft verlagert. Dadurch entsteht das Problem, wie der Erzähler seine Rückkehr zur Ausgangssituation plausibel machen kann. Nicht also der Vorgriff selbst, der Sprung nach vom, der sich ja von normalen Raffungsakten nicht unterscheidet, sondern die Rückkehr zur Erzählgegenwart bereitet Schwierigkeiten: Da Vorgriffe erzähllogisch nicht durch die Figuren selbst, sondern nur durch eine die gesamte Geschichte überblickende Instanz vollzogen werden können, können sie nicht figurenperspektivisch motiviert werden, und eben deshalb kann auch die Rückkehr zur Ausgangsposition nicht über den Dialog, sondern allenfalls über sprachliche Erzählmittel plausibel gemacht werden. Eine Ausnahme von dieser Regel und zugleich die, wie mir scheint, plausibelste Lösung des Problems bieten Gesprächssituationen, die sich um ein von den Figuren schon absehbares zukünftiges Geschehen drehen, denn in diesen Fällen kann der Dialog die temporale Markierung der Zeitebenen leisten. Diese Lösungsmöglichkeit präsentiert Fassbinder in »Fontane Effi Briest« (BRD 1974) bei der Darstellung des großen Gesprächs zwischen Innstetten (Wolfgang Schenck) und Wüllersdorf (Karlheinz Böhm), in dem beide, initiiert durch Innstettens Bitte, Wüllersdorf möge ihm beim Duell mit Crampas sekundieren, über Sinn und Notwendigkeit des Duells diskutieren: In diese Gesprächsszene sind an mehreren Stellen Bilder einmontiert, die bereits die Reise Innstettens nach Kessin, zum Duell, zeigen. Der Erzähler macht damit demonstrativ klar, daß die Entscheidung für das Duell schon längst gefallen ist, daß die Wahlmöglichkeit, die sich Innstetten im Gespräch mit Wüllersdorf noch zu bieten scheint, keine ist. Die Lösung des Problems zeitlicher Vorgriffe im Film liegt hier in einem ebenso einfachen wie wirkungsvollen Kunstgriff, nämlich in der Wahrung der zeitlichen Einheit der Gesprächsszene und damit der Präsenz der Zeitebene der Erzählgegenwart durch den Tontrakt, also in einem nicht-bildlichen Mittel: Die gesamte Sequenz ist mit dem Dialog Innstettens und Wüllersdorfs unterlegt. Das erspart dem Erzähler die sonst nur schwerfällig über sprachliche Erzählerrede motivierbare Rückkehr zur Erzählgegenwart: Er verharrt auf der Ebene der Erzählgegenwart, 'hört' den beiden Gesprächspartnern weiter 'zu', während die Zukunft schon - wenn man so will, vor seinem geistigen Auge - erscheint. Seine Vorgriffe werden so von der Ebene der Erzählgegenwart aus plausibel gemacht, wobei dieses Zukünftige selbst durch
158
Kapitel III: Montage
den Dialog hinreichend präzisiert wird. Die alternierende Montage gegenwärtiger und zukünftiger Bilder erlaubt zugleich eine elegante Form der Zeitraffung, denn mit dem Ende der Gesprächsszene sind auch die einmontierten Zukunftsbilder, die Bilder der Reise nach Kessin, so weit in der Sukzession fortgeschritten, daß die Duellszene unmittelbar anschließen kann. Auch dieser Fall bestätigt die eingangs getroffene Feststellung, daß erzählte Gegenwart und Erzählgegenwart im Film nicht auseinandergelegt werden können: Fassbinders Lösung ist deshalb so überzeugend, weil sie die filmspezifische zeitliche Koinzidenz von Erzählen und Erzähltem respektiert, den Vorgriff aus der Erzählgegenwart ableitet, indem sie den einmontierten Zukunftsbildern durch den Tontrakt den Status eines in der Erzählgegenwart sich vollziehenden mentalen Akts - einer Vorausschau des 'allwissenden' Erzählers - gibt. Realitäts- und Fiktionsebenen Was über die zeitlichen Beziehungen zwischen verschiedenen Zeitebenen gesagt wurde, gilt auch für zeitliche Beziehungen zwischen Bildern, die verschiedene Realitäts- oder Fiktionsebenen visualisieren. Einstellungsfolgen, die mentale Prozesse (Gedanken, Träume, Visionen etc.) ins Bild setzen, wechseln die (fiktionale) Realitätsebene, ohne die zeitliche Einheit der diese Prozesse motivierenden Szene zu durchbrechen. Die als Erinnerung einer Figur motivierten Rückwendungen sind, wie schon angedeutet, immer auch als Wechsel der Realitätsebene anzusprechen. Wechsel der Fiktionsebene liegen vor, wenn Fiktionen selbst Gegenstand der filmischen Fiktion werden (Theater- und Film-im-Film-Einlagen), und auch hier bleibt die zeitliche Einheit der motivierenden Szene erhalten.74 2.2 Technische, räumliche und konfigurative Strukturierung Die Zergliederung des filmischen Diskurses in szenische Einheiten und deren Strukturierung nach Maßgabe der eben erörterten zeitstrukturellen Organisationsformen ergibt nur eine von mehreren möglichen 'Ordnungen' des Gegenstandes und zudem eine nur grobe. Differenziertere Strukturelemente, deren Analyse entsprechend differenzierteren interpretatorischen Fragestellungen als Grundlage dienen kann, ergeben sich aus Konfigurationswechseln, Schau74 »Citizen Kaue« liefert auch dafür ein gelungenes Beispiel: Die ruhige expositorische Sequenz am Beginn, die Kanes Tod zeigt, wird abrupt von lärmenden Bildern abgelöst, die Kanes Leben in einem raschen Überblick zusammenfassen und die sich dann als Rohfassung eines Wochenschauberichts herausstellen, den Wochenschau-Redakteure während einer Redaktionsbesprechung begutachten. Auch hier sind die Szenenfolgen der Wochenschau der Szene, die ihre Vorführung bedingt (der Redaktionskonferenz), untergeordnet, berühren die zeitliche Einheit der Rahmenszene nicht.
Kapitel III: Montage
159
Platzwechseln und aus den bisher nur am Rande erwähnten technischen Segmentierungssignalen, den Einstellungskonjunktionen. Die aus diesen Segmentierungskriterien abgeleiteten technischen, konfigurativen und räumlichen Segmente sind von besonderer Bedeutung für die Bildung szenischer Subsegmente, die der Interpretation einzelner Szenen Voraussetzungen zu liefern imstande sind. Allerdings sind diese Segmente, von den Einstellungen abgesehen, nicht nur innerhalb der zeitlichen Segmentgrenzen, der Szenen, anzutreffen, sondern können auch als szenenübergreifende Einheiten erscheinen und als solche Hinweise auf handlungslogische Zusammenhänge geben, korrespondieren also nicht nur mit den szenischen, sondern auch mit den sequentiellen Segmenten. 2.2.1 Segmentierungssignale Einstellungskonjunktionen Der einfache Schnitt ist, wie schon gesagt, eine semantische Null-Stelle: Er bedeutet nichts. Erst die Rekurrenzen und Differenzen zwischen den beiden Bildern, die er trennt, geben diesem »Nichts« Bedeutung. Als Segmentierungssignal ist er also erst im Rekurs auf die Bilder selbst von Belang. Bei Blenden ist das, zumindest graduell, anders: Ab- und Aufblenden, Überblenden, Klappblenden, Vorhangblenden, Rauchblenden, Zerreißblenden usw. 75 sind filmspezifische Kontextierungs- bzw. Segmentierungssignale mit gewissen eigenen semantischen Valenzen.76 Diese Valenzen sind jedoch nur schwach konventionalisiert und dadurch ihrerseits sehr kontextabhängig: Ob z.B. eine Überblende einen Zeitsprung, einen Wechsel der Zeitebene oder einen mentalen Prozeß (des Erinnerns, Träumens usw.) ankündigt, ist nur aus dem Zusammenhang, in dem sie erscheint, zu erschließen. Blenden sind also mehrdeutige Zeichen, die erst über den jeweiligen Kontext vereindeutigt werden, sind folglich keine autonomen Bedeutungsträger, ihre jeweiligen Funktionen deshalb nur im je konkreten Fall exakt zu bestimmen. Da Blenden aber nicht innerhalb normaler szenischer Einheiten erscheinen können, läßt sich ihre Funktion immerhin allgemein beschreiben als explizite Markierung und
75
Vgl. die Auflistung der Blendenformen bei SIEGRIST 1986, 177. Auf den Unterschied zwischen Blenden und Mehrfachbildern (Bildüberlagerungen) ist ausdrücklich hinzuweisen: Blenden sind Einstellungskonjunktionen, spezifizieren also die Beziehungen zwischen zwei Einstellungen. Mehlfachbilder (z.B. Doppelkopierung, Doppelbelichtung, split-screen etc.; vgl. MONACO 1980, 126), verändern den Inhalt der Einstellungen selbst, nicht die Beziehungen zwischen Einstellungen. Dieser Unterschied wird besonders in Bezug auf Überblenden und Bildüberlagerungen (Doppelbelichtungen etc.) gern vernachlässigt (vgl. SŒGRIST 1986, 179f.).
160
Kapitel III: Montage
zusätzliche Indikation von Szenenwechseln bzw. von Wechseln der Zeit- oder Realitätsebene. Diese allgemeine Funktionsbestimmung kann mit Blick auf die verschiedenen Blendenformen noch etwas spezifiziert werden: Mit Ausnahme der Abund Aufblenden (und ihrer Verwandten), die durch das Stück Schwarzfilm (Rauch, Nebel usw.), das sie zwischen die beiden Segmente legen, einen deutlichen Trennungsstrich schaffen (der ihre Konventionalisierung als Zeichen markanter zeitlicher Zäsuren begründet), zeigen alle übrigen Blendenformen eine mehr oder weniger deutliche Integration an, indem sie Bilder oder Bildteile der beiden Einstellungen für Momente gleichzeitig ins Bild setzen. Das verschafft ihnen einen vergleichsweise größeren Spielraum für semantische Varianzen, der allerdings nur bei einer Blendenform, nämlich bei der Überblende, wirklich erwähnenswert ist, zumal die übrigen Blenden in der Filmpraxis eine ohnehin untergeordnete Rolle spielen. Man kann diese variationsreicheren Blendenformen nach Maßgabe ihrer formalen Strukturen auf zwei Grundformen reduzieren, die entsprechende semantische Funktionen implizieren: Die eine Grundform beruht auf der Verdrängung des alten Bildes durch Verschiebungen der gesamten oder in Teilfelder gegliederten Bildfläche (Wisch-, Vorhang-, Jalousie-, Zerreißblende u. ä.), die andere auf der Verdrängung des alten Bildes durch Formen des Ineinanderfließens beider Bilder (Unschärfeblenden, Überblenden usw.). Im ersten Fall handelt es sich formal wie semantisch um einen Akt des 'Wegschiebens', der damit eher die segmentierende Funktion von Blenden betont: Das alte Bild wird von dem neuen buchstäblich weggewischt, zugedeckt, zerrissen usw. Im zweiten Fall handelt es sich formal wie semantisch um einen Akt der demonstrativen Integration, der damit eher die kontextierende Funktion von Blenden betont: Die beiden Bilder sind durch einen fließenden Übergang verbunden, der auf einen zeitlichen, räumlichen, mentalen oder thematischen Zusammenhang verweist. Prominenteste Vertreterin der zweiten Grundform ist die Überblende, und das nicht ohne Grund, denn sie ist die einzige Blendenform, bei der es zu einem echten Ineinanderübergehen beider Bilder kommt, das zudem keinen zeitlichen Begrenzungen unterliegt und deshalb ausgiebige Relationierungen beider Bilder erlaubt. Schauplatzwechsel Anders als auf der Bühne sind Wechsel des Schauplatzes beim Film nicht zwangsläufig mit Unterbrechungen der räumlichen Kontinuität verbunden, weshalb zwischen kontinuierlichen und diskontinuierlichen Schauplatzwechseln zu unterscheiden ist.
Kapitel III: Montage
161
Räumlich kontinuierliche Schauplatzwechsel werden normalerweise innerhalb von Einstellungen durch Kamerafahrten vermittelt, können aber auch durch sukzessive, den sich bewegenden Figuren nachfolgende, szenisch montierte Standortwechsel der Kamera erreicht werden. Ihre Funktion läßt sich allgemein als Klärung räumlicher Entfernungs- und Lageverhältnisse bestimmen. Da der Aktionsradius der Kamera innerhalb von Einstellungen und szenischen Einheiten beschränkt ist, sind die durch kontinuierliche Schauplatzwechsel vermittelten Räume in der Regel auch als Teile eines zusammenhängenden Gesamtschauplatzes zu kategorisieren (etwa verschiedene Räume eines Hauses, verschiedene Bereiche einer Straße, z.B. Gehsteig, Läden, Cafés usw.). Kontinuierliche Schauplatzwechsel sind aufgrund ihrer raumklärenden Funktion und ihrer Bezogenheit auf einen übergreifenden Gesamtschauplatz denn auch eher zusammenhangbildende (das Kontinuum des Raumes betonende) als segmentierende Zeichen. Ihre Bedeutung für die Subsegmentierung szenischer Einheiten ist deshalb in der Regel auch geringer als die der Konfigurationswechsel (s.u.). Wo aber diese als Segmentierungskriterien ausfallen, weil die Konfiguration nicht verändert wird, avancieren sie neben den Einstellungswechseln zu maßgeblichen Kriterien für die Bildung szenischer Subsegmente.77 Räumlich diskontinuierliche Schauplatzwechsel fallen in der Regel mit den Schnittstellen szenischer Einheiten zusammen (vgl. Rekurrenztypen 5, 6, 12).78 Auch sie haben - wie kontinuierliche Schauplatzwechsel - eine geringere disjunktive Kraft als Konfigurationswechsel, sind daher als Segmentierungskriterium dem des Konfigurationswechseis unterzuordnen: Die Verbindung, die eine von Szene zu Szene unveränderte oder nur partiell veränderte Konfiguration zwischen zwei Szenen herstellt, ist in der Regel stärker als die trennende Wirkung des Schauplatzwechsels. Und umgekehrt ist die Verbindung, die ein unveränderter Schauplatz schafft, in der Regel schwächer als die trennende Wirkung eines totalen Konfigurationswechseis. Wo aber ein diskontinuierlicher Schauplatzwechsel und ein totaler Konfigurationswechsel η Da die Ortsveränderungen hier kontinuierlich vermittelt werden, sind die Segmentgrenzen allerdings unscharf. Ihre Bestimmung hat daher einen gewissen Ennessensspielraum und läßt sich nur an der je konkreten Situation entscheiden. Ob etwa der Vorgang der Ortsveränderung selbst als Segment oder nur als Schnittstelle zwischen zwei Teilschauplätzen kategorisiert wird, hängt von den räumlichen Verhältnissen (von der Distanz zwischen den beiden Schauplätzen) und von seiner Funktion selbst ab: Wo er nicht nur die Funktion der Vermittlung räumlicher Verhältnisse hat, sondern selbst ein maßgebliches Thema der Szene ist (z.B. bei einer Fluchtszene u.ä.), konstituiert er zweifellos ein eigenes Segment. 78 Ausnahmen bilden z.B. alternierende Bilder zweier miteinander durchs Telefon kommunizierender Figuren: hier ist trotz räumlicher Diskontinuität die zeitliche Kontinuität gewahrt.
162
Kapitel III: Montage
zusammenfallen, entsteht die stärkste visuelle Disjunktion, die der Film kennt (Rekurrenztyp 12). Konfigurationswechsel und Kadrierung Die Begriffe Konfiguration und Konfigurationswechsel entstammen der Dramentheorie: Konfiguration meint das Ensemble der gleichzeitig auf der Bühne anwesenden Figuren, Konfigurationswechsel die durch den Abgang oder den Auftritt von Figuren bewirkte Veränderung dieses Ensembles.79 Die Konfigurationsanalyse dient in erster Linie der Rekonstruktion der Interaktionen und darin der Beziehungen zwischen den dramatis personae. Sie kann zugleich auch eine Segmentierung des Diskurses begründen, die - insbesondere im Zusammenspiel mit der technischen und räumlichen Strukturierung - die Detailanalyse einzelner Szenen fundiert. Eine den Konfigurationswechseln folgende Segmentierung ist in der Dramenanalyse mühelos zu praktizieren, weil die Bühne den Schauplatz und damit die je aktuellen Konfigurationen gewöhnlich als ganze präsentiert. Der Film aber zerlegt den Schauplatz, sofern er ihn nicht mit einer einleitenden Totale vorstellt, in Teilausschnitte, die mithin auch die Konfigurationen immer nur partiell erfassen. Erst auf der Grundlage der durch Schauplatzwechsel definierten räumlichen Einheiten des Films (s.o.) ist deshalb beim Film Aufschluß über die Konfigurationen zu gewinnen. Partielle Konfigurationswechsel liegen vor, wo nur ein Teil der Gesamtkonfiguration einer Szene, sei es durch Abgänge von Figuren, sei es durch Auftritte neuer Figuren, verändert wird. 80 Totale Konfigurationswechsel bezeichnen den vollständigen Austausch des Personals. Neben der Frage nach den mit den Konfigurationen rekonstruierbaren Interaktionen der Figuren und nach den Beziehungen zwischen den konfigurativen und den technischen und räumlichen Segmenten findet die filmische Konfigurationsanalyse ein weiteres Feld in der Untersuchung der wechselnden Kadrierung der Konfigurationen, d.h. der durch Einstellungswechsel, Kamerabewegungen und/oder Figurenbewegungen entstehenden Wechsel des jewei79 V g l . PFISTER 1 9 8 2 , 2 3 5 - 2 4 0 .
so Was Manfred Pfister mit Bezug auf Dramentexte betont, nämlich daß eine völlig konsequente Konfigurationsanalyse, die »auch sehr periphere Konfigurationsveränderungen berücksichtigt, (...) für die Rezeption des plurimedialen Textes oft irrelevant (ist)« (PFISTER 1982, 315), gilt für den Film noch mehr als für das Drama, weil hier - im Bereich der Statisterie, insbesondere bei Außenaufnahmen und Massenszenen - eine Fülle von partiellen Konfigurationswechseln denkbar ist, die der Zuschauer gar nicht registriert. Aber nicht nur mit Blick auf Statisten, sondern auch mit Blick auf Nebenfiguren sind partielle Konfigurationswechsel für die Segmentierung häufig unerheblich. Anders als beim Drama kann hier die Kameraführung eine maßgebliche Hilfe sein bei der Entscheidung darüber, ob ein peripherer Konfigurationswechsel berücksichtigt werden muß oder nicht.
Kapitel III: Montage
163
ligen Ausschnitts einer konstanten Konfiguration. Sie begründet die Ausgliederung weiterer Subsegmente, die Aufschluß über die innere Struktur einer konstanten Konfiguration geben können, genauer: darüber, wie die Erzählinstanz die Beziehungen zwischen den Figuren wahrnimmt. Dieser Segmentierungsschritt kann eine u.U. hochrelevante interpretationsmethodische Voraussetzung abgeben. 2.2.2 Beispielanalyse: Technische, konfigurative und räumliche Segmente als szenische Subsegmente An einer Szene aus Orson Welles' »Citizen Kane« sei illustriert, welche Funktionen die technische, räumliche und konfigurative Segmentierung für die Analyse und Interpretation einer filmischen Szene gewinnen kann. Es handelt sich dabei um eine Szene der 'Leland-Sequenz', d.i. der Teil des Films, der die Lebensgeschichte des Titelhelden aus der rückblickenden Perspektive seines ehemaligen Freundes und Kulturredakteurs, Jedediah Leland (Joseph Cotton), erzählt.81 In dieser Szene geht es um die Erpressung, mit der Kanes Konkurrent bei den Gouverneurswahlen, Jim Gettys, Kane zur Rücknahme seiner Kandidatur zu zwingen versucht, indem er ihm droht, sein Liebesverhältnis mit Susan Alexander publik zu machen: Er hat Susan gezwungen, Kanes Ehefrau Emily einen Drohbrief zu schreiben, worauf Emily sich entschließt, Susan aufzusuchen; sie setzt Kane davon in Kenntnis, der daraufhin zu ihr ins Auto steigt und mit ihr zu Susan fährt. Kane und Emily, damit beginnt die hier interessierende Szene, betreten gemeinsam Susans Wohnung und treffen dort auf Gettys, der Kane seine erpresserische Forderung stellt: Kane solle sich, Krankheit vorschützend, aus dem Wahlkampf zurückziehen, andernfalls werde Gettys sämtlichen Zeitungen des Bundesstaates das Material zur Verfügung stellen, das Kanes Liebesaffäre mit Susan beweise. Kane lehnt diese Forderungen ab und jagt Gettys mit Beschimpfungen und leeren Drohungen aus Susans Haus. Die nachfolgende schematische Darstellung gibt einen Überblick über die technischen, konfigurativen, räumlichen sowie über die durch wechselnde Kadrierung der Konfigurationen zustandekommenden Subsegmente der Szene. Ein durch seine Ausdehnung auffälliges Subsegment soll hier vor allem interessieren: Die konfigurative Segmentierung zeigt einen sehr deutlichen Schwerpunkt mit einem großen, von dem Auftritt Jim Gettys' am Ende von Einstellung 86 bis zum Abgang Emilys in Einstellung 95 reichenden Segment (C), das durch die gemeinsame Anwesenheit der vier Figuren, um deren Schicksal es hier geht, begründet wird. Tatsächlich liegt hier der Schwer81 Vgl. Anm. 71.
164
Kapitel III: Montage
Subsegmente der 20. Szene der »Leland-Sequenz« aus Orson Welles' »Citizen Kane« Schauplatz Konfigurationen Kadrierung E 86 A Susan Al Susan I TreppenΒ Susan Emily Kane B1 Emily Kane Susan haus C Susan Emily Kane Gettys CI Gettys Susan Kane Emily 87 C2 Kane Emily Gettys C3 Kane Emily 88 II Susans C4 Susan Kane Emily Wohnung C5 Emily Kane Gettys C6 Emily Susan Kane Gettys 89 C7 Susan Kane Gettys 90 C8 Gettys Emily Kane 91 C9 Susan Kane Gettys 92 C10 Gettys Emily 93 94 Cll Susan Kane Gettys C12 Gettys Emily Kane 95 D Susan Kane Gettys DI Gettys Kane E Susan Kane El Kane Susan F Susan Fl Susan III Trep96 G Kane Gettys Gl Kane Gettys G2 Gettys 97 penhaus G3 Kane 98 99 Hl Susan Kane H Susan Kane IV vor 100 I Emily Gettys I 1 Gettys Emily dem Haus Κ Gettys K1 Gettys LI L punkt der gesamten Szene. Denn mit Jim Gettys' Auftritt wird Kane vor die für alle Beteiligten folgenreiche Alternative gestellt, und Emilys Abgang markiert den Moment, da Kane entschieden hat: Kane läßt sie allein gehen und gibt damit kund, daß er sich der Erpressung seines Kontrahenten nicht beugen wird. Schauplatzwechsel, vor allem aber Einstellungswechsel und Kadrierung strukturieren nun dieses große konfigurative Segment. Der einmalige Schauplatzwechsel (vom Treppenhaus vor Susans Wohnung in die Wohnung selbst bei E 87/88) wird folgerichtig an der Stelle vollzogen, an dem das Gespräch nach den einleitenden Formalitäten an Intimität gewinnt: Die Kamera springt in dem Moment vom Treppenhaus in das Innere der Wohnung, da Emily Susan und Kane wegen Susans Brief zur Rede stellt. Einstellungswechsel und Kadrierung zeigen zunächst divergente Segmentbildungen (E 86-89 vs. C l C6) und kommen erst von Einstellung 90 an zu kongruenten Segmenten (E 90-94, C7-C11). Der Einstellungswechsel bei 86/87 verändert die Aufnahme-
Kapitel III: Montage
165
distanz (Halbtotale/Amerikanische), bei 87/88 den Schauplatz (Treppenhaus/ Wohnung), und mit dem Wechsel 88/89 setzt eine bis zu Emilys Abgang beibehaltene Schuß-Gegenschuß-Montage ein, die von Einstellung 90 an mit wechselnden Kadrierungen einhergeht. Das von sprachlichen Handlungen beherrschte, an äußeren Aktionen arme konfigurative Segment C wird auf diese Weise detailliert strukturiert, denn Einsteilungswechsel und Kadrierung unterstützen die durch die Inszenierung, insbesondere durch Choreographie und Lichtführung sorgfaltig erarbeitete Verräumlichung der Beziehungen zwischen den Figuren. Das zeigt sich besonders deutlich an Susan, die, obwohl sie der Anlaß der Auseinandersetzung ist, nur eine marginale Rolle spielt, was nicht nur über den Dialog vermittelt wird dadurch, daß sie beständig von den anderen Figuren unterbrochen wird bzw. ihre Repliken unbeachtet bleiben: Auch die Kamera drängt sie durch die Kadrierung immer neu an den Rand des Geschehens, scheint sie - wie die Figuren - nur wahrzunehmen, wenn sie geradezu gewaltsam auf sich aufmerksam macht und sich selbst ins Bild drängt. In E 87 (C1/C2) schwenkt die Kamera mit Kane von ihr weg auf Kane, Emily und Gettys, der dann aus dem Bild geht, fahrt nah auf Emily und Kane (C3), springt dann in E 88 ins Innere der Wohnung, kadriert wiederum das Ehepaar, so daß Susan erst dadurch wieder im Spiel ist, daß sie selbst ins Bild geht (C4). Ihre Erklärungsversuche werden von Gettys aus dem Off unterbrochen, was die Kamera zum Anlaß nimmt, wieder von ihr wegzuschwenken, um Gettys ins Bild zu setzen. Da Emily und Kane sich zu Gettys umwenden und vorgehen, behält sie sie, nicht aber Susan im Blickfeld und macht so deutlich, wer in dieser Situation die Handlungs- und Entscheidungsträger sind (C5). Die Choreographie stellt Kane und Gettys in den Bildhintergrund und dabei im doppelten Sinn in den Schatten, Emily dagegen in den Bildvordergrund ins Licht und gibt ihr (die zudem als einzige hell gekleidet ist) damit die Position einer moralischen Richterin, vor der sich die beiden Männer zu verantworten haben. Sie läßt Gettys zu Emily vor- und damit ins Licht treten in dem Moment, da dieser sein Verhalten vor Emily zu rechtfertigen sucht, während Susan wiederum selbst ins Bild treten muß, um auf sich aufmerksam zu machen (C6): Sie geht zu Kane in den verschatteten Hintergrund, dann nach vorn zu Emily ins Licht, um sich (abermals erfolglos, weil Gettys und Emily sie erneut unterbrechen) zunächst vor Kane und dann vor Emily zu rechtfertigen. Der anschließende Gegenschuß in E 89 nimmt letztmalig alle vier Figuren in ein Bild: Emily wendet sich zum Gehen, bleibt dann stehen und fragt ihren Mann, ob er mit ihr gehen werde, eine Frage, mit deren Beantwortung Kane lange zögert, während die Kamera, ihn von hinten im Halbprofil im Anschnitt haltend und damit seiner Perspektive sich annähernd, ruhig die gespannten
166
Kapitel III: Montage
Blicke der drei Figuren registriert, für die von Kanes Antwort Entscheidendes abhängt. Mit Kanes entschiedenem »Nein« beginnt dann von E 90 (C7) an die schon erwähnte Schuß-Gegenschuß-Montage, bei der mit den Einstellungswechseln auch die Kadrierungen wechseln: Während Emily und Susan versuchen, Kane zum Einlenken zu bringen, zeigt die Kamera im regelmäßigen Wechsel Kane mit Gettys und Emily bzw. mit Gettys und Susan und verweist damit demonstrativ auf die Alternative (Emily vs. Susan bzw. Anerkennung vs. Verachtung der Gesellschaft), vor die Gettys seinen Kontrahenten hier stellt (E 90-95; C7-C12). Die übrigen Subsegmente ergeben sich aus den äußeren Aktionen der Figuren: Gettys verläßt die Wohnung (D), Kane läuft ihm nach (E), so daß Susan allein zurückbleibt (F), und verfolgt ihn unter lauten Beschimpfungen noch ein Stück weit ins Treppenhaus (E 96-99; G1-3), bevor Susan ihn an einem Treppenabsatz einholt und zurückhält (H). Vor der Haustür (E 100) trifft Gettys noch einmal auf Emily, die nach einem kurzen Wortwechsel fortgeht (I). Danach verläßt auch Gettys den Schauplatz (K), der leer bleibt (L) und sich dann mit einer Überblende in ein Zeitungsfoto verwandelt, das unter einer reißerischen Schlagzeile das »Liebesnest« des Kandidaten Kane präsentiert. Die Bildung szenischer Subsegmente stellt, wie sich schon an diesem kleinen Beispiel zeigt, Analysebefunde bereit, die einer detaillierten Interpretation einzelner Szenen wichtige Voraussetzungen zu bieten in der Lage sind. Sie klärt die Korrelationen zwischen Kameraarbeit (Einstellungswechsel, Kadrierung) und Inszenierung der Darstellungsebene (Konfigurationen, Schauplatz, Choreographie etc.) und liefert damit eine Grundlage für die Rekonstruktion des semantischen Konzepts der Szene, dem die kinematographische und inszenatorische Realisierung folgen. 2.3 Handlungslogische Strukturierung: Sequenzen Das Kriterium der sequentiellen Segmentierung des filmischen Diskurses, die Handlungslogik der erzählten Geschichte, ist, anders als die bisher erörterten Segmentierungskriterien, kein diskursspezifisches Kriterium, gehört vielmehr der Ebene der Geschichte an, also jenes noch vor aller medienspezifischen Realisierung als »Bewegung zwischen zwei Zeitpunkten« zu denkenden Konstrukts, das die strukturale Literaturwissenschaft als spezifische Schicht narrativer Texte von der Schicht des realisierten 'Textes der Geschichte' (Stierle), des Diskurses, unterscheidet: »Die Geschichte erzählt, was die Differenz von Anfangspunkt und Endpunkt bewirkt hat, und erklärt ihr Zustandekommen«,82 klärt also die handlungslogischen Voraussetzungen jener »Bewegung zwischen 82 STIERLE 1979b, 217.
Kapitel III: Montage
167
zwei Zeitpunkten«, die den zweiten Zeitpunkt, das Ende der Geschichte, plausibel machen. Der narrative Diskurs selbst ist nicht an die kausallogischen Zusammenhänge der Ereignisse gebunden, hat vielmehr die Möglichkeit, die Voraussetzungen oder Folgen einer Handlung auf der Zeitachse des Erzählens vorzuverlegen oder nachzuliefern oder auch zwei Handlungen oder Handlungszusammenhänge nebeneinander herzuführen, so daß, was auf der Ebene der Geschichte als zusammenhängende handlungslogische Einheit erscheint, auf der Ebene des Diskurses unter Umständen verstreut, auf verschiedene Stellen verteilt erscheinen kann. Gerade das begründet die interpretationsmethodische Relevanz der handlungslogischen Analyse und damit zugleich den Wert der Unterscheidung zwischen Geschichte und Diskurs: Wie die Beziehungen zwischen Erzählzeit und erzählter Zeit oder zwischen der Chronologie des Erzählens und der des Erzählten, kann auch die Beziehung zwischen der zeitlichen Abfolge des Erzählens und der handlungslogischen Abfolge des Erzählten, d.h. die Anordnung der handlungslogischen Einheiten auf der narrativen Achse wichtige Aufschlüsse über Erzählkonzept und Sinnmodell von Texten geben. Grundlage für die Sequenzbildung ist demnach die handlungslogische Segmentierung nicht des Diskurses, sondern der Geschichte, dies freilich - da es hier um die Analyse konkreter Texte, nicht um die Entwicklung einer universalen »Erzählgrammatik« geht (vgl. Kap. A.l) - mit dem Ziel, handlungslogische Einheiten auf der Ebene des Diskurses zu identifizieren und den Diskurs entsprechend zu segmentieren. Zwar korrespondieren technische, zeitliche, räumliche und konfigurative Segmente mit handlungslogischen Segmenten, so daß diskursspezifische Segmentierungssignale häufig auf handlungslogische Schnittstellen verweisen. Das ändert aber nichts daran, daß die Rekonstruktion handlungslogischer Einheiten auf der Ebene der Geschichte stattfinden muß, sich also nicht an diskursspezifischen Segmentierungssignalen orientieren kann. Der Vergleich handlungslogischer und diskursspezifischer Segmente aber ist ein unter Umständen hochproduktiver Ansatzpunkt interpretatorischer Operationen. Da nun aber die Geschichte ein aus dem Diskurs abgeleitetes Konstrukt ist, ist ihre handlungslogische Analyse ohne jede Frage den Bedingungen des Textverstehens unterworfen, also kein rein beschreibender Akt mehr. Aus hermeneutischer Perspektive ist das keine Katastrophe, sondern nur Anlaß, den methodischen Status der sequentiellen Segmentierung als einen nicht mehr nur auf Beschreibungsakten, sondern als einen in seinen wesentlichen Teilen bereits auf Interpretationsakten beruhenden Arbeitsschritt zu kategorisieren und folglich zu verlangen, daß die Entscheidungen, die diesen Arbeitsschritt leiten, wie bei jeder Interpretation, offenzulegen, im Rekurs auf den je
168
Kapitel III: Montage
konkreten Text zu begründen und damit der Überprüfung zugänglich zu machen sind. Anders als die bisher erörterten Segmentbildungen, die die Ebene der reinen Beschreibung zu verlassen keinen Anlaß haben, weil sie sich auf diskursspezifische Segmentierungssignale stützen, ist demnach die sequentielle Segmentierung bei der konkreten Analyse jeweils neu und explizit zu begründen. Das heißt auch, daß sie analysetheoretisch nicht sehr weitreichend vorgeklärt werden kann. 2.3.1 Verfahren der Sequenzbildung Begriffsklärung: Handlung, Geschehen, Situation Der Begriff Handlung ist in der umgangssprachlichen Verständigung über Texte mehrdeutig, kann die Gesamtheit der in einem Drama oder Roman erzählten Ereignisse oder auch die einzelne Aktion einer Figur meinen. Der Begriff Handlungslogik transportiert beide Bedeutungen, meint den aktionslogischen Zusammenhang der Einzelhandlungen, der die Geschichte als »Bewegung zwischen zwei Zeitpunkten« (s.o.) konstituiert, schränkt damit aber zugleich den Begriff Handlung auf die Einzelhandlung ein. Handlung in diesem Sinne - und so soll der Begriff hier verwendet werden - ist zunächst an ein Subjekt gebunden, das willengeleitet handelt: Sie ist eine intentionale Veränderung einer Situation, gfls. auch nur den intentionalen Versuch einer Situationsveränderung. Handlungen weisen demnach »immer eine triadische Struktur auf, deren Segmente die Ausgangssituation, der Veränderungsversuch und die veränderte Situation sind«.83 Dabei spielt es keine Rolle, ob die Endsituation gegenüber der Ausgangssituation tatsächlich »verändert« ist, ob also der Veränderungsversuch Erfolg hatte oder nicht: Auch eine ergebnislose Handlung, der erfolglose Versuch einer Veränderung der Ausgangssituation, ist eine Handlung, und die Endsituation ist insofern nicht mehr identisch mit der Ausgangssituation, als die Unfähigkeit des Subjekts, sie zu verändern, ihr eine gewandelte Bedeutung gibt. Kernstück der Handlung ist also der intentionale Veränderungsversuch selbst, der nicht dadurch den Status einer Handlung verlieren kann, daß er fehlschlägt. Dasselbe gilt selbstverständlich auch für Handlungen, die andere Situationsveränderungen zeitigen, als sie das handelnde Subjekt intendiert hatte. Auch ist für diesen Handlungsbegriff irrelevant, ob der die Handlung konstituierende Willensakt als ein freier und bewußter konzipiert ist oder nicht: Worauf es ankommt, ist die Verursachung der Situationsveränderung durch ein menschliches (oder anthropomorphisiertes) Subjekt.
«3 pfister 1982, 269.
Kapitel III: Montage Der Begriff Geschehen
169
bezeichnet im Unterschied dazu Situations Verände-
rungen, die nicht durch Handlungen im eben genannten Sinne Zustandekommen, also nicht auf willengeleitete
Akte zurückzuführen
eignisse das augenfälligste Beispiel sind. Der Begriff Situation
sind, wofür Naturer-
84
beschreibt die Voraussetzung und die Folge einer
Handlung, meint also zweierlei Arten von Zuständlichkeiten, nämlich zum einen die durch eine Handlung zu verändernde (Ausgangssituation) und die durch eine Handlung bewirkte Z u s t ä n d i g k e i t (Endsituation), die ihrerseits wieder zur Ausgangssituation einer neuen Handlung wird oder
werden
kann. 85 M Pfister spricht von 'Geschehen' auch und sogar in erster Linie dort, wo die Unfähigkeit der dramatis personae, ihre Lebenssituation zu verändern, zu einem zentralen Thema der Texte avanciert (ebd. 270f.). Er spricht daher mit Bezug auf Dramen der Moderne von 'handlungslosen Dramen' (270) und sieht, etwa bei Becketts Dramen, eine »Reduktion der Geschichte auf Geschehensabläufe« gegeben (271), weil die Figuren ihre existentielle Situation nicht verändern können. Damit aber bindet er den Handlungsbegriff an einen idealistischen Subjektbegriff und läßt ihn auf diese Weise unter der Hand von einem analytischen zu einem historischen Begriff mutieren, der dann spätestens vom naturalistischen Drama an als metasprachlicher eigentlich nicht mehr uneingeschränkt benutzt werden könnte, sondern durch den Begriff 'Geschehen' ersetzt werden müßte. Die Begriffe sollten daher von historischen Konnotationen freigehalten werden: Handlungen im oben definierten Sinn vollziehen auch die Figuren der von Pfister angesprochenen modernen Dramen ununterbrochen. DaB diese Handlungen - etwa in Becketts »Warten auf Godot« - »zum zeitvertreibenden Spiel verkommen« (ebd.) und nicht mehr geeignet sind, die existentielle Situation der Figuren relevant zu verändern, entzieht ihnen nicht den Status von Handlungen: Auch 'Zeitvertreib' ist zweifellos eine intentionale, auf die Veränderung einer Situation (Langeweile) gerichtete Tätigkeit, eine Handlung also. Daß diese Handlungen die existentiellen Konditionen der Figuren nicht verändern können, heißt ja nicht, daß sie keine Geschichten hervorbringen, im Gegenteil: Gerade daß sie Geschichten hervorbringen, die von keinen existentiell relevanten Veränderungen mehr zu berichten wissen, ist ja das Spezifikum dieser Dramen. 85 Pfister möchte den Begriff - mit Rücksicht auf moderne Dramen und in Konsequenz seines Geschehensbegriffs (vgl. Anm. 84) - auch auf Zuständlichkeiten angewendet wissen, die »konfliktlos, entspannt und statisch« sind (ebd. 272). Damit koppelt er den Situationsbegriff vom Handlungsbegriff ab und nimmt ihm seine analytische Funktionsfähigkeit: 'Statische' Situationen, die keine Möglichkeiten des Handelns eröffnen, gibt es (vom Tod abgesehen) nicht, und deshalb gibt es auch keine allein auf Geschehen aufbauenden 'handlungslosen' Dramen. Es gibt nur unterschiedlich 'wichtige' Situationen, die unterschiedlich 'wichtige' Handlungsmöglichkeiten eröffnen: Die von Pfister anvisierten, angeblich 'handlungslosen' modernen Dramen sind durch solche 'unwichtigen' Situationen gekennzeichnet, die zwar durchaus Handlungsmöglichkeiten, aber keine solchen eröffnen, die die existentielle Situation der Figuren maßgeblich zu verändern in der Lage sind. Das aber berührt ihren handlungslogischen Status nicht, denn der hängt nicht von ihrem existentiellen Gewicht, sondern allein von ihrer immanenten handlungslogischen Relevanz ab, davon, ob sie eine für den Fortgang der Geschichte relevante Handlung provozieren. Deshalb sind die existenziellen Zuständlichkeiten, die Pfister im Zusammenhang mit Becketts Dramen 'Situationen' nennt, auch keine handlungslogisch relevanten Situationen, weil die Fi-
170
Kapitel 111: Montage
Sequenzen und Subsequenzen Dem eben bezeichneten Handlungsbegriff zufolge wäre nun aber beispielsweise das Schließen einer Tür ebenso als intentionale Veränderung einer Situation und damit als Handlung zu bestimmen wie etwa die folgenreiche zornige Replik der Maria am Ende der großen Streitszene der Königinnen im 3. Akt von Schillers »Maria Stuart« (III, 4). 'Handlung' und 'Situation' sind also höchst relative Größen: Eine Filmfigur, die eine Straße überquert, sich eine Zigarette ansteckt, das Haar ordnet, die Jacke zuknöpft usw. usf., vollzieht zweifellos Handlungen im oben beschriebenen Sinn, nur könnte sie diese Handlungen vermutlich auch unterlassen, ohne damit den Verlauf der Geschichte zu verändern. Für die handlungslogische Analyse von Geschichten ist es demnach zweifellos nötig, Handlungen nach Maßgabe ihrer handlungslogischen Relevanz zu qualifizieren, d.h. zu unterscheiden zwischen Handlungen bzw. Geschehnissen, die den Verlauf der Geschichte nicht beeinflussen, und solchen, di e für den Verlauf der Geschichte konstitutiv sind, deren Fehlen der Geschichte ihre handlungslogische Plausibilität nähme, ohne die also die Veränderung zwischen Anfang und Ende der Geschichte nicht zustandekäme. Diese Qualifizierung läßt sich nur vom Ende der Geschichte her treffen, beruht auf einem vom Ende her begründeten Verstehen der Geschichte: Die für den Verlauf der Geschichte relevanten Handlungen/Geschehnisse sind diejenigen, die an der Herbeiführung des Ausgangs der Geschichte substantiell beteiligt sind, ohne die die Geschichte anders enden würde. Das heißt nun natürlich nicht, daß Handlungen oder Geschehnisse, die dieser Bestimmung zufolge als handlungslogisch irrelevant einzustufen sind, darum auch schon für das Sinnmodell der Geschichte bedeutungslos sind, sondern nur, daß sie keine oder nur geringe Relevanz für den aktionslogischen Gang der Dinge haben. So hat beispielsweise der Ausflug nach »Hankels Ablage«, den Lene und Botho in Fontanes Roman »Irrungen, Wirrungen« kurz vor ihrer Trennung unternehmen, für das Sinnmodell des Textes zentrale Bedeutung, für seine Handlungslogik aber ist er irrelevant, weil er keine die Aktionslogik der Geschichte konstituierende Handlung darstellt.86 Die Relevanz oder Irrelevanz guren sie zu verändern weder in der Lage sind noch den Versuch machen. Als Situationen sind hier vielmehr die aus dieser hoffnungslosen Lage resultierenden Zustände anzusprechen, etwa die Langeweile (vgl. Anm. 84), die die 'sinnlosen' Handlungen der Figuren provozieren, aus denen die gleichermaßen 'sinnlosen' Geschichten resultieren. Die handlungslogische Analyse hätte hier eben diese 'Sinnlosigkeit' der dargestellten Geschichten zu rekonstruieren: Die Fixierung des Situationsbegriffs auf seine handlungslogische Dimension impliziert folglich durchaus nicht, wie Pfister befürchtet (ebd. 272), dessen Einschränkung auf die traditionelle konfliktorientierte Dramatik. 86 Daß den Liebenden hier - in der unverhofften Begegnung mit Bothos Freunden und ihren Mätressen vor allem - ihr Standesunterschied und damit die Hoffnungslosigkeit ihrer Lie-
Kapitel 111: Montage
171
einer Handlung für die Aktionslogik einer Geschichte muß also durchaus noch nichts über die Relevanz oder Irrelevanz dieser Handlung für das Sinnmodell der Geschichte aussagen. Vielmehr handelt es sich bei der handlungslogischen Analyse erzählender Texte um die Rekonstruktion eines aktionslogischen Gerüsts, dessen Funktionen für die erzählerische Sinnproduktion erst im interpretatorischen Zugriff erkennbar werden können. Die handlungslogische Qualifizierung der vom Diskurs in ununterbrochener Folge präsentierten Einzelhandlungen und Einzelgeschehnisse liefert die Voraussetzung für die sequentielle Segmentierung der Geschichte: Sequenzen seien im Sinne der eben genannten Qualifikationskriterien als handlungslogische Einheiten erster Ordnung bestimmt, nämlich als Einheiten, deren Grenzen durch die jeweiligen Endsituationen der für den Ausgang der Geschichte konstitutiven Handtungen markiert sind. Als Ergebnisse handlungslogisch relevanter Handlungen sind diese Endsituationen per definitionem maßgebliche Konstituenten der Ausgangssituation der jeweils nachfolgenden konstitutiven Handlung, so daß sich das handlungslogische Gerüst einer einfach gebauten (einsträngigen) Geschichte als Kette von einander bedingenden Handlungen darstellen läßt: Jede dieser sequenzbildenden Handlungen hat die ihr vorausgehende zur conditio sine qua non.87 Wie diese konstitutiven Handlungen und damit die sequentiellen Einheiten praktisch zu rekonstruieren sind, kann hier nur grob skizziert werden, denn dabei handelt es sich, wie gesagt, um einen von interpretatorischen Entscheidungen bereits maßgeblich gesteuerten Arbeitsschritt, der eben deshalb auch einer je besonderen, aus dem konkreten Text selbst abzuleitenden Begründung bedarf. Ausgehend von der Endsituation der Geschichte, ist diejenige Handlung (oder das Geschehen) aufzusuchen, die diese Endsituation herbeigeführt hat; die Frage nicht nach sämtlichen einzelnen Voraussetzungen dieser Handlung, sondern nach ihrer handlungslogischen conditio sine qua non, nämlich nach der Handlung, die ihre Ausgangssituation herbeigeführt und damit sie selbst überhaupt erst möglich gemacht hat, führt in der Chronologie der Gebe besonders drastisch ins Bewußtsein gerückt wird, ist nicht der handlungslogische Anlaß ihrer bald darauf vollzogenen Trennung, sondern beschreibt - im Kontext eines komplexen raumsymbolischen Verweisungszusammenhangs - die ihnen von Anbeginn an bewußten Bedingungen ihrer Liebe. Der handlungslogische AnlaB für die Trennung ist vielmehr ein ganz äußerer, der Brief, mit dem Bothos Mutter ihren Sohn auffordert, mit einer standesgemäßen Heirat den wirtschaftlichen Ruin der Familie abzuwenden. 87 Wie groß diese Einheiten sind, ist dabei eine zweitrangige Frage: Sie können durch zwei unmittelbar aufeinanderfolgende Handlungen/Geschehnisse definiert sein, in der Regel aber bestehen sie aus Folgen - Sequenzen im wörtlichen Sinne - von Einzelhandlungen, die mehr oder minder zielstrebig auf eine für den Verlauf der Geschichte konstitutive und die Segmentierung begründende Handlung hin organisiert sind.
172
Kapitel III: Montage
schichte zurück zu eben dieser sie bedingenden Handlung (bzw. Geschehen), die damit als eine der gesuchten, für den Verlauf der Geschichte konstitutiven Handlungen klassifiziert werden kann. Die Ausgangssituation dieser Handlung hat dann ihrerseits ihre conditio sine qua non in einer vorausgehenden Handlung, die wiederum als konstitutive Handlung zu klassifizieren ist, und auf diese Weise ist fortzufahren, bis die Ausgangssituation der Geschichte selbst erreicht ist.88 Daß komplex strukturierte, mehrsträngige Geschichten die Anwendung dieses einfachen analysepraktischen Rezepts erheblich verkomplizieren können, versteht sich von selbst. Wichtiger ist der Hinweis, daß die handlungslogischen Kriterien, die dabei zur Anwendung kommen, keine universalen sein können, sondern aus dem jeweiligen Text selbst und der ihm immanenten Kausallogik abzuleiten sind, eine Einsicht, die sich nicht erst mit Blick auf die besonderen kausallogischen Gesetze von Märchen, surrealistischen oder Science-Fiction-Texten, sondern schon mit Blick auf jeden älteren Erzähltext einstellt, nämlich aus der Historizität der Logik menschlichen Handelns (der Naturkausalität usw.) ergibt.89 Sequenzen sind in der Regel sehr große Einheiten, die deshalb auch in vielen Fällen in weitere, kleinere handlungslogische Einheiten zweiter (dritter, vierter usw.) Ordnung, in Subsequenzen, zerlegt werden können. Die Segmentierung auf der Ebene der Subsequenzen klärt die handlungslogische Entwicklung von der Ausgangs- zur Endsituation der Sequenzen, indem sie die für diese Entwicklung maßgeblichen Handlungen/Geschehnisse bestimmt. Ihre Rekonstruktion folgt demselben Verfahren wie die der Sequenzen: Ausgehend von der Endsituation der sequenzbildenden Handlung sind die sie bedingenden Handlungen aufzusuchen, und zwar hier nun nicht mehr ihre handlungslogische conditio sine qua non (die ja in der Handlung der vorhergehenden Sequenz präsent ist), sondern ihre untergeordneten handlungslogischen 88 An dem Geschehen beispielsweise, das die Endsituation in Fontanes »Effi Briest« erzeugt, Effis Tod, ist, so will es der Erzähler, weniger eine (deshalb auch gar nicht näher explizierte) Krankheit als Bedingung von Interesse als vielmehr der Verlust aller Lebensmöglichkeiten, den Effi als geschiedene Frau erleidet, die Situation also, die durch die Handlung der Ehescheidung herbeigeführt wird. Deren conditio sine qua non ist der Ehebruch, der wiederum in der durch die Eheschließung mit Innstetten entstehenden Situation seine handlungslogische Voraussetzung erster Ordnung hat. Diese drei Handlungen (Heirat, Ehebruch, Scheidung) und das Geschehnis am Ende (Effis Tod) erlauben die Segmentierung der Geschichte in vier große Sequenzen: Effis Leben in Hohen-Cremmen bis zu ihrer Verheiratung, ihre Ehe mit Innstetten bis zum Ehebruch, ihr Eheleben nach dem Ehebruch bis zur Scheidung und schließlich ihr Leben nach der Ehescheidung bis zu ihrem Tod. 89 So ist etwa die Qualifizierung der Ehescheidung als konstitutiver handlungslogischer Voraussetzung für Effi Briests langsames Sterben (vgl. Anm. 88) nur im Rekurs auf sozialethische Normen der wilhelminischen Gesellschaft um 1900 und deren Bedeutung für die Existenz einer schuldig geschiedenen Frau begründbar.
Kapitel III: Montage
173
Konditionen.90 Die Zahl solcher untergeordneten Segmentierungsniveaus ist abhängig von der Komplexität der Handlungszusammenhänge, die die Endsituationen der Sequenzen bedingen. 2.3.2 Die Organisation von Sequenzen auf der narrativen Achse Die so gewonnenen handlungslogischen Einheiten der Geschichte sind nun in einem zweiten Schritt auf den Diskurs anzuwenden mit dem Ziel, handlungslogische Einheiten auf Diskursebene zu identifizieren, ihre Anordnung auf der narrativen Achse zu beschreiben und damit die Beziehungen zwischen der Chronologie des Erzählens und der Handlungslogik der Geschichte zu rekonstruieren. Die Normalform der Anordnung von Sequenzen und Subsequenzen auf der narrativen Zeitachse ist das an der zeitlichen Abfolge der Sequenzen orientierte chronologische Nacheinander, das ja stets auch handlungslogisch begründet ist insofern, als der kausallogische Zusammenhang von Handlungen als Ursache-Wirkungs-Zusammenhang ein zeitliches Nacheinander von selbst erfordert. Abweichungen von dieser Normalform können zunächst durch die zeitlichen Verhältnisse des Erzählten selbst begründet sein, etwa dadurch, daß zwei Sequenzen im Verhältnis nicht des zeitlichen Nacheinander, sondern Nebeneinander, der Gleichzeitigkeit, stehen, oder dadurch, daß das Erzählen (Erinnern, Träumen, Darstellen etc.) einer Geschichte selbst zum Gegenstand des Erzählens wird, so daß das Erzählte zwei Zeitebenen (bzw. Realitätsebenen, Fiktionsebenen) aufweist, die im Verhältnis der Über- bzw. Unterordnung stehen. Alle übrigen Abweichungen von der Normalform der Sukzession sind nicht aus den zeitlichen oder logischen Verhältnissen des Erzählten selbst abzuleiten, sondern allein auf diskursspezifische Operationen und damit auf darstellungsmethodische Entscheidungen des Erzählers zurückzuführen (Vorgriffe, nicht figurai motivierte Rückwendungen; vgl. Kap. C.2.1). Nebenordnung: Alternierende Sequenzverknüpfung Die Darstellung gleichzeitig ablaufender, zeitlich nebengeordneter Sequenzen ist beim Film an besondere Bedingungen gebunden, weil der filmische Erzähler keine Möglichkeit hat, in der erzählten Zeit vor- oder zurückzuspringen, ohne diesen Akt eigens aus der Erzählgegenwart abzuleiten (vgl. S. 154-158). 90 Die die dritte Sequenz von »Effi Briest« begründende Handlung, die Scheidung (vgl. Anm. 88), hat eine solche untergeordnete handlungslogische Kondition in der Entdeckung des Ehebruchs durch Innstetten. Sie begründet die Ausgliederung zweier Subsequenzen (Effis Eheleben nach dem Ehebruch bis zu dessen Aufdeckung, Innstettens Entschluß zu Duell und Scheidung und deren Realisierung), die dann ihrerseits nach demselben Prinzip weitergehend segmentiert werden können.
174
Kapitel III: Montage
Deshalb bleibt ihm nur ein Mittel, Gleichzeitigkeit zu vermitteln, nämlich die alternierende Montage, die abwechselnd Bilder der beiden gleichzeitig verlaufenden Vorgänge zeigt. Es handelt sich dabei um die oben bereits beschriebene Form des »alternierten Syntagmas« (vgl. S. 153f.), das in doppelter Gestalt erscheinen kann, nämlich als alternierende Szenenverknüpfung, die Szenen ein und derselben Sequenz verbindet, oder als alternierende Sequenzverknüpfung, die zwei verschiedene Sequenzen miteinander verbindet. Unterordnung Von den besonderen Voraussetzungen zeitlicher Rückwendungen und Vorgriffe im Film war schon im Zusammenhang mit der zeitstrukturellen Organisation des filmischen Diskurses die Rede, die hier nun lediglich auf Fälle anzuwenden sind, bei denen das in Rückwendungen oder Vorgriffen Erzählte den Status von Sequenzen hat. Da Rückwendungen und Vorgriffe im Film aus der erzählten Gegenwart abgeleitet werden müssen, kommt es in diesem Fall zur Einschachtelung solcher zurück- oder vorgreifenden Sequenzen in eine Szene, und das hat zur Folge, daß solche Sequenzen auf Diskursebene dieser - ihre Erzählbarkeit begründenden - Szene erzähllogisch untergeordnet sind. Bei figurenperspektivisch motivierten, aus Erinnerungshandlungen der Figuren abgeleiteten Rückwendungen ist diese Unterordnung nicht nur zeitlich, sondern darin zugleich auch handlungslogisch begründet, weil der Erinnerungsakt, durch den das zurückliegende Geschehen präsentiert wird, ein Moment nicht des Diskurses, sondern der Geschichte ist, d.h. das Erzählen (oder sprachlich nicht artikulierte Erinnern) der Figur ist hier ein der Geschichte angehörender Akt, also selbst ein handlungslogisches Moment: Der filmische Erzähler erzählt einen Erzählakt (Erinnerungsakt). Das Erinnerte selbst, das in der eingeschachtelten Sequenz erzählte Erzählte (Erinnerte), folgt zwar seinen eigenen handlungslogischen Gesetzen, geht also aus der Gegenwartshandlung handlungslogisch nicht hervor. Das erzählte Erzählen (Erinnern) aber leitet sich handlungslogisch aus der Gegenwartshandlung ab, so daß die eingeschachtelten Sequenzen als ganze eine der Gegenwartshandlung angehörende Handlung (einen Akt des Erinnerns) darstellen. Entsprechendes gilt für die oben angesprochenen Einschachtelungen von Träumen, Visionen usw. oder von Theater- oder Film-im-Film-Einlagen, die nicht auf Wechseln der Zeit-, sondern der Realitäts- oder Fiktionsebene beruhen (vgl. S.158). 2.3.3 Haupt- und Nebengeschichten Eine besondere Situation entsteht, wenn eine oder mehrere Sequenzen von den übrigen Sequenzen handlungslogisch isoliert sind, d.h. wenn die in einer
Kapitel III: Montage
175
oder mehreren Sequenzen erzählten Handlungen und Geschehnisse mit Blick auf die übrigen Sequenzen handlungslogisch irrelevant sind. Dies ist der Fall bei Filmen (wie bei Romanen), deren Geschichte aus mehreren, zwar miteinander verknüpften, gleichwohl klar isolierbaren Einzelgeschichten besteht. Beim Film gehören dazu zunächst Episodenfilme, in denen mehrere, handlungslogisch voneinander völlig unabhängige Geschichten erzählt werden, die durch einem gemeinsamen thematischen Aspekt verknüpft werden, eine Form, für die Roberto Rossellinis »Paisà« (I 1946) als Prototyp gelten kann. Hier ist die handlungslogische Analyse kein Problem, weil jede Geschichte für sich segmentiert werden kann und muß. Schwieriger gestaltet sich die Analyse bei Erzähltexten, deren Einzelgeschichten eng miteinander verzahnt, etwa durch konfigurative, räumliche oder zeitliche Überschneidungen aufeinander bezogen sind, aus denen sich dann unter Umständen auch handlungslogische Berührungspunkte ergeben können, wie dies etwa in Wolfgang Koeppens Roman »Tauben im Gras« beispielhaft der Fall ist. Ein mit dessen hochkomplexer Bauweise vergleichbares filmisches Beispiel ist mir nicht geläufig. Möglicherweise hängt es mit der (ein 'Zurückblättern' ausschließenden) 'Entprivatisierung' des filmischen Rezeptionsprozesses zusammen, daß komplex strukturierte Geschichten, wie sprachliche Erzähltexte sie entwickeln können, im Kino seltener sind. Filme bedienen sich, sofern sie das einfache Grundmuster der einsträngigen Geschichte verlassen, eher traditioneller dramaturgischer Formen, nämlich der Hierarchisierung der Einzelgeschichten nach Hauptgeschichte und Nebengeschichten. In diesem Fall sind die Nebengeschichten handlungslogisch von der Hauptgeschichte abhängig, nicht aber die Hauptgeschichte von den Nebengeschichten: Die Nebengeschichte bezieht wesentliche handlungslogische Voraussetzungen aus der Hauptgeschichte, die Hauptgeschichte aber bliebe auch ohne diese Nebengeschichten als handlungslogisch konsequenter Zusammenhang verständlich.91 91 So erzählt beispielsweise Veit Harlans Film »Der große König« (D 1942) neben seiner Hauptgeschichte, der Geschichte des Siebenjährigen Krieges von der Schlacht bei Kunersdorf bis zum siegreichen Ende, die mit ihr in vielfältiger Weise verknüpfte Geschichte des Paul Treskow (Gustav Fröhlich), Feldwebels im Regiment Bernburg, und seiner Frau Luise (Kristina Söderbaum). Für die Hauptgeschichte spielt diese Nebengeschichte nur an einer einzigen Stelle eine nennenswerte Rolle: Bei der Schlacht von Torgau bläst Treskow eigenmächtig zur Attacke, als er erkennt, daß die Österreicher den Preußen in den Rücken zu fallen im Begriff sind, und liefert damit eine Voraussetzung für den Sieg der Preußen. Gleichwohl ist diese Handlung für die Nebengeschichte wichtiger als für die Hauptgeschichte: Friedrich (Otto Gebühr) läßt Treskow für sein eigenmächtiges Handeln aus disziplinarischen Gründen bestrafen, hat aber vor, ihn nach Verbüßung der Strafe mit einer Beförderung zum Leutnant zu belohnen. Treskow, der davon nichts weiß und der sich auch schon an früheren Entscheidungen des Königs heftig gerieben hat, verzweifelt hier
176
Kapitel III: Montage
D. Deskriptive und systematische Montage Beschreibende, erörternde, kommentierende Abschnitte innerhalb erzählender Texte werden in der Erzähltheorie gern mit dem Begriff »zeitlose Erzählweisen« zusammengefaßt.92 Der Begriff, der besagen soll, daß es sich hier um Redeformen handelt, die »Erzählzeit ohne erzählte Zeit (besitzen)«,93 daß die erzählte Zeit für die Dauer solcher Passagen 'stillsteht',94 ist im Grunde eine contradictio in adjecto, denn wo die erzählte Zeit 'stillsteht', wird auch nicht mehr erzählt, sondern eine anderes Textschema verwendet. Stierles Begriff des deskriptiven bzw. systematischen Textschemas hat hier zweifellos den Vorteil größerer Präzision, kategorisiert den Wechsel von der Narration zur Deskription bzw. zum Kommentar zutreffender als Wechsel des Textschemas (statt als Wechsel der 'Erzählweise'). Der Erzählfilm kennt, wie bei der Sichtung optischer Rekurrenztypen deutlich wurde, seinerseits Formen deskriptiver und systematischer Textbildung, doch macht deren Unterscheidung von der narrativen Textbildung, d.h. von einer zeitlichen Kriterien folgenden Organisation von Sachlagen',95 hier gewisse Schwierigkeiten. Das liegt an den besonderen temporalen Bedingungen filmischer Rede: Die Zeitlichkeit des Filmbildes verleiht den Gegenständen filmischer Rede per se eine zeitliche Dimension, weshalb es wirklich 'zeitlose' Redeformen im Film nicht geben kann (vgl. S. 41f.). Im Film ist alles Vorgang: Abgesehen von der Standkopierung (freeze frame), vergeht in jedem Filmbild Zeit sowohl auf der Ebene der Filmzeit (auf der Abbildungsebene) als auch auf der Ebene der gefilmten Zeit (auf der Darstellungsebene), denn in jedem filmischen Bild 'geschieht' etwas, und sei es auch nur das 'Geschehen', das Vergehen von Zeit selbst.96 'Zeitlosigkeit' ist deshalb kein geeignetes Kriterium für die Bestimmung deskriptiver und systematischer Textbildungsformen im Film.97
endgültig an seinem König und kündigt ihm die Gefolgschaft, indem er sich zur Desertion entschließt, zu der es dann freilich nicht kommt, weil er sich, unterstützt durch seine Frau, zuletzt doch besinnt. Diese Nebengeschichte fungiert - im Kriegsjahr 1942 - als Lehrstück über soldatische Treuepflicht. 92 Vgl. LÄMMERT 1968, 86-91.
93 Ebd. 89. 94 Ebd. 90. 95 STIERLE 1979a, 184 und oben S. 132. 96 Vgl. Kap. I, Anm. 91 und 94. 97 Deshalb ist Christian Metz' Unterscheidung zwischen »achronologischen« und »chronologischen« Syntagmen auch nicht plausibel (vgl. METZ 1966/67, 173, 175 und hier S. USHe).
Kapitel III: Montage
177
1. Deskriptive Textbildung Das deskriptive Textschema ist zu beschreiben als Organisation von Sachlagen' unter dem leitenden Gesichtspunkt' räumlicher Beziehungen.98 Danach kann man zunächst sagen, daß filmische Bilderfolgen immer dann ais deskriptive anzusprechen sind, wenn ihre Montage nicht auf die Herstellung eines zeitlichen, sondern eines im weitesten Sinne räumlichen Zusammenhangs gerichtet ist. Dieses Differenzkriterium reicht aus, solange sich die filmische Deskription auf Räume bezieht, in denen sich, abgesehen davon, daß Zeit vergeht, tatsächlich nichts ereignet, in denen weder handelnde Subjekte agieren noch Geschehen sich an den Bildobjekten vollzieht: Kamerablicke auf Landschaften, Gebäude, Innenräume usw. sind problemlos als Deskription zu klassifizieren. Solche Bilder sind aber nicht die Regel. Häufiger begegnen im Erzählfilm deskriptive Bilderfolgen, in denen durchaus agiert wird, und das eröffnet der Frage, ob es dabei dann um diese Aktionen oder aber um deren Schauplätze geht, einen so weiten Ermessensspielraum, daß das Differenzkriterium (räumlich vs. zeitlich) hier einer Präzisierung bedarf. Dafür sind die Ergebnisse der handlungslogischen Analyse beizuziehen: Deskription liegt dann vor, wenn die Kamera Zeitspannen der erzählten Zeit erfaßt, in denen keine handlungslogisch relevanten Vorgänge stattfinden, in denen sich also nichts ereignet, das die Geschichte voranbringt, in denen, wenn schon nicht die erzählte Zeit, so doch die Geschichte stillgelegt ist." Die Funktion solcher in deskriptiven Bilderfolgen gezeigten Vorgänge ist - von ihrer raumorientierenden Funktion abgesehen - in der (Charakterisierung der erzählten Welt zu suchen. Als solche für die erzählte Welt charakteristische Vorgänge haben sie häufig den Status iterativer Begebenheiten, die nicht in ihrer Einmaligkeit, sondern als für diesen Ort typische, immer wiederkehrende Vorgänge interessieren. Als Beispiel dafür wie für filmische Deskription überhaupt seien hier die Einstellungsfolgen näher betrachtet, mit denen in Michael Curtiz' »Casablanca« (USA 1942) der zentrale Ort der Geschichte, Ricks Nachtclub, das »Café 9» Stierle verunklärt seinen eigenen Ansatz, wenn er hier ein zeitliches statt räumliches Kriterium ansetzt, nämlich das »Gesetz der Gleichzeitigkeit« zum Definitionskriterium des deskriptiven Textschemas erhebt, weil das räumliche »Nebeneinanderstehen der Elemente« eine Beziehung der Gleichzeitigkeit impliziert (STIERLE 1979a, 183). 99 Dieses negative handlungslogische Differenzkriterium präzisiert das bei der einführenden Rekurrenztypologie genannte visuelle Negativmerkmal deskriptiver Bildfolgen, die Abwesenheit von Figuren (im Unterschied zu Statisten) der Geschichte (Rekurrenztyp 11). Beide Merkmale gehen in der Regel miteinander einher. Ausnahmen von dieser Regel begegnen dort, wo Figuren keine handlungslogisch relevanten Aktionen vollziehen, und vor allem in expositorischen Szenen.
178
Kapitel III: Montage
Américain«, eingeführt wird. Sie sind ein besonders gelungenes Beispiel für die semantische Funktionalisierung des deskriptiven Textschemas, denn sie erschöpfen sich nicht in der bloßen visuellen Erschließung eines neuen Schauplatzes, sondern nutzen die Raumbeschreibung für die expositorische Charakterisierung der Welt der erzählten Geschichte und der diese Geschichte bedingenden politisch-sozialen Situation, orientieren nicht bloß über die räumlichen Verhältnisse des Nachtclubs, sondern auch und vor allem über seine Bedeutung als Treffpunkt von Emigranten, Fluchthelfern, dubiosen Geschäftemachern usw. und damit über einen charakteristischen Ausschnitt aus der Welt des Exils während des Zweiten Weltkrieges. Der Wechsel von der Narration zur Deskription wird hier über den Dialog der vorhergehenden Szene (zwischen Capitain Renault und SS-Major Strasser) eingeleitet, in dem von Ricks »Café Américain« die Rede ist: Durch dieses Stichwort motiviert, wechselt die Kamera in der folgenden Einstellung den Schauplatz, befindet sich vor Ricks Nachtclub, schwenkt dann, nach einem Blick auf die Außenfront und ihre nächtliche Leuchtreklame, zum Eingang und bewegt sich, einem eintretenden Gast folgend, in den Nachtclub hinein. Hier gibt sie zunächst mit einer Halbtotalen einen ersten Überblick über den Raum, springt dann nach einem Schnitt von der Tür zur Mitte des Raumes und fährt, ebenfalls in einer Überblick schaffenden Halbtotale, langsam nach links an vollbesetzten Tischen vorbei, faßt dabei den klavierspielenden Sam (Dooley Wilson) ins Auge und fährt langsam von der Halbtotale bis zur Nahaufnahme auf ihn zu. 100 Danach spezifiziert sie ihre in den Halbtotalen vermittelten Überblicksinformationen mit vier amerikanischen bzw. nahen Einstellungen, die vier verschiedene Tische und Fetzen der an ihnen geführten Gespräche erfassen, die sich allesamt um Flucht, Exil oder Widerstand drehen. Von hier aus schwenkt sie dann mit einem Kellner zur Bar, wo der Barkeeper Sascha agiert, und springt dann nach einem Schnitt wieder in eine Halbtotale vor eine Tür, die in den Spielsalon des Cafés führt: Sie beobachtet den Kellner Carl, der mit einem Tablett hineingeht und springt dann nach einem Schnitt in den Raum. Mit den weiteren Einstellungen kehrt sie dann nicht abrupt, sondern allmählich und schrittweise - zur Narration zurück. 101 100 in rezeptionsästhetischer Perspektive hat Sam hier noch den Status eines Statisten, ist als Mitglied des Figurenensembles der Geschichte noch nicht expliziert: Die Aufmerksamkeit, mit der die Kamera ihn registriert (die Ranfahrt und das recht lange Verharren in der Nahaufnahme), legt zwar schon die Vermutung nahe, daß es sich hier nicht bloß um einen beliebigen Bar-Pianisten handelt, doch bestätigt sich diese Vermutung erst in späteren Bildern. ιοί Sie zeigt zunächst, wie Carl die Getränke serviert, und registriert das Gespräch zwischen Carl und den Gästen, das weiterhin der Charakterisierung des Nachtclubs als Zufluchtstätte für Emigranten aus ganz Europa dient, dabei aber auch schon die Einfuhrung der
Kapitel 111: Montage
179
Die Bilderfolge zeigt typische Merkmale und Funktionen deskriptiver Kontextierungsverfahren im Film: Die in den Einstellungen gezeigten Vorgänge sind für den Verlauf der erzählten Geschichte ohne Belang; sie haben, wie besonders die an den vier verschiedenen Tischen spielenden Handlungsfragmente zeigen, den Status iterativer Vorgänge, die sich hier so oder so ähnlich jede Nacht abspielen und damit die Welt des »Café Américain« charakterisieren: Hier wird jede Nacht über Ausreisevisa, Flucht und Widerstandsaktionen gesprochen, um Schmuck und Preziosen gefeilscht, gespielt und getrunken, jede Nacht serviert hier der vormalige Professor (Carl) die Getränke, spielt Sam Klavier usw. usf. Die Einstellungswechsel sind daher nicht handlungslogisch motiviert, konstituieren keine Zusammenhänge zwischen den verbalen und nonverbalen Handlungen der Statisten bzw. Figuren, sondern beziehen ihren Zusammenhang aus der Einheit des Ortes. Dabei interessiert sich die Kamera weniger für die präzise räumliche Verortung ihrer Einzelwahrnehmungen als vielmehr für charakteristische Einzelheiten, eben jene iterativen Vorgänge, die die Atmosphäre des Emigranten-Treffpunktes erfassen, nimmt also diskontinuierliche Rekurrenzbeziehungen in Kauf. Erst in dem Moment, da der Kellner Carl mit dem Tablett in den Spielsalon geht, die Gäste bedient und mit ihnen redet, kehrt der Schnitt zu kontinuierlichen Rekurrenzen zurück, und das ist kein Zufall, denn mit diesen Bildern wird die Rückkehr zur Narration vorbereitet. Dieser fließende Übergang von der Deskription zur Narration ist ebenfalls typisch für die Einfügung deskriptiver Passagen in die filmische Narration und zugleich das deutlichste Indiz dafür, daß deskriptive Passagen in der Regel keine selbständigen Segmente bilden.
2.
Systematische Textbildung: Filmische Verfahren der Begriffsbildung
Systematische Texte befassen sich nicht mit der »je einmaligen Zuordnung einer Sachlage auf einen Sachverhalt«, sondern mit der »Beschreibung von Klassen von Sachlagen, das heißt mit Aussagen, die in einem bestimmten Gegenstandsbereich allgemeingültig sind«.102 Daß hier mit Bezug auf den Film von systematischer Textbildung gesprochen wird, mag auf den ersten Blick verwundern, denn bisher wurde ja größter Wert auf die Feststellung gelegt, daß Bilder das, was systematische Texte definiert, die Klassifikation, gerade Hauptfigur vorbereitet, des Besitzers des Nachtclubs, Rick Blaine (Humphrey Bogart), der in der darauffolgenden Einstellung erstmals ins Bild gesetzt und - durch einige ebenfalls deskriptive (iterative Handlungen) zeigende Bilder - charakterisiert wird, bevor er dann, ausgelöst durch den Auftritt Ugartes (Peter Lorre), zu handlungslogisch relevanten Aktionen übergeht. 102 STŒRLE 1979a, 185.
180
Kapitel III: Montage
nicht vollziehen können, weil ihre Zeichen nicht-klassifikatorischer Natur sind und daher über die 'je einmalige Zuordnung' von Sachlagen zu Sachverhalten nicht hinauskommen (vgl. Kap. I.A.2). Tatsächlich beschränkt sich denn auch das, was hier als systematische Textbildung bezeichnet werden soll, auf die Herstellung derjenigen Bedingungen, die die Ausgangssituation jeder klassifikatorischen Operation schaffen: auf die Herstellung einer Situation, die den Vergleich mehrerer Sachlagen ermöglicht. Die Bilder liefern das 'Vergleichsmaterial', können aber den Vergleich selbst, geschweige denn den daraus sich ableitenden Akt der Klassifikation, nicht vollziehen, müssen ihn vielmehr dem Rezipienten überlassen. 2.1 Voraussetzungen: Vergleich, Klassifikation, Begriffsbildung Der Zwang zur Rekonstruktion systematischer Beziehungen zwischen den Bildern entsteht immer dann, wenn die Bilder keine zeitlichen und/oder räumlichen Zusammenhänge ergeben, die das narrative bzw. deskriptive Textschema kennzeichnen, beruht also auf einem negativen Signal, auf dem Fehlen zeitlicher oder räumlicher Beziehungen: Die Einstellungsfolge am Beginn von »Modern Times« (USA 1932/35) etwa, bei der Chaplin das Bild einer zur Arbeit hastenden Menschenmenge mit dem Bild einer Schafherde verbindet (vgl. S. 143), ergibt weder einen zeitlichen noch einen räumlichen Zusammenhang, gewinnt vielmehr Plausibilität erst unter der Voraussetzung, daß die Bilder im Wege des Vergleichs in eine systematische Beziehung zueinander gesetzt werden, die die gehetzten Menschen - wie eine Herde Schafe - als fremdbestimmte Masse zu deuten erlaubt. Ähnlich ergeben die vielzitierten Schlachtszenen, die Eisenstein in »Streik« (UDSSR 1924) in die Bilder der Auseinandersetzung zwischen Arbeitern und Polizei einmontiert, weder zeitliche noch räumliche Zusammenhänge, bedürfen vielmehr ihrerseits eines Vergleichs, der sie in eine systematische Beziehung zu setzen erlaubt, die die Polizisten als brutale Schlächter und die Arbeiter als wehrlos niedergemetzeltes Schlachtvieh charakterisiert. Die vergleichende Operation, die der Zuschauer hier vollziehen soll, setzt voraus, daß die Bilder die Bedingung der Vergleichbarkeit erfüllen. Diese Bedingung manifestiert sich optisch in formalen und/oder thematischen Rekurrenzen (vgl. S. 143). Bei dem Beispiel aus »Modern Times« sind es allererst formale Rekurrenzen, Ähnlichkeiten in Bildaufbau und Bewegungsablauf (eine in gleiche Richtung hetzende Masse von Menschen/Schafen), in den Bildern aus »Streik« vor allem thematische Rekurrenzen (der Vorgang des Tötens), die optisch auf einen Zusammenhang zwischen den Bildern hinweisen und den Vergleich initiieren.
Kapitel ¡II: Montage 181 Ziel des Vergleichs ist hier wie bei jedem Vergleich die Klassifikation von Dingen oder Sachlagen. Sie kann zwei Ergebnisse zeitigen, die in der Filmtheorie traditionellerweise unter der Bezeichnung Parallel- bzw. Kontrastmontage geführt werden:103 Die in den Bildern gezeigten Sachlagen können entweder aufgrund eines oder mehrerer gemeinsamer Merkmale zu einer gemeinsamen Klasse von Sachlagen (hastende Menge, töten) zusammengefaßt oder aufgrund differenter Merkmale verschiedenen Klassen von Sachlagen (z.B. arm vs. reich)104 zugeordnet werden. Dieser Klassifikationsakt ist - wie jede klassifikatorische Operation - ein Akt der Begriffsbildung: Die Bildinhalte werden einer gemeinsamen Klasse oder zwei gegensätzlichen Klassen von Sachverhalten und damit einer Größe zugeordnet, die nicht in den Bildern selbst, sondern im Kopf des Rezipienten und dort nicht als Bild, sondern als Begriff existiert. Das heißt: Die systematische Montage ist ein - gemessen an der Wortsprache höchst umständliches - Verfahren, mit Bildern Begriffe zu evozieren, den Zuschauer dazu zu bringen, die von der Kamera abgebildeten individuellen Dinge 'auf den Begriff zu bringen'. Bei der Kontrastmontage geht es darum, die Differenzen nicht nur als Differenzen, sondern als Gegensätze zu erkennen (arm vs. reich), d.h. die Bildinhalte auf einander wechselseitig ausschließende Begriffe zu beziehen: Die Kontrastmontage, könnte man sagen, evoziert »Antonyme«, begriffliche Gegensatzpaare. Bei der Parallelmontage geht es darum, aus den gemeinsamen Merkmalen einen Oberbegriff (töten) abzuleiten, der die Bildinhalte als kommutierbare Vertreter einer Klasse von Sachlagen ausweist: Die Parallelmontage evoziert (partielle) »Synonymer* ('erschießen' und 'schlachten'). Als Mittel, über die 'einmalige Zuordnung einer Sachlage auf einen Sachverhalt', d.h. über die Narration oder Deskription hinauszugelangen, nämlich allgemeine Aussagen zu formulieren, sind systematische Textbildungsformen in erzählenden Filmen per definitionem explizite Erzählerkommentare und als solche eine Form uneigentlicher Rede (vgl. Kap. VII). 2.2 Formen Zwei Grundformen der systematischen Textbildung in Erzählfilmen sind zu unterscheiden und im weiteren getrennt zu behandeln, weil sie zwei grundsätzlich verschiedene Voraussetzungen haben: In der einen Form entstammt das Vergleichsmaterial der erzählten Geschichte selbst, so daß die systemati103 V g l . z . B . PUDOWKIN 1 9 6 1 , 7 6 f . ; ARNHEIM 1 9 7 9 , 1 1 9 f .
104 Vgl. etwa - in Ermangelung eines praktischen Beispiels - die bei Pudowkin (ebd. 76) und Arnheim (ebd. 120) genannte Gegenüberstellung von Bildern eines Hungernden und eines Schlemmers, die auf die Bildung zweier differenter Klassen von Sachlagen (Reichtum vs. Armut) zielen würde.
182
Kapitel III: Montage
sehe Kontextierung in die Narration integriert ist. In der anderen Form zeigt das Vergleichsmaterial keine Beziehungen zur erzählten Geschichte, so daß die systematische Kontextierung eine deutliche Unterbrechung der Narration mit sich bringt, d.h. die Montage einen demonstrativen Wechsel vom narrativen zum systematischen Textschema anzeigt. Grundform 1: Systematische Montage narrativer Bilder Die systematische Montage narrativer Bilder schafft eine auf den ersten Blick paradoxe Situation: Sie unterbricht den Fluß der erzählten Zeit nicht, weil ihre Bilder der Welt der erzählten Geschichte entstammen und die mit ihnen vergehende Zeit daher Teil der erzählten Zeit ist, und dennoch stiftet sie keinen zeitlichen (oder räumlichen) Zusammenhang, weil sie die Bilder nicht nach zeitlichen (oder räumlichen), sondern nach systematischen Gesichtspunkten montiert und so den Rezipienten zu klassifikatorischen Operationen nötigt. Die große Schlußsequenz von Eisensteins »Panzerkreuzer Potemkin«, die Begegnung des Panzerkreuzers mit einem zaristischen Geschwader auf dem Schwarzen Meer, mag das veranschaulichen: In ihr ist eine lange Bilderfolge der Angriffsfahrt gewidmet, mit der die »Potemkin« mit voller Kraft und gefechtsbereiten Geschützen auf das Geschwader zufährt (vgl. Kurzprotokoll S. I83ff.). Sämtliche Bilder betreffen den erzählten Vorgang, sind aber unterschiedlich, nämlich abwechselnd narrativ und systematisch montiert: In den systematisch montierten Passagen (im Kurzprotokoll durch Klammerungen markiert) sind die Bilder so aneinandergefiigt, daß deren Inhalt und Abfolge keinen zeitlichen oder räumlichen Zusammenhang zu stiften vermögen.105 Die mit ihnen vergehende Zeit ist zwar die Zeit der erzählten Geschichte, d.h. sie unterbrechen den Fluß der erzählten Zeit nicht, sind aber selbst nicht zeitlich organisiert. Denn anders als die narrativ montierten Passagen106 zeigen sie keine Progression, enthalten keine Hinweise darauf, daß sich etwas relevant verändert. Daß sich, während die Kamera diese Bilder liefert, gleichwohl etwas verändert hat, wird erst in den anschließenden, narrativ montierten Partien klar.107 Die zeitliche Indifferenz der systematischen Passagen wird dabei 105 Die hier gezeigten Vorgänge gehören zwar dem Handlungszusammenhang an, aber das geht nicht aus den Bildern selbst hervor, sondern aus ihrer Einbettung in die narrativ montierten (im Kurzprotokoll nicht eingeklammerten) Abschnitte, was sich empirisch erproben lieBe, wenn man die systematischen Passagen isoliert vorführen würde: Für sich allein ergäben die Bilder keinen Verlaufszusammenhang. 106 Vgl. etwa die zeitlichen Anschlußbildungen durch das fortschreitende Ausschwenken des Geschützrohrs in 24, 26, 28. 107 Vgl. z.B. E 38, 40, 48, 50: das Schiff macht zunehmend mehr Fahrt; E 36/42/56, 61, 68/69, 80: das Geschwader ist nähergekommen usw.
Kapitel III: Montage 183 Kurzprotokoll: Die Angriffsfahrt der »Potemkin« aus der Schußsequenz von Sergej M. Eisensteins »Panzerkreuzer Potemkin* (Bronenosec Potemkin, UdSSR 1925)10S 1 Am 2 3 Am 4 1-5 6 7 8 9 10 11
Am Ν Ν HT Am Ν Ν HT
12 HT 13 HT 14 15 16 17 18 19 20 21 22
Ν Ν Ν HT Ν Ν Ν HT Τ
23 24 25 26 27 28 29 30 1-31 32 33 L 34 35 36
Am HT Ν HT ΗΝ HT ΗΝ
-
HT HT HT HT Am Τ
Kommandobrücke: Matjuschenko gibt Befehle durch ein Sprachrohr INSERT: »Volldampf«
Maschinenraum: ein Maschinist spricht durch ein Bordtelefon (mit Matjuschenko) Kommandobrücke: Matjuschenko telefoniert (mit dem Maschinisten) stampfende und rotierende Maschinenteile dass. schwarze Dampfwolken quellen aus dem Schornstein stampfende Maschinenteile, daneben ein Maschinist rotierende Maschinenteile dass. Blick von der linken Reling: die Wasserfläche fliegt vorüber (von oben rechts nach unten links) Blick auf das vorüberfliegende Kielwasser Blick von der rechten Reling: die Wasserfläche fliegt vorüber (von oben links nach unten rechts) stampfende und rotierende Maschinenteile ( = 5 ) rotierende Maschinenteile (= 10) stampfende Maschinenteile (= 6) Blick von der linken Reling (ähnlich 11) rotierende und stampfende Maschinenteile dass. dass. schwarze Dampfwolken quellen aus dem Schornstein ( = 7 ) das Meer (vom Heck aus): der schwarze Dampf der »Potemkin« verdunkelt den Himmel Matjuschenko gibt Anweisungen Geschützrohre des Kreuzen schwenken aus ein Matrose richtet das Geschütz aus Geschützrohre schwenken weiter aus Matrosen beim Ausrichten des Geschützes Geschützrohre schwenken weiter aus ein Matrose richtet das Geschütz aus INSERT: »Dem Feind entgegen!« fast vertikaler Blick auf die Bugspitze: die Wasserfläche fliegt vorüber Blick von der linken Reling ( = 1 1 ) Blick von der rechten Reling ( = 1 3 ) das heftig bewegte Wasser Kommandobrücke: Matjuschenko mit Steuermann ein Teil des feindlichen Geschwaders
108 Die Originalfassung des Films ist verschollen, und die heute zugänglichen Fassungen zeigen sämtlich mehr oder weniger starke Differenzen. Das Kurzprotokoll des hier interessierenden Teils beruht auf der gegenwärtig am leichtesten zugänglichen Fassung, auf der von Jürgen Labenski und Gerd Luft für das ZDF erarbeiteten Rekonstruktion, die ich insgesamt für überzeugender halte als die Fassung, die die 35 mm-Kopie der Stiftung Deutsche Kinemathek (Berlin) zeigt und der das von Christian Weisenborn hergestellte Protokoll (in EISENSTEIN 1973, 42-86) folgt.
184
37 38 39 40 41 42 43 44 45 46 47 48 49 50 (-51 52 53 L 54 55 56 57
Kapitel III: Montage Am G Am G ΗΝ Τ
Ν ΗΝ ΗΝ Ν Ν G G Am HT HT HT Am Τ
58 Τ 59 Ν 60 61 Τ (-62 HT 63 HT •-64 HT 65 Am 66 HT 67 68 HT 69 HT 70 Ν 71 HT 72 HT 73 HN HN Γ74 75 HT 76 HN 77 HT L 78 Τ 79 Ν 80 HT 81 Ν 82 Ν 83 84 Ν 85 ΗΝ
Kommandobrücke: Matjuschenko gibt dem Steuermann Anweisungen der Geschwindigkeitsmesser steigt Maschinenraum: ein Maschinist telefoniert der Geschwindigkeitsmesser steigt weiter ein Geschütz wird vorbereitet ein Teil des feindlichen Geschwaders (wie 36) stampfende Maschinenteile ein Matrose richtet ein Geschütz aus dass, (ähnlich 27, 29) dass. (= 25) rotierende und stampfende Maschinenteile ( = 1 8 ) der Geschwindigkeitsmesser INSERT: »Mit äußerster Kraft voraus!« der Geschwindigkeitsmesser zeigt Höchstgeschwindigkeit stampfende Maschinen, daneben ein Maschinist (wie 8) Blick von der linken Reling ( = 1 7 ) dass, (ähnlich 11) schwarze Dampfwolken quellen aus dem Schornstein (ähnlich 7, 21) Kommandobrücke: Matjuschenko gibt dem Steuermann Anweisungen das feindliche Geschwader INSERT: »Das Torpedoboot Nr. 267, das sich dem Aufstand angeschlossen hat, begleitete den Panzerkreuzer wie ein Schatten« Luftaufnahme: die »Potemkin« und das Torpedoboot Kommandobrücke: Matjuschenko mit Steuermann INSERT: »Das Flaggschiff greift an!« das feindliche Geschwader fährt auf die Kamera zu schwarze Dampfwolken quellen aus dem Schornstein (= 54) Blick von der linken Reling (= 17, 52) dass. (= 53) Kommandobrücke: Matjuschenkow mit Steuermann ein Geschütz schwenkt nach vorn INSERT: »Das Geschwader kommt näher!« das Geschwader fährt auf die Kamera zu dass. ein Matrose richtet ein Geschütz aus ( = 25, 46)
ein Geschütz schwenkt aus dass, (ähnlich 66) Matrosen tragen Munition schwarze Dampfwolken über dem Geschützturm das heftig bewegte Wasser (ähnlich 34) schwarze Dampfwolken über dem Geschützturm (= 74) schwarze Dampfwolken quellen aus dem Schornstein (= 7, 21) das Meer: der Dampf der »Potemkin« verdunkelt den Himmel (= 22) Kommandobrücke: Matjuschenko mit Steuermann (ähnlich 59) das Geschwader Kommandobrücke (ähnlich 59, 79) Matjuschenkos Hand greift nach dem Telefon INSERT: »Signal geben: 'Schließt Euch uns an!'« Matjuschenkos Hand hängt den Hörer wieder ein ein Matrose gibt Raggensignale
Kapitel III: Montage 86 87 88 89 90 91 (-92 93 94 95 96 L97
HT
HT HT HT HT HT HT HT HT HT 98 HN 99 HN 100
185
INSERT: »- Schließt euch ...« Flaggen werden am Mast hochgezogen INSEKT: » . . . u n s an!«
Flaggen steigen am Mast hoch dass. dass, (ähnlich 89) Blick von der linken Reling ( = 17, 52, 63) dass, (wie 11) das heftig bewegte Wasser (ähnlich 34, 75) schwarze Dampfwolken ziehen am Mast vorbei Dampfwolken quellen aus dem Schornstein ein Geschützrohr von unten, darüber vorbeiziehender Dampf ein Matrose blickt durch das Zielfernrohr seines Geschützes Matrosen an einem Geschütz INSERT: »Der Feind im Schufibereich«
nicht nur durch die Montage, sondern auch und vor allem durch die gewählten Ausschnitte selbst erzeugt, denn die Kamera erfaßt hier nicht einmalige Handlungen, sondern iterative, für die Zeitdauer des gesamten Vorgangs ständig wiederkehrende Vorgänge, die eben deshalb keine zeitliche Progression anzeigen können: auf Hochtouren arbeitende Maschinen, den kräftig aus den Schornsteinen des Schiffes hervorquellenden Rauch, die vorüberfliegende Wasserfläche aus verschiedenen, effektvoll kombinierten Blickwinkeln, die heftigen, von der Schiffsbewegung erzeugten Turbulenzen im Wasser. Die Montage könnte, selbst wenn sie wollte, mit diesen Bildern keine zeitlichen Zusammenhänge herstellen. Das Fehlen zeitlicher und räumlicher Anschlüsse zwischen den Einstellungen zwingt den Zuschauer, die Bilder, statt in eine zeitliche oder räumliche, in eine systematische Ordnung zu bringen, sie zu vergleichen: Das tertium comparationis ist hier zweifellos das in jeder Einstellung neu formulierte Prinzip einer entschlossenen, kraftvollen Vorwärtsbewegung, das die Bilder zu Symbolen revolutionärer Kraft und Entschlossenheit erhebt (zum Begriff des symbolischen Vergleichs vgl. Kap. VII.D.2). Grundform 2: Digressionen Die zweite Grundform der systematischen Montage arbeitet mit Bildern, deren Objekte - wie etwa die Schafherde in »Modern Times« oder die Schlachtszenen in »Streik« (vgl. S. 143, 180) - nicht in der erzählten Welt zu verorten sind, in denen die Kamera, die Narration unterbrechend, ihren Blick auf Gegenstände oder Vorgänge richtet, die in keiner ersichtlichen räumlichen Beziehung zur Welt der erzählten Geschichte stehen. Solche Bilder seien, weil die Kamera dabei in einem ganz buchstäblichen, räumlichen Sinne vom Ort
186
Kapitel ΠΙ: Montage
des Geschehens abschweift, Digressionen (digressive Bilder) genannt, 109 ein Begriff, der hier an die Stelle des in der Filmsemiotik üblichen Begriffs des »Extradiegetischen« (Nicht-Diegetischen) tritt. 110 Der Vergleich, zu dem systematisch montierte Bilderfolgen nötigen, betrifft bei Digressionen in der Regel die Beziehung nicht zwischen mehreren digressiven Bildern, sondern zwischen je einzelnen, in die Narration eingefügten digressiven Einstellungen und den sie umgebenden narrativen Bildern. Dabei handelt es sich meistens um Parallelmontage, die narrative und digressive Bilder einem gemeinsamen Begriff (»töten«)111 zuzuordnen und damit als (partielle) 'Synonyme' (»erschießen« und »schlachten«), als kommutierbare Varianten des klassenbildenden Begriffs zu verstehen anweist. Dabei geht es naheliegenderweise nicht um die wechselseitige (Commutation dieser 'Synonyme', sondern darum, daß der mit dem digressiven Bild evozierte Begriff (»schlachten«) auf die narrativen Bilder (die Ermordung der streikenden Arbeiter) bezogen, als Kommentierung des Erzählten verstanden wird. 112
109 in der Erzähltheorie hat der Begriff keinen festen terminologischen Status, sondern fungiert dort als einer von vielen allgemeinen Sammelbegriffen für die verschiedenen Formen von - beschreibenden, kommentierenden, erörternden - Abschweifungen des Erzählers vom erzählten Geschehen. Mit Bezug auf den Film soll er in einem eingeschränkten Sinn als räumliche Entfernung vom Schauplatz der Geschichte gelten, n o Vgl. z.B. METZ 1966/67, 172; SCHNEIDER 1981, 113-115; SIEGRIST 1986, 67. - Der Be-
griff leitet sich aus einem - offenbar auf die französische Filmsemiologie zurückgehenden - Begriffsgebrauch ab, der »Diegese« als Bezeichnung für die fiktive Welt der erzählten Geschichte und die von ihr (von der Darstellungsebene) vergebenen Informationen vorsieht und alle Informationen, die nicht der fiktiven Welt entstammen (z.B. voice over, Filmmusik usw.), »nicht-diegetisch« oder »extradiegetisch« nennt. Dieser Begriffegebrauch verstößt nicht nur gegen die Etymologie, sondern auch gegen einen alten terminologischen Konsens, denn der Begriff hat eine klare Kontur und begriffsgeschichtliche Tradition als Teil des Begriffspaars Diegesis und Mimesis, mit dem Piaton 'Bericht' und 'Darstellung', d.h. die narrative und dramatische Sprechsituation, unterschieden hat (Politela, 392a-398; Stephanus-Zählung) und das seither in eben dieser Bedeutung seinen festen terminologischen Ort hat (vgl. hier Kap. I, S. 36f.). Abgesehen davon, daß das, was in der Filmsemiotik mit dem Begriff »diegetisch« bezeichnet werden soll, eher »mimetisch« heißen müßte (weil im Film das Erzählte sich im Modus dramatischer Rede präsentiert) und daß »nicht-diegetisch« (»extra-diegetisch«) dasselbe wie »mimetisch* bedeutet, gerät dieser Begriffsgebrauch vollends zum baren Widersinn dort, wo die Bindung des Diegese-Begriffs an seinen Gegenbegriff (Mimesis) zugunsten anderer Gegenbegriffe endgültig gelöst wird, wie das etwa bei Schneider geschieht, die »Diegese« - einer heillosen Verwirrung der Begriffe bei Metz folgend (METZ 1965, 29ff.) - gar als Gegenbegriff zu »Fiktion« einfühlt, um die Differenz zwischen sprachlichem und filmischem Erzählen zu erfassen (SCHNEIDER 1981, 113-115). m Vgl. das S. 142, 180 und 185f. genannte Beispiel aus Eisensteins »Streik«. 112 Da es sich hier um eine Art 'Übertragung' handelt, wird in solchen Fällen gern von filmischen Metaphern gesprochen (vgl. z.B. SIEGRIST 1986, 67; MÖLLER 1986, 104f. u.a.), ein
Kapitel III: Montage
187
Eine der berühmtesten systematischen Montagen der Filmgeschichte - die drei Bilder steinerner Löwen in Eisensteins »Panzerkreuzer Potemkin« - verdient wegen ihrer formalen Besonderheit eigens Erwähnung. Hier wird der Erzählprozeß - die Darstellung des Angriffs der »Potemkin« auf den Sitz des zaristischen Generalstabs im Theater von Odessa - mit drei digressiven Einstellungen unterbrochen, in denen nacheinander drei verschiedene steinerne Löwenfiguren - ein schlafender, ein erwachender und ein brüllend sich erhebender Löwe - erscheinen,113 die unschwer als Allegorien des - schlafenden, erwachenden, sich erhebenden - Volkes zu deuten sind. Die formale Besonderheit besteht hier darin, daß die digressiven Bilder ihrerseits narrativ organisiert sind, nämlich - mit den Mitteln der Bildergeschichte, mit unbewegten Einzelbildern - eine kleine Geschichte, eine Geschichte in der Geschichte erzählen. Die eingeschachtelte Bildergeschichte wiederholt kommentierend die erzählte Geschichte und gewinnt damit den Charakter eines Gleichnisses.
Begriff, der den Sachverhalt verfehlt (vgl. Kap. VII.A). Vielmehr handelt es sich hier um schlichte So-Wie-Vergleiche. 113 Vgl. die Abbildung in EISENSTEIN 1973, 264.
Kapitel IV Filmische Erzählsituationen
Aus der Bestimmung der filmischen Sprechsituation (Kap. I.C) ergeben sich die Voraussetzungen für die Anwendung der literaturwissenschaftlichen Kategorie der Erzählsituation auf den Film: Die »Mittelbarkeit« des Erzählens realisiert sich im Film als optische und akustische Wahrnehmungsbeziehung, die über die Abbildungsebene organisiert wird (S. 42f). Die Bestimmung filmischer Erzählsituationen wird demnach ihre Kriterien aus den in den beiden vorhergehenden Kapiteln untersuchten Abbildungsverfahren beziehen. Das Verhalten der Kamera, dem hier nun auch die Montage, verstanden als Blickwechsel der Kamera, zugerechnet werden kann, spielt dabei die Hauptrolle: Die die Bestimmung von Erzählsituationen leitende Frage nach dem »Standort des Erzählers« ist beim Film eine ganz gegenständlich-räumliche, nämlich eine allererst auf den Standort des Abbildungsapparats bezogene Frage. Das und die vergleichsweise geringe Variabilität filmischer Erzählsituationen vereinfacht die Klassifikation: Der Umstand, daß die erzählte Welt im Film ihren Subjektstatus insoweit bewahrt, als sie auch unter den Bedingungen der filmischen Reproduktion im Modus dramatischer Selbstdarstellung erscheint (vgl. S. 36-39), hat zur Folge, daß die Verfügungsmöglichkeiten des filmischen Erzählers über das Erzählte - im Vergleich zum sprachlichen Erzähler deutlich eingeschränkt sind. Deshalb ist der Formenreichtum, den Erzählsituationen in sprachlichen Erzähltexten zeitigen, hier sichtlich reduziert, was zugleich heißt, daß die Bedeutung der Erzählsituationen für die Ästhetik des Films insgesamt wesentlich geringer zu veranschlagen ist. Entsprechend sind auch die Probleme, die die Literaturwissenschaft bei der Bestimmung von Erzählsituationen nach wie vor hat, hier deutlich geringer. 1 Der Versuch, die Formen der »Mittelbarkeit« des Erzählens zu klassifizieren, verbindet sich vor allem mit dem Namen Franz K. Stanzeis, dessen verschiedene Modellentwürfe, ungeachtet ihrer methodischen und begrifflichen Unschärfen (s.u.), den ι
Für eine Grundsatzdiskussion, die diese Probleme und damit die besonders in den späten sechziger und frühen siebziger Jahren geführte Auseinandersetzung (vgl. etwa HAMBURGER 1 9 6 8 ; COHN 1 9 6 6 , 1 9 6 9 ; DOLOZEL 1 9 7 2 ; LEIBFRIED 1 9 7 0 , 2 4 3 f f . ; FÜGER 1 9 7 2 u . a . )
noch einmal aufrollt, besteht hier deshalb wenig AnlaB. Stattdessen kann hier pragmatisch verfahren werden, indem die in der Literaturwissenschaft etablierten Begriffe und Kriterien aus filmspezifischer Sicht refonnuliert werden.
Kapitel IV: Erzählsituationen
189
nach wie vor wichtigsten und umfassendsten Beitrag zum Thema geliefert haben, 2 dem selbst die Versuche ihrer Überwindung noch deutlich verpflichtet sind. 3 Stanzeis Modelle werden deshalb auch hier Pate stehen. Die Filmwissenschaft selbst hat noch kaum Ansätze zu einer systematischen Klassifikation filmischer Erzählsituationen entwickelt. 4 Von Ausnahmen abgesehen, 5 operiert sie noch immer mit der wenig plausiblen Unterscheidung zwischen »subjektiver« und »objektiver Kamera«.6 Sprachliche Äußerungsformen des filmischen Erzählers (»voice-over«, Schriftinserts usw.) werden im weiteren abermals vernachlässigt: Sie sind hier von untergeordnetem Interesse, weil für sie die für sprachliche Erzählsituationen entwickelten Merkmale gelten. Hier soll es stattdessen um die Klassifikation der genuin filmischen Organisationsformen von Erzählsituationen gehen.
A. Die Ich-Erzählsituation 1.
Literaturwissenschaftliche Begriffsexplikation
In der letzten Fassung seiner Theorie der Erzählsituationen stellt Stanzel seine Ergebnisse in der Form eines »Typenkreises« dar,7 auf dem drei einander überlagernde Kreishälften erscheinen, die durch drei als jeweils »binäre Oppositionen«8 gefaßte Kriterienpaare (»Identität vs. Nicht-Identität der Seinsbe-
2 Die typischen Erzählsituationen im Roman, Wien-Stuttgart 19SS; Typische Formen des Romans, 9. Aufl. 1979; Theorie des Erzählens, 2. Aufl. Göttingen 1982. 3 Vgl. z.B. FÜGER 1972; KAHRMANN/REISS/SCHLUCHTER 1986, 143-147. 4 Ansätze zu einer Systematik filmischer Erzählsituationen liefern, auch wenn der Begriff dort nicht auftaucht, zwei Arbeiten von Jan Marie Peters (PETERS 1971 und 1984), die freilich von problematischen Setzungen ausgehen. Die frühere Arbeit verkennt die grundlegende, jedem Sprechakt immanente Differenz von Subjekt und Objekt der Rede, wenn sie den Grad dieser Differenz zum Kriterium der Klassifizierung macht, nämlich zwischen einem von den Objekten 'abgelösten', einem in ihnen 'aufgehenden' und einem in ihnen 'verschwindenden' Abbildungsverhalten spricht (PETERS 1971, 57). Die spätere Arbeit verbindet diese intuitive Kategorisierung mit sprechakttheoretischen Begriffen (PETERS 1984), verwendet diese Begriffe aber falsch (vgl. hier S. 57, Anm. 4). 5 Vgl. Z.B. KANZOG 1981a; WEGSCHEIDEL 1989. 6 Vgl. z.B. SIEGRIST 1986, 132-149; das Differenzkriterium »subjektiv« vs. »objektiv« eskamotiert die jedem (also auch dem filmischen) Sprechakt eigene Subjekt-Objekt-Struktur. 1 STANZEL 1982 (Anhang) und hier Abb. 11. 8 Ebd. 75f. - Der Begriff ist hier seiner strukturalistischen Bedeutung weitestgehend entkleidet, nur ein Beispiel für die in dieser letzten Fassung allenthalben spürbare Neigung, die ursprünglich phänomenologisch-beschreibende Methode durch Rekurse auf stnikturalistische Begriffe in eine stnikturalistische umzudeuten.
190
Kapitel IV: Erzähbituationen
reiche«, »Innen- vs. Außenperspektive«, »Erzähler- vs. Reflektorfigur«) gebildet werden. Diese drei einander überlagernden Kreishälften erzeugen sechs Sektoren: Drei dieser Sektoren sollen die drei klassischen Erzählsituationen (im folgenden: ES) abbilden, während die zwischen ihnen liegenden übrigen drei Sektoren »Übergangsbereiche« darstellen, in denen Texte oder Textpassagen anzusiedeln sind, die Misch- oder Übergangsformen zwischen den drei klassischen ES zeigen. 9 Das Typenkreis-Schema soll verdeutlichen, daß die drei ES-Typen Idealtypen sind, die in der literarischen Praxis eine Fülle von Übergangsformen zeitigen. Das Schema schafft nun aber den Zwang, den kategorialen Unterschied zwischen erzählter Figur und Erzählerfigur aufzuheben und damit zugleich die Differenz von Ich- und Er/Sie-Erzählung zu verwischen, nämlich Erzählformen, die ohne Frage der Er/Sie-Erzählung angehören, 10 diesseits der »Ich/Er-Grenze« (vgl. Abb. 11) anzusiedeln und damit der Ich-Form zuzuschlagen, d.h.: Mit den ineinandergreifenden Halbkreisen des Typenkreis-Schemas werden »Überlagerungen« von Sachverhalten behauptet, die einander gar nicht »überlagern« können, weil sie einander ausschließen, 11 ® Die Oppositionen dieser drei Kriterienpaare werden als Pole dreier den Typenkreis zentral durchschneidender Achsen dargestellt, wobei jeweils einer der beiden Pole als definitorisches Merkmal jeweils einer der drei klassischen ES bestimmt wird (vgl. Abb. 11). Jede dieser als Verbindungslinie zweier polarer Gegensätze gedachten Achsen sondert jeweils zwei verschiedene Kreishälften aus, die durch die diese Achsen rechtwinklig schneidenden Geraden entstehen. Diese drei Geraden markieren die 'äußersten' Grenzen der jeweils zugehörigen ES und teilen den Typenkreis in sechs Sektoren, von denen die (in der Abbildung schraffierten) Sektoren, in deren Mittelpunkt die drei als definitorisch erkannten Merkmale liegen, die Bereiche der drei klassischen ES abbilden sollen, während die anderen die Bereiche anzeigen sollen, in denen sich die jeweils benachbarten ES überschneiden. 10 Das »Ich des inneren Monologs« beispielsweise, das Stanzel diesseits der »Ich/Er-Grenze«, auf der Ich-Seite, ansiedelt, ist per definitionem kein erzählendes, sondern vielmehr ein vom Erzähler-Ich klar getrenntes erzähltes Ich, das folglich nur in Er/Sie-Formen vorkommen kann, also in den den inneren Monolog umgebenden Textpartien in der 3. Person erscheint. Wo es aber keine umgebenden Textpartien gibt, wo also der 'innere Monolog' den ganzen Text ausmacht, handelt es sich nicht um einen inneren Monolog, sondern entweder um einen dramatischen Monolog oder um die Erzählerrede einer Ich-Erzählung. Hier wird also das Kriterium vernachlässigt, das jene beiden »Ichs«, Erzähler-Ich und erzähltes Ich, zu unterscheiden verlangt, das Redekriterium: das erzählte Ich des inneren Monologs spricht ja nicht - wie das Erzähler-Ich - zum (fiktiven) Leser, d.h. kommuniziert nicht im vermittelnden, sondern ausschließlich im inneren Kommunikationssystem (vgl. Abb. 1, S. 45). 11 Das liegt daran, daB die »Erzähler-Reflektor-Grenze« im Typenkreis-Modell diesseits der »Ich/Er-Grenze«, auf der »Ich«-Seite, zu stehen kommt: Die Reflektorfigur ist nun aber per definitionem eine vom Erzähler verschiedene Figur, die deshalb in der Erzählerrede in der dritten Person erscheinen muß. Stanzel rechtfertigt seine Anordnung damit, daB »im Raum der Bewußtseinsdarstellung und bei Absenz [!] einer Erzählerfigur die Unterscheidung zwischen Ich- und Er-Bezug merkmallos wird« (STANZEL 1982, 271). Auch diese
Kapitel IV: Erzählsituationen
191
und umgekehrt werden Sachverhalte als einander ausschließende behauptet, die einander »überlagern« können.12 Ausgangspunkt dafür ist das für die IchErzählsituation als defmitorisch gesetzte Kriterienpaar:13 Stanzel setzt zwei »Seinsbereiche« an, den der erzählten Figuren und den des fiktiven Erzählers, und leitet daraus die Opposition »Identität vs. Nicht-Identität der Seinsbereiche« ab. Im ersten Fall sei das Erzähler-Ich im »Seinsbereich« der Figuren, in der »Welt der Charaktere« angesiedelt und daher (weil es 'leibhaftig' in der erzählten Welt agiere) ein »Ich mit Leib«,14 das der Position des Ich-Erzählers eine für die Ich-ES als, defmitorisch postulierte 'ontologische Basis'15 gebe. Im zweiten Fall fehle diese 'ontologische Basis' und damit das für die Ich-ES deflatorische »Maß der 'Leiblichkeit' des 'ich'-sagenden Erzählers«,16 was den in Frage stehenden Text der Er/Sie-Form zuweise. Nun soll es aber gleichwohl - und zwar innerhalb des durch »Identität der Seinsbereiche« (also durch die Ich-Form) ausgewiesenen Formenspektrums - »Übergangsformen« zwischen Ich- und (auktorialen bzw. personalen) Er/Sie-Formen geben, und die sollen sich aus jenem »Maß der 'Leiblichkeit' des 'ich'-sagenden Erzählers« ableiten lassen, das als Resultante kontinuierlicher Verschiebungen des Verhältnisses zwischen »erlebendem Ich« und »erzählendem Ich« gedacht wird: Ausgehend von dem Gleichgewicht zwischen »erlebendem Ich« und »erzählendem Ich«, das die klassische Ich-ES charakterisiert, sollen die Übergänge zu den auktorialen bzw. personalen Er/Sie-Erzählungen dadurch Zustandekommen, daß »der Grad der 'Leiblichkeit' des erzählenden Ich ab(nimmt)« und »dafür die 'Leiblichkeit' des erlebenden Ich umso deutlicher hervor(tritt)«.17 Da sich daraus die Differenz zwischen auktorialer und personaler ES noch nicht ableiten läßt, beschreibt Stanzel diese Übergänge zwischen Ich- und Er/Sie-Formen dann einerseits als Ergebnis eines (zur aukto-
12
13
14 15 16 Π
Annahme beruht auf der Vernachlässigung des Redekriteriums (vgl. Anm. 10), die hier dazu führt, daß Reflektorfigur und Erzählerfigur zuletzt identifiziert werden. Von einer »Absenz« des Erzählers kann in Erzähltexten schlechterdings nicht die Rede sein, weil der narrative Sprechakt per definitionem ein vermittelndes Kommunikationssystem voraussetzt (vgl. Abb. 1, S. 45): Ein Text, in dem »kein Erzähler mehr da ist« (144), ist ein dramatischer Text. Dieser Fall entsteht z.B. beim inneren Monolog, der als eine den 'Übergang' zwischen Ich- und personaler ES kennzeichnende Form ausgewiesen (vgl. Anm. 10) und damit zugleich als Darbietungsweise klassifiziert wird, die auktorialen Eizählern nicht zu Gebote steht (das 7. Kapitel von Thomas Manns »Lotte in Weimar« könnte den Gegenbeweis antreten). STANZEL 1 9 8 2 , 7 1 f . , 1 0 9 - 1 4 8 , vor allem 1 2 0 - 1 2 5 , wo die 'neue erzähltheoretische Begründung der Ich-/Er-Opposition' entwickelt wird. Ebd. 124. Ebd. 122. Ebd. 125. Ebd.
192
Kapitel IV: Erzählsituationen
rialen ES hin) sukzessiv zunehmenden Dominierens der Perspektive des (dabei zugleich zunehmend »körperlos« werdenden) »erzählenden Ich« und andererseits als Ergebnis eines (zur personalen ES hin) sukzessiv zunehmenden Dominierens der Perspektive des (dabei zugleich zunehmend »körperlich« werdenden) »erlebenden Ich«.18 Daß nun aber »erzählendes« und »erlebendes Abb. 11: Typenkreis (nach Stanzel 1982)
Personale ES
Ich« bei dieser 'Verschiebung' über die Grenzen der 'reinen' Ich-ES hinaus nicht bloß ihre perspektivischen Dominanzbeziehungen oder den Grad ihrer »Leiblichkeit« verändern, sondern auch und vor allem zu zwei verschiedenen Figuren werden, daß also das »erlebende Ich« unterdessen (und schon diesseits der als »Ich/Er-Grenze« deklarierten Gerade im Typenkreis) zu einem »Er« oder einer »Sie« mutiert, wird dabei ignoriert, d.h.: Mit dem Kriterium »Identität der Seinsbereiche« wird ein Formenkontinuum behauptet, wo tatsächlich ein qualitativer Sprung, nämlich der Wechsel von der Ich- zur ErForm und damit das Auseinandertreten von erzählter und Erzählerfigur voris Vgl. ebd. 258-299, vor allem 266f., 285f., wo Reflektorfigur und »erlebendes Ich« expressis verbis identifiziert werden.
Kapitel IV: Erzählsituationen
193
liegt. Um die den Typenkreis-Entwurf leitende Vorstellung eines 'organischen' (Continuums zwischen den drei klassischen ES aufrechtzuerhalten, muß also der kategoriale Unterschied zwischen Subjekt und Objeta des narrativen Sprechakts, zwischen Erzählerfigur und erzählter Figur, vernachlässigt werden. Eben dadurch aber verliert das Differenzkriterium die Fähigkeit, die »Ich/Er-Grenze« und damit die Ich-Es plausibel zu begründen.19 Der Unterschied, den Stanzel mit dem Begriff »Seinsbereich« eigentlich meint, den er aber nicht meinen »darf« (weil dann die Geometrie seines Typenkreises hinfall ig würde), läßt sich durch eine viel einfachere Frage erfassen, durch die Frage nämlich, ob der Erzähler selbst als Figur der erzählten Geschichte in Erscheinung tritt oder nicht. Das hat zu tun mit der Frage, wessen Geschichte erzählt wird: Erzählt der Erzähler seine eigene Geschichte oder - wie z.B. Serenus Zeitblom in Thomas Manns »Doktor Faustus« - eine mit seiner eigenen Geschichte verquickte Geschichte, dann erscheint er zwangsläufig nicht nur als Erzählerfigur, sondern auch als erzählte Figur. Das heißt: Er tritt als Kommunikationspartner nicht nur des fiktiven Lesers, sondern auch der fiktiven Figuren in Erscheinung. Daraus läßt sich - im Rekurs auf das Modell der narrativen Sprechsituation (vgl. Abb. 1, S. 45) - eine Bestimmung der Ich-ES ableiten, die den kategorialen Unterschied zwischen Ich- und Er-Form präzise zu erfassen imstande ist: In der Ich-ES kommuniziert der fiktive Erzähler (S 2) nicht bloß mit seinem fiktiven Leser (E 2), sondern auch mit seinen fiktiven Figuren (S/E 1), besetzt folglich im Modell der narrativen Sprechsituation sowohl die Position S 2 als auch die Position 19 »Identität der Seinsbereiche« ist ein hochgradig unspezifisches Kriterium, das alle möglichen Formen einer irgendwie gearteten 'leiblichen' Anwesenheit des Erzählers in der erzählten Welt erfaBt, gleichgültig, wann und wo diese Anwesenheit sich vollzieht: Ein Erzähler, der seine eigene Geschichte erzählt, unterschiede sich demnach nur durch das »Maß« seiner »Leiblichkeit«, nicht aber prinzipiell von einem Erzähler, der sich als Herausgeber eines Manuskripts, Tagebuchs u.ä. fingiert, denn beide wären (wenn auch 'graduell' verschieden intensive) Teilhaber am »Seinsbereich« der erzählten Welt. Das verweist darauf, daB und warum das Konstrukt zweier fiktiver »Seinsbereiche« selbst schon problematisch ist, denn es gibt nur einen »Seinsbereich«, eben den der Fiktion (im Unterschied zum »Seinsbereich« des empirischen Werksubjekts bzw. Rezipienten): Der Erzähler ist, wie Stanzel doch selbst zu betonen nicht müde wird, eine fiktive Figur und als solche per definitionem selbst Teil der fiktiven Welt des Erzählten, denn allein daraus bezieht er seine Legitimation als Subjekt (fingierter) Wirklichkeitsaussagen, als Erzähler einer 'wahren Begebenheit', als die er seine Geschichte - im Rahmen der erzählerischen Fiktion verstanden wissen will (vgl. S. 31 f.). D.h.: Die Gliederung dieser fiktiven Welt in zwei »ontische« Bereiche ist eizähltheoretisch nicht begründbar. Für die Bestimmung filmischer Erzählsituationen ist sie ohnehin von vornherein unbrauchbar, denn die Einheit der »Seinsbereiche«, die »leibliche« Anwesenheit des filmischen Erzählers am Ort des Geschehens, ist, weil filmisches Erzählen auf der Vermittlung optisch-akustischer Wahrnehmungen beruht, conditio sine qua non filmischer Rede.
194
Kapitel IV: Erzählsituationen
S/E 1. Was Stanzel ontologisierend als »Seinsbereiche« apostrophiert, sind also Ebenen der fiktiven Kommunikation. Die Ich-ES läßt sich so präzisieren als Eintreten des Erzählers in eine doppelseitige Kommunikation, mit der er sich auf der Ebene sowohl des vermittelnden (N 2) als auch des inneren Kommunikationssystems (N 1) bewegt. Der qualitative Sprung von der Ich- zur Er-Form läßt sich damit klar verorten: Er ist dort anzusetzen, wo das Erzähler-Ich nicht als Kommunikationspartner der fiktiven Figuren agiert, wo S 2 und S/E 1 nicht mehr in 'Personalunion' erscheinen und daher die Kommunikationsniveaus Ν 2 und Ν 1 klar getrennt sind.20 Das hat dann freilich zur Folge, daß die von Stanzel als »Übergangsformen« zwischen Ich- und Er/ SieErzählungen angesetzten Erzählformen klar den Er/Sie-Erzählungen zuzuweisen sind, was zugleich bedeutet, daß die eine organische 'Kette der Wesen' insinuierende Geometrie des Typenkreises aufgegeben werden muß: Die »Ich/ Er-Grenze« fallt mit den Grenzen des (in Abb. 11 schraffierten) Sektors zusammen, der im Stanzeischen Typenkreis die 'reine' Ich-ES repräsentiert. Die erheblichen funktionalen Unterschiede zwischen Ich- und Er-Form lassen sich auf dieser Grundlage präzise begründen. Wenn der Ich-Erzähler sich dadurch auszeichnet, daß er sowohl als Erzählerfigur als auch als erzählte Figur, als Kommunikationspartner seiner Figuren agiert, dann stehen ihm logischerweise diejenigen Darstellungsweisen, die für die beiden klassischen Typen der Er-Erzählung, für die auktoriale und die personale ES, definitorischen Status haben, nicht zur Verfügung: Weder kann er sich, wie der auktoriale Erzähler, die Position einer 'olympischen' Instanz zuweisen, noch kann er, wie der personale Erzähler, das Geschehen aus der Perspektive einer seiner (Mit-)Figuren darstellen. Vielmehr bleibt er - als in der fiktiven Welt fest verorteter Akteur - unwiderruflich an seine eigene, subjektive Perspektive gebunden21 und ist deshalb, wo er Informationen vermitteln will, die ihm aus seiner Perspektive nicht zugänglich sind, gezwungen zu begründen, woher er diese Informationen hat.22 Von einem der personalen ES ähnlichen innenper20 Texte, in denen der Erzähler sein Erzählen aus einer Begegnung mit einer der fiktiven Figuren herleitet, etwa dergestalt, daß ihm diese Figur die Geschichte erzählt oder ihm Papiere (Briefe, Tagebücher, Manuskripte) übergeben hat, aus denen er die Geschichte rekonstruiert, stellen diese Bestimmung nicht in Frage: Hier entsteht zwar eine kommunikative Beziehung zwischen Erzähler und Figur, aber die spielt sich in einer anderen Geschichte ab, nämlich in einer (unter Umständen rudimentären) Rahmengeschichte, die der eigentlichen, als ' Binnengeschichte ' anzusprechenden Geschichte zeitlich nachfolgt. Das Erzähler-Ich figuriert dabei also als Akteur der Rahmengeschichte, die daher füglich als Ich-Erzählung anzusetzen wäre, nicht aber als Akteur der 'Binnengeschichte', die entsprechend als Er/Sie-Erzählung zu kategorisieren wäre. 21 Vgl. STANZEL 1982, 122f.
22 Nicht zufällig legitimiert etwa Serenus Zeitblom in Thomas Manns »Doktor Faustus« sein Wissen über die Innerlichkeit seines Helden oder über Ereignisse, die er selbst nicht mit-
Kapitel IV: Erzûhlsituationen
195
spektivischen Erzählen kann man bei der Ich-Erzählung also allenfalls mit Bezug auf die Innenperspektive des Erzählers selbst, nicht aber mit Bezug auf die Innenperspektive der übrigen Figuren reden.23 Die Ich-Erzählung kann als eine rein innenperspektivisch vermittelte Wahrnehmung von Welt erscheinen, dann nämlich, wenn erzählendes und erlebendes Ich zeitlich koinzidieren, so daß das Erzählen einem dramatischen Monolog nahekommt.24 Erzählendes Ich und erlebendes Ich sind hier eine Einheit, weil Erleben und Erzählen simultan verlaufen. Die Darstellungsweise ist der des personalen Erzählens insofern ähnlich, als in beiden Fällen die Perspektive eingeschränkt wird auf eine im Erleben ihrer Geschichte befangene Figur. Die kategoriale Differenz zur personalen ES bleibt gleichwohl erhalten, der Umstand, daß die Figur hier zugleich auch Subjekt des narrativen Sprechakts ist. Ein der auktorialen ES ähnliches außenperspektivisches Erzählen setzt eine zeitliche Distanz zwischen erzählendem und erlebendem Ich voraus: Das erzählende Ich kann sich selbst von außen betrachten, wenn es, wie das in der klassischen Ich-ES der Fall ist, aus einer zeitlichen Distanz auf seine Geschichte zurückblickt. In diesem Fall hat die Ich-ES einen auktorialen Gestus insofern, als der Erzähler hier als eine Art allwissende Instanz auftritt, die ihre Figur - sich selbst - wechselweise von innen und außen betrachten kann, Überblick über das Geschehen hat (deshalb Vorausdeutungen formulieren kann) und die Ereignisse ihrer kritischen Norm unterwerfen, sie kommentieren, bewerten, deuten kann (vgl. z.B. Max Frischs »Homo faber«). Von der auktorialen ES ist diese Variante der Ich-ES gleichwohl grundlegend verschieden, weil der auktoriale Status des Erzählers sich hier allein auf seine ei-
23
erlebt hat, mit Briefen und Gesprächen, in denen Adrian Leverkiihn ihn an seinen Erlebnissen, Gefühlen oder Gedanken teilhaben läBt. Das übersehen KAHRMANN/'REISS/SCHLUCHTER 1986, wenn sie, FÜGER 1 9 7 2 folgend, für die Ich-Erzählung dasselbe von der (quasi-personalen) »Innenposition« bis zur (quasi-auktorialen) »Außenposition« reichende Formenspektrum ansetzen wie für die Er-Erzählung ( 1 4 6 ) : Die Unterscheidung zwischen »Innenposition« und »AuBenposition« kann auf die Ich-ES nur unter der Bedingung Anwendung finden, daß beide Varianten hier als selbstbezügliche Positionen verstanden werden: bezüglich der übrigen Figuren ist die Unterscheidung hinfällig, weil hier dem Ich-Erzähler schlechterdings nur die Außenposition zur Verfügung steht, die allenfalls den außenperspektivischen und zudem durch 'Quellennachweise' legitimierten (vgl. Anm. 22) Bericht über Innerlichkeit, nicht aber deren Präsentation durch perspektivierende Erzählverfohren (innerer Monolog, erlebte Rede) zuläßt. Vgl. etwa Ingeborg Bachmanns »Malina«-Roman, dem die Autorin nicht zufällig einen Absatz vorangestellt hat, den man gewöhnlich nur in Dramentexten findet, der nämlich die 'mitwirkenden Personen' sowie Ort und Zeit des 'Dramas', das hier ein Roman ist, nennt, und der denn auch konsequenterweise im Präsens statt im epischen Präteritum steht.
196
Kapitel IV: Erzählsituationen
gene Geschichte bezieht: Auch dieser Ich-Erzähler bleibt, was seine Möglichkeiten der Welterfassung angeht, an seine subjektive Perspektive gebunden. Dasselbe gilt für einen Ich-Erzähler, der nicht seine, sondern die Geschichte einer anderen Figur in den Mittelpunkt stellt wie etwa Serenus Zeitblom in »Doktor Faustus«. Stanzel nennt Serenus Zeitblom treffend einen »peripheren Ich-Erzähler«,25 weil er nicht seine, sondern Adrian Leverkühns Geschichte erzählt und deshalb an der Peripherie der erzählten Ereignisse steht. Der »periphere Ich-Erzähler« steht an der Grenzlinie zwischen Ich-ES und auktorialer ES: Vom auktorialen Erzähler trennt ihn die Bindung an die einmal festgelegte Position in der fiktiven Welt, die seine 'Wahrnehmungsmöglichkeiten' einschränkt und ihn zwingt, seinen Kenntnisstand zu legitimieren.
2.
Die Ich-Erzählsituation im Film
Wenn die Ich-ES definiert ist dadurch, daß der Erzähler hier in eine doppelseitige Kommunikation - als fiktive Erzählerfigur (S2) mit seinen fiktiven Rezipienten (E2) und als Figur der Geschichte (S/El) mit den übrigen fiktiven Figuren - eintritt, dann bedeutet das mit Bezug auf den Film, daß von einer filmischen Ich-Es immer und nur dann zu sprechen ist, wenn das Bildsubjekt nicht nur als Bildsubjekt, sondern auch als Figur der Geschichte agiert. Das heißt: In der filmischen Ich-ES wird die hier bisher sprechakttheoretisch begründete Identifikation des fiktiven filmischen Erzählers mit dem technischen Apparat zu einer faktischen dergestalt, daß die Kamera nicht nur als narrative Vermittlungsinstanz (S 2), sondern zugleich auch als Figur (S/E 1) der erzählten Geschichte und damit als Kommunikationspartner der übrigen fiktiven Figuren in Funktion tritt, selbst zu einem der Akteure der Geschichte wird. Bisher war von den »Augen« und »Ohren«, vom »Zusehen« und »Zuhören« des fiktiven filmischen Erzählers in einem uneigentlichen Sinn die Rede. Mit Blick auf die filmische Ich-ES sind diese Umschreibungen in ihrem eigentlichen Sinn zu verstehen, denn hier wird der technische Apparat tatsächlich als menschliche Figur fingiert, die nicht nur zuhört und zusieht, sondern auch spricht, läuft, sitzt, hantiert, andere Figuren berührt etc., und die von diesen Figuren nicht, wie in den Er-Formen filmischen Erzählens, ignoriert, sondern als Kommunikationspartnerin behandelt wird. Die filmische Ich-ES nimmt den Subjektstatus des Apparats wörtlich, macht aus dem stummen Wahrnehmungssubjekt filmischer Bilder tatsächlich ein, wie Stanzel das nennt, »Ich mit Leib«, gibt den körperlosen Augen und Ohren Körper und Stimme.
25 STANZEL 1982, 263f.
Kapitel IV: Erzählsituationen
197
Diese »Verleiblichung« des Apparats bekommt den filmischen Bildern aber nicht gut: Sie nimmt ihnen ihre Überzeugungskraft. Dafür sorgt weniger die eingeschränkte Perspektive des Ich-Erzählers26 als vielmehr der Umstand, daß diese 'Verleiblichung' der Kamera die Künstlichkeit des Kamerablicks zum Defizit werden läßt. Die Identifikation des Apparats mit dem menschlichen Körper drängt dem Rezipienten nämlich einen Vergleich auf, der nur zum Nachteil der Kamera ausschlagen kann, den Vergleich der Wahrnehmungsbilder der Kamera mit denen des menschlichen Auges und der Bewegungen der Kamera mit denen des menschlichen Körpers. Das filmische Bild, das sonst wie kein anderes Erzählmedium kraft seines »Realitätseindrucks« die Beglaubigung des Erzählten zu leisten vermag, erfahrt so einen massiven Verlust seiner Glaubwürdigkeit und illusionierenden Kraft: Der rechteckige Bildausschnitt, die bis zu den Bildrändern reichende gleichmäßige Bildschärfe, die Aufhebung der Größen- und Formenkonstanz, die Kontinuität von Schwenkbildern (anstelle der Sakkaden des menschlichen Auges) u.v.m. erscheinen plötzlich als Defizit, weil sie der Wahrnehmungsweise des menschlichen Auges, als das die Kamera sich hier nun beglaubigen soll, widersprechen. Nicht filmästhetische, sondern Fragen der 'richtigen', menschlicher Wahrnehmung möglichst ähnlichen Optik werden so zum produktionsästhetischen Kriterium jeder Einstellung, und entsprechendes gilt auch auf rezeptionsästhetischer Seite, auf der die Akzeptanz des artifiziellen Filmbildes notwendig rapide sinken muß, sobald es an den vom menschlichen Auge gelieferten Bildern gemessen wird. 27 In der Ich-ES liefert also der fiktive filmische Erzähler seine hochartifizielle Wahrnehmungsweise einer Konkurrenz mit der Wahrnehmungsweise des 26 MONACO 1980, 4 2 .
27 Einer der wenigen konsequent durchgeführten Ich-Filme, Robert Montgomerys »Lady in the Lake« (USA 1946), in dem die Kamera den Detektiv Philipp Marlowe 'verkörpert', der in Spiegelaufnahmen gelegentlich - in der Gestalt Robert Montgomerys - sichtbar wird, liefert dafür eine Fülle von Beispielen: Wenn etwa Philipp Marlowe, also die Kamera, telefoniert und die Sprechmuschel in der unteren rechten Ecke des Bildes erscheint, dann fragt sich der Zuschauer sogleich, ob man beim Telefonieren eigentlich die Sprechmuschel scharf und von vorn oder nicht vielmehr unscharf und von schräg oben sieht; wenn Philipp Marlowe nach einem Unfall verletzt auf den Knien zu einer Telefonzelle kriecht, dann stoßen dem Zuschauer zwangsläufig die merkwürdige Perspektive, mit der Marlowe seine eigenen Arme wahrnimmt, und die mangelnde Konvergenz der Körper-, d.h. der Kamerabewegungen mit denen dieser Arme auf, werden zu massiven Illusionsstörungen, die den Rezipienten mehr zu einer Beschäftigung mit der optischen »Richtigkeit« der Bilder als mit ihren Gegenständen selbst nötigen. Und wenn dann gar Audrey Totter die Kamera umarmt und, ihren Mund dem Kameraobjektiv zum Kusse nähernd, haucht: »Du machst ja auch die Augen zu«, um den Schwaizfilm zu legitimieren, mit dem die Kamera ihren KuB gnädig zudeckt, zudecken muß, um sich nicht vollends ad absurdum zu führen, dann löst sich das filmästhetische 'Experiment' endgültig in Komik auf.
198
Kapitel IV: Enählsituationen
menschlichen Auges aus, die sie nur verlieren kann, unterwirft sie dem Wahrscheinlichkeitskriterium, dem zu genügen sie von vornherein keine Chance hat. Eben das nimmt den Strukturen subjektiver Welterfassung, auf deren Erzeugung die Ich-ES angelegt ist, ihre Glaubwürdigkeit und Überzeugungskraft. Die buchstäbliche, 'leibliche' Identifikation des Apparats mit einem menschlichen Subjekt, die die Ich-ES erzwingt, drängt die Kinematographie in die Rolle einer (schlechten) Doublette menschlicher Wahrnehmung und unterwirft die Kameraführung einem Programm, das, indem es größtmögliche Ähnlichkeit mit menschlichen Wahrnehmungsbildern zu seinem höchsten Ziel erklärt, auf eine Selbstaufhebung oder, besser, auf eine Vertuschung des artifiziellen Charakters der kinematographischen Wahrnehmung hinausläuft: Wo die Künstlichkeit des Kamerablicks als Defizit figuriert, wird deren Kompensation zum Hauptgeschäft der Kamera, die sich damit zu wesentlichen Teilen ihrer eigenen Sprache begibt. Die Ich-ES erzwingt tendenziell eine Verleugnung der spezifisch kinematographischen Ästhetik.
B. Die personale Erzählsituation Von Formen der Er/Sie-Erzählung ist der hier vorgeschlagenen Bestimmung der Ich-ES zufolge immer dann zu sprechen, wenn der fiktive Erzähler ausschließlich als Erzählerfigur (S 2), nicht dagegen als erzählte Figur (S/E 1) in Erscheinung tritt, sich also allein auf dem Kommunikationsniveau Ν 2 bewegt (vgl. Abb.l, S. 45). In den Er/Sie-Formen treten erzählende Figur und erzählte Figuren also klar auseinander, und aus der Frage, wie die erzählende Figur sich im Akt der narrativen Vermittlung zu den erzählten Figuren verhält, leiten sich die klassischen Typen der Erzählsituation in Er/Sie-Erzählungen, die auktoriale und die personale ES, ab. Anders als zwischen Ich-ES und Er/Sie-Formen, die - im Film zumal - strikt voneinander zu trennen sind, gibt es zwischen den ES der Er/Sie-Formen vielfältige Beziehungen und Übergänge. Deren Erfassung setzt indes eine präzise Konturierung der Grundformen voraus.
1.
Literaturwissenschaftliche Begriffsexplikation
In der personalen ES28 artikuliert sich der Erzähler nicht selbstbezüglich, tritt vielmehr hinter das Erzählte zurück, indem er das Geschehen aus der Per28 V g l . STANZEL 1 9 8 2 , 1 8 9 - 2 3 9 , 2 4 1 - 2 5 7 .
Kapitel IV: Erzählsituationen
199
spektive einer (oder mehrerer) seiner Figuren vermittelt, die Stanzel »Reflektorfigur« nennt:29 Das Geschehen wird aus einer dem räumlichen und mentalen Blickwinkel der Reflektorfigur stark angenäherten Position, nämlich so erzählt, wie es sich im Bewußtsein der ihre Geschichte erlebenden Figur »reflektiert«, spiegelt. Der an sich treffende Begriff verliert freilich bei Stanzel rasch wieder seine Kontur, weil Stanzel die kategoriale Differenz zwischen Subjekt und Objekt des narrativen Sprechakts auch hier verwischt, indem er den Begriff z.B. auch auf Ich-Erzähler, die ganz aus der Position des erlebenden Ich erzählen, anwendet30 und so den Status der Reflektorfigur als erzählter Figur verunklärt. Er läuft deshalb beständig Gefahr, Reflektorfigur und Erzählerfigur zu identifizieren, läßt die Reflektorfigur unter der Hand zu einer Art Erzähler-Ersatz mutieren, der immer dann in Funktion tritt, wenn der Erzähler, wie er meint, »absent« ist.31 Tatsächlich ist der Erzähler natürlich auch hier nicht »absent«, sondern vielmehr beständig präsent, denn er - nicht die Reflektorfigur - ist es ja, der hier ununterbrochen redet. Die die Erzählperspektive liefernde Reflektorfigur ist also selbstverständlich nicht - wie in der Ich-ES - zugleich auch Subjekt der Erzählerrede.32 Nicht Abwesenheit des Erzählers charakterisiert die personale ES, sondern die Bindung der Erzählerperspektive an eine Figurenperspektive.33 In dieser perspektivischen Bindung liegt zugleich das maßgebliche Differenzmerkmal zwischen personaler und auktorialer ES: Die alle Er/Sie-Formen kennzeichnende (und für die auktoriale ES definitorische) Außenperspektive34 wird in der personalen ES umgangen dadurch, daß der Erzähler hier auf M 30 31 32
Ebd. 71u.ö. Vgl. ebd. 195. Ebd. 271. Diese fundamentale Differenz übersieht auch Füger, wenn er ständig von der Reflektorfigur als von einem erzählenden, darstellenden 'Medium' redet (vgl. FÜGER 1972, 275f. U.Ö.).
33 Die Differenz von Erzähler- und Reflektorfigur äußert sich nicht zuletzt darin, daß die in der Erzählerrede geführte Sprache die des Erzählers ist, nicht die der Figur, deren Sprache vielmehr erst in den Spielarten der Figurenrede (direkte Rede, erlebte Rede, innerer Monolog) zur Wirkung kommt. Erzählerfigur und erzählte Figur bleiben - in ihrer Sprache - immer noch als zwei differente Subjekte spürbar, und deshalb hat der Erzähler auch noch in der personalen ES - freilich sehr subtile - Möglichkeiten, sich von seiner Reflektorfigur zu distanzieren, nämlich - eben mit seiner Sprache und ihren Differenzen zur Figurensprache - darauf hinzuweisen, daß er ein von seiner Reflektorfigur verschiedenes Subjekt ist (vgl. z.B. die durch ein subtiles Changieren zwischen Erzähler- und Figurensprache in der erlebten Rede signalisierte Beziehung des Erzählers zu seinen Reflektorfiguren in Wolfgang Koeppens »Tauben im Gras«). 34 In den Er-/Sie-Formen ist die Erzählerfigur, wie gezeigt wurde, selbst nicht unmittelbar ins Geschehen 'verwickelt', so daB ihre eigene Perspektive auf dieses Geschehen grundsätzlich eine Außenperspektive sein muß.
200
Kapitel IV: Erzählsituationen
eine Darstellung der erzählten Welt aus seiner Sicht verzichtet und sich stattdessen der Sicht einer (oder mehrerer) seiner Figuren anschließt. Dadurch wird auch in den Er/Sie-Formen - wie in der Ich-ES - Welt darstellbar als subjektiv erfahrene. Der Verzicht auf eine eigene Perspektive, die, eben weil sie nur eine Außenperspektive sein könnte, stets ein gewisses Maß an Verbindlichkeit hätte und dem Erzähler den Status einer quasi-objektiven, die Geschichte als ganze übersehenden und distanziert-betrachtenden Instanz gäbe, signalisiert den Verzicht auf eine verbindliche Weltdeutung: Die Subjektivierung der erzählerischen Welterfahrung in der personalen ES gibt kund, daß ein außenperspektivischer, 'objektiver', die disparaten Teile, die das Subjekt wahrnimmt, zu einer Ganzheit fügender Blick auf Wirklichkeit nicht mehr unternommen, eine verbindliche Weltsicht nicht mehr versucht werden soll, daß Wirklichkeit vielmehr nur im Disparaten erfahrbar, nämlich das ist, was im Subjekt sich spiegelt und in jedem Subjekt sich anders spiegelt. In erzählpragmatischer Hinsicht hat die Bindung des Erzählers an die Perspektive einer im Erleben ihrer Geschichte befangenen Figur, was die Vermittlung von Außenwelt angeht, eine erhebliche Einschränkung zur Folge: Der personale Erzähler kann nur zur Darstellung bringen, was die Reflektorfigur wahrnimmt, und dies auch nur so, wie sie es wahrnimmt. Damit nimmt er sich einen erheblichen Teil der Verfügungsmöglichkeiten über das Erzählte, die der auktoriale Erzähler hat: Indem er sich an die Sicht der Reflektorfigur bindet, ist er auch an ihren Kenntnisstand über die Ereignisse gebunden, weshalb es hier - zumindest bei einer konsequent durchgeführten personalen ES - auch keine Differenzen zwischen der Informiertheit des Erzählers und der seiner Reflektorfigur (daher auch nicht zwischen Rezipienten- und Figureninformiertheit) gibt. Dieser Verlust an Möglichkeiten der Vermittlung von Außenwelt bringt nun aber - gegenüber der auktorialen ES - einen erheblichen Zugewinn an Möglichkeiten der erzählerischen Vermittlung von Innerlichkeit mit sich: Wo einem konsequenten auktorialen Erzähler nur der außenperspektivische Gedankenbericht zur Verfügung steht, eröffnet die personale ES sehr viel weiterreichende Möglichkeiten, Innerlichkeit zu gestalten: Im auktorialen Gedankenbericht dominieren die ordnende Hand und die Sprache des Erzählers, der die Gefühle und Gedanken seiner Figuren in eine (seine) Ordnung überführt und in seine Sprache übersetzt. In den bevorzugten Darbietungsmitteln der personalen ES dagegen, in der erlebten Rede und im inneren Monolog erscheint Innerlichkeit als ein im Akt des Erlebens sich vollziehender und darum noch ungeordneter Prozeß und diktiert daher auch die Sprache, in der sie erscheint, die - im inneren Monolog vollständig, in der erlebten Rede teilweise - die der Reflektorfigur selbst ist.
Kapitel IV: Erzählsituationen
201
Mischformen zwischen personaler und auktorialer ES sind geeignet, den erzählpragmatischen Beschränkungen personalen Erzählens aus dem Wege zu gehen, ohne damit zugleich die Möglichkeiten der Vermittlung von Innerlichkeit zu verlieren. Die zahlreichen Varianten, die die Erzählpraxis hervorgebracht hat, sind hier, weil sie für filmische ES bedeutungslos sind, nicht zu diskutieren. Erwähnt seien hier nur zwei Grundmuster, das multiperspektivische Erzählen und die Einfügung personal erzählender Passagen in einen insgesamt als auktorial zu klassifizierenden Text. Multiperspektivisches Erzählen, bei dem der Erzähler zwar im personalen Modus erzählt, dabei aber seine Reflektorfiguren wechselt (vgl. etwa Wolfgang Koeppens »Tauben im Gras«), hat einen auktorialen Gestus nur insofern, als der Wechsel der Reflektorfigur selbst ein auktorialer Akt ist, in dem sich das Erzähler-Ich als organisierende Instanz des Textes zu erkennen gibt. Die multiperspektivische Erzählweise erweitert die Erzählmöglichkeiten, ohne daß sich der Erzähler damit schon den Status einer »allwissenden« Instanz zuwiese. Vielmehr kann er sich, indem er sich auf die Position eines Referenten mehrerer figuraler Einzelperspektiven zurückzieht, auch hier einer verbindlichen Deutung der erzählten Welt enthalten. Freilich erweitert sich sein 'Gesichtskreis' mit der Vielzahl der Perspektiven, und die Nebenordnung mehrerer subjektiver Perspektiven sorgt für eine gewisse Objektivierung' des Erzählten, auch wenn der Erzähler nicht explizit als normative Instanz in Erscheinung tritt. In jedem Fall aber dominiert die personale ES hier deutlich. Ebenso deutlich dominiert die auktoriale ES bei Einfügungen perspektivierender Passagen in einen ansonsten auktorial erzählenden Text. Die Bindung der Erzählerperspektive an die Perspektive einer Figur auf kürzere oder längere Strecken hat im Rahmen auktorial erzählter Geschichten stets den Charakter einer freiwilligen Selbstbeschränkung und verliert damit ihren Status als Anzeiger des Verzichts auf verbindliche Weltdarstellung. Weniger deren Subjektivierung als vielmehr Interesse an der Innenperspektive der Figur steht hier daher im Vordergrund, und nicht zufällig fungieren perspektivierende Passagen denn auch sehr häufig als Mittel einer subtilen Figurencharakterisierung, wofür das siebente Kapitel aus Thomas Manns »Lotte in Weimar«, der große innere Monolog Goethes, eines der gelungensten Beispiele gibt.
2.
Die personale Erzählsituation im Film
Die Er/Sie-Formen des Erzählens sind nicht nur die Normalform, sondern auch, wie der Blick auf die Probleme der filmischen Ich-ES gezeigt hat, die im Grunde einzig plausible Form filmischen Erzählens, weil sich die kinema-
202
Kapitel IV: Erzählsituationen
tographische Ästhetik nur in ihr voll entfalten kann: Hier bleibt das ErzählerIch eine 'unleibliche', allein in der artifiziellen Wahrnehmungstätigkeit des Apparats präsente Instanz, die die Künstlichkeit ihrer Bilder nicht verleugnen muß, sondern im Gegenteil zum zentralen Bestandteil ihrer Sprache macht. Aus der Bestimmung der personalen ES als figurenperspektivisch gebundenen Erzählens ergibt sich für den Film eine ebenso klare wie einfache Bestimmung: In der personalen ES übernimmt die Kamera die Perspektive einer der Figuren, sei es, indem sie sich neben oder schräg hinter sie stellt (so daß die Figur im Anschnitt im Bild bleibt), sei es, indem sie sich ganz an ihre Stelle versetzt (so daß die Figur aus dem Bild verschwindet) und das Geschehen so vom Blickpunkt der Figur aus präsentiert.35 Im zuletzt genannten Fall entstehen Bilder, die mit Bildern eines Ich-Films identisch zu sein scheinen. Gleichwohl bleibt auch dabei - anders als in der Ich-ES - die Dualität von Erzähler und erzählter Figur, von Kamera- und Figurenwahrnehmung erhalten: Wie in sprachlichen Erzähltexten die Sprache der Erzählerrede auch in der personalen ES die des Erzählers bleibt, so bewahren auch beim Film die perspektivierenden Bilder ihren Status als Wahrnehmungen des Subjekts filmischer Rede, sind nicht etwa Wahrnehmungen der Figur. Die Kamera betrachtet die fiktive Welt aus der Perspektive einer Figur, wird darum aber nicht - wie in der Ich-ES - mit ihr identisch.36 Eben Manche Filmwissenschaftler sprechen in diesen Fällen, anglistischem Sprachgebrauch folgend, von »point-of-view shots« (vgl. BRANIGAN 1975; MONACO 1980, 199; WEGSCHEIDER 1989 u.a.). Der Terminus wird hier aus zwei Gründen nicht übernommen: Zum einen soll an dem Begriff der personalen ES festgehalten werden, weil er den (literatur-)theoretischen Kontext signalisiert, in den der Sachverhalt hier gestellt wird und der ihn als Teil eines kohärenten klassifikatorischen Modells ausweist. Zum anderen ist der Begriff geeignet, Mißverständnisse zu erzeugen, und dies auch und gerade in der Filmwissenschaft, in der das Modell des narrativen Sprechakts und das erzähltheoretische Konstrukt des fiktiven Erzählers (und damit die Einsicht in die Perspektivität allen Erzählens) als systematische Bezugspunkte filmtheoretischer Überlegungen noch keine Tradition haben: Die Kamera hat ja immer - nicht nur bei figurenperspektivischen Abbildungsverfahren - einen »point of view«, ein Umstand, den eine exklusive, auf figurenperspektivische Darstellungsweisen eingeschränkte Verwendung des Begriffs implizit negieren würde. Der Begriff ist mithin (ähnlich wie der Terminus »subjektive Kamera«) geeignet, die Einsicht in den sprechakttheoretischen Status der Kamera als Subjekt des narrativen Sprechakts und damit in die Perspektivität aller Kamerablicke zu verbauen, eine Einsicht, die sich in der Filmwissenschaft recht eigentlich erst einstellen muß, wie schon der Umstand zeigt, daß man für auktoriale Kameraperspektiven nur den sachlich falschen Begriff der »objektiven Kamera« (vgl. z.B. SIEGRIST 1986, 133-144) oder gar keinen Namen hat (vgl. MONACO 1980, 198, der für diesen Fall den abwegigen Begriff »Perspektive der dritten Person« vorschlägt). 36 Das Differenzmerkmal zwischen Ich- und personaler ES findet sich nicht in den einzelnen Bildern, sondern (ebenso wie in sprachlichen Erzähltexten) im Kontext und darin in einem einfachen erzähllogischen Sachverhalt: Ebensowenig wie das sprachliche Erzähler-Ich in
Kapitel TV: Erzählsituationen
203
diese Dualität von Erzähler- und Reflektorfigur ist auch der Grund, warum die Probleme der filmischen Ich-ES hier nicht entstehen: Der artifizielle Kamerablick bewahrt - als Blick nicht einer leibhaftigen Figur, sondern des Apparats - seine Geltung und Legitimation als Sprachmedium und Kunstmittel filmischer Erzählerrede und gerät damit nicht in die Verlegenheit, sich mit der natürlichen Wahrnehmung des menschlichen Auges messen zu müssen. Die Kamera referiert die Figurenwahrnehmung mit ihren Mitteln. Ebenso wie der personale Erzähler sprachlicher Erzähltexte muß auch die Kamera ihre Reflektorfigur erst einmal 'benennen', bevor sie ihre Perspektive übernimmt, denn andernfalls wäre ihr Blick für den Rezipienten gar nicht als figurenperspektivischer zu identifizieren. Sie muß die Reflektorfigur also zunächst ins Bild setzen, bevor sie ihre Wahrnehmungen reproduziert, und die Inszenierung der Darstellungsebene kommt ihr dabei in aller Regel zuhilfe, indem hier vereindeutigende Signale in Gestalt eines auffälligen Wahrnehmungsverhaltens der Reflektorfigur vergeben werden.37 Jeder Kamerablick auf die Reflektorfigur aber ist zwangsläufig ein außenperspektivischer (es sei denn, er würde - im Rahmen einer multiperspektivischen Kameraführung - als Blick einer zweiten Reflektorfigur motiviert). Das ist freilich in personalen Erzähltexten im Prinzip nicht viel anders,38 und dort wie hier ist diese zwangsläufig außenperspektivische Einführung der Reflektorfigur ein aus der personalen ES nicht zu eliminierender auktorialer Gestus. Ich-Erzählungen von sich selbst in der dritten Person sprechen kann, ebensowenig kann das Erzähler-Ich in der filmischen Ich-ES vor der Kamera erscheinen (allenfalls über Spiegelaufhahmen sichtbar werden), weil es mit der Kamera identisch ist. Anders die Reflektorfigur einer personal erzählenden Kamera: Wie in der Erzählliteratur die Reflektorfigur in der dritten Person erscheint und damit auch grammatisch als erzählte (nicht erzählende) Figur klar markiert ist, so ist sie auch im Film niemals Subjekt der KameraWahrnehmung, sondern nur ihr Reflektor, kann deshalb auch selbst im Bild erscheinen und unterscheidet sich damit grundsätzlich von dem Erzähler-Ich der filmischen Ich-ES. 37 Das üblichste Signal ist das Aufblicken und Fixieren eines (außerhalb des Bildes befindlichen) Objekts, das die Kamera dann in der nachfolgenden Einstellung aus der Perspektive der Figur kadriert. BRANIGAN 1975 spricht beim ersten Bild vom »point/glance shot«, der die Wahrnehmungsaktivitüt der Figur (»glance«) registriert, und beim zweiten, dem Gegenstand der Figurenwahrnehmung gewidmeten Bild von »point/object shot«. - Die Plausibilität perspektivierender Kameraführung hängt wesentlich von dem »point/glance shot« ab, davon, ob die Kamera die Reflektorfigur, ihre Situierung im Raum und ihre Blickrichtung, vor allem aber das den Perspektivenwechsel motivierende Moment hinreichend klar bezeichnet. 38 Auch hier ist schon die schlichte Nennung des Namens der Figur wie der Gebrauch des Personalpronomens ein im Grunde außenperspektivischer Akt, und darüber hinaus kommen auch hier immer wieder auBenperspektivische Passagen zustande, vorzugsweise immer dann, wenn es um Merkmale der Reflektorfigur geht, die dieser selbst nicht bewußt oder ihrer Wahrnehmung nicht unmittelbar zugänglich sind (wie etwa ihr äußeres Erscheinungsbild, ihre Gestik, Mimik u.ä.).
204
Kapitel IV: Erzühlsituationen
Die personale ES beschränkt die Möglichkeiten der erzählerischen Erfassung von Welt hier ebenso wie in der Literatur. Beim Film hat diese Beschränkung freilich mit konzeptionellen, erzählerisches Weltverhalten signalisierenden Entscheidungen häufig weniger zu tun als mit erzählstrategischen Erwägungen. Denn in der filmischen Praxis erschöpft sich die perspektivierende Kameraführung sehr häufig im bloßen Referat äußerer, visueller Wahrnehmungen der Reflektorfigur, das die Möglichkeiten der personalen ES als Medium der Subjektivierung erzählerischer Welterfassung kaum nutzt, sie stattdessen bevorzugt als Vehikel von Vorenthaltungsstrategien in Funktion setzt, nämlich mit ihrer Hilfe die Informationsvergabe gezielt dosiert und retardiert, was besonders - wie fast jeder Kriminalfilm illustrieren könnte - für die Erzeugung spannungssteigernder Effekte eine Rolle spielt. Auch der mit der personalen ES verbundene Zugewinn an Möglichkeiten der Darstellung von Innerlichkeit fällt beim Film eher bescheiden aus, weil filmische Rede auf die phototechnisch erfaßbare Außenhaut der Dinge, auf die Welt des Sichtbaren angewiesen ist. Innerlichkeit müßte hier folglich als verinnerte Außenwelt zur Darstellung kommen, d.h. die Wahrnehmungen der Figur müßten als verinnerte Welterfahrung kenntlich gemacht, Außenwelt in Innenwelt übersetzt werden, ein schwieriges Unternehmen, dem die meisten Filmemacher aus dem Wege gehen. Einer der Auswege ist die Darstellung reiner Innenwelt, die durch einen Wechsel der Realitätsebene zustandekommt (vgl. S. 158): Die Kamera stellt dabei nicht die reale Erfahrungswelt der Figur innenperspektivisch dar, sondern visualisiert reine, von der Außenwelt abgelöste Innerlichkeit - Gedanken, Gefühle, Träume, Erinnerungen, Visionen usw. ihrer Reflektorfigur - als innere Bilderschau.19 Das Problem einer echten optischen Verinnerung von Außenwelt ist damit umgangen.40 Ein anderer Ausweg ist die Darstellung von Innerlichkeit als Reaktion auf Außenwelt, die durch einen Wechsel innen- und außenperspektivischer Bilder erreicht werden kann: Im Schuß-Gegenschuß-Verfahren werden Bilder montiert, die abwechselnd perspektivierend referierte Wahrnehmungen der Figur 39 Die von Salvador Dali entworfenen Traumszenen in Alfred Hitchcocks »Spellbound« (USA 1945) liefern dafür eindrückliche Beispiele. - Sofern diese Innenwelt nicht wie in diesem Fall (bei Träumen oder Visionen) selbst schon eine Bilderwelt, sondern eine abstrakte Gedankenwelt ist, müssen mentale Abstrakta optisch reformuliert, im Rekurs auf die Welt des Sichtbaren in Bilder 'übersetzt' werden, was der 'gegenständlichen' Sprache des Films naheliegenderweise erhebliche Probleme bereitet. 40 Deshalb ist auch der Vergleich, der sich hier aufdrängt, der Vergleich dieser 'inneren Bilderschau' mit dem inneren Monolog der Erzählliteratur, ein schiefer: Der innere Monolog kann Außenwelt unmittelbar in der Reflexion der Figur spiegeln, die innere Bilderschau ist reine, von der realen sichtbaren Erfahrungswelt abgelöste Innenwelt, blendet Außenwelt ganz aus.
Kapitel IV: Erzählsituationen 205 und deren Reaktionen auf das Wahrgenommene im außenperspektivischen Blick auf die Figur selbst zeigen, auf ihre Körpersprache als optisch wahrnehmbare Spiegelung innerer Prozesse, besonders auf ihr Gesicht, ihre Mimik. 41 Dieses Verfahren macht sich den Umstand zunutze, daß der nächstliegende und direkteste Weg, Innerlichkeit optisch zu vermitteln, im Film über den außenperspektivischen Blick auf die nonverbale Sprache der Figur selbst führt. Kamerablicke dieser Art haben einen ähnlichen Status wie der auktoriale Gedankenbericht in erzählenden Texten, bleiben aber gegenüber der differenzierten und präzisen, Bezeichnung mentaler Prozesse, die die Sprache leisten kann, naheliegenderweise sehr viel unbestimmter. Wo die Kamera diese Auswege nun aber nicht gehen will, sondern die Wahrnehmungen der Figur als innenperspektivische Welterfahrung darzustellen sucht, hat sie es erheblich schwerer als der sprachliche Erzähler. Der nämlich kann bei der perspektivierenden Erfassung von Außenwelt die sie spiegelnde Innerlichkeit der Reflektorfigur auf allen Ebenen des Mentalen vom Bewußten bis zum Unbewußten, von der deutenden, wertenden, Zusammenhänge herstellenden Reflexion der Figur bis zu unbewußten, emotionalen Reaktionen auf Außenwelt - ausloten, weil er 'Namen' für diese abstrakten, mentalen Vorgänge hat. Die Kamera dagegen muß versuchen, den Blick der Reflektorfigur auf die Welt des Sichtbaren als verinnerten zu vermitteln, den Wahrnehmungsprozeß als Bewußtseinsprozeß erfahrbar zu machen, den Bewußtseinsprozeß in einen Wahrnehmungsprozeß zu übersetzen. Die Mittel, die ihr dafür zur Verfügung stehen, wurden bei der Untersuchung des Kameraverhaltens schon thematisiert (Kap. II): Sämtliche über das bloße Referat der erzählten Welt hinausgehenden Verhaltensweisen der Kamera können als figurenperspektivische in Funktion treten, wobei vor allem das vierte Funktionskriterium (vgl. S. 55), die Qualifizierung des Wahrnehmungsverhaltens als Interaktionsverhalten, von besonderem Interesse ist. 42 Weitere Möglich41 Eine solche Passage gibt es z.B. am Beginn von Hitchcocks »Psycho« (USA 1960): Marion (Janet Leigh) flieht mit dem Geld ihres Chefs im Auto und fühlt sich unterwegs von einem Verkehrspolizisten verfolgt, der zuvor ihre Papiere kontrolliert hatte. Die Kamera wechselt dabei mehrfach zwischen Nahaufnahmen ihres Gesichts und, jeweils motiviert durch Marions Blick zum Rückspiegel, perspektivierenden Aufnahmen des Rückspiegels, in dem der Wagen des Polizisten sichtbar wird, und macht auf diese Weise die zunehmende Nervösität der Diebin und schließlich ihre tiefe Erleichterung in dem Moment deutlich, da der Polizist an einer Wegzweigung abbiegt. 42 Vgl. die dort zitierten Beispiele, etwa die Aufnahme des Grafen aus der Untersicht in Eric Rehmers »Marquise von O«, die die Innenperspektive der Marquise - ihren Eindruck, einem Engel zu begegnen - artikuliert (vgl. Kap. II, Anm. 34), oder die extrem kurzen Blicke auf den nackten Körper der Mrs. Robinson in »The Graduate«, die die Mischung aus Scham und Neugier vermitteln, mit der die Reflektorfigur, Benjamin, die Situation erlebt (vgl. Kap. II, Anm. 106).
206
Kapitel IV: Erzählsituationen
keiten der Verinnerung der Welterfahrung der Figur bieten Rekurse auf konventionalisierte Symbole oder Allegorien (vgl. Kap. VII): Der von der perspektivierenden Kamera reproduzierte Figurenblick auf 'symbolträchtige' optische Sachverhalte ist vor allem geeignet, Gedankeninhalte der Figur zur Anschauung zu bringen. Daß alle diese Möglichkeiten der figurenperspektivischen Verinnerung weit hinter denen des sprachlichen Erzählers zurückbleiben, versteht sich von selbst. Gerade die Darstellungsmöglichkeiten, die die personale ES zu einer der bevorzugtesten Formen der modernen Erzählkunst haben werden lassen, die Möglichkeiten der Darstellung von Welt als Gegenstand subjektiver Erfahrung, kann personales Erzählen im Film also nur in begrenztem Umfang leisten. Der figurenperspektivische Blick auf Außenwelt kann hier bei weitem nicht das Maß an Erweiterung und Vertiefung von Innenwelt herbeiführen wie in der Literatur. Das ist, wie mir scheint, auch der wichtigste Grund dafür, daß es m. W. keinen einzigen konsequent personal erzählenden Film gibt, daß die personale ES in der Regel vielmehr nur passagenweise eingesetzt wird: Eine durchgehend perspektivierende Kameraführung würde zwangsläufig eine Fülle von Bildern liefern, deren personale Perspektive eine lediglich äußere - durch den Standort der Figur im Raum begründete - wäre, die zu einer innenperspektivischen Vertiefung des Erzählten nichts beitrüge. Ihre größten Wirkungsmöglichkeiten entfaltet die personale ES im Film zweifellos dann, wenn sie nur punktuell, nämlich nur an solchen Stellen eingesetzt wird, wo es tatsächlich um die innenperspektivische Reflexion gehen soll. Nicht zufallig begegnet sie denn auch mit einiger Regelmäßigkeit in personal-auktorialen Mischformen und darin meistens in der Form von Einfügungen perspektivierender Passagen in auktorial erzählende Filme. Für diese Mischform gilt Ähnliches wie für die entsprechenden Formen in literarischen Erzähltexten: Auch hier hat die Bindung der Erzählerperspektive an die Perspektive einer Figur auf kürzere oder längere Strecken den Charakter einer freiwilligen Selbstbeschränkung und verliert damit ihre Bedeutung als Anzeiger eines generellen Verzichts auf eine verbindliche Wirklichkeitssicht.43 Formen multiperspektivischen Erzählens sind in der Filmpraxis m.W. noch nicht konsequent, d.h. mit ununterbrochen perspektivierender Kameraführung, realisiert « Vgl. Alfred Hitchcocks »Spellbound« (USA 1945): Alle jene weißen Flächen, die die pathologischen Reaktionen des Helden auslösen, nimmt die Kamera zunächst aus ihrer eigenen, auktorialen Perspektive in den Blick und identifiziert sie damit als das, was sie sind (eine Tischdecke, ein Bettüberwurf, ein Morgenmantel, Rasierschaum, Milch usw.), artikuliert also eine verbindliche (»richtige*) Sicht der Dinge, bevor sie sie dann aus der Perspektive des Helden zeigt, in der sie (unterstützt durch Zwischenschnitte auf dessen angstvolle Gesicht, z.T. auch durch Lichtwechsel, Musik u.a.) unversehens zu unheimlichen, angstauslösenden Gegenständen werden.
Kapitel IV: Erzählsituationen
207
worden.44 Ein Grund dafür dürfte auch hier in dem Umstand zu suchen sein, daß die figurenperspektivische Erfassung von Wirklichkeit, sofern sie konsequent durchgehalten wird, im Film auf weite Strecken einer rein äußerlichen Perspektivik erliegen muß und deshalb, wenn man so will, den Aufwand nicht lohnt, der mit ihr verbunden ist, eben weil sie im Film nicht das Maß an Verinnerung des Erzählens zu leisten vermag, das sie in sprachlichen Erzähltexten leistet.
C. Die auktoriale Erzählsituation 1. Literaturwissenschaftliche Begriffsexplikation Definitorisches Merkmal der auktorialen ES ist die außenperspektivische Vermittlung des Erzählten:45 Der Erzähler präsentiert die fiktive Welt nicht aus der Sicht einer seiner Figuren wie in der personalen ES, sondern aus seiner eigenen Perspektive, und diese Perspektive ist per definitionem Außenperspektive. Außenperspektive sagt nichts über den räumlichen Standort des Erzählers aus, hat nichts mit der Frage zu tun, wo der Erzähler in der erzählten Welt steht.46 Außenperspektive besagt vielmehr allein, daß der Erzähler die Geschichte nicht aus der Perspektive einer diese Geschichte erlebenden Figur präsentiert: Außenperspektivisches Erzählen macht das Erzählte nicht als Bewußtseinsinhalt eines Subjekts erfahrbar, sondern postuliert Welt als eine unabhängig von den sie wahrnehmenden und erlebenden Subjekten bestehende und als solche beschreibbare Faktizität. Darin liegt der 'objektive' Gestus, den man der auktorialen ES gern nachsagt, wobei freilich nicht oft genug betont werden kann, daß natürlich auch das Bild der Welt, das in der auktorialen ES entworfen wird, kein objektives, sondern ein subjektives, eben das des 44
Orson Welles' »Citizen Kane« ist, auch wenn er seine Geschicbte(n) aus Erinnerungen von Figuren rekonstruiert, kein multiperspektivischer Film im hier definierten Sinn, weil die Kamera nicht figurenperspektivisch, sondern eindeutig außenperspektivisch, auktorial arbeitet (obwohl sie ihre Rückblenden als Erinnerungen der berichtenden Figuren motiviert). Es handelt sich hier um eine Variante der auktorialen ES, um einen 'eingeschränkten' auktorialen Erzähler (vgl. Kap. IV.C). 4 5 Vgl. STANZEL 1982, 72f., 149ff.; FÜGER 1972, 272f.; KAHRMANN/REISS/SCHLUCHTER 1986, 146f. 46 Stanzel (1982, ISO) bestimmt AuBenperspektive als Standort, der »außerhalb der Hauptfigur oder an der Peripherie des Geschehens liegt« (Hervorhebungen von mir), und handelt sich damit die Schwierigkeit ein zu begründen, wie es kommt, daB auktoriale Erzähler die fiktive Welt gleichwohl aus räumlichen Perspektiven zur Darstellung bringen können, die einen Standort innerhalb dieser Welt voraussetzen.
208
Kapitel IV: Erzählsituationen
Erzählers, ist: Worauf es für die Unterscheidung der auktorialen ES von den anderen ES ankommt, ist der Anspruch aitf eine geltungsfähige Weltdeutung, den die auktoriale ES - durch die Außenperspektive - signalisiert und der selbst dann noch aufrechterhalten wird, wenn der Erzähler die Geltung dieses Anspruchs einschränkt dadurch, daß er sich als »persönlicher« Erzähler zu erkennen gibt (s.u.). Außenperspektivität bedeutet zugleich, daß hier, wie Stanzel gezeigt hat, Innerlichkeit nur außenperspektivisch zur Darstellung kommen kann:47 Auktoriale Auskünfte über innere Prozesse der Figuren vollziehen sich (im sog. Gedankenbericht) notwendig außenperspektivisch, können Innerlichkeit also nicht aus der Perspektive der Figur - als selbstreflexiven Prozeß - präsentieren. Ein weiteres wichtiges Differenzmerkmal ergibt sich aus der potentiellen Ubiquität des Erzählerstandorts, d.h. aus dem Umstand, daß der Erzähler in der auktorialen ES nicht standortgebunden ist: Da er nicht als erzählte Figur erscheint und folglich in der fiktiven Welt nicht fest verortet ist, ist seine Perspektive - anders als selbst noch die eines »peripheren« Ich-Erzählers (s.o.) nicht an einen bestimmten Standort in der fiktiven Welt gebunden. Das heißt zugleich, daß Standortwechsel nicht legitimiert werden müssen: Der auktoriale Erzähler kann von einem Satz zum nächsten seinen Standort verändern, ohne diesen Ortswechsel motivieren zu müssen.48 Die Varianzen auktorialen Erzählens ergeben sich zunächst aus der Frage, wie bestimmt oder unbestimmt der Erzähler seinen Standort markiert, d.h. in welchem Ausmaß er sich als Subjekt der Rede zu erkennen gibt, seine Subjektivität konturiert. Die Spannbreite dieser Varianzen erstreckt sich von dem »persönlichen« Erzähler (Stanzel), der sich in selbstreflexiven Äußerungen, Kommentaren, Reflexionen, direkten Ansprachen an den fiktiven Rezipienten usw. explizit als Subjekt der Rede präsentiert und damit für den Leser zur 47 Vgl. ebd. 172. 48 Beide Differenzmerkmale - der Verzicht auf eine figurenperspektivische Sicht auf die erzählte Welt und die potentielle Ubiquität des Erzählerstandorts - sind der Grund, warum Stanzel bei der auktorialen ES auch von aperspektivischem Erzählen redet (vgl. ebd. 151, 165ff.). Nicht nur mit Blick auf den Film, bei dem es Aperspektivismus schon aus technischen Gründen nicht geben kann, sondern auch mit Blick auf sprachliche Erzähltexte scheint mir dieser Gedanke eher irreführend. Denn wie jeder Sprechakt setzt auch der narrative Sprechakt ein Subjekt, einen Sprecher, voraus, ist also an die Perspektivität jeder subjektiven Sicht auf Welt gebunden, schließt die Möglichkeit echter Aperspektivität schlichtweg aus. Und das betrifft den äußerlich-räumlichen »Standort« ebenso wie den geistig-mentalen »Standpunkt« (vgl. KAHRMANN/REISS/SCHLUCHTER 1986, 147) des Erzählers. Der im Begriff auktorialen Erzählens implizierte Verzicht auf perspektivierendes Erzählen bedeutet ja nicht, daß auktoriale Weltdarstellung und -deutung 'objektiv' sind, sondern nur, daß sie den subjektiven Erfahrungshorizont der im 'Erleben' ihrer Geschichte befangenen Figuren überschreiten.
Kapitel IV: Erzählsituationen
209
Person macht, bis zu dem »unpersönlichen« Erzähler, der sich expliziter Kommentare und selbstbezüglicher Äußerungen enthält und darum keine persönlichen Konturen gewinnt, ausschließlich auf den Erzählvorgang konzentriert ist, sich ganz auf die Vermittlerrolle beschränkt. Der unpersönliche Erzähler verleugnet, wenn man so will, seine Subjektivität, kaschiert die Subjekt-Objekt-Struktur narrativer Rede, indem er sein Objekt in den Vordergrund stellt und das Subjekt, sich selbst, nicht explizit ins Spiel bringt. Er verdeckt damit die Perspektivität seiner Darstellung und verhilft so dem vermeintlich objektiven Gestus der auktorialen Außenperspektive und damit zugleich einer perfekten Illusionierung zu größtmöglicher Entfaltung. Demgegenüber betont der persönliche Erzähler klar und explizit seine Subjektposition selbst dann, wenn er sich in wertenden Kommentaren und Deutungen des Erzählten als normative Autorität empfiehlt, und hält, indem er seine Vermittlerrolle deutlich markiert, die Subjekt-Objekt-Struktur des narrativen Sprechakts beständig gegenwärtig, insbesondere dann, wenn er den Erzählakt selbst zum Gegenstand seiner Rede macht. Der persönliche und der unpersönliche Erzähler sind Idealtypen: Die Erzählliteratur zeigt ein breites Feld von Varianzen, das sich zwischen diesen beiden Polen erstreckt. Die potentielle Ubiquität des auktorialen Erzählers impliziert potentielle »Allwissenheit«, d.h. sie ermöglicht einen Erzähler, dem die fiktive Welt in ihrer Gesamtheit - als äußere ebenso wie als innerpsychische Welt - zugänglich ist. Ein zweites Feld von Varianzen auktorialen Erzählens ergibt sich daher aus der Frage, ob der Erzähler diese potentielle Allwissenheit für sich in Anspruch nimmt und sich damit die größtmögliche Verfügung über die fiktive Welt einräumt oder ob er sie nicht ausschöpft und sich damit als eingeschränkter Erzähler präsentiert. Von eingeschränktem auktorialem Erzählen kann naheliegenderweise nur dort die Rede sein, wo der Erzähler diese Einschränkungen durch spezifische Erzählverfahren markiert49 oder selbst ausdrücklich thematisiert,50 etwa indem er seine Kompetenz zur Diskussion stellt, Informationsdefizite explizit zu erkennen gibt, seinen Kenntnisstand legitimiert usw. Solche selbstbezüglichen Kommentare setzen einen persönlichen Erzähler voraus: Sie markieren die Subjektivität der fiktiven Vermittlungsinstanz und destruieren damit die olympische Autorität auktorialen ErSo z.B. durch die - von Stanzel "Fokussierung" genannte - Konzentration des Erzählens auf die Erfahnings- und Erlebniswelt einer bestimmten Figur (vgl. STANZEL 1982, 152). 50 Da der empirische Rezipient narrativer Texte sein Wissen über die fiktive Welt des Erzählten allein vom Erzähler bezieht, kann er dessen Kompetenz und Informiertheit bei auktorial erzählten Texten nicht beurteilen, es sei denn, der Erzähler gibt selbst Urteile darüber ab, ein Umstand, den Füger (1972, 272f.) übersieht, wenn er die Frage nach Kompetenz und Informiertheit des Erzählers zum definitorischen Kriterium auktorialer Texttypen erhebt (vgl. ähnlich auch KAHRMANN/REISS/SCHLUCHTER 1986, 146).
210
Kapitel IV: Erzählsituationen
zählens. Diese olympische Position bezieht dagegen der allwissende Erzähler, der häufig zugleich ein unpersönlicher Erzähler ist, der sich nicht selbstreflexiv äußert (also auch seine Kompetenz nicht in Frage stellt).51
2.
Die auktoriale Erzählsituation im Film
Die Überlegungen zu den Schwierigkeiten einer konsequent durchgeführten personalen ES im Film deuteten schon darauf hin: Die auktoriale Außenperspektive ist die dem Film nächstliegende, dem bildsprachlichen Medium unmittelbar entsprechende Erzählperspektive. Die photographische Reproduktion des Sichtbaren, auf der filmische Rede beruht, schreibt ihr die Außenperspektive geradezu auf den Leib, und der in der auktorialen ES implizierte Anspruch, Welt als eine unabhängig von den sie erlebenden Subjekten bestehende Faktizität gültig darstellen zu können, liegt dem photographischen Bild von Hause aus nahe, weil es wie kein anderes Bildmedium Unbestechlichkeit vortäuscht, Wirklichkeit detailgetreu und ohne Auslassungen abzubilden vorgibt. Die Erfassung der fiktiven Welt durch eine nicht an die Perspektive einer Figur gebundene und daher potentiell ubiquitäre und »allwissende« Kamera ist in der Praxis denn auch die Normalform filmischen Erzählens. Wie in der Literatur sind nun aber auch hier Varianten auktorialen Erzählens auszumachen, die sich ebenfalls aus den beiden oben eingeführten Oppositionen (persönlicher vs. unpersönlicher und eingeschränkter vs. allwissender Erzähler) ergeben. In der Opposition von persönlichem und unpersönlichem auktorialen Erzählen kehrt die weiter oben eingeführte Unterscheidung zwischen kommentierendem und referentiellem Abbildungsverhalten wieder, die hier nun im Konstrukt der Erzählsituation ihre systematische Begründung findet (vgl. S. 56-58). Referentielles Abbildungsverhalten ist das herausragende Merkmal unpersönlichen auktorialen Erzählens im Film, das in der Geschichte des Films lange Zeit das Feld beherrscht hat und bis heute eine kaum zu überschätzende Si Das heißt zwar nicht, daß der unpersönliche Erzähler nicht auch eingeschränkt erzählen kann, wohl aber, daß er diese Einschränkungen nicht als Einschränkungen markiert: Das Nicht-Erzählte behält hier grundsätzlich den Status des nicht Erzählenswerten und das Nicht-Eizählen damit den klassischen auktorialen Gestus eines Erzählers, der sich autorisiert sieht zu entscheiden, was wichtig und was unwichtig ist, was zu wissen oder nicht zu wissen seinem Leser frommt. Einschränkungen der Kompetenz und Informiertheit des Erzählers sind hier demnach, anders als in der personalen und Ich-ES, keine Frage der Erzählsituation, die hier dem Erzähler ja per definitionem eine ubiquitäre und allwissende Position einräumt, sondern eine Frage der Nutzung oder Nicht-Nutzung der in dieser ES gegebenen Verfugungsmöglichkeiten über die fiktive Welt.
Kapitel IV: Erzûhlsituationen 211 Rolle spielt. Denn es steht ein für das filmästhetische Programm perfekter IIlusionierung, das Filmtechniker wie Filmemacher seit den Anfangen des Films immer neu in seinen Bann gezogen hat: Der unpersönliche filmische Erzähler zieht sich ganz auf seine Vermittlerrolle zurück, ohne diese selbst spürbar werden zu lassen, vermeidet daher explizite Selbstkundgaben, sieht seine Hauptaufgabe vielmehr darin, das Erzählte optimal ins Bild zu setzen, die dramatische Selbstdarstellung der Bildobjekte weitestgehend für sich selbst sprechen zu lassen und die Bedingung ihres Erscheinens, die »Mittelbarkeit« des Erzählens, vergessen zu machen. Die Kamera verschreibt sich den oben als Verfahren referentiellen Abbildungsverhaltens ausgewiesenen Darbietungsweisen, die Schnittechnik sucht die Schnitte unsichtbar zu machen, die Montage unterwirft sich den Bedürfnissen der narrativen Textbildung, meidet naheliegenderweise Formen der systematischen Textbildung (vgl. Kap. III.D.2). Kameraarbeit und Montage sind hier also ganz darauf aus, sich selbst und damit den Erzähler zu verleugnen, den Status der erzählten Welt als einer vermittelten zu kaschieren, der Fiktion zu größtmöglichem »Realitätseindruck« und dem Rezipienten zu perfekter Illusion zu verhelfen. Ausdrückliche Selbstkundgaben im Wege kommentierenden Abbildungsverhaltens dagegen sind das herausragende Merkmal des persönlichen auktorialen Erzählers, der damit die Subjekt-Objekt-Struktur seiner Bilder explizit macht und der perfekten Illusionierung entgegenwirkt dadurch, daß er sich als Subjekt der Bilder konturiert und damit die Subjektivität seiner Wahrnehmungen im Bewußtsein des Rezipienten ebenso gegenwärtig hält wie den Status des Erzählten als Vermittelten: Seine Kamera gibt sich als Organ der Wahrnehmung explizit zu erkennen, beschränkt sich nicht auf das Referat und kann daher alle Möglichkeiten kommentierenden Abbildungsverhaltens nutzen. Entsprechend stehen auch der Montage alle Textbildungsverfahren offen, die explizit auf das Subjekt filmischer Rede verweisen. Kameraarbeit und Montage sind hier also darauf aus, dem scheinbar objektiven Gestus der auktorialen ES entgegenzuwirken dadurch, daß die Subjektivität der Kamerawahrnehmung ausdrücklich markiert wird.52 Wie in der Literatur sind auch im Film Ubiquität und »Allwissenheit« als potentielle Merkmale des fiktiven Erzählers der auktorialen ES immanent. & Persönliches auktoriales Erzählen, im russischen Stummfilm der Eisenstein, Pudowkin, Vertov u.a. erprobt und - insbesondere in der Montage - schon längst zu vollendeten Formen gereift, war in Westeuropa in den vierziger und frühen fünfziger Jahren in Westeuropa und Amerika eine der Antworten ambitionierter Filmregisseure auf den »glatten« Filmrealismus der dreißiger Jahre; vgl. etwa in Amerika den junge Orson Welles (»Citizen Kane«) oder in Deutschland - verspätet durch NS-Kino und Krieg - einzelne Nachwuchsregisseure, darunter vor allem einige der ersten Regisseure der DEFA wie Wolfgang Staudte, Konrad Wolf u.a.
212
Kapitel IV: Erzählsituationen
Eingeschränktes auktoriales Erzählen, das diese potentielle Ubiquität und Allwissenheit nicht nutzt, bleibt daher auch hier merkmallos, solange es nicht eigens markiert wird. 53 Und da der filmische Erzähler, anders als der literarische, sein Erzählverhalten selbst mit bildsprachlichen Mitteln nicht thematisieren kann (weil die Kamera, im Prinzip jedenfalls, keine Möglichkeit hat, sich selbstbezüglich zu äußern), also auch nichts über seinen Kenntnisstand sagen, geschweige denn das, was er nicht weiß, benennen kann (weil die Kamera nicht 'sagen' kann, was sie nicht sieht), kann eingeschränktes auktoriales Erzählen im Film auch nur auf zwei Wegen Zustandekommen, nämlich durch das, was Stanzel »Fokussierung« nennt,54 oder durch die Konstruktion einer Rahmenerzählung. Bei der »Fokussierung« bindet sich der Erzähler zwar nicht - wie in der personalen ES - an die Perspektive, wohl aber an den Erfahrungs- und Aktionsraum einer Figur, verfolgt Tun und Lassen dieser Figur, nutzt also seine potentielle Ubiquität nicht aus. Obwohl er dabei wohlgemerkt nicht figurenperspektivisch, sondern außenperspektivisch erzählt, hat diese »Fokussierung« einen perspektivierenden Effekt: Sie hat zwangsläufig zur Folge, daß der Rezipient erheblich mehr und erheblich differenziertere Informationen über die »fokussierte« Figur gewinnt als über die anderen Figuren, was seine Bereitschaft, Partei zu nehmen, das erzählte Geschehen nämlich von der Warte dieser Figur aus zu betrachten, ihre Perspektive zu seiner eigenen zu machen, deutlich erhöht. Bei der Rahmenerzählung bindet sich der Erzähler an den Wissensstand eines zweiten Erzählers, des Binnenerzählers, der hier normalerweise eine der dramatis personae ist, weshalb Rahmenerzählungen im Film der Form nach eigentlich Rückwendungen sind (vgl. S. 155f.) mit dem Unterschied, daß die Rückwendung hier nun Vehikel des gesamten Erzählvorganges ist:55 Der filmische Erzähler zeigt als Rahmenerzähler eine Erinnerungshandlung, in deren Verlauf eine der Figuren die Geschichte - sich an sie als selbst erlebte (als nur gehörte, schon einmal erzählte usw.) erinnernd - zu erzählen beginnt, während die Kamera, zumeist nach einer signifikanten Blendenverbindung, das Erzählte in Bilder umsetzt. Auch filmische Rahmenerzählungen haben, obwohl sie die Binnengeschichte in der Regel (und inkonsequenterweise) außenperspektivisch präsentieren, einen perspektivierenden Effekt, der durch die Bindung an den Wissens- und Erfahrungshorizont des Binnenerzählers zustan53 Vgl. Anm. 51. 54 Vgl. STANZEL 1982, 152.
55 Vgl. z.B. Orson Welles' »Citizen Kane« (USA 1940) oder Helmut Käutners »Romanze in Moll« (D 1943), in denen sich der Erzählvorgang aus mehreren figuralen Erinnerungsakten rekrutiert.
Kapitel IV: Erzählsituationen
213
dekommt, zumindest dort, wo die Rahmenkonstruktion nicht zum bloßen Vorwand verkommt: Die Bindung an den Kenntnisstand des Binnenerzählers gibt der Binnengeschichte eine perspektivische Handlungslogik, zeigt die kausallogischen Zusammenhänge der Geschichte so, wie sie der Binnenerzähler sieht.
Kapitel V Die Selbstdarstellung des Erzählten: Dramatische Informationsvergabe im Film
Da der filmische Sprechakt auf der Abbildung dramatischer Sprechakte beruht, das Erzählte hier also im Modus dramatischer Selbstdarstellung erscheint (vgl. Kap. I.C.2), kann die Analyse der Darstellungsebene (vgl. S. 42f.) zu wesentlichen Teilen auf Ergebnisse der Dramentheorie und Dramenanalyse zurückgreifen, sofern sie dabei die Bedingungen für das Erscheinen der Darstellungsebene im Film reflektiert (vgl. S. 49).1 Dies gilt vor allem für den Bereich der sprachlichen, kaum dagegen für den Bereich der nichtsprachlichen Informationsvergabe: Als eine vornehmlich auf den gedruckten, weniger auf den inszenierten Dramentext gerichtete Disziplin hat es die Dramenanalyse allererst mit sprachlichen Vermittlungsformen zu tun. Bei Filmen ist die Situation eine grundlegend andere, denn das Drehbuch hat hier weder dieselbe Funktion noch denselben kommunikativen Status wie der gedruckte Dramentext,2 weshalb eine Trennung zwischen gelesenem und inszeniertem Text, die beim Drama die traditionelle Aufgabenverteilung zwischen Literaturwissenschaft und Theaterwissenschaft mitbegründet hat, für eine Theorie des Films gar nicht erst in Betracht kommt. Beim Film hat man es in der Regel nicht mit zwei, sondern mit einem Text zu tun, und zwar mit einem hochkomplexen, verbale und nonverbale Zeichen verwendenden Text. Bei der Analyse der nonverbalen Informationsvergabe im Film kann die Filmtheorie folglich wenig oder nur mittelbar von der Dramentheorie profitieren, wohl aber bei der Analyse der sprachlichen Informationsvergabe, darunter vor al1
Als allgemeine Rekurs- und Verweisinstanz fungiert dabei die dramentheoretische Grundlegung von Manfred Pfister (PFISTER 1982), und dies aus zwei Gründen: Zum einen bestehen zwischen Pfisters und den hier gewählten Ansätzen Korrespondenzen insofern, als Pfister Ergebnisse der strukturalistischen und semiotischen Texttheorie verarbeitet, ohne damit das historisch-hermeneutische Konzept der Textanalyse preiszugeben, das seine Grundlegung unverkennbar leitet. Zum anderen entwickelt er die derzeit ausführlichsten und detailliertesten Analyseverfahren gerade auf den Feldern der Dramenanalyse, die für die Filmanalyse relevant sind. 2 Das Drehbuch ist - normalerweise - kein dem Rezipienten zugänglicher Lesetext, sondern, vergleichbar dem eingestrichenen Regiebuch einer Theaterinszenierung, eine Arbeitsgnmdlage für Regisseur, Kameramann, Schauspieler und technischen Stab.
Kapitel V: Dramatische Informationsvergabe
215
lem der Formen und Funktionen der Figurenrede (Kap. V.A) sowie bei der Analyse dramatischer Makrostrukturen, insbesondere der Struktur des dramatischen Personals, der Struktur und Präsentation der figuralen Interaktionen und der Verfahren der Figurencharakterisierung (Kap. V.C). Dramentheoretischen Modellen entstammt auch die Frage nach der aus dem Ensemble der diversen Figurenperspektiven abzuleitenden Perspektivenstruktur, der hier jedoch ein eigenes Kapitel vorbehalten ist, weil die narrativen Strukturen des Films einen veränderten Ansatz erfordern (Kap. VI). Veränderte oder neue, nicht oder nur partiell aus der Dramentheorie, eher schon aus einschlägigen Arbeiten der Theaterwissenschaft3 ableitbare Ansätze aber verlangt der gesamte Bereich der nonverbalen Informationsvergabe (Kap. V.B) sowie die Untersuchung räumlicher Strukturen im Film (Kap. V.D).
A. Sprachliche Informationsvergabe: Figurenrede im Film 1. Figurenrede im Spannungsfeld von Normal- und Bühnensprache Dramatische Rede steht im Spannungsfeld zweier »Abweichungsdimensionen«, der Normalsprache und der jeweils etablierten bühnensprachlichen Norm.4 Für den Film sind diese beiden »Abweichungsdimensionen« von sehr viel geringerem Gewicht als für das Drama, weil die Anpassung an die Normalsprache hier von Anfang an Programm war: Der »Realismus« des photographischen Mediums, der das erzählte Geschehen von der artifiziellen Welt der Bühne auf reale Schauplätze zu verlegen vorgab (und dies dank der zunehmenden Beweglichkeit der Kamera nicht nur - mit den Dekorationen im Atelier - vorgab, sondern immer häufiger auch wirklich tat), veränderte die Regeln des verabredeten Spiels, das Theater und Film gleichermaßen betreiben, dergestalt, daß Wirklichkeit für die filmische Mimesis eine ungleich stärkere normative Kraft hatte als für das Theater. Theaterzuschauer bringen der Künstlichkeit der Bühnenwelt und ihren unübersehbaren Abweichungen von Wirklichkeit - aufgrund der hier geltenden Spielregeln - eine weitaus höhere Toleranz entgegen als Filmzuschauer der Künstlichkeit der filmischen Welt. Die normative Kraft des optischen Realismus, der das photographische Bild ausgesetzt ist, hatte und hat zwangsläufig Folgen auch für die Sprache der Figuren, legte die Annäherung der Figurensprache an die Normalsprache von vornherein nahe. Hinzu kamen und kommen rezeptionsästhetische Motive 3 Vgl. vor allem FISCHER-LICHTE 1983. 4
V g l . PFISTER 1 9 8 2 150f.
216
Kapitel V: Dramatische Informationsvergabe
des kommerziellen Kinos, das ein breites Publikum erreichen muß, ein breites Publikum aber nur erreichen zu können glaubt, wenn es dessen Sprache spricht. Das heißt freilich nicht, daß Sprache im Film nicht in einem Spannungsverhältnis zur Normalsprache stünde. Auch Filmfiguren sind in den allermeisten Fällen überartikulierte Sprecher, und selbst dort, wo sie Soziolekte oder Dialekte sprechen, unterliegt ihre Sprache nicht selten einem Stilisierungsprinzip, das nicht nur ihre schon aus kommerziellen Gründen notwendige Verständlichkeit sicherstellt, sondern sie auch als Ausdruck eines ästhetischen Programms ausweist.5 Konventionen der Bühnensprache spielen deshalb auch für den Film eine - wenn auch vergleichsweise geringe - Rolle. Wohl hatten die überartikulierten Figuren des klassischen Dramas hier von vornherein wenig Chancen, aber das liegt nicht nur an der normativen Kraft des kinematographischen Oberflächenrealismus, sondern hat auch mit der Geschichte des Films zu tun, die seine Beziehungen zur Bühnensprache prädisponierte. Seine Geburtsstunde fiel in eine Zeit, in der Realismus und Naturalismus die Normen literarischer Weltaneignung geprägt hatten und noch prägten, will sagen: in der die überartikulierte Sprache der klassischen und nachklassischen Dramatik auch auf der Bühne längst schon in Frage gestellt, die Alltagssprache, insbesondere durch die Experimente der naturalistischen Dramatiker, als Bühnensprache denkbar und der berühmte Ausspruch Arno Holz' - »Die Sprache des Theaters ist die Sprache des Lebens. Nur des Lebens!«6 - zu einem programmatischen Schlagwort geworden war. Und die Geburtsstunde des Tonfilms in den späten zwanziger Jahren fiel in eine Zeit, in der das Theater schon nicht mehr unbestrittene Domäne der erwerbs- und bildungsbürgerlichen Oberschicht war, sondern sich - in der Theatermetropole Berlin zumal mit einem weitgefächerten Angebot, das von der politischen Kleinkunstbühne über das Boulevard-Theater bis zum Staatstheater reichte, breiteren Publikumsschichten geöffnet hatte, was der Annäherung der Bühnensprache an die 5 So war z.B. Hans Mosers Sprache, sein berühmtes 'Genuschel', stets auch für Nicht-Wiener zu verstehen, aber sie war auch die Sprache der mundartlichen Komödie, bezog ihre Wirkungen vor allem aus den bewährten Mitteln des Wiener Volksstücks. Die Soziolekte und Dialekte vieler Fassbinder-Figuren sind einem neo-naturalistischen Programm verpflichtet, »das den restringierten Sprachcode seiner Figuren auf ihr restringiertes Bewußtsein hin transparent macht« (PFISTER 1982, 150, mit Bezug auf Dramen von Franz Xaver Kroetz). Und das Hunsrücker Platt, das Edgar Reitz' Figuren in dem Post-Oberhausener Epos »Heimat« (1984) sprechen, ist Garant für die Aussprechbarkeit des in der Hochsprache Unaussprechlichen, hat Namen (z.B. »Geheischnis«) für Sachverhalte, für die die Hochsprache gar keine Wörter mehr hat, gibt dem, was in der Hochsprache sentimentales Klischee wäre, seine - subjektive - Geltung zurück. 6 Arno Holz, Vorwort zu »Sozialaristokraten« (1896), wiederabgedr. in: Theorie des Naturalismus, hg. v. Th. Meyer, Stuttgart 1974, 281-285, hier 282 (Hervorhebung im Text).
Kapitel V: Dramatische Informationsvergabe
217
Normalsprache in der zeitgenössischen Dramatik erhebliche Impulse gegeben hat. Die von der Bühnensprache her bestimmte »Abweichungsdimension« der Figurenrede war beim Film also zweifellos auch deshalb von vornherein geringer bemessen, weil sich die Sprache der zeitgenössischen Dramatik ihrerseits auf dem Weg einer Annäherung an die Normalsprache befand, und dies nicht zuletzt gerade in den Genres, in denen sich der junge Tonfilm bevorzugt übte, in den Komödien und Lustspielen, für die er im zeitgenössischen Volksstück und - dies vor allem - im zeitgenössischen Salonstück reichliche Vorbilder fand.
2.
Funktionen der Figurenrede
Sprechakte sind Formen menschlichen Handelns und als solche multifunktional. Das hat als einer der ersten Bühler gesehen (vgl. S. 27), und die an Austin und Searle7 anschließende Sprechakttheorie hat diese Einsicht dann systematisch entwickelt. Die Sprechakttheorie gestattet einen differenzierten Blick auf die Funktionen sprachlicher Handlungen und wird hier deshalb bei der Untersuchung verbaler Sprechakte im Film Pate stehen. Allerdings vernachlässigt sie eine Funktion, die Bühlers Organon-Modell noch vorsieht, nämlich die auf das Subjekt des Sprechakts zurückweisende Symptom-Funktion (vgl. S. 27). Manfred Pfister berücksichtigt diese Funktion (»expressive Funktion«) bei seiner Klassifizierung funktionaler Aspekte dramatischer Figurenrede, rekurriert dabei aber nicht auf die Sprechakttheorie, sondern auf das (ältere) Modell sprachlicher Kommunikation von Roman Jakobson,8 mit dem er sechs Funktionen von Sprechakten unterscheidet, die referentielle, appellative, phatische, metasprachliche, poetische und expressive Funktion.9 Da er keine Verbindungen zwischen Jakobsons Modell und den späteren sprechakttheoretischen Modellen herstellt, entgehen ihm die Präzisierungsmöglichkeiten, die letztere eröffnen. Deshalb soll seine Kategorisierung dramatischer Sprechakte hier im Rekurs auf sprechakttheoretische Begriffe reformuliert werden. Proposition, Illokution, PerlokiUion Die an Austin und Searle anschließende Sprechakttheorie unterscheidet drei bzw. vier Teilhandlungen sprachlichen Handelns: Nach Austin werden Loku1
Vgl. J. L. Austin, How to do Things with Words, Oxford 1962 (dt.: Zur Theorie der Sprechakte, Stuttgart 1972); SEARLE 1971; 1980a; 1980b. 8 R. Jakobson, Linguistics and Poetics, in: Style in Language, hg. v. Th. A. Sebeok, Cambridge/Mass. 1960, 350-377. 9
Vgl. PFISTER 1982, 151-168.
218
Kapitel V: Dramatische Informationsvergabe
tion (unterteilt in einen phonetischen, phatischen und rhetischen Akt), Illokution und Perlokution unterschieden, nach Searle, dem hier gefolgt werden soll, bestehen Sprechakte aus Lokution (unterteilt in einen phonetischen und phatischen Akt), Proposition, Illokution und Perlokution.10 Was Pfister mit Jakobson die referentielle Funktion dramatischer Sprechakte nennt,11 der »Redeinhalt«, die »Darstellung eines Redegegenstands«,12 ist mit dem sprechakttheoretischen Begriff Proposition präziser zu erfassen. 13 Searle versteht unter Proposition den Akt der Erzeugung einer bestimmten Menge von Informationen, den er in zwei Teilhandlungen zerlegt, nämlich in den Akt der sprachlichen Bezugnahme auf Welt, der Referenz, und den Akt der Aussage über Welt, der Prädikation.14 Er faßt die propositionalen Akte als zunächst neutrale Aussageformen auf, die in unterschiedlichsten grammatischen Formen und unterschiedlichsten illokutiven Funktionen erscheinen können: Die Äußerungen »Du bist faul«, »Warum bist du faul?«, »Sei nicht so faul!« sind in propositionaler Hinsicht identisch, weil alle dieselbe Referenz (den Angeredeten) und dieselbe Prädikation vollziehen (»faul«); ihre Differenzen liegen in den differenten illokutiven Akten, die sie vollziehen (Feststellung, Frage, Befehl). 15 Die Begriffe Illokution und Perlokution präzisieren das, was Pfister mit Jakobson die (der Bühlerschen Appell-Funktion vergleichbare) appellative »Funktion der Beeinflussung« nennt,16 die vom Sprecher intendierte Wirkung auf den Hörer. Unter Illokution bzw. illokutiven (oder illokutionären) Akten wird die mit dem propositionalen Akt verfolgte kommunikative Intention verstanden, die den eigentlichen Akt sprachlichen Handelns darstellt: Im illokutiven Akt wird übermittelt, zu welchem Zweck der Sprecher die Proposition vollzieht, wird die kommunikative Verwendung der Proposition angegeben (z.B. feststellen, behaupten, fragen, befehlen, drohen, warnen usw.). 17 Diese Verwendungsangabe kann ausdrücklich mit performativen »sprechhandlungsbezeichnenden Ausdrücken«18 vollzogen (z.B. »Ich stelle fest, daß du faul bist«) oder mit sog. illokutiven Indikatoren (z.B. Satzform, Intonation, Ak10 V g l . HINDELANG 1 9 8 3 , 4 - 1 8 ; FRASER 1980, 5 5 f . ; BUSSMANN 1 9 8 3 , 4 9 7 - 5 0 0 . Π V g l . PFISTER 1 9 8 2 , 1 5 3 - 1 5 6 .
12 Ebd. 152. 13 Der Begriff entspricht in etwa dem, was Austin den »rhetischen« Akt nennt und als Teil der Lokution klassifiziert, und korrespondiert mit Bühlers Begriff der »Darstellung« (vgl. S. 27). 14 V g l . HINDELANG 1 9 8 3 , 17f.; FRASER 1980, 55; BUSSMANN 1983, 4 1 6 f . 15 V g l . HINDELANG 1 9 8 3 , 18. 16 PFISTER 1 9 8 2 , 152; v g l . d a z u a u c h 1 5 8 - 1 6 1 . 17 V g l . HINDELANG 1 9 8 3 , 8 - 1 1 ; FRASER 1 9 8 0 , 55; BUSSMANN 197. 18 HINDELANG 1 9 8 3 , 2 1 .
Kapitel V: Dramatische Informationsvergabe
219
zent, Adverbien u.a.) angezeigt werden.19 Nun geschieht es in der Praxis sehr häufig, daß die sprachlich indizierte Illokution von der tatsächlich gemeinten Illokution abweicht. In diesem Fall, in dem Searle von »indirekten Sprechakten« redet,20 geht die gemeinte (»primäre«) illokutive Funktion allererst aus dem kommunikativen Kontext hervor:21 Bei der Äußerung »Du bist faul« ist die sprachlich (durch die Form des Aussagesatzes) indizierte (»sekundäre«) Illokution ein Akt der Feststellung; wenn ein Lehrer sie einem Schüler gegenüber ausspricht, ist die gemeinte (»primäre«) Illokution aber vermutlich eine andere, nämlich kein bloßer Akt des Feststellens, sondern des Tadeins, Warnens und damit der Aufforderung, in Zukunft fleißig zu sein. Unter Perlokution (auch: perlokutionären Effekten) wird hier die Wirkung verstanden, die die im illokutiven Akt vollzogene Handlung des Sprechers beim Hörer hervorruft.22 Perlokution meint demnach die tatsächlich erreichte Wirkung des Sprechakts, die mit der vom Sprecher intendierten, im illokutiven Akt präsenten Wirkung nicht notwendig identisch sein muß, also als Gelingen oder Mißlingen des illokutiven Akts beschrieben werden kann. Im Beispielfall hätte der Sprechakt seine illokutive Funktion erfüllt, sofern sich der getadelte Schüler vornimmt, in Zukunft fleißig zu sein. Sprechakte können aber selbstverständlich auch nicht intendierte perlokutionäre Effekte haben.23 Für die Analyse dramatischer Sprechakte hat die Unterscheidung von Illokution und Perlokution einigen Wert, weil sie eine Begrifflichkeit an die Hand gibt, die die Beschreibung und Interpretation sprachlicher Handlungsverläufe zu präzisieren geeignet ist: Die Erfassung der perlokutionären Effekte von dramatischen Sprechakten schafft die Voraussetzung, jede Replik sowohl als Aktion wie auch als (perlokutive) Reaktion zu analysieren und dabei unter dem Aspekt des Gelingens oder Mißlingens der Illokution zu untersuchen, was naheliegenderweise vor allem zur genaueren Klärung mißlungener Kommunikation beitragen kann.
19 Vgl. BUSSMANN 1983, 197; HINDELANG 1983, 14f. und 21-40. Vgl. SEARLE 1980a. Zur Kritik des Modells der »indirekten Sprechakte« vgl. HINDELANG 1983, 92-97. 21 Vgl. SEARLE 1980a, 140f.; HINDELANG 1983, 15f. 22 Diese (vereinfachende) Begriffsbestimmung (vgl. FRASER 1980, SS) hält gewissermaßen die Mitte zwischen den komplexeren, dabei aber divergenten Begriffsexplikationen, die in der Sprechakttheorie diskutiert werden (vgl auch HINDELANG 1983, llf. und 92-97). 23 Diese Situation wäre im Beispielfall etwa dann gegeben, wenn der Schüler sich zu unrecht getadelt fühlte, den illokutiven Akt also zwar richtig verstünde, sich aber weigerte, die Proposition als wahr anzuerkennen, oder wenn er sich durch den Tadel entmutigt fühlte, also den illokutiven Akt falsch, nämlich nicht als Aufforderung, fleißig zu sein, sondern als Feststellung eines unabänderlichen Zustands, als abfällige Bemerkung verstünde. In beiden Fällen wäre der illokutive Akt mißlungen.
20
220
Kapitel V: Dramatische Informationsvergabe
Mit Blick auf die in der literatur- und filmwissenschaftlichen Rezeption der Sprechakttheorie häufiger zu beobachtende Neigung, zwischen Proposition und Illokution Dominanzrelationen anzunehmen oder gar beide voneinander zu isolieren, 24 ist nachdrücklich zu betonen, daß Proposition und Illokution Teilhandlungen ein und derselben sprachlichen Handlung sind, Sprechakte also nicht entweder propositional oder illokutiv und auch nicht das eine mehr als das andere, sondern stets beides sind. Es ist deshalb abwegig, Proposition und Illokution zu quantifizieren und damit Dominanzrelationen zwischen beiden zu konstruieren.25 Lokation als soziales Handeln Was Pfister mit Jakobson die phaäsche Funktion dramatischer Sprechakte nennt,26 meint das durch den bloßen Akt des Sprechens signalisierte Interesse des Sprechers, mit dem Hörer in Kommunikation zu treten bzw. zu bleiben, beschreibt Sprechen als soziales Verhalten, das darauf aus ist, den kommunikativen Kontakt durch Sprechen aufrechtzuerhalten. Der Begriff hat mit dem des 'phatischen Akts', den die Sprechakttheorie zusammen mit dem phonetischen Akt als Konstituente des lokutiven Akts versteht, nur mittelbar zu tun: Lokution bezeichnet den Äußerungsakt in seiner akustischen und grammatischen Gestalt, meint die Produktion einer artikulierten Lautfolge (phonetischer Akt) und deren grammatischen Regeln folgende Organisation, also die Äußerung wohlgeformter Sätze (phatischer Akt). 27 Als Akt der sprachlichen 2* Vgl. z . B . PETERS 1984 (und hier Kap. II, A n m . 4); PFISTER 1982, 153-161.
25 Das versucht etwa Pfister, wenn er die propositionale (referentielle) Funktion »in konventionellen dramatischen Redeformen des Berichtens«, nämlich in Expositionserzählung, Botenbericht, Teichoskopie usw. (PFISTER 1982, 153), die illokutive (appellative) Funktion dagegen in stark 'partnerbezogenen' Dialogen dominieren sieht, in denen »der Sprecher versucht, seinen Dialogpartner zu beeinflussen, ihn umzustimmen« (ebd. 158). Botenberichte haben keine geringere illokutive Funktion und auch keine stärkere propositionale Funktion als Streitgespräche. Der illokutive Akt eines Botenberichts besteht normalerweise in der Kenntnisgabe eines Sachverhalts: Der Sprecher eines Berichts ist darauf aus, daß der Hörer den berichteten Sachverhalt zur Kenntnis nimmt. Der perlokutive Akt besteht demnach in der Kenntnisnahme des berichteten Sachverhalts durch den Hörer und gfls. in einem dem gewonnenen Kenntniszuwachs angepaßten Verhalten. Und bei Streitgesprächen sind die Sprecher darauf aus, ihre Gesprächspartner dazu zu bewegen, ihre Propositionen als wahre Aussagen anzuerkennen, sich also überzeugen zu lassen und gfls. ihr zukünftiges Verhalten entsprechend zu verändern. Pfisters Eindruck, daß die propositionale (referentielle) Funktion in berichtenden Sprachhandlungen dominiert, resultiert offenbar aus dem Umstand, daß die semantische Informationsmenge, die in der Proposition erzeugt wird, hier gewöhnlich rein quantitativ erheblich höher ist als in kurzen Wechselreden, während umgekehrt in diesen die Anzahl der Sprechakte und damit auch die Anzahl der illokutiven (appellativen) Akte höher ist als in langen Berichtsszenen. 26 Vgl. ebd. 161f. 21 Vgl. FRASER, 1980, 55, HINDELANG 1983, 7 f . , 16f.
Kapitel V: Dramatische Informationsvergabe
221
Äußerung ist der lokutive Akt also die Basis sprachlicher Kommunikation und als solche per definitionem ein Akt der Initiierung und Aufrechterhaltung von Kommunikation: Lokution als Gegensatz zum Schweigen, Nicht-Sprechen, ist per se ein »phatischer« Akt im Jakobsonschen Sinn. Dieser soziale Aspekt jedes Sprechakts sei hier, da der Begriff des »Phatischen« in der Sprechakttheorie mit anderer Bedeutung verwendet wird, als soziale Funktion bezeichnet. Die soziale Funktion ist jedem Sprechakt immanent; auch sie kann nicht ebensowenig wie Proposition und Illokution - in Dominanzrelationen zu den anderen Funktionen des Sprechakts treten.28 Metasprachliche, poetische und expressive Funktion Der lokutive, propositionale und illokutive Akt konstituieren jeden Sprechakt und bilden ein geschlossenes Kategoriensystem, das sprachliches Handeln, soweit es den Sprecher selbst betrifft, in drei Teilhandlungen zerlegt, die um den Aspekt der Perlokution als empfängerbezogenen Aspekt erweitert werden. Die übrigen funktionalen Aspekte dramatischer Rede, die Pfister, Jakobson folgend, benennt und den drei Teilhandlungen des Sprechakts als gleichrangige nebenordnet (metasprachliche, poetische, expressive Funktion), stehen zu diesem Kategoriensystem in unterschiedlichen Beziehungen, sind als je besondere Realisationsformen von Sprechakten bzw. als funktionale Aspekte einzelner Teilhandlungen des Sprechakts zu bestimmen, also den sprechakttheoretischen Grundkategorien nicht gleichrangig beizuordnen. Die metasprachliche Funktion29 ist kein allen Sprechakten zukommender funktionaler Aspekt, sondern ein - in diesem Fall durch den propositionalen Inhalt selbst bestimmter - Sprechakt-Typ. Sie eignet Sprechakten, deren Propositionen sich nicht auf außersprachliche Sachverhalte, sondern auf die Sprache selbst beziehen, wie das hier beispielsweise in diesem Augenblick ge28 Davon geht Pfister (1982, 161) mit Blick auf Dialoge aus, in denen sprachliches Handeln ganz auf die soziale Funktion abgestellt ist, darauf, das Vorhandensein einer Beziehung zwischen den Subjekten zu bestätigen (»small talk«, Konversation formeller und informeller Art zum Zweck der Aufrechterhaltung von Kommunikation, der formalen »Bindungspflege« usw.). In diesem Fall handelt es sich nicht um einen funktionalen Aspekt von Sprechakten, sondern um einen bestimmten, hier aufgrund illokutiver Aspekte zustandekommenden Sprechakt-Typ, nämlich um Sprechakte, in denen nur geredet wird, um den kommunikativen Kontakt nicht abreißen zu lassen. Pfister übersieht, daB in solchen Fällen illokutive (appellative) und soziale (phatische) Funktion zusammenfallen, weshalb dabei auch nicht von einer sozialen Funktionalisiemng der Illokution (Appellfunktion) gesprochen werden kann: Der illokutive Akt ist nicht etwa verschwunden oder vom sozialen dominiert, sondern besteht in der illokutiven Anweisung, die Proposition als beliebige Äußerung über Wirklichkeit aufzufassen, um deren Inhalt es dem Sprecher weniger zu tun ist als darum, irgendetwas zu sagen, den kommunikativen Kontakt nicht versiegen zu lassen. 29 Vgl. ebd. 163-165.
222
Kapitel V: Dramatische Informationsvergabe
schieht, im Vorgang der Begriffsexplikation: Metasprachliche Sprechakte beziehen sich auf den jeweils aktualisierten Kode und werden immer dann notwendig, wenn sich die Kommunikationspartner vergewissern müssen, ob sie denselben Kode benutzen (z.B. »Wie meinst du das?«, »Wie soll ich das verstehen?«, »Was heißt metasprachliche Funktion?«). Metasprachliche Sprechakte sind ein Spezialfall metakommunikativer Sprechakte, worunter Sprechakttheoretiker nicht nur den Kode betreffende, sondern den gesamten Kommunikationsakt betreffende Äußerungen verstehen (z.B. »Ich kann dein Gejammer nicht mehr hören«).30 Im Drama haben metasprachliche Sprechakte, wie Pfister ausführlich zeigt, eine lange Tradition (etwa in Witzen, Wort- und Sprachspielen) und spielen im modernen Drama eine besondere Rolle für die Darstellung gestörter Kommunikation.31 Die poetische (ästhetische) Funktion, die Pfister in Nachfolge Jakobsons eigens ausgliedert,32 ist allererst ein funktionaler Aspekt der Lokation: Wortwahl, metrische und rhythmische Fügungen, Alliterationen, stilistische Merkmale usw. betreffen nicht, zumindest nicht primär, den propositionalen Gehalt und die illokutive Funktion des Sprechakts, sondern befriedigen allererst sprachästhetische Bedürfnisse, und das nicht nur in der künstlerischen Sprache des Dramas, sondern auch - was für den Film von besonderer Bedeutung ist - in der Normalsprache, wie nicht zuletzt vielbenutzte Redewendungen der Alltagssprache zeigen.33 Die Orientierung filmischer Figurensprache an normalsprachlichen Standards (s.o.) bedeutet deshalb nicht, daß die poetischen Aspekte dramatischer Sprechakte hier völlig irrelevant sind.34 30 Vgl. HINDELANG 1983, 34-37. 31 Vgl. PFISTER 1982, 163f. - Auch hier kann aber nicht davon gesprochen werden, daß die metasprachliche Funktion die anderen Funktionen 'dominiert', wie Pfister meint (ebd. 165). Vielmehr wird hier die Sprache selbst zum Redeinhalt, wird zur Proposition, die eine Fülle denkbarer illokutiver Funktionen haben kann (z.B. die der sozialen Distanzierung durch expliziten Verweis auf einen restringierten Kode des Gesprächspartners u.ä.). 32 Vgl. ebd. 166f. 33 Vgl. z.B. Alliterationen oder Reimbindungen in Wendungen wie »auf Biegen und Brechen«, »bei Nacht- und Nebel«, »weit und breit«, »Stein und Bein« usw. 34 Pfister möchte die poetische Funktion dramatischer Figurenrede von der Figur abkoppeln, auf das Konto des Autors buchen und damit als einen im inneren Kommunikationssystem 'unwirksamen', allein im äußeren Kommunikationssystem, für die Beziehung zwischen empirischen Rezipienten (E 4) und empirischem Autor (S 4) relevanten Kode definieren (vgl. PFISTER 1982, 166). Das scheint mir problematisch: Abgesehen davon, daB damit der kommunikationstheoretische Status der Figurenrede in Frage gestellt wird (vgl. S. 45, Abb. 1), ist die poetische Potenz dramatischer Figurenrede in klassischen Dramen ja doch Teil der konventionalisierten Überartikuliertheit der Figuren. Der Eindruck, sie sei im inneren Kommunikationssystem unwirksam, resultiert daraus, daB sie hier in der Regel nicht den Status einer überartikulierten, sondern der Normalsprache hat, weil alle Figuren mehr oder weniger ttberartikuliert reden. Diese Normalsprache der hochartifiziellen Büh-
Kapitel V: Dramatische Irtformationsvergabe Die expressive (emotive) Funktion dramatischer Rede schließlich,35 die mit der Bühlerschen Symptom-Funktion vergleichbar ist (vgl. S. 27), betrifft die mit jedem Sprechakt geäußerte (vor allem emotionale) Beziehung des Sprechers zu dem in der Proposition referierten und prädizierten Sachverhalt, seine auf diesen Sachverhalt bezogene Stimmung und innere Befindlichkeit. Hier spielen paralinguistische Aspekte des Sprechakts (Intonation, Tonstärke, Sprechtempo usw., vgl. Kap. B) naheliegenderweise eine wichtige Rolle, was darauf verweist, daß die expressive Funktion sich allererst über den bkutiven Akt realisiert. Die expressive Funktion kann sich, in neutral referierenden Sprechakten (z.B. in Botenberichten), dem Nullwert nähern oder, etwa in hochdramatischen Streitgesprächen, zu einem zentralen Aspekt der dramatischen Informationsvergabe avancieren. Die expressive Funktion kann einen eigenen Illokutions-Typ konstituieren, dann nämlich, wenn die Beziehung des Sprechers zu dem von ihm in der Proposition referierten Sachverhalt den illokutiven Akt des Sprechakts darstellt. In dieser Variante kommt die sonst wenig beachtete expressive Funktion auch in der Sprechakttheorie vor: Im Rahmen seiner Klassifikation von Illokutionsakten bestimmt Searle sie als eigene Klasse illokutiver Akte (»Expressiva«),36 was zugleich bedeutet, daß dabei nur bewußte emotionale Beziehungen des Sprechers zu dem von ihm proponierten Sachverhalt berücksichtigt werden können. Gemeint sind dabei vor allem formelhafte Sprechakte wie Beglückwünschen, Kondolieren, Entschuldigen, Willkommenheißen usw., in denen der illokutive Akt durch expressive Verben (»Ich beglückwünsche Sie zu ...«) ausdrücklich indiziert wird. Wie bei fast jedem Sprechakt, kann aber auch bei den Expressiva der Fall eintreten, daß die indizierte Illokution (Expression) von der gemeinten abweicht, das heißt: Auch Expressiva können als indirekte Sprechakte (s.o.) erscheinen (vgl. z.B. ironische Glückwünsche). Selbstverständlich kann die Beziehung eines Sprechers zu einem Sachverhalt darüber hinaus auch selbst Gegenstand der Proposition werden (z.B. »Ich freue mich über das schöne Wetter«) und dabei unterschiedlichste illokutive Funktionen haben.37 Die expressive Funknenwelt wird gewiß erst dort als überartikulierte, als »poetische« erkennbar, wo die Normalsprache des Publikums als Vergleichsnorm wirksam wird, also im äußeren Kommunikationssystem. Das heißt aber ja nicht, daß der Zuschauer die Sprache der Figuren nicht als ihre eigene, sondern als die des Autors rezipiert, denn das würde bedeuten, daß der ästhetischen Gestaltung der Figurensprache keine Funktion für die Konstituierung der Figuren, für die Figurencharakterisierung beizumessen, die ästhetische Sprachgestaltung also letztlich als bloßer Zierat anzusprechen wäre. 35 Vgl. ebd. 156-158. 36 Vgl. SEARLE 1980b, 95f.
37 Die Aussage »Ich freue mich über das schöne Wetter« beispielsweise kann u.U. (etwa wenn das Satzsubjekt betont wird) auch tadelnde Bedeutung gewinnen (als Rüge eines Hörers, der sich nicht über das schöne Wetter freut).
223
224
Kapitel V: Dramatische Informationsvergabe
tion der Figurenrede spielt naheliegenderweise eine besondere Rolle für die figurale Selbstcharakterisierung; das ist freilich kein Grund, den Begriff in dieser Richtung zu erweitern:38 Der Begriff sollte der Beziehung des Sprechers zum je aktuellen Gegenstand seiner Rede vorbehalten bleiben.
3.
Formen der Figurenrede: Monolog und Dialog
Die klassische Unterscheidung zwischen monologischen und dialogischen Formen dramatischen Sprechens hat für die Filmanalyse ein vergleichsweise geringes Gewicht, weil monologische Formen39 in der filmischen Figurenrede deutlich seltener vorkommen als im Drama. Die filmtheoretische Kategorienbildung wird sich deshalb allererst auf die dialogischen Formen der Figurenrede im Film konzentrieren. Monologe im Film Die geringe Bedeutung monologischen Sprechens im Film hängt zweifellos mit der normativen Kraft des photographischen Realismus zusammen: Das laute Selbstgespräch, im Drama als Hilfsmittel vor allem für die Darstellung von Innerlichkeit über lange Zeit fest konventionalisiert, kommt leicht in Konflikt mit der impliziten realistischen Norm des Films, weil es in der Realität eher als abweichendes Verhalten aufgefaßt wird. Darüber hinaus dürften auch hier historische Querverbindungen zwischen filmischen und dramengeschichtlichen Konventionen eine Rolle gespielt haben, denn als der Film aus der Taufe gehoben wurde, waren den Dramatikern der konventionelle Monolog und das Beiseitesprechen auch bereits ebenso fragwürdig geworden wie die sprachliche Überartikuliertheit der klassischen Dramenfigur, sollte das Drama nun doch »auf das Naturwahre, Wirkliche gerichtet« sein und darauf, »die psychologische Unwahrscheinlichkeit vollkommen zu vermeiden«.40 DiePfister erweitert den Begriffsinhalt auf die generelle Funktion der Figurenrede als Medium der figuralen Selbstcharakterisierung (PFISTER 1982, 156). Damit entdifferenziert er aber nicht nur den Begriff, sondern verstellt auch den Blick dafür, daB die selbstcharakterisierende Funktion selbstverständlich sämtlichen Aspekten des Sprechakts zukommt, sich in samtlichen Teilhandlungen des Sprechakts vollzieht: Im lokutiven Akt hinsichtlich der sprachlichen Kommunikationstätigkeit selbst (soziale Funktion), der Verwendung bestimmter Sprechkodes (restringiert/elaboriert; Idiolekte, Soziolekte, Dialekte usw.; Stil; poetische Funktion) und der paralinguistischen Realisierung, im propositionalen Akt hinsichtlich der Wahl und Prädikationsweise des Redegegenstands und im illokutiven Akt hinsichtlich der mit dem Sprechakt verfolgten Intention (vgl. dazu Kap. V.C). 39 Zu den Definitionsproblemen vgl. ebd. 180-182. 40 Christian v. Ehrenfels, Wahrheit und Irrtum im Naturalismus (1891), in: Theorie des Naturalismus, hg. v. Th. Meyer, Stuttgart 1974, 277-280, hier 278f.
Kapitel V: Dramatische ¡nformaäonsvergabe
225
se Norm ist für den realistisch erzählenden Spielfilm bis heute unausgesprochene Norm: Der konventionelle große Theatermonolog kommt hier praktisch nicht vor, und die sorgfältige psychologische Motivierung eines Selbstgesprächs ist hier zur Selbstverständlichkeit geworden.41 Dialoge im Film Für die Normalform dramatischer wie filmischer Figurenrede, den Dialog, gibt es eine Reihe quantitativer und qualitativer Analysestrategien, die Rückschlüsse vor allem auf die Konzeption der Figuren und deren Interrelationen erlauben.42 Die quantitative Analyse betrifft die Frequenzen des Sprecherwechsels innerhalb eines Dialogs und die Verteilung der Redeanteile auf die Figuren. Während letztere vor allem auf die »Strukturierung des Personals nach Hauptund Nebenfiguren« und damit naheliegenderweise zugleich auf die Bedeutung der einzelnen Figuren für die Steuerung der Rezipientenperspektive verweisen,43 kann die Frequenz des Sprecherwechsels (und damit die Länge der Repliken) Aufschlüsse über Struktur und Funktion von Dialogen geben. Dialoge mit hoher Wechselfrequenz haben schon durch den Wechsel der Stimmen und die Kürze der Repliken einen bewegteren Rhythmus als Dialoge mit geringer Wechselfrequenz und langen Repliken und finden sich deshalb auch nicht zufällig besonders häufig in Szenen gesteigerter Dramatik, in denen Konflikte zugespitzt und ihrer Auflösung zugetrieben werden. Das gilt freilich nicht generell und nur unter der Voraussetzung, daß zum einen die Sprecherwechsel mit deutlichen semantischen Richtungswechseln (s.u.) verbunden sind, die konfliktorientiertes Sprechen (Rede - Widerrede) kennzeichnen, und daß zum anderen die Repliken nicht durch lange Pausen voneinander getrennt sind, die Rhythmik und Tempo selbst eines Dialogs mit sehr kurzen Repliken deutlich verlangsamen. Dialoge mit hoher Wechselfrequenz und entsprechend kurzen Repliken signalisieren in der Regel ein hohes Maß an »dialogischer Partnerorientiertheit und Situationsgebundenheit«, während Dialoge mit langen Repliken eher auf einen monologischen »Selbstbezug« und auf eine größere Di41 Monologe sprechen im Film allererst pathologische, übererregte, träumende, von Fieber, Alkohol- oder Drogenrausch getrübte Figuren, auch Figuren, die beten, einen nur vorgestellten Dialogpartner ansprechen oder mit einem Ding reden. Auch dabei gerät die semantische Folgerichtigkeit der Reden und die aus Gründen der Verständlichkeit notwendige Artikuliertheit des Sprechens in vielen Fällen (Traum, Rausch, Sterben u.ä.) in einen latenten Widerspruch zum Wahrscheinlichkeitspostulat des realistischen Eizählkinos. Im Horizont der realistischen Norm sind konventionelle Monologe im Film denn auch ein Wagnis, dem selten Erfolg beschieden ist. 42 Vgl. PF1STER 1982, 196-215. 43 Ebd. 200.
226
Kapitel V: Dramatische Informationsvergabe
stanz des Sprechers zur aktuellen Situation verweisen.44 Dieser generalisierenden Funktionszuweisung ist freilich entgegenzuhalten, daß kurze Repliken, wenn sie durch lange Pausen voneinander getrennt sind, gerade umgekehrt Indikator einer gestörten Partnerorientiertheit sein können. Und der gewiß in vielen Fällen zutreffenden Tendenz langer Repliken zu monologischem Selbstbezug kann durch häufige Apostrophen des Dialogpartners und nicht zuletzt durch den Redegegenstand selbst gegengesteuert werden. Die qualitative Analyse von Dialogen läßt sich zum einen mit Blick auf die Repliken der einzelnen Figuren innerhalb eines Dialogs, zum anderen mit Blick auf die Interrelationen zwischen den Repliken der Dialogpartner vornehmen.45 Im ersten Fall geht es um die Strukturierung der Repliken einer Figur innerhalb eines Dialogs, die die Dramenanalyse mit den Kriterien der Konstanz bzw. Inkonstanz der »semantischen Orientierung* und des Situationsbezugs zu erfassen sucht. Dabei geht es um die Frage, ob die Repliken einfache, auf die aktuelle Situation bezogene und dabei linear auf ein konstantes Argumentationsziel (bzw. illokutives Moment) zusteuernde Sprachhandlungen darstellen oder ob sie komplexer organisiert, nämlich von wechselnden Situationsbezügen und semantischen Richtungswechseln geprägt sind, mit denen die Figur - Argument und Gegenargument abwägend oder Assoziationen folgend - in eine Art Wechselrede mit sich selbst eintritt.46 Die zweite Variante bietet naheliegenderweise erheblich mehr Möglichkeiten, verschiedene »Bewußtseinsschichten, Seinsmöglichkeiten oder Rollen des Sprechers« zum Vorschein zu bringen.47 Bei der Analyse der Beziehungen zwischen den Repliken der Dialogpartner geht es allererst um die Frage nach Art und Grad der wechselseitigen Bezugnahme. Hier sind zunächst zwei polare Oppositionen anzusetzen, nämlich einerseits die für den dramatischen wie filmischen Dialog normale Interrelation der aufeinander bezugnehmenden Wechselrede und andererseits die vollständige semantische Beziehungslosigkeit. Semantische Beziehungslosigkeit repräsentiert die Extremsituation 'dialogisierter Monologe': Die Repliken nehmen nicht aufeinander Bezug, die Figuren reden aneinander vorbei, sei es, weil sie sozialer Interaktion nicht fähig sind, sei es, weil sie auf die Replik des Dialogpartners nicht eingehen wollen. Im letztgenannten Fall ist die semantische Null-Relation nurmehr auf propositionaler Ebene gegeben, denn in perlokutiver Hinsicht handelt es sich durchaus um einen Akt der Bezugnahme, eben der negativen Bezugnahme: Die propositionale Beziehungslosigkeit signali44 45 46 47
Ebd. 199. Vgl. ebd. 204-212. Vgl. ebd. 204f. Ebd. 204.
Kapitel V: Dramatische Informationsvergabe
227
siert die Weigerung, über den vom Dialogpartner thematisierten Sachverhalt zu reden. Bei der normalen Dialogform, die durch hochgradige semantische Interrelationen charakterisiert ist, kann man ebenfalls zwei polare Grundmuster annehmen, den konfliktorientierten und den »Konsensdialog«.48 Im Konsensdialog zielen die illokutiven Akte der Dialogpartner darauf ab, sich gegenseitig ihrer übereinstimmenden Meinung in der zur Rede stehenden Sache zu versichern. Im konfliktorientierten Dialog dagegen sind die illokutiven Akte darauf gerichtet, den Dialogpartner umzustimmen, zu überzeugen oder zu überreden. Zwischen diesen beiden polaren Idealtypen entfaltet sich eine Fülle möglicher Interrelationen, die kategorisieren zu wollen ein sinnloses Unterfangen wäre. Allenfalls ein dritter Typus wäre zu nennen, der ungefähr auf der Mitte zwischen den beiden erstgenannten anzusiedeln ist und der hier Verständigungsdialog genannt sei: Die Dialogpartner tauschen Informationen und/oder Argumente aus, »erklären« einander (vgl. die klassische Liebeserklärung) und erreichen oder erhöhen damit gegenseitiges Verstehen oder Konsens in einer Sache. In beiden Fällen entsteht eine Situation, die gemeinsame Aktionen begründen kann. Dialog und Kadrierung Für die filmische Präsentation von Dialogen ist die Frage der Kadrierung naheliegenderweise von maßgeblicher Bedeutung: Mit ihr setzt der filmische Erzähler Akzente, richtet die Aufmerksamkeit des Rezipienten aus. Die weiter oben untersuchten Funktionen von Aufnahmedistanz, Standort, Perspektive und Kamerabewegungen für die Darstellung sozialer Interaktionssituationen kommen hier zum Tragen (vgl. Kap. II), wobei in diesem Zusammenhang insbesondere an die Bemerkungen über die integrierende Kraft großer und die isolierende Kraft kleiner Aufnahmedistanzen (S. 67-69) sowie über die unter Umständen 'trennende' Wirkung des Schuß-Gegenschuß-Verfahrens in Dialogsituationen (S. 69) erinnert sei. Darüber hinaus ist hier auf die Möglichkeiten der Akzentsetzung hinzuweisen, die die Kamera mit der Entscheidung darüber hat, ob sie die redende oder die zuhörende(n) Figur(en) kadriert: Im ersten Fall konzentriert sie die Aufmerksamkeit des Zuschauers ganz auf die sprechende Figur, gibt ihrer Rede volles Gewicht; im zweiten Fall lenkt sie die Aufmerksamkeit des Zuschauers auf die Wirkungen dieser Rede, indem sie die nonverbalen Reaktionen des Dialogpartners verzeichnet, verlagert damit also den Akzent deutlich. Für die Organisation der Perspektivenstruktur von Filmen sind diese beiden Grundmuster der Kadrierung von einiger Bedeutung (vgl. Kap. VI).
48 Ebd. 206.
228
Kapitel V: Dramatische Informationsvergabe
B. Nonverbale Informationsvergabe Die äußere Erscheinung der Figuren (Physiognomie, Statur, Maske, Kostüm usw.), vor allem aber ihr paralinguistisches und körpersprachliches Verhalten konstituieren ein neben der sprachlichen Informationsvergabe beständig präsentes und aktualisiertes Zeichenrepertoire, dessen Bedeutung für sämtliche darstellende Künste, für Sprechtheater und Film zumal, kaum überschätzt werden kann. Seit Béla Balázs den Film als die 'Wiederkehr des sichtbaren Menschen' und die Großaufnahme des menschlichen Gesichts gar als Eroberung einer 'neuen Dimension' gefeiert hatte,49 wurde und wird die (vor allem gegenüber dem Theater betonte) Fähigkeit des Films, nonverbale, insbesondere mimische Artikulationsweisen, präzise zu registrieren, immer wieder hervorgehoben, ist die Einsicht in die hohe Relevanz nonverbaler Zeichen für die filmische Informationsvergabe ein filmtheoretischer Gemeinplatz. Der aber zeitigte in der filmwissenschaftlichen Reflexion bislang keine Folgen: Anders als in der Theaterwissenschaft, wo bereits Ansätze zu einer systematischen Reflexion der nonverbalen Kommunikation auf der Bühne vorliegen,50 ist das nonverbale Zeichenrepertoire, das Schauspieler bewußt oder unbewußt aktivieren, als filmwissenschaftliches Problem noch nicht zusammenhängend diskutiert worden. Die neuerdings häufiger formulierten Forderungen nach einer nonverbale Enkodierungsprozesse berücksichtigenden Medienforschung sind deshalb sehr begrüßenswert.51 Sie beruhen allerdings durchweg auf einem wenig gerechtfertigten Erkenntnisoptimismus: Die Vorstellung, wonach Ergebnisse der mit nonverbalen Kommunikationsprozessen befaßten Disziplinen ohne Einschränkungen in die praktische Filmanalyse »einzubringen« sind,52 beruht auf einer generellen Überschätzung nicht nur der Ergebnisse dieser Disziplinen selbst, sondern auch ihrer Operationalisierbarkeit für die Filmanalyse. Die Frage, welche Perspektiven Ergebnisse der Psychologie und Humanethologie der Filmwissenschaft für die Analyse nonverbaler Zeichenprozesse im Film eröffnen, wird hier daher im Mittelpunkt der Überlegungen stehen.
1. Zur Analyse transitorischer nonverbaler Zeichen Im weiteren wird unterschieden zwischen transitorischen und nicht-transitorischen nonverbalen Zeichen. Im ersten Fall handelt es sich um nonverbale 49 BALAZS 1 9 8 0 , 5 2 f . 50 V g l . FISCHER-LICHTE 1983.
51 Vgl. Z.B. BENTELE/HESS-LÜTTICH 1985, VIII-X, 85, 313 u. pass. 52 GRAF 1 9 8 5 , 7 3 .
Kapitel V: Dramatische Informationsvergabe
229
kommunikative Zeichen im eigentlichen Sinne, um phonetische und kinesische Akte, die im Kommunikationsprozeß bewußt oder unbewußt vollzogen werden und bewußt oder unbewußt als aktuelle, auf die Situation bezogene Zeichen rezipiert werden, nämlich um paralinguistische und kinesische (mimische, gestische, proxemische) Zeichen. Im zweiten Fall handelt es sich nicht um aktuell produzierte, im Prozeß der Kommunikation auch nicht spontan veränderbare Zeichen, sondern um unveränderliche bzw. länger andauernde, nämlich um angeborene bzw. habitualisierte Merkmale von Menschen (Stimme, Physiognomie, Körpergröße, -umfang, -form, Gang usw.) oder um Merkmale ihrer äußeren Aufmachung (Maske, Kostüm usw.). 53 Merkmale dieser Art können in der Interaktion durchaus eine zeichenähnliche Funktion übernehmen, weil wir dazu neigen, äußere Körper- und Erscheinungsmerkmale von Menschen als Indices für Charakter, Mentalität, Temperament etc. zu rezipieren. Für die darstellenden Künste spielen sie eine nicht zu unterschätzende Rolle, haben deshalb auch, beim Film zumal, für die Besetzung einige Bedeutung (vgl. Kap. B.2). 1.1 Grundprobleme der Erfassung und Deutung nonverbaler Zeichen Eine historisch-hermeneutisch orientierte Filmwissenschaft wird sich allererst für die Frage zu interessieren haben, wie die auf nonverbalen Kommunikationsakten beruhenden Verstehensprozesse und damit die aus ihnen abgeleiteten Interpretamente kontrolliert werden können, das heißt: wie nonverbale Zeichen erfaßt, beschrieben und die ihnen zugeordneten Bedeutungen begründet werden können. Die Erfassung nonverbaler Zeichen in der Filmanalyse hat zwei Grundprobleme, zum einen den Umstand, daß viele nonverbale Zeichen unwillkürlich enkodiert und nicht bewußt und zudem selektiv dekodiert werden, zum anderen den Umstand, daß die Grenze zwischen zeichenhaftem und nicht-zeichenhaftem Körperverhalten häufig schwer zu ziehen ist. Die Deutung nonverbaler Zeichen in der Filmanalyse steht der Schwierigkeit gegenüber, daß nonverbale Zeichen zum überwiegenden Teil hochgradig mehrdeutig, daher in den meisten Fällen extrem kontextabhängig sind. 54 Diese drei Grundprobleme sind hier zunächst kurz zu skizzieren, bevor die Frage erörtert wird, inwieweit die nonverbale Kommunikationsforschung Möglichkeiten 53 Ich übernehme die Begriffe von FISCHER-LICHTE 1983, Bd. 1, 39, die die Unterscheidung freilich nur mit Bezug auf paralinguistische Phänomene vorsieht. 54 V g l . BIRDWHISTELL 1 9 7 9 , 196; FISCHER-LICHTE 1 9 8 3 , B d . 1, 3 8 u . ö . - T r a n s i t o r i s c h e
nonverbale Zeichen sind deshalb auch in vielen Fällen »negoziabel«, wie Kommunikationsforscher (wenig glücklich) die Möglichkeit des Senders eines nonverbalen Zeichens nennen, eine vom Empfänger verbalisierte Deutung dieses Zeichens abzustreiten (vgl. SCHERER 1979a, 21).
230
Kapitel V: Dramatische Informationsvergabe
ihrer Lösung eröffnet. Probleme der Beschreibung nonverbaler Zeichen werden abschließend zu erörtern sein (Kap. 1.6). Unwillkürliche Enkodierung und unbewußte Dekodierung nonverbaler Zeichen Nonverbale Zeichen regulieren menschliche Interaktion, »ohne an die Sprache und die bewußten psychischen Vorgänge gebunden zu sein.«55 In alltäglichen Kommunikationssituationen reagieren wir beständig auf nonverbale Zeichen, sind uns aber oft nicht darüber klar, worauf wir eigentlich reagieren: Wenn wir uns von Dominanzgebärden eingeschüchtert oder herausgefordert, durch eine »kalte Schulter« abgewiesen, durch »offene Arme« akzeptiert fühlen, sind wir uns häufig nicht bewußt, woher diese Gefühle stammen, neigen eher dazu, sie auf den Inhalt verbaler Äußerungen des Kommunikationspartners zurückzuführen als auf nonverbale Zeichen. Hinzu kommt, daß wir nonverbale Zeichen nur selektiv rezipieren. Das liegt u.a. daran, daß die meisten nonverbalen Zeichen permanent erzeugt werden: Wir senden ununterbrochen nonverbale Informationen, und da die Rezeption dieser Informationen als kommunikativer Akte nicht vom Willen des Senders abhängt,56 kommen sämtliche Varianten und Nuancen des Körperverhaltens als potentielle kommunikative Zeichen in Betracht. Damit aber ist unsere Empfangskapazität offenbar überfordert: Sie reicht im allgemeinen »nicht dazu aus, alles nonverbale Verhalten als Kommunikation zu interpretieren«.57 Wir konzentrieren uns daher meistens (ebenfalls unbewußt) auf bestimmte Zeichenarten und Körperregionen (s.u.). Das heißt: Nicht nur die Enkodierung, sondern auch und vor allem die Dekodierung nonverbaler Zeichen entzieht sich in alltäglichen Kommunikationssituationen zu erheblichen Teilen der bewußten Kontrolle. Bei der Rezeption dargestellter nonverbaler Kommunikationsprozesse in Theater oder Film ist die Situation nur graduell verändert: Der Rezipient ist hier nicht Partner, sondern Beobachter nonverbaler Kommunikationsprozesse; da er also (im inneren Kommunikationssystem) nicht Adressat der nonverbalen Zeichen ist, folglich auch die Senderrolle übernehmen und planen zu müssen nicht in Verlegenheit kommt, ist er nicht unmittelbar in diese Kommunikationsprozesse involviert. Die dadurch gewonnene Distanz eröffnet die Möglichkeit einer bewußteren Rezeption nonverbaler Zeichen, die sich freilich auf die dem Bewußtsein verfügbaren Zeichen beschränkt: Empirische Untersuchungen haben ergeben, daß sich die eben erwähnte selektive Wahrnehmung visueller nonverbaler Zeichen vornehmlich auf die Mimik des Kommunikationspartners konzentriert: Es ist der Gesichtsausdruck, dessen Zeichenreper55 SCHEFLEN 1 9 7 6 , 11. 56 V g l . NÖTH 1 9 8 5 , 3 2 6 . 5V
Ebd.
Kapitel V: Dramatische ¡nformationsvergabe 231 toire der Selbstkontrolle wie der wechselseitigen Kontrolle der Kommunikationspartner am stärksten unterworfen wird, während Selbst- und Fremdkontrolle gestischer oder proxemischer Zeichen deutlich schwächer realisiert werden. 58 Das dürfte damit zusammenhängen, daß der Gesichtsausdruck der wichtigste nonverbale Kommunikator primärer Affekte 59 ist, deren (spontane oder gestellte) Enkodierung und Dekodierung naheliegenderweise zentrale Bedeutung für menschliche Interaktion haben. 60 Daraus darf zwar füglich der Schluß abgeleitet werden, daß wir in der Dekodierung mimischer Zeichen die größte Übung haben, nicht aber, daß das gesamte »Lexikon« mimischer Zeichen unserem Bewußtsein verfügbar ist: »Die Aussage, daß das Gesicht zuverlässig über spontanes emotionales Verhalten informiert, ist am besten für die grobe Unterscheidung in positive und negative Gefühle gesichert«.61 Folglich wird man allenfalls sagen können, daß mimische Zeichen der Reflexion am ehesten zugänglich sind, während ein großer Teil der gestischen und proxemischen Zeichen dem Bewußtsein der sie produzierenden bzw. rezipierenden Subjekte normalerweise entzogen bleiben. Die Untersuchung nonverbaler Zeichenprozesse im Film stößt also schon auf einer sehr fundamentalen Ebene auf grundsätzliche Schwierigkeiten, setzt nämlich voraus, daß die bewußte Wahrnehmung nonverbaler Zeichen zu großen Teilen überhaupt erst eingeübt werden muß.
Zeichenhaftes und nicht-zeichenhafies Körperverhalten Eine zweite grundsätzliche Schwierigkeit ergibt sich aus dem Umstand, daß die Frage, was nonverbale Zeichen eigentlich sind, unter welchen Voraussetzungen nichtsprachliche menschliche Verhaltensweisen als kommunikative Akte zu definieren sind, keineswegs geklärt ist, auch nicht in der nonverbalen Kommunikationsforschung. Wenn z.B. jemand während einer Unterhaltung die Augen mit den Händen bedeckt, dann kann das Reaktion auf einen zu starken Lichtreiz sein, es kann aber auch ein nonverbales Zeichen sein, das Verhaltenspsychologen den sog. »Selbst-Adaptoren« zurechnen 62 und das kundgibt, daß der Betreffende eigentlich nicht kommunizieren möchte oder
58 Vgl. EKMAN/FRŒSEN 1979, 119.
59 Dazu zählen nach EKM AN/FRIESEN/ELLSWORTH 1974, 145 Ärger/Zorn, Traurigkeit, Glück, Ekel/Verachtung, Angst, Überraschung. 60 Vgl. ebd. u . ö . ; EKMAN 1979, 52. 61 EKM AN/FRIES EN/ELLSWORTH 1974, 144.
62 Vgl. EKMAN/FRŒSEN 1979, 115-117. - Adaptoren sind »Bewegungen, die anfänglich gelernt wurden, um selbstbezogene oder körperbezogene Bedürfhisse zu befriedigen« wie z.B. Kratzen (115). In der Privatsphäre werden sie vollständig, in der Öffentlichkeit dagegen »reduziert oder fragmentarisch durchgeführt« (ebd.) und gewinnen dabei den Status unbewußter nonverbaler Zeichen (vgl. ebd. 116).
232
Kapitel V: Dramatische Informationsvergabe
daß er sich schämt. 63 Und es kann sich dabei schließlich auch um eine Verbindung zwischen beiden handeln, etwa indem ein Lichtreiz als Vorwand benutzt wird, der den Zeichencharakter der Handbewegung kaschiert. Wenn jemand einer manuellen Tätigkeit nachgeht, beispielsweise einen Stuhl repariert, dann ist das kein nonverbales Zeichen, sondern eine objektbezogene Handlung. Es kann aber zum nonverbalen Zeichen werden, etwa wenn der Betreffende seine Arbeit während eines Gesprächs fortsetzt oder wieder aufnimmt und damit u.U. signalisiert, daß er sich nicht oder nicht mehr unterhalten möchte. Die Definition nonverbaler Zeichen macht also Schwierigkeiten, eben weil viele Körperbewegungen sowohl nicht-kommunikatives als auch kommunikatives Handeln und häufig nicht nur das eine oder das andere, sondern auch beides zugleich sein können. Unter nonverbaler Kommunikation wird »eigentlich nur eine Ansammlung von Verhaltensweisen verstanden (...), die u.U. kommunikative Funktionen übernehmen können«: Das ist der wenig ermutigende Schluß der nonverbalen Kommunikationsforschung.64 Er zeigt an, daß die Entscheidung darüber, ob eine Verhaltensweise als Zeichen, als kommunikativer Akt aufzufassen ist, zumeist nur im Rekurs auf den Kontext der jeweiligen Situation getroffen werden kann. Bei dargestellten menschlichen Verhaltensweisen im Film hat man es nur in bestimmten Fällen und auch dort nur graduell leichter, dann nämlich, wenn die Kamera nonverbales Verhalten ausdrücklich als Zeichen markiert, etwa indem sie einen Gesichtsausdruck, eine Gebärde, eine zitternde Hand usw. in Großaufnahmen isolierend kadriert. Das setzt aber nicht nur voraus, daß die nonverbale Enkodierung zwischen Kameramann und Schauspieler verabredet, also bewußt inszeniert wird, sondern auch, daß sie kameratechnisch überhaupt isoliert werden kann, d.h. einen so geringen Raum einnimmt, daß die Kamera sie deutlich isolieren und die Kadrierung damit als hinweisender Gestus des filmischen Erzählers rezipiert werden kann. Diese Voraussetzungen aber sind keineswegs regelmäßig gegeben: Zum einen können raumgreifende gestische und erst recht proxemische Zeichen kameratechnisch kaum markiert werden. Zum anderen sind viele nonverbale Zeichen nicht Ergebnis bewußter Inszenierung und bewußter schauspielerischer Darstellung, sondern Ergebnis schauspielerischer Intuition, das nicht Gegenstand der Planung und Verabredung zwischen Schauspieler, Regisseur und Kameramann werden kann. Hilfestellungen für die Erfassung nonverbaler Zeichen im Spielfilm sind von der Kameraarbeit also nicht regelmäßig zu erwarten, so daß die Filmanalyse im Prinzip vor denselben Definitionsproblemen steht wie die Verhaltenswissenschaften selbst. Wenn aber das, was einen (realen oder dargestellten) Verhal« E b d . 116. 64 SCHERER/WALLBOTT 1 9 7 9 , 13.
Kapitel V: Dramatische Informationsvergabe
233
tensakt zu einem kommunikativen Akt, zu einem Zeichen macht, in vielen Fällen nicht an ihm selbst zu verifizieren ist, vielmehr aus der Situation erschlossen werden muß, in der er vollzogen wird, dann heißt das, daß nicht erst die Deutung, sondern schon die Erfassung nonverbaler Zeichen im Film zu wesentlichen Teilen auf Interpretationsprozessen beruht. Das Problem eines kontrollierten Umgangs mit der nonverbalen Informationsvergabe im Film stellt sich demnach schon bei der bloßen Registratur nonverbaler Zeichen, die folglich zwei Grundschwierigkeiten zu überwinden hätte: Weil erstens viele nonverbale Zeichen unbewußt und selektiv rezipiert werden, ist die Möglichkeit beständig präsent, daß sie bei der Filmanalyse gar nicht erst erfaßt werden und ihr Einfluß auf die Filminterpretion daher nicht kontrolliert werden kann. Es bedarf demnach einer gezielten Einübung in die bewußte Wahrnehmung nonverbaler Akte. Und weil zweitens die Identifikation nonverbaler Verhaltensweisen als kommunikativer Akte in vielen Fällen kontextbedingt ist, setzt sie Verstehensakte voraus, die der Selbst- und Fremdkontrolle zugänglich zu machen wären. Wie dies geschieht, hängt davon ab, wie das Verstehensproblem selbst gelöst wird. Die Mehrdeutigkeit nonverbaler Zeichen Die Beziehungen zwischen Signifikant und Signifikat sind bei den meisten nonverbalen Zeichen hochgradig instabil. Es gibt zwar eine Reihe von Zeichen, deren Bedeutungen relativ fest konventionalisiert sind (z.B. akustische und kinesische Betonungszeichen, Kopfnicken, Kopfschütteln, Achselzucken, eine Reihe expressiver mimischer Zeichen u.a.), in den meisten Fällen aber kann ein und dasselbe nonverbale Zeichen verschiedene Bedeutungen haben, eben weil es hier keine feste Verkoppelung zwischen Signifikant und Signifikat gibt: Die Bedeutung erschließt sich noch nicht aus dem Zeichen selbst, sondern erst aus dem Kontext, in dem es erscheint, aus dem Kontext nämlich erstens aller übrigen, gleichzeitig produzierten verbalen und nonverbalen Zeichen und zweitens der Interaktionssituation selbst. Wenn sich aber »Funktionen und Bedeutungen des Bewegungsverhaltens nicht im System, sondern nur im kinemischen Text (manifestieren)« und also bei den meisten nonverbalen Zeichen »feste Zuordnungsbeziehungen zwischen den Einheiten der Ausdrucks· und der Inhaltsform« fehlen,65 dann heißt das auch, daß es kein Lexikon nonverbaler Zeichen geben kann.66 Disziplinen wie Theater- oder Filmwissenschaft stehen unter diesen Voraussetzungen vor erheblichen Problemen bei dem Versuch, Interpretationen, die auf dem Verstehen paralinguistischer und kinesischer Zeichen beruhen, zu objektivieren. Nichts liegt daher näher 65 NÖTH 1 9 8 5 , 3 5 9 .
66 Vgl ebd.
234
Kapitel V: Dramatische Informatiortsvergabe
als die Frage, ob die mit nonverbalen Kommunikationsprozessen befaßten Disziplinen Ergebnisse bereitstellen, die für Theater- oder Filmanalyse operationalisiert werden können. 1.2 Verhaltenswissenschaftliche Forschungen zur nonverbalen Kommunikation: Ein Überblick In der neueren Forschung zur nonverbalen Kommunikation konstatiert Klaus R. Scherer ein »Schisma« zwischen zwei Forschungsrichtungen, die von zwei Strömungen der amerikanischen Verhaltenswissenschaften geprägt sind, nämlich eine »linguistisch-anthropologisch« und eine »ethologisch-psychologisch« orientierte Richtung, die freilich beide bisher noch keine »ernstzunehmende(n) theoretische(n) Ansätze hervorzubringen vermocht« haben. 67 Die erste Richtung verbindet sich mit dem Begriff »Kinesik« und dem Namen ihres Hauptvertreters, Ray L. Birdwhistell. 68 Die zweite, den weitaus größten Teil der nonverbalen Kommunikationsforschung repräsentierende Richtung steht in der Tradition einerseits der Ausdrucks- und Verhaltenspsychologie, andererseits der Humanethologie und verbindet sich allererst mit den Forschungen Paul Ekmans und seiner Mitarbeiter zur Mimik und Gestik69 sowie mit den Arbeiten des »Entdeckers« der Proxemik, Edward T. Hall, und den an ihn anschließenden Untersuchungen, insbesondere von Michael O. Watson und Erving Goffman. 70 Zwischen beiden Hauptrichtungen kann man Arbeiten ansiedeln, die sich der ebenfalls linguistisch inspirierten »Kontextanalyse« zurechnen, dabei aber nicht eigentlich strukturalistisch, sondern empirisch-psychologisch arbeiten. Linguistisch inspirierte Ansätze: Kinesik Die Einsicht, daß es bei den meisten nonverbalen Zeichen keine festen Zuordnungsbeziehungen zwischen Ausdruck und Inhalt gibt, ist ein Basistheorem der Kinesik. Um so erstaunlicher ist daher, daß die Kinesik Theorien und Methoden der strukturalen Linguistik adaptiert und damit von der Hypothese einer strukturellen Analogie zwischen nonverbalen und verbalen Zeichensystemen ausgeht: 71 Birdwhistell, der die Kontextabhängigkeit nonverbaler Informationen selbst so nachdrücklich betont, 72 meint gleichwohl in der Kinesik 67 SCHERER/WALLBOTT 1979, 12f. 68 Vgl. BIRDWHISTELL 1970; 1979 und die bei NÖTH 1985, 360f. verzeichnete Literatur. 69 Vgl. EKMAN/FR1ESEN/ELLSWORTH 1974; EKMAN/FRIESEN 1975; 1979; EKMAN 1979. 70 HALL 1959; 1966; WATSON 1970; GOFFMAN 1971; 1986. 71 Vgl. BIRDWHISTELL 1952; 1970; 1979 und den Überblick über diesen Forschungszweig bei NÖTH 1985, 354-361. 72 Vgl. BIRDWHISTELL 1979, 196.
Kapitel V; Dramatische Informationsvergabe
235
Elemente isolieren zu können, die den Phonen, Phonemen, Morphemen, Lexemen und Sätzen der Sprache entsprechen, die er denn auch analog Kine, Kinem, Kinemorph/Kinemorphem, »komplexes Kinemorph« (d.i. das nonverbale Äquivalent des Lexems) und »komplexes kinemorphisches Gebilde« (d.i. das nonverbale Äquivalent des Satzes) nennt und für die er ein linguistischen Beschreibungstechniken nachempfundenes Notationsverfahren entwickelt hat.73 Er unterstellt kinesischen Zeichen folglich nicht nur eine doppelte Gliederung, sondern impliziert damit zugleich, was er explizit abstreitet, nämlich daß es feste Zuordnungsbeziehungen zwischen Zeichen und Bedeutung gibt, denn die Erkenntnis bedeutungsdifferenzierender (Kineme) und bedeutungstragender Einheiten (Kinemorpheme) setzt solche festen Zuordnungsbeziehungen voraus. Wenn es sie aber nicht gibt, dann sind Birdwhistells Minimalpaare auch keine »signifikanten Minimaleinheiten«, wie Nöth zutreffend feststellt,74 begründen kein »kinelogisches« (kinematisches) oder »kinemorphologisches« Inventar, sondern sind am Ende bloß bewegungstechnische Minimaleinheiten. Wenn etwa das Heben und Senken der Augenbrauen je nach Kontext Zeichen des Zweifeins, des Nicht-Verstehens, der Überraschung oder der Betonung (von gleichzeitig Gesprochenem) sein kann,75 dann kann es zweifellos nicht den Status eines Kinems oder Kinemorphems haben, weil ihm der Opponent fehlt, der seinen systembegründenden Status - als bedeutungsunterscheidendes bzw. bedeutungstragendes Zeichen - fundiert, mit anderen Worten: Aus mehrdeutigen Zeichen können schlechterdings keine »kinelogischen« oder »kinemorphologischen« Minimalpaare gebildet werden. Ansatz und Methoden der Kinesik sind denn auch - gerade auch innerhalb der semiotischen Forschung - umstritten:76 »Zweifel an der Möglichkeit der Erstellung eines endlichen Kineminventars verbinden sich mit Zweifeln an der strukturalistischen Segmentierbarkeit kinesischen Verhaltens«.77 Nur über den heuristischen Nutzen der Arbeiten Birdwhistells scheint Einigkeit zu bestehen.78 Dies und der Umstand, daß die Kinesik noch keine operationalisierbaren Ergebnisse vorweisen kann, macht sie als potentielle Rekursinstanz für die Lösung diesbezüglicher Probleme der Filmwissenschaft untauglich. Semantisch-kontextanalytische Ansätze Zwischen der Kinesik und der »ethologisch-psychologisch« orientierten Kommunikationsforschung stehen Arbeiten der Verhaltenspsychologie, die zwar 73 Vgl. ebd. 198. 74 Nöth 1985, 332 (Hervorheb. im Text). 75 Vgl. BIRDWHISTELL 1979, 199f. 7 6 Vgl. N Ö T H 1985, 359f. 77 Ebd. 359. 78 Vgl. ebd. 360.
236
Kapitel V: Dramaäsche Informationsvergabe
von Verfahren der Kinesik beeinflußt zu sein angeben und sich der linguistisch inspirierten »Kontextanalyse« zurechnen, dabei aber empirisch-psychologisch arbeiten und allererst an positiven Aussagen über Bedeutungen nonverbaler Zeichen interessiert sind, nicht an der Begründung eines kinesischen Systems, und dies nicht zuletzt auch deshalb, weil es ihnen dabei immer auch schon um Fragen der praktischen Verwendbarkeit ihrer Ergebnisse in der Psychotherapie geht. 79 Sie beruhen auf experimentellen Untersuchungen, bei denen nonverbale Vorgänge in echten oder gestellten Kommunikationssituationen detailliert beobachtet und beschrieben werden mit dem Ziel, ihre Bedeutungen aus dem wechselnden Kontext abzuleiten. Wo dabei allerdings allein das sprachliche Verhalten der Versuchspersonen als Kontext figuriert, läuft diese Methode zweifellos Gefahr, verbale Aussagen auf nonverbale Verhaltensweisen zu übertragen und etwa potentielle Widersprüche zwischen verbalem und nonverbalem Verhalten gar nicht erst zu erfassen. 80 Wiederkehrende nonverbale Verhaltensmuster in bestimmten Kommunikationssituationen sind das maßgebliche Kriterium anderer, im weitesten Sinne ebenfalls kontextanalytisch orientierter Arbeiten, die dieselben Methoden verwenden (vergleichende, auf Beobachtungen der Autoren selbst gestützte Analyse ähnlicher Kommunikationssituationen), sich jedoch nicht mit zeichentheoretischen Fragestellungen befassen.81 Dabei geht es vorwiegend um gestische und proxemische, weniger um mimische Zeichen. Serien vergleichbarer Kommunikationssituationen werden untersucht mit dem Ziel, wiederkehrende nonverbale Verhaltensweisen herauszufiltem, sie auf den Gesamtkontext der verbalen und nonverbalen Kommunikation (also nicht nur auf den Inhalt verbaler Äußerungen) zu beziehen und daraus Rückschlüssé auf ihre interaktionalen Funktionen zu ziehen: Wo sich beispielsweise herausstellte, daß Personen, die sich im kommunikativen Gesamtkontext als dominante Personen erwiesen (z.B. dadurch, daß sie die Gesprächsführung übernahmen, Sanktionen erteilten usw.), mit einiger Regelmäßigkeit Plätze wählten, »von denen aus
79 V g l . Z.B. SCHEFLEN 1 9 7 3 ; 1 9 7 9 .
80 Wenn z.B. SCHEFLEN 1979 Bedeutungen des nonverbalen Verhaltens von Therapeuten und Klienten in psychotherapeutischen Sitzungen geradenwegs aus dem verbalen Verhalten beider ableitet, dann erreicht er damit nicht eigentlich Zuordnungen von nonverbalen Zeichen und Bedeutungen, sondern von nonverbalen Zeichen und Sprachverhalten. Der Geltungsanspruch seiner Ergebnisse kann sich denn auch allenfalls auf den Umstand stützen, daß nicht nur eine, sondern mehrere therapeutische Sitzungen auf diese Weise untersucht wurden und dabei festgestellt werden konnte, daß die ethologischen »Grundkonfigurationen verblüffend ähnlich sind« (ebd. ISS), was die Unterstellung eines engen Zusammenhangs zwischen den jeweiligen Bedeutungen verbalen und nonverbalen Verhaltens allerdings nur fur diese spezifische Kommunikationssituation - einigermaßen legitimiert. 81 Vgl. etwa die Arbeiten von ARGYLE 1972; SCHEFLEN 1976; KENDON 1979.
Kapitel V: Dramatische Informationsvergabe
237
sie sich an den größten Teil der Versammlung wenden können«, 82 konnte mit einiger Zuverlässigkeit als erwiesen gelten, was allgemeinen Erfahrungssätzen entspricht, nämlich daß Platzwahl und soziale Dominanz bzw. Unterlegenheit signifikant korrelieren, Platzwahl also Ausdruck der Rangordnung in einer Gruppe sein kann. Auf diese Weise konnten einige typische kontextuelle Grundmuster insbesondere proxemischen Verhaltens identifiziert werden. 8 3
Semantische Ansätze: Ethologisch-psychologische Forschungen Der größte Teil der nonverbalen Kommunikationsforschung konzentriert sich auf den Akt der Dekodierung nonverbaler Zeichen selbst: Hier werden die Bedeutungszuordnungen nämlich nicht von den Forschern selbst durchgeführt, sondern von Versuchspersonen erfragt, wobei es bislang allererst um mimische und einige gestische, kaum dagegen um proxemische Zeichen gegangen ist. Die angewandten Methoden zeigen durchweg dasselbe Grundprinzip: Einer mehr oder weniger großen Gruppe von Versuchspersonen werden Fotos oder Videofilme echter oder gestellter Kommunikationssituationen vorgelegt (gelegentlich auch - durch eine Einwegscheibe - zur aktuellen Beobachtung vorgeführt) mit dem Auftrag, nonverbale Zeichen entweder nach vorgegebenen Kategorien oder mit eigenen Worten semantisch zu bewerten. Diese Bewertungen werden dann quantitativ-statistisch verarbeitet, wobei die Geltung der Bedeutungszuordnungen naheliegenderweise um so höher veranschlagt wird, je höher der Prozentsatz der übereinstimmenden Bewertungen ausfällt. 84 Hohe Übereinstimmungen der Dekodierungsleistungen wurden insbesondere bei relativ kontextunabhängigen und daher semantisch recht eindeutigen mimischen Zeichen, nämlich im Bereich der mimischen Enkodierung primärer Affekte festgestellt und lieferten die Legitimation für Versuche, eine Art Minimallexikon mimischer Zeichen zu entwerfen: 8 5 Bei der Dekodierung mimischer Zeichen für Ärger, Traurigkeit, Glück und Ekel/Verachtung entstehen hohe, bei der Dekodierung von Überraschung und Angst relativ hohe Übereinstimmungen. 8 6 Ähnliche Untersuchungen gibt es für eini-
82 KENDON 1 9 7 9 , 2 1 1 .
83 Vgl. etwa die Darstellung der wichtigsten proxemischen Verhaltensmuster (z.B. Affiliation, Dominanz- bzw. Submissionsverhalten, Territorialverhalten u.a.) in typischen Interaktionssituationen bei SCHEFLEN 1 9 7 6 und KENDON 1979.
M Vgl. z.B. die methodischen Konzepte von EKMAN/FRŒSEN/ELLSWORTH 1974; EKMAN/FRŒSEN 1975; EKMAN/ FRIESEN 1979 (wo nicht nur die Dekodierung, sondern z.T.
auch die Enkodierung von Versuchspersonen durchgeführt wurde, vgl. 117f.); MEHRABIAN/FRIAR 1979; BUGENTAL/KASWAN/LOVE 1979. - Vergleichbare Verfahren werden auch in der Paralinguistik angewandt (vgl. z.B. HEKE 1969). 85 V g l . EKMAN/FRIESEN/ELLSWORTH 1 9 7 4 ; EKMAN/FRIESEN 1975. 86 V g l . EKMAN/FRŒSEN/ELLSWORTH 1 9 7 4 , 145.
238
Kapitel V.· Dramatische Informationsvergabe
ge gestische Zeichen, 87 doch ist die Forschung begreiflicherweise von einer auch nur überblickshaften Erfassung semantischer Aspekte des gesamten Inventars nonverbaler Zeichen - gesetzt den Fall, es sei endlich - noch weit entfernt. Vor allem sind komplexere Enkodierungsprozesse, insbesondere Ausdrucksformen, die Gefühlsmischungen anzeigen, noch kaum geklärt. Eine Beurteilung und Bewertung dieser Methode setzt nicht nur die Kenntnis des jeweils benutzten Testmaterials, der Vorgaben an die Versuchspersonen und der praktischen Durchführung voraus, sondern auch und vor allem die intime Kenntnis der Verfahren der empirischen Psychologie und der Statistik, ist also von Fachfremden gar nicht zu leisten. Geht man davon aus, daß das entscheidende Kriterium der Bedeutungszuordnungen, der Übereinstimmungsgrad, methodisch sorgfältig abgesichert wurde, so daß ausgeschlossen werden kann, daß übereinstimmende Dekodierungsleistungen sekundär durch Vorgaben und/oder praktische Versuchsanordnung - Zustandekommen, dann liefern diese Arbeiten zwar keine positiven Ergebnisse darüber, ob die dekodierten Bedeutungen vom Enkodierer tatsächlich bewußt oder unbewußt »gemeint« waren, geben aber einige Aufschlüsse darüber, welche Zeichen wie verstanden werden. Und da dieses Verstehen in der alltäglichen Kommunikation gelernt, also vielfältig erprobt wurde und im Alltag immer neu auf seine Funktionstüchtigkeit für eine gelingende Kommunikation überprüft wird, ist anzunehmen, daß es eine hohe Affinität zwischen enkodierter und dekodierter Bedeutung gibt. Von besonderem Interesse sind die im Zuge dieser wie auch im Rahmen humanethologischer Forschungen gewonnenen Ergebnisse zur Frage der Kulturabhängigkeit nonverbaler Zeichen.88 Ein großer Teil nonverbaler Zeichen scheint demnach kulturabhängig zu sein, doch gibt es offenbar auch eine nicht geringe Anzahl universaler, in allen Kulturen gleichartig entwickelter und semantisch identischer Zeichen. Dazu gehören wiederum vor allem mimische Anzeiger primärer Affekte (s.o.): Bei ihnen sind es nicht, worauf besonders Ekman aufmerksam macht,89 die Zeichen selbst, die von Kultur zu Kultur variieren, sondern ihre Anwendungsregeln (vgl. etwa die unterschiedlichen Verhaltensregeln bei Bestattungen). 87 Vgl. z.B. Ekman/Friesens Bericht über Untersuchungen von Handbewegungen (EKMAN/ FRIESEN 1979).
88 Vgl. die Untersuchungen zur Frage der Universalität bzw. Kulturabhängigkeit nonverbaler Zeichen in der Verhaltenspsychologie (z.B. EFRON 1972; EKMAN 1979) und in der Humanethologie, vor allem die Arbeiten von Eibl-Eibesfeldt, der z.B. im GruBverhalten von Menschen unterschiedlichster kultureller und ethnischer Herkunft oder in der Mimik taubblind geborener Kinder Indizien für universale menschliche Verhaltensmuster gesammelt hat (EIBL-EIBESFELDT 1972, 452-540 und 1984; 1985). 89 V g l . EKMAN 1 9 7 9 .
Kapitel V: Dramatische Informationsvergabe
239
Formale und funktionale Klassifikationsversuche Die bisherigen Ergebnisse der nonverbalen Kommunikationsforschung schlagen sich in verschiedenen Versuchen nieder, nonverbale Zeichen nach formalen und/oder funktional-semantischen Kriterien zu klassifizieren und damit zugleich das Arbeitsfeld der nonverbalen Kommunikationsforschung und dies vor allem - ihre Begrifflichkeit zu fixieren. Diese Klassifikationsversuche sind, neben den eher spärlichen Einzelergebnissen zur Semantik nonverbaler Zeichen, die beim gegenwärtigen Stand der Forschung wertvollste Hilfestellung, die die Filmwissenschaft von der nonverbalen Kommunikationsforschung beziehen kann. Bevor sie zur Sprache kommen, ist zunächst zu begründen, warum sie hier als derzeit wichtigste Rekursinstanz filmwissenschaftlicher Problemlösungsversuche eingeschätzt werden. 1.3. Möglichkeiten der Operationalisierung verhaltenswissenschaftlicher Forschungsergebnisse für die Filmanalyse Der Überblick über die wichtigsten Ansätze der nonverbalen Kommunikationsforschung hat gezeigt, daß die Hoffnung, die Filmwissenschaft könne ihre Probleme der Erfassung und Deutung nonverbaler Zeichen im Rekurs auf die Ergebnisse der nonverbalen Kommunikationsforschung lösen, verfrüht ist. Das liegt nicht nur daran, daß die positiven Einzelergebnisse über Bedeutungen einzelner nonverbaler Zeichen eher spärlich ausfallen, sondern auch und vor allem an den Methoden, die der größte Teil der an semantischen Fragen interessierten Arbeiten, die »ethologisch-psychologisch* orientierte Forschung, bevorzugt. Denn der Versuch, die aus der statistischen Auswertung nonverbaler Dekodierungsleistungen bezogenen Ergebnisse für die Filmwissenschaft zu operationalisieren, führt in den allermeisten Fällen zu Zirkelschlüssen: Wenn diese Ergebnisse auf Verstehensakten von »native speakers«, Angehörigen derselben Kulturgemeinschaft, beruhen und als gesichert nur dort gelten dürfen, wo die Versuchspersonen signifikant übereinstimmend dekodierten, dann ist der Rekurs auf sie in der Filmwissenschaft eine methodische Tautologie, denn diese Ergebnisse besagen ja gerade, daß Angehörige derselben Kultur bei der Dekodierung der in Frage stehenden (signifikant übereinstimmend dekodierten) nonverbalen Zeichen mit höchster Wahrscheinlichkeit zu übereinstimmenden Deutungen kommen, vorausgesetzt, die Sender dieser nonverbalen Zeichen (z.B. die Schauspieler eines Films) gehören ebenfalls demselben Kulturkreis an. Es kann folglich mit guten Gründen vorausgesagt werden, daß Filminterpreten bei der Deutung dieser Zeichen genauso verfahren werden wie die Versuchspersonen, d.i. wie die meisten Angehörigen ihrer Kultur, und daß diese Zeichen von ihren Sendern dann auch sehr
240
Kapitel V: Dramarische Informationsvergabe
wahrscheinlich so gemeint sind, wie sie von der Mehrzahl ihrer Rezipienten verstanden werden. Das heißt: Mit Blick auf jene nonverbalen Zeichen, für die gesicherte Ergebnisse vorliegen, mit Blick also auf einfache, semantisch relativ eindeutige Zeichen (allererst auf die mimischen Anzeiger primärer Affekte), können die Verhaltenswissenschaften der Deutung nonverbaler Zeichen in der Filmwissenschaft eine Legitimation lediglich insofern verschaffen, als sie experimentell bestätigen, daß für das Verstehen dieser Zeichen bei normal sozialisierten Angehörigen derselben Kultur eine hohe Kompetenz vorausgesetzt werden darf. Wenn das aber so ist, dann ist der Versuch, das Verstehen dieser Zeichen im Rekurs auf diese experimentellen Ergebnisse jeweils neu begründen zu wollen, methodisch redundant.90 Bei Zeichen aber, über deren Bedeutung Zweifel entstehen, können auch die »ethologisch-psychologisch« arbeitenden Verhaltenswissenschaftler nicht weiterhelfen, weil sie in solchen Fällen des Versagens der nonverbalen Kompetenz selbst kapitulieren, aufgrund ihrer Methodik auch kapitulieren müssen, eben weil sie bei solchen Zeichen (vorausgesetzt, sie wurden schon untersucht) keine hohen Übereinstimmungsgrade erzielen, will sagen: Für die Interpretation jener mehrdeutigen, komplexen Zeichen, für die keine signifikanten Ergebnisse erreicht wurden und deshalb keine eindeutigen Bedeutungszuordnungen vorgenommen werden konnten,91 kann die ethologisch-psychologisch orientierte Kommunikationsforschung der Film- oder Theaterwissenschaft keine Hilfestellungen geben. Bei den kontextanalytisch orientierten Arbeiten, die sich nicht auf die Methode der statistischen Auswertung der Dekodierungsleistungen von Versuchspersonen, sondern auf die Methode der vergleichenden Beobachtung und Beschreibung vergleichbarer Kommunikationssituationen stützen, liegen die Dinge insofern anders, als sie sich vorzugsweise gerade mit diesen komplexeren nonverbalen, insbesondere gestischen und proxemischen Enkodierungs90 Wenn z.B. feststeht, daß bestimmte Bewegungen der Gesichtsmuskulatur mit hochsignifikanter Übereinstimmung als Zeichen fur »Glück« dekodiert werden, dann ist anzunehmen, daß auch Filminterpreten in entsprechenden Fällen zu demselben Ergebnis kommen. Der Aufwand, den sie fur eine Begründung dieser Deutung im Rekurs auf die Erkenntnisse der Verhaltenspsychologie treiben müßten, steht daher in keinem vernünftigen Verhältnis zum Ergebnis: Im Beispielfall etwa wäre zu prüfen, ob in den Gesichtern Brauen und Stirn sich in Grundstellung befinden, kleine Fältchen am unteren Augenrand und an den Augenwinkeln entstehen, Mundwinkel und Wangen hochgezogen sind, Falten von der Nase zu den Mundwinkeln laufen und ob der Mund eventuell geöffnet ist, so daß die Zähne sichtbar werden (vgl. die nach EKMAN/FRŒSEN 1975 zusammengestellte Synopse mimischer »Sets« für die primären Affekte bei FISCHER-LICHTE 1983, Bd. 1, 51). Das heißt, es wäre ein ungemein hoher Beschreibungsaufwand zu leisten für die Begründung einer Deutung, deren Zuverlässigkeit ohnedies mit hoher Wahrscheinlichkeit angenommen werden darf. 91 V g l . EKMAN/FRŒSEN/ELLSWORTH 1 9 7 4 , 5 4 , 1 4 4 f .
Kapitel V: Dramatische Informationsvergabe
241
prozessen befassen, bei denen die statistischen Methoden weitgehend versagen. Abgesehen davon, daß positive Ergebnisse hier bislang eher spärlich ausfallen, wäre aber auch hier die Erwartung verfehlt, die Ergebnisse seien wie ein Lexikon zu benutzen, das die Bedeutung nonverbaler Verhaltensweisen aufschlüsseln und damit als Rekursinstanz für die Begründung filmwissenschaftlicher Interpretamente fungieren könnte: Gerade weil es sich hier um größtenteils extrem kontextabhängige nonverbale Zeichen handelt, können diese Arbeiten bisher auch nur für bestimmte, typische kontextuelle Grundmuster (Grußverhalten, Territorialverhalten, Dominanz- vs. Submissionsverhalten u.a.) mit semantischen Zuordnungen aufwarten. Folglich können sie auch nur in diesen bestimmten Fällen als Rekursinstanz für die Begründung einzelner Interpretamente in Anspruch genommen werden. Das aber heißt: Die nonverbale Kommunikationsforschung ist ganz offensichtlich nicht der Zauberstab, der das Verstehensproblem nonverbaler Zeichen für die Filmwissenschaft mit einem Streich lösen könnte. Wo es um jene einfachen, relativ kontextunabhängigen und daher recht eindeutigen Zeichen geht, die von Versuchspersonen mit hochsignifikanten Übereinstimmungen dekodiert wurden, erübrigt sich der Rekurs auf die Verhaltenswissenschaften aus den oben genannten Gründen. Und wo es um komplexe, mehrdeutige und daher hochgradig kontextabhängige nonverbale Enkodierungsprozesse geht, kann die Filmwissenschaft hinsichtlich einiger typischer kontextueller Grundmuster zwar auf Ergebnisse der Verhaltenswissenschaften rekurrieren, in allen anderen und also in den meisten Fällen aber bleibt ihr gar nichts anderes übrig als sich auf die Tugenden der hermeneutischen Reflexion zu besinnen, das Verstehen nonverbaler Zeichen in präzisen Rekursen auf ihre Kontexte zu begründen, den hermeneutischen Zirkel sorgfaltig abzuschreiten.92 Das heißt nun freilich nicht, daß Rekurse auf die nonverbale Kommunikationsforschung sich damit schon erübrigen. Denn nach wie vor bleibt das eingangs angesprochene Problem bestehen, daß unsere nonverbale Kompetenz auf weite Strecken eine nicht nur unbewußte, sondern offenkundig auch eine unterschiedlich gut ausgebildete ist, weil wir bei der gegenseitigen Verhaltenskontrolle selektiv verfahren und wesentlich kompetenter und geübter in der Dekodierung mimischer Zeichen sind als etwa in der Dekodierung gestischer und proxemischer Zeichen. Die schon angesprochenen Versuche einiger Verhaltenswissenschaftler, Formen und Funktionen nonverbalen Verhaltens Zu diesem Ergebnis kommt letztlich auch FISCHER-LICHTE 1983 (vgl. Bd. 1, 55 u.ö.), obwohl sie die Möglichkeiten einer Operationalisierung nicht nur der Ergebnisse, sondern sogar der Methoden, nämlich der Notationsverfahren (vgl. Bd. 3, 112-118, bes. 113, 117) der nonverbalen Kommunikationsforschung (hier für die Theaterwissenschaft) wesentlich optimistischer zu beurteilen scheint (vgl. dazu unten Kap. 1.6).
242
Kapitel V: Dramatische Informationsvergabe
auf der Grundlage der bisher erreichten Ergebnisse zu klassifizieren, können dieses Problem zwar nicht lösen, immerhin aber ein Stück weit entschärfen. Denn sie sind zum einen geeignet, die Wahrnehmung nonverbaler Zeichen im Film von der Ebene der unbewußten auf die Ebene der bewußten Wahrnehmung zu heben. Zum anderen sind sie geeignet, die eben berufene hermeneutische Reflexion der auf nonverbalen Zeichen beruhenden Verstehensprozesse generell vorzustrukturieren und kommunizierbar zu machen dadurch, daß sie den Gegenstandsbereich systematisch ordnen und begrifflich fixieren: Zwar werden sie sich als noch sehr vorläufige und durchaus nicht immer befriedigende Klassifikationsversuche herausstellen, können aber doch immerhin insoweit hilfreich sein, als sie einen Überblick über die Gesamtheit potentieller kommunikativer Funktionen nonverbaler Zeichen geben, »Bedeutungsfelder« abstecken und damit eine Art Raster vorgeben, das der hermeneutischen Reflexion einen kohärenten sachlichen wie begrifflichen Bezugsrahmen verschaffen kann. Ihre Rekapitulation halte ich deshalb für sinnvoller als die Sichtung der ohnehin spärlichen Einzelergebnisse der verhaltenswissenschaftlichen 'Bedeutungsforschungen'. Zuvor sind die Techniken nonverbaler Enkodierung kurz zu rekapitulieren. 1.4 Techniken nonverbaler Enkodierung Die nachfolgende Übersicht systematisiert die Gesamtheit nonverbaler Enkodierungstechniken, die nach Maßgabe des jeweils benutzten Kanals (auditiv vs. visuell) bzw. des jeweils eingesetzten Körperorgans klassifiziert werden können, wobei nicht-transitorische nonverbale Zeichen nicht berücksichtigt sind. Über den auditiven Kanal werden die paralinguistischen Zeichen vergeben, die zwei Gruppen bilden: Während sprachbezogene Zeichen im Akt der Sprachproduktion erzeugt werden, stehen sprachunabhängige Zeichen nicht in Verbindung mit der Artikulation sprachlicher Zeichen, ersetzen sie vielmehr wie etwa die meisten Interjektionen, konversationssteuernde Laute (»hm« u.a.) - oder sind Ausdruck von Affekten (Weinen, Lachen, Schreien). Bei den sprachbezogenen Zeichen bedürfen die Kategorien Artikulation, Tonstärke und Sprechtempo keiner ausführlichen Erläuterung: Artikulation meint die phonetische Realisation der Laute, den Grad ihrer Präzision (exakte Artikulation vs. Nuscheln, Murmeln, Lallen u.a.), ihre idiolektische, soziolektische, dialektische Einfárbung usw. ; Tonstärke meint die im Rahmen der nicht-transitorischen Merkmale der Sprecherstimme möglichen Varianten der Lautstärke und Sprechtempo die im Rahmen der nicht-transitorischen, habituellen Merkmale der Sprechweise möglichen Varianten der Geschwindigkeit der Lautfolgen. Die Intonation ist die wohl wichtigste paralinguistische Katego-
Kapitel V: Dramatische Informationsvergabe
243
rie, weil sie die Bedeutung des Gesprochenen maßgeblich spezifiziert und differenziert: Die Akzentuierung, hervorgebracht durch Veränderungen der Tonhöhe und/oder Dauer des betonten Vokals,93 regelt die Verteilung von Wort-, Phrasen- und Satzbetonungen, die für die Bedeutungsdifferenzierung erhebliche Relevanz haben.94 Für den Tonhöhenverlauf werden traditionell drei Variablen angenommen: Man unterscheidet terminale (fallende), interrogative 1. Auditiver Kanal: Paralinguistische Zeichen 1.1 Sprachbezogene Zeichen 1.1.1 Artikulation 1.1.2 Tonstärke 1.1.3 Sprechtempo 1.1.4 Intonation 1.1.4.1 Akzentuierung (Betonung) 1.1.4.2Tonhöhenverlauf (Tonfall, Satzmelodie) 1.1. S Sprechpausen und Sprechrhythmus 1.1.6 Phrasierung 1.2 Sprachunabhängige Zeichen 1.2.1 Sprachersetzende Laute 1.2.2 Affektlaute 2. Visueller Kanal: Körpersprachliche Zeichen 2.1 Mimik 2.2 Blickverhalten 2.3 Gestik 2.3.1 Kopfbewegungen 2.3.2 Schulterbewegungen 2.3.3 Arm- und Handbewegungen 2.3.4 Beinbewegungen 2.3.5 Rumpfbewegungen 2.4 Proxemik 2.4.1 Distanzverhalten und Berührung 2.4.2 Körperorientierung 2.4.3 Körperhaltung
(steigende) und progrediente (ebene) Satzmelodien und ordnet ihnen die Satztypen des Aussage- und Fragesatzes sowie die Situation eines noch nicht vollendeten Satzes oder Sprechakts zu.95 Sprechpausen hängen eng mit der Intonation zusammen (jedem Akzent geht in der Regel eine minimale Sprechpause voraus), werden deshalb häufig auch als Teil der Intonation kategorisiert.96 Die Phrasierung stützt sich auf alle vorher genannten paralinguistischen Tech93 Vgl. HEIKE 1969, 56-71. 94 Vgl. die Bedeutungsdifferenzen durch unterschiedliche Akzentuierung etwa bei dem Satz: »Ich gehe fort« vs. »Ich gehe fort« vs. »Ich gehe fort*.
95 Vgl. HEKE 1969, 21-38. 96 Vgl. bussmann 1983, 219. - Hier seien sie eigens ausgegliedert, weil dabei nicht nur an phonatorische und artikulatorische, sondern auch an rhythmisierende (z.B. Fermaten) und expressive Funktionen (vgl. z.B. Verlegenheitspausen, Stottern, Stammeln) zu denken ist.
244
Kapitel V: Dramatische
¡nformationsvergabe
niken, denn sie gliedert den Redefluß, markiert Abgrenzungen und Zusammenhänge, bildet semantische bzw. sprachliche Handlungseinheiten durch Pausen, durch Wechsel von Artikulation, Tonstärke, Tonhöhe, Tempo oder Rhythmik bzw. durch Kombinationen mehrerer dieser Elemente. Die sprachbezogenen Zeichen differenzieren und spezifizieren die Bedeutung des Gesprochenen in hohem Maß, was freilich nicht heißt, daß sie sich notwendig auf das Gesprochene beziehen müssen. Insbesondere Sprechtempo, Tonstärke und Artikulation können auch rein expressive Funktionen übernehmen, die nicht auf das Gesprochene, sondern vielmehr auf die psychische und/oder physische Befindlichkeit des Sprechers verweisen (vgl. z.B. das Lallen eines Betrunkenen). Über den visuellen Kanal werden die körpersprachlichen Zeichen vergeben, die hier, üblichen Klassifikationen folgend, 97 nach Maßgabe des jeweils eingesetzten Körperteils gruppiert werden: Unter Mimik werden sämtliche durch die Gesichtsmuskulatur erzeugten Bewegungen (Stirn, Brauen, Lider, Nase, Wangen, Mund, Kinn) verstanden. Davon ausgenommen sind Bewegungen des Augapfels, weil sie die Blickrichtung und damit eine spezifische Gruppe körpersprachlicher Zeichen, das Blickverhalten (fixieren, wegsehen, auf-, niederblicken usw.), erzeugen. In Ermangelung präziser Definitionen seitens der Kommunikationsforschung wird hier von Gesten mit Blick auf alle übrigen Bewegungsabläufe des Körpers gesprochen, die erstens - im Unterschied zur proxemischen Kategorie der Körperhaltung, die über einen längeren Zeitraum beibehalten wird - kurzfristig sind und zweitens - im Unterschied zu Bewegungen, die eine proxemische Situation verändern (sich entfernen, umwenden, zurücklehnen, vorbeugen u.ä.) und damit kein eigenständiges Zeichen sind, sondern von einem Zeichen zu einem neuen überleiten selbständige Bedeutungsträger sind. Beide Kriterien sind vage und werden in Grenzfallen voraussichtlich versagen, dürften aber vorerst ausreichen, um eine grobe Ordnung herzustellen, um z.B. ein Achselzucken als gestisches, dauerhaft hochgezogene Schultern dagegen als proxemisches Zeichen (»mit eingezogenem Kopf dasitzen«) klassifizieren zu können. Das Zeichenrepertoire der Proxentik bezieht sich auf das Verhalten des ganzen Körpers und darin allererst auf die Regelung der räumlichen Distanz zwischen Kommunikationspartnern sowie auf die dabei stattfindende Körperorientierung (Zuwendung, Abwendung usw.). Distanz und Körperorientierung zeigen in erster Linie den »Grad der Direktheit oder Unmittelbarkeit« der Interaktion und darin zumeist auch den Grad der Offenheit der Kommunikationspartner füreinander an. 98 Das ist der Grund, warum die Körperhaltung zumeist ebenfalls dem 97 Vgl. SCHERER/WALLBOTT 1979; NÖTH 1985, 321-375. 98 MEHRABIAN/FRIAR 1979, 176.
Kapitel V: Dramatische Informationsvergabe
245
proxemischen Zeichenrepertoire zugeordnet wird, denn sie ist nicht nur ein wesentlicher Faktor der Distanzregulierung (vgl. zurückgelehnte vs. vorgebeugte Haltung), sondern auch ein maßgebliches Zeichen für den Grad der Offenheit bzw. Verschlossenheit eines Kommunikationspartners (vgl. verschränkte vs. offene Arme). 99 1.5 Funktionen nonverbaler Enkodierung: Ansätze zur funktionalen Klassifikation nonverbaler Zeichen Im weiteren werden zwei Ansätze der nonverbalen Kommunikationsforschung zur funktionalen Klassifikation nonverbaler Zeichen vorgestellt: Der erste von Ekman/Friesen100 ist hier vor allem deshalb von Interesse, weil er einige Grundbegriffe und funktionale Kategorien einzuführen geeignet ist, mit denen die nonverbale Kommunikationsforschung arbeitet. Der zweite - auf Ekman/ Friesen aufbauende - Klassifikationsversuch von Klaus R. Scherer101 gestattet einen differenzierteren Überblick über funktionale Aspekte nonverbaler Zeichen. Auf ihn baut deshalb der anschließende Versuch einer den Belangen der Filmanalyse angepaßten sprechakttheoretischen Reformulierung nonverbaler Zeichenfunktionen auf (Kap. 1.5.3). 1.5.1 Der klassifikatorische Ansatz von Ekman/Friesen Ekman/Friesen unterscheiden fünf Klassen nonverbaler Zeichen: Embleme, Illustratoren, Regulatoren, Affektdarbietungen und Adaptoren. Diese fünf Gruppen kommen aufgrund heterogener Kriterien zustande, stellen also keine kohärente Klassifikation dar. 102 Hier interessiert daher auch weniger dieser Klassifikationsversuch selbst, als vielmehr die dabei entwickelten Begriffe, die seither einen festen Platz in der verhaltenswissenschaftlichen Terminologie haben. Unter Emblemen103 werden hier nonverbale Zeichen mit einer jeweils präzise festgelegten Bedeutung verstanden, die »den meisten oder allen Angehörigen einer Gruppe, Klasse, Subkultur oder Kultur bekannt ist«.104 Embleme W Vgl. die Auflistung proxemischer «Kodes« bei NÖTH 1985, 366, 368. 1Ö0 EKMAN/FRIESEN 1969. 101 SCHERER 1 9 7 9 b .
102 Funktionale Klassen sind nur die Illustratoren und Regulatoren. Embleme und Adaptoren sind eher formale Klassen, gewonnen aufgrund von Kriterien, die sich auf Ausdrucksformen, nicht auf kommunikative Funktionen beziehen. Die Gruppe der Affektdarbietungen kommt Uber ein semantisches Kriterium zustande, faßt alle Zeichen zusammen, die dem Ausdruck von Emotionen dienen und die als solche natürlich ihrerseits unterschiedliche kommunikative Funktionen Ubernehmen können. 103 V g l . EKMAN/FRIESEN 1969, 6 3 - 6 8 ; EKMAN/FRIESEN 1979, l l l f . 104 EKMAN/FRIESEN 1 9 7 9 , 111.
246
Kapitel V: Dramatische
Informationsvergabe
können daher ohne weiteres verbal übersetzt werden, können Sprache also auch ersetzen und kommen eben deshalb zum überwiegenden Teil zur Anwendung, wo verbale Kommunikation nicht möglich ist. Die Zeichen der Gehörlosensprache oder die der Verkehrspolizisten gehören hierher, aber auch die Fülle konventionalisierter Zeichen, die in der alltäglichen Kommunikation benutzt werden, wie z.B. der nach oben oder unten weisende Daumen (»gewonnen« vs. »verloren«), das »Victory«-Zeichen usw. Das heißt zugleich, daß Embleme normalerweise bewußt erzeugte Zeichen sind.105 Illustratoren106 sind in der Regel sprachbegleitende Zeichen, die das Gesagte unterstreichen, amplifizieren, modifizieren, ihm u.U. auch widersprechen. Ekman/Friesen rechnen aber auch sprachersetzende Zeichen zu den Illustratoren, nämlich alle Embleme und ihnen ähnliche Zeichen, sofern sie in einer Gesprächssituation eingesetzt werden, die den Verzicht auf Verbalisierung nicht erzwingt. Die Autoren unterscheiden acht Typen von Illustratoren. Bâtons und Ideographen sind ausschließlich sprachbegleitende Zeichen: Bâtons sind paralinguistische oder kinesische Zeichen, die den Sprachfluß akzentuieren oder rhythmisieren, Ideographen sind kinesische, in erster Linie gestische Zeichen, »die den Verlauf oder die Richtung der Gedanken skizzieren«.107 Die übrigen sechs Typen können sowohl in sprachbegleitender als auch in sprachersetzender Funktion erscheinen: Deiktische Bewegungen verweisen direkt auf einen Ort oder ein Objekt, spatiale Bewegungen deuten räumliche Sachverhalte, rhythmische Bewegungen Rhythmus und Tempo eines Vorgangs, Kinetographen Bewegungsvorgänge und Piktographen die äußere Gestalt des Gemeinten an. Emblematische Bewegungen schließlich sind Embleme, sofern sie eine verbale Aussage innerhalb eines Gesprächs ersetzen bzw. illustrieren oder duplizieren. Regulatorenm sind ebenfalls sprachbegleitende Zeichen, paralinguistische oder kinesische Akte, die den Verlauf von Gesprächen organisieren, darunter vor allem die Rollenverteilung von Sprecher und Hörer regulieren: »They tell the speaker to continue, repeat, elaborate, hurry up, become more interesting, less salacious, give the other a chance to talk, etc. They can tell the listener to pay special attention, to wait just a minute more, to talk, etc.«109 Eine progrediente Intonation, eine erhobene Hand, ein gesenkter Blick u.a. können z.B. 105 EKMAN/FRŒSEN 1 9 6 9 , 6 3 .
106 Vgl. ebd. 68-70; EKMAN/FRŒSEN 1979, 112-115. 107 EKMAN/FRIESEN 1979, 113. - Ideographen dürften sich größtenteils in der Form der im folgenden genannten Illustrator-Typen (mit Ausnahme der deiktischen Bewegungen) realisieren, weil die gestische Visualisierung solcher abstrakten Sachverhalte sehr häufig auf bildlichen Vorstellungen beruht. 108 V g l . EKMAN/FRŒSEN 1 9 6 9 , 8 2 - 8 4 .
109 Ebd. 82.
Kapitel V: Dramatische Informationsvergabe
247
signalisieren, daß der Sprecher die Sprecherrolle noch nicht abgeben will, wie umgekehrt ein Sprecher, der seinen letzten Satz terminal intoniert, dabei aufblickt und gfls. die Hand sinken läßt, anzeigt, daß er zuende gesprochen hat. Nach Ekman/Friesen können alle in den übrigen vier Klassen gruppierten Zeichen als Regulatoren fungieren. 110 Affektdarbietungen (affect displays)'" sind paralinguistische und kinesische, insbesondere mimische Zeichen, die emotionale Befindlichkeiten des Senders anzeigen. Wo sie verbale Äußerungen nicht ersetzen, sondern begleiten, können sie zum einen auf den Inhalt des Gesprochenen bezogen sein und ihn dann amplifizieren, modifizieren oder ihm widersprechen, zum anderen können sie aber auch ohne Bezug zum Inhalt verbaler Äußerungen und neben diesen als spezieller Kanal fungieren, über den neue, von den sprachlichen Informationen unabhängige Informationen vergeben werden. Adaptoren112 schließlich gliedern Ekman/Friesen speziell aus, weil es sich dabei um kinesische Akte handelt, von denen sie annehmen, daß sie ursprünglich gelernt wurden, um Körperbedürfnisse zu befriedigen, Emotionen zu kompensieren, interpersonale Beziehungen zu regulieren (Aggression, Affiliation u.a.) oder um Objekte instrumenten zu betätigen (z.B. schreiben, rauchen, Kleidung glattziehen u.a.), die dann aber, ihrer ursprünglichen Funktion weitgehend entfremdet und deshalb zumeist auch nur noch rudimentär ausgeführt, 113 zu Zeichen werden können, die auf emotionale Befindlichkeiten oder unausgesprochene affektive interpersonale Beziehungen verweisen. Unterschieden werden Selbst-Adaptoren (auf den eigenen Körper bezogene Bewegungen, z.B. das Ordnen des Haars), Fremd-Adaptoren (auf den Interaktionspartner bezogene Bewegungen, z.B. rudimentäre Abwehrbewegungen) und Objekt-Adaptoren (Hantieren an/mit einem Gegenstand, z.B. das Spielen mit einem Bleistift, einer Zigarette u.ä.). Adaptoren werden in der Regel unbewußt angewandt, sind also keine intentional zu kommunikativen Zwecken eingesetzten Zeichen, werden vom Interaktionspartner daher auch normalerweise nicht thematisiert, vielmehr - zumeist aus Gründen der Höflichkeit übersehen. 1.5.2 Der klassifikatorische Ansatz von Scherer Der Klassifikationsversuch Klaus R. Scherers basiert auf den von Ekman und Friesen entwickelten Kategorien, bezieht sich allerdings größtenteils auf sprachbegleitende Zeichen und dabei auch nur auf ihre Funktionen für die 110 Vgl. ebd. m Vgl. ebd. 70-81. 112 Vgl. ebd. 84-92; EKMAN/FRIESEN 1979, 115-117. 113 V g l . EKMAN/FRIESEN 1 9 7 9 , 116.
248
Kapitel V: Dramatische Informationsvergabe
verbale Kommunikation selbst, kommt also nicht, zumindest nicht systematisch, auf den Umstand zu sprechen, daß simultan mit sprachlichen Zeichen vergebene nonverbale Zeichen sich keineswegs notwendig auf die verbale Kommunikation beziehen müssen. In Anlehnung an linguistische Begriffe unterscheidet Scherer parasemantische, parasyntaktische, parapragmatische und dialogische Funktionen, die er wie folgt untergliedert: 1. Parasemantische Funktionen 1.1 Substitution (Embleme) 1.2 Amplifikation (Illustratoren) 1.3 Kontradiktion 1.4 Modifikation 2. Parasyntaktische Funktionen 2.1 Segmentation (des Sprachflusses) 2.2 Synchronisation (verschiedener Verhaltensweisen) 3. Parapragmatische Funktionen 3.1 Expression 3.2 Reaktionsfunktionen 3.2.1 Signale der Aufmerksamkeit 3.2.2 Signale des Verstehens 3.2.3 Signale der Bewertung 4. Dialogische Funktionen 4.1 Regulationsfunktionen 4.2 Relationsfunktionen 4.2.1 Signale der Sympathie/Antipathie 4.2.2 Signale der Statusrelation (Symmetrie/Asymmetrie) 4.2.3 Signale der Responsivität bzw. Aktivität
Die parasemantischen Funktionen (1.) betreffen die Beziehungen zwischen den Bedeutungen der verbalen und der nonverbalen Äußerungen, weshalb die zuerst genannte Funktion der Substitution (1.1), die Ersetzung verbaler Äußerungen durch nonverbale Zeichen, hier auch nicht hingehört. Die übrigen Funktionen sind sprachbezogene Funktionen: Von Amplifikation (1.2) spricht Scherer, wenn nonverbale Zeichen die simultan vergebenen verbalen Informationen »in ihrer Bedeutung unterstützen, illustrieren, verstärken, verdeutlichen«, und ordnet die meisten der von Ekman/Friesen katalogisierten Illustratoren dieser funktionalen Klasse zu.114 Wo dagegen ein »Widerspruch zwischen dem Bedeutungsgehalt der verbalen und der nonverbalen Verhaltensweisen« vorliegt, spricht er von Kontradiktion (1.3), 115 und wo nonverbale Zeichen die verbalen Informationen abschwächen, variieren (etwa wenn eine Absage mit entschuldigendem Lächeln formuliert wird), von Modifikationen (1.4). 116
114 V g l . SCHERER 1 9 7 % , 2 7 .
115 Ebd. 116 Ebd. 28f.
Kapitel V: Dramatische Informationsvergabe
249
Die parasyntaktischen Funktionen (2.) betreffen in erster Linie nonverbale Verfahren der Segmentation (2.1) des Sprachflusses, also vor allem paralinguistische Zeichen wie Phrasierung, Sprechtempo, Sprechpausen und -rhythmus, aber auch kinesische Illustratoren (Ekman/Friesens »Bâtons«). Die Abgrenzung von den »parasemantischen« Funktionen ist nicht ganz deutlich, denn paralinguistische und kinesische Intonation, Phrasierung etc. haben immer auch und sogar allererst semantisch relevante Funktionen. Was Scherer Synchronisation (2.2) nennt, ist, soweit seine recht vage Begriffsexplikation überhaupt eine Beurteilung zuläßt,117 offenbar gar keine funktionale Kategorie und wird hier deshalb zu vernachlässigen sein: Sie bezieht sich auf spezifische Regeln für die gleichzeitige Anwendung verschiedener Kommunikationsweisen und -kanäle, dafür, »welche Zeichen in welchem Kontext wo und wann auftreten können«.118 Gemeint sind also anscheinend die von Kultur zu Kultur wechselnden Anwendungsregeln für bestimmte nonverbale Zeichen in bestimmten Situationen. Parapragmatische Funktionen (3.) nennt Scherer Funktionen sprachbegleitender nonverbaler Zeichen, die sich nicht auf den Inhalt des Gesprächs, sondern auf den Gesprächsakt selbst beziehen, nämlich den Gesprächsverlauf mitbestimmen und steuern. Auf Seiten des Senders wird die Expression (3.1) als gesprächsregulierende Funktion angesetzt, die den »Ausdruck von Persönlichkeitsdispositionen, Affekten und Intentionen« (also vor allem Ekman/Friesens »affect displays«) betrifft und von der Scherer annimmt, daß sie »wesentliche Wirkungen auf den Ablauf des Gesprächs haben können.«119 Wenn er von vornherein nur die gesprächsregulierenden Funktionen expressiver nonverbaler Zeichen in Betracht zieht, verengt er freilich ihre breite funktionale Palette auf einen einzigen Aspekt, unterschlägt vor allem ihre primären, referentiellen Funktionen.120 Auf Seiten des Empfängers setzt Scherer Reaktionsfunktionen (3.2) nonverbaler Zeichen an, die das Verhältnis des Empfängers zu den verbal oder nonverbal vergebenen Informationen des Sprechers anzeigen: Signale der Aufmerksamkeit (Unaufmerksamkeit), die dem Sprecher i " vgl. ebd. 29. 118 Ebd. 119 Ebd. 30. 120 Wenn jemand beispielsweise in einem Gespräch eine niedergedrückte Stimmung nonverbal signalisiert, dann ist das zunächst ein (bewußter oder unbewußter) referentieller Akt, der im Prinzip denselben Status wie eine verbale Feststellung vergleichbaren Inhalts hat (»Ich bin deprimiert«) und sich ja keineswegs zwangsläufig auf Inhalt und Verlauf des Gesprächs beziehen muß. Aber auch wenn er sich auf die verbale Kommunikation bezieht, muß er nicht notwendig allein gesprächssteuernde, kann vielmehr auch parasemantische Funktionen übernehmen, dann nämlich, wenn er verbale Aussagen über die Befindlichkeit des Sprechers amplifiziert, modifiziert oder negiert.
250
Kapitel V: Dramatische Informationsvergabe
mitteilen, »daß man ihm überhaupt zuhört« (oder eben nicht zuzuhören gewillt oder fähig ist), Signale des Verstehens oder Nicht-Verstehens (Kopfnicken, hochgezogene Brauen u.ä.) und Signale der Bewertung (zustimmendes Nikken, Kopfschütteln usw.). 121 Unter dialogischen Funktionen (4.) versteht Scherer Funktionen nonverbaler Zeichen, die »die Beziehungen zwischen Zeichen und dem dyadischen System der beiden Interaktionspartner« betreffen. Als sprachbezogene Zeichenfunktionen, als die sie hier untersucht werden, sind sie von den parapragmatischen Funktionen (3.) nicht plausibel zu trennen: Die Regulationsfunktionen (4.1) sind eindeutig sprachbezogene Funktionen und haben nichts (bzw. nur sekundär) mit der interpersonalen Beziehung, sondern mit der Regelung des Gesprächablaufs zu tun, meinen dasselbe, was Ekman/Friesen als Regulatoren beschreiben, Zeichen also, die den Gesprächsablauf (insbesondere die Zuweisung der Hörer- und Sprecherrolle) organisieren. 122 Aber auch die Relationsfunktionen (4.2) - Signale der Sympathie oder Antipathie, der Statusverhältnisse und der Responsivität bzw. Aktivität - lassen sich kaum von den »parapragmatischen« Funktionen abgrenzen, denn als Determinanten der verbalen Kommunikation, als die Scherer sie ja untersucht, haben sie per definitionem »parapragmatische«, nämlich gesprächsregulierende Funktionen. Daß sie hier dennoch eigens ausgegliedert werden, liegt zweifellos an einer unbemerkten Verschiebung der ursprünglichen Frage nach sprachbezogenen auf die Frage nach sprachunabhängigen Funktionen nonverbaler Zeichen. 123 121 SCHERER 1979b, 30. 122 Die Abgrenzung dieser »Regulationsfunktionen« von den als »parapragmatisch« klassifizierten »Expressionen« und »Reaktionen« (3.1, 3.2) leuchtet nicht ein, weil sie sich zu wesentlichen Teilen ja gerade über diese »Expressionen« und »Reaktionen« realisieren. 123 Bei den Statusrelationen (4.2.2) abersieht Scherer zudem, daß sie weniger Inhalt nonverbaler (und verbaler) Zeichen sind als vielmehr und weit häufiger Regulatoren der Verwendung bzw. Nicht-Verwendung von Zeichen sind. Zwar gibt es eine Reihe von Zeichen, die (wie z.B. explizite Dominanz- und Submissionsgebärden, Territorialverhalten u.ä.m.) Statusverhältnisse anzeigen, aber ein großer Teil der von Scherer gemeinten Zeichen sind nicht Regulatoren von Statusverhältnissen, sondern vielmehr deren Folge: Statusbeziehungen regeln allererst die Frage, welche verbalen und nonverbalen Zeichen überhaupt und welche davon reziprok (symmetrisch) verwendet werden dürfen und welche nicht: Der Chef darf seinem Angestellten anerkennend auf die Schulter klopfen, nicht aber der Angestellte seinem Chef. Der Chef gibt damit aber nicht notwendig kund, daß er der sozial Überlegene ist, sondern zunächst nur, daß er eine Leistung seines Angestellten für lobenswert hält. Will sagen: Nicht das nonverbale Verhalten reguliert hier soziale Rangverhältnisse, sondern diese Rangverhältnisse regulieren nonverbales Verhalten. Nicht das nonverbale Zeichen, sondern der Akt seiner Verwendung also sagt unter Umständen - und sekundär - etwas aus über die sozialen Beziehungen zwischen den Interaktionspartnern. Erst und nur dann, wenn der Verwendungsakt selbst zum intentional gesetzten Zeichen wird, das die Rangverhältnisse klären, an sie erinnern, sie festigen soll, bat er selbst Zeichencharakter. Dann aber gehört er zweifellos, wie die primären Statusanzeiger, zu den regula-
Kapitel V: Dramatische Informationsvergabe
251
1.5.3 Vorschläge zu einer modifizierten Klassifikation Die Schwierigkeiten einer konsistenten funktionalen Klassifikation nonverbaler Zeichen resultieren allererst aus der Multifunktionalität und Kontextabhängigkeit nonverbaler Zeichen, die es verbieten, bestimmte Zeichen (ζ. B. »Expression«) monofunktional festzulegen: Ein und dasselbe Zeichen kann offenbar nicht nur je nach Kommunikationssituation wechselnde, sondern dabei auch gleichzeitig mehrere kommunikative Funktionen haben. Eine konsistente Klassifikation läßt sich demnach nicht durch die Zuordnung bestimmter Zeichen oder Zeichentypen zu bestimmten Funktionen erreichen, sondern vielmehr nur durch eine Klassifikation dieser potentiellen Funktionen selbst, die nicht präjudizieren kann und darf, welche Zeichen und Zeichenarten unter welchen Bedingungen welche und wieviele Funktionen übernehmen können. In diesem Sinne und auf der Grundlage der eben rekapitulierten verhaltenswissenschaftlichen Ansätze sei hier ein auf die Belange der Filmanalyse zugeschnittener Funktionenkatalog entworfen, der sich wie folgt gliedert: 1. Nicht-spracbbezogene Funktionen 1.1 Propositionale Funktionen 1.1.1 Subjektspezifische Propositionen 1.1.2 Objektspezifische Propositionen 1.1.3 Relationsspezifische Propositionen 1.1.4 Regulative und direktive Propositionen 1.2 Illokutive Funktionen 1.2.1 Repräsentative 1.2.2 Regulativa und Direktiva 2. Sprachbezogene Funktionen 2.1 Parasemantische Funktionen 2.1.1 Vereindeutigung 2.1.1.1 Vereindeutigung der verbalen Proposition 2.1.1.2Illokutive Indikation 2.1.2 Ergänzung verbaler Propositionen und Illokutionen 2.1.2.1 Amplifikation 2.1,2.2Modifikation 2.1.2.3 Kontradiktion 2.2 Expressive Funktion: Bewertung verbaler Propositionen und Illokutionen 2.3 Gesprächsregulierende (metakommunikative) Funktionen 2.3.1 Regulationen der Sprecher-Hörer-Rolle 2.3.2 Regulationen des Sprecherverhaltens 2.3.3 Regulationen des Hörerverhaltens
Die Frage, ob die Zeichen sprachliche Äußerungen simultan begleiten oder nicht, wird dabei nicht herangezogen, weil sie kein funktionaler, sondern ein tiven, die Bedingungen und den Verlauf der Interaktion steuernden Zeichen, bedarf also keiner speziellen Kategorisiemng.
252
Kapitel V: Dramatische Informationsvergabe
rein formaler Aspekt ist. Stattdessen aber wird unterschieden zwischen sprachbezogenen und nicht-sprachbezogenen Funktionen: Von nicht-sprachbezogenen Funktionen, die sich sowohl simultan mit verbalen Sprechakten als auch unabhängig von sprachlichen Äußerungen erfüllen können, ist immer dann zu reden, wenn die nonverbalen Zeichen als selbständige Zeichen fungieren und deshalb, sofern sie simultan mit verbalen Sprechakten vergeben werden, nicht auf das Gesprochene, weder auf seinen Inhalt noch auf den Akt des Sprechens selbst, bezogen sind. Das heißt nicht, daß sie das Gespräch nicht gfls. indirekt beeinflussen können, sondern nur, daß sie in keinem erkennbaren Zusammenhang mit Inhalt und Vorgang der verbalen Kommunikation stehen. Sprachbezogene Funktionen dagegen haben nonverbale Zeichen immer und nur dann, wenn sie auf Inhalt und Verlauf simultan artikulierter verbaler Sprechakte bezogen sind, also der zusätzlichen Klärung der verbalen Informationen oder der Organisation des Gesprächsverlaufs dienen. Für die weitere Klassifikation werden sprechakttheoretische Prämissen in heuristischer Funktion zu Hilfe genommen,124 um homogene Begriffe zu haben erstens für die Bezeichnung der (von Scherer nicht systematisch berücksichtigten) referentiellen (propositionalen) Funktionen nonverbaler Zeichen und zweitens und vor allem für die sachliche wie begriffliche Klärung sämtlicher regulativer Funktionen: Was Scherer »parapragmatische« und »dialogische« Funktionen nennt und was Ekman/Friesen »Regulatoren« nennen, sind in sprechakttheoretischer Sicht zu einem großen Teil illokutive Funktionen, die auch in nicht-sprachbezogenen Funktionen (beispielsweise als Anzeiger primärer Affekte in nichtsprachlichen Interaktionssituationen) erscheinen können, es sei denn, es handelt sich um spezifische regulative (direktive) Propositionen, d.h. um Zeichen, deren propositionaler Inhalt die Regulation des Interaktionsvorgangs selbst ist (vgl. etwa abwehrende oder einladende Gesten). Nonverbale Proposition Bei den nicht-sprachbezogenen Funktionen sei entsprechend zwischen propositionalen und illokutiven Funktionen und bei den propositionalen Funktionen (1.1) zwischen vier großen Gegenstandsbereichen nonverbaler Propositionen unterschieden, zwischen subjektspezifischen, objektspezifischen, relationsspezifischen und regulativen (bzw. direktiven) Propositionen.125 124
Heuristischen Status hat diese Adaption deshalb, weil das Theorem des Sprechakts kommunikatives Verhalten als intentionales Handeln definiert, das für nonverbale Zeichen nicht regelmäßig vorausgesetzt werden kann (vgl. Kap. V.B. 1.1). Diese Unterscheidungen mögen auf den ersten Blick banal erscheinen: Propositionen (nonverbale wie verbale) können sich logischerweise nur auf zweierlei beziehen, nämlich auf den Sender selbst oder auf das, was er sich zum Objekt machen kann, auf »Welt«, darunter speziell auf seine Beziehung zum Interaktionspartner oder auf den Interaktionsakt als
Kapitel V: Dramatische Informationsvergabe
253
Subjektspezifische Propositionen (1.1.1) vollziehen nonverbale Zeichen immer dann, wenn sie selbstbezügliche Informationen vergeben, nämlich über psychische, mentale oder physische Dispositionen des Senders Auskunft geben, also etwa Affekte und Stimmungen artikulieren. Hierher gehören vor allem die expressiven Zeichen, also die meisten der von Ekman/Friesen als Affektdarbietungen und Adaptoren beschriebenen Zeichen, u.U. auch einige Embleme. 126 Subjektspezifische Propositionen beziehen sich demnach auf innerpsychische Befindlichkeiten des Senders. Ein ernstes Gesicht, eine resignierende Geste, eine schlaffe Körperhaltung etwa verweisen auf eine depressive Stimmung. Wo sie einen verbalen Kommunikationsakt begleiten, müssen sie keineswegs zwangsläufig auf Gegenstand und Verlauf des Gesprächs bezogen sein: Ein tief deprimierter Lehrer etwa, der seinen Unterricht durchzuführen hat, wird seine Stimmung nonverbal kaum vollständig verhehlen können, wohl aber verbal. Zwar dürften subjektspezifische Propositionen in vielen Fällen zu einer verbalen Reaktion des Gesprächspartners führen, aber ob das geschieht, hängt, das Beispiel deutet es an, vom Charakter der Interaktionssituation und den für sie geltenden Verwendungsregeln nonverbaler Zeichen ab. 127
solchen. Gleichwohl hat diese Unterscheidung hier ihren Wert, weil damit explizit angezeigt werden kann, was in der Schererschen Klassifikation verlorenzugehen droht, der Umstand nämlich, daß nonverbale Verhaltensweisen Zeichencharakter haben können und damit eigenständige Träger von Bedeutung sein können, also eine eigene Semantik haben und sich nicht in der »Parasemantik« - in der Verdeutlichung verbaler Äußerungen - oder in der Regulierung des aktuellen Gesprächs- oder Interaktionsvorgangs selbst erschöpfen: Der hier schon mehrfach bemühte Chef, der seinem Angestellten anerkennend auf die Schulter klopft, vollzieht eine objektspezifische (Prädikation einer Leistung: »sehr gut«) und eine relationsspezifische Proposition (Anerkennung: positive interpersonale Relation), deren illokutive Funktionen durchaus rein repräsentativer (referentieller) Natur sein können (s.u.), also keineswegs zwangsläufig regulativ sind. Regulative Funktionen gewänne das Zeichen erst dann, wenn der Chef zugleich klarstellen möchte, wer hier der Chef und wer der Angestellte ist, etwa um zu verhindern, daß der Angestellte die Anerkennung als Aufforderung mißversteht, die Statusverhältnisse neu zu definieren. 126 Das heißt wohlgemerkt nicht, daß Affektdarbietungen per definitionem subjektspezifische Propositionen sind; vielmehr können sie durchaus auch objekt- oder relationsspezifische Propositionen vollziehen. Ein Lächeln bei einer Begrüßung mag z.B. in bestimmten Fällen subjektspezifische (»Ich bin froh«) und relationsspezifische Proposition (»..., weil du da bist«) zugleich sein, ist aber häufig auch nur letzteres (»Ich freue mich, Sie zu sehen«) und sagt dann noch nichts über den Gemütszustand des Senders aus: Auch ein trauernder Mensch mag bei einer Begrüßung lächeln, und der Empfänger wird dieses Zeichen nicht als Ausdruck heiterer Stimmung, sondern als zeremonielle relationsspezifische Proposition rezipieren. 127 Auch paralinguistische Zeichen können nicht-sprachbezogene, subjektspezifische Propositionen vollziehen: Die nonverbale Erscheinung eines deprimierten Menschen wäre etwa durch eine tonlose, gepreßte Stimme vervollständigt, wobei die Bedingung einer nicht-
254
Kapitel V: Dramatische Informationsvergabe
Objektspezifische Propositionen (1.1.2) beziehen sich nicht auf das Subjekt der nonverbalen Enkodierung selbst, sondern auf die Welt außerhalb von ihm, d.h.: objektspezifische Propositionen vollziehen nonverbale Zeichen immer dann, wenn sie Objekte, Sachverhalte der Realität referieren und prädizieren, also im wesentlichen als Sprachersatz fungieren, wo verbale Kommunikation nicht möglich ist. Die von Ekman/Friesen als Embleme kategorisierten Zeichen haben hier ihren Platz. Aber auch die als ausschließlich sprachbezogene Zeichen (»directly tied to speech«),128 nämlich als Illustratoren klassifizierten Zeichen - deiktische, spatiale, rhythmische, kinetographische und vor allem piktographische Bewegungen - spielen als potentielle sprachersetzende Zeichen eine Rolle. Wer jemanden z.B. mit deiktischen Bewegungen oder Blicken auf ein Objekt oder einen Sachverhalt, z.B. auf eine Gefahr aufmerksam macht, ihm Größe, Gestalt oder Anzahl von Objekten oder Personen, Art und Tempo ihrer Bewegungen stumm signalisiert, setzt nonverbale Zeichen als objektspezifische Propositionen in Funktion. Relationsspezifische Propositionen (1.1.3) vollziehen nonverbale Zeichen immer dann, wenn sie die Beziehung des Senders zum Empfänger explizit thematisieren. Die Unterscheidung von den vorgenannten Propositionstypen ist nicht immer problemlos: Ob z.B. der mimische Ausdruck von Verärgerung als subjektspezifische (»Ich bin verärgert«), oder als relationsspezifische Proposition (»Ich ärgere mich über dich«) fungiert, kann nur aus dem Kontext erschlossen werden. Es gibt aber auch Zeichen, deren propositionale Funktionen primär relationsspezifisch sind. Dazu gehören spezielle Zeichen der Sympathie/Antipathie, Dominanz/Submission, der Affiliation und Werbung129 u.v.m.: Wer z.B. jemandem zum Abschied eine Kußhand zuwirft, bekundet Sympathie, wer jemandem die geballte Faust entgegenhält, das Gegenteil. Wer jemanden mit einem kurzen Kopfnicken grüßt oder ihm dabei lächelnd zuwinkt, gibt kund, daß die Beziehung noch besteht und/oder wie (eng) er sie einschätzt. Die meisten taktilen Zeichen und viele proxemische Zeichen, insbesondere Körperorientierung, Dominanz- und Submissionsverhalten, Distanzverhalten u.a., vollziehen allererst relationsspezifische Propositionen: Umarmung, Kuß, Streicheln usw. sind primär Akte, die den Intensitätsgrad der intersubjektiven Beziehung definieren oder - als »bindungspflegende« Aktivitäten130 - bestätigen. Eine frontale Körperzuwendung zum Interaktionspart-
sprachbezogenen Funktion selbstverständlich nur dann erfüllt ist, wenn der verbale Sprechakt nicht seinerseits selbstbezüglichen Inhalt bat. 128 EKMAN/FRIESEN 1969, 9 4 .
129 Zum Affiliationsverhalten vgl. besonders SCHEFLEN 1976, 26-33. 130 Vgl. ebd. 31f.
Kapitel V: Dramatische Informationsvergabe
255
ner (Vis-à-vis-Position)131 und Aufnahme von Blickkontakt etwa signalisieren Interaktionsbereitschaft, Abwendung des Körpers und rasche Unterbrechung eines Blickkontakts das Gegenteil. Dominanz- oder Submissionsverhalten definieren die intersubjektive Beziehung als asymmetrische, Distanzverhalten definiert den Intimitätsgrad der Beziehung usw. Daß die meisten dieser relationsspezifischen Propositionen in illokutiver Hinsicht regulative Funktionen haben, also den Interaktionspartner zu einem bestimmten Interaktionsverhalten zu bewegen suchen, liegt auf der Hand. Es gibt aber auch Zeichen, die spezifisch regulative und direktive Propositionen (1.1.4) vollziehen, Zeichen also, deren propositionaler Inhalt selbst in Handlungsanweisungen an den Empfanger bestehen. Regulative Propositionen sind (vor allem gestisch realisierte) nonverbale Regulationen des interaktiven Verhaltens, z.B. Interaktion abwehrende (Abwinken, abwehrend erhobene Hände, fortweisende Zeigegesten, Kopfschütteln, Wegblicken usw.) oder ausdrücklich einladende Gesten (Heranwinken, ausgebreitete Arme usw.). Man kann sie auch als metakommunikative nonverbale Propositionen beschreiben,132 weil sie sich auf die Regulation des aktuellen Kommunikationsprozesses beziehen. Direktive Propositionen sind dagegen keine metakommunikativen, keine interaktionsspezifischen, sondern (ebenfalls vor allem gestische) Befehle, die den Interaktionspartner zu einem bestimmten praktischen Verhalten veranlassen: Sie realisieren sich in »emblematischen« Zeige- und Befehlsgesten (s.o.), weisen den Interaktionspartner beispielsweise an, in eine bestimmte Richtung zu gehen oder zu fahren, schneller oder langsamer, mehr links oder rechts zu gehen, anzuhalten, zurückzubleiben, sich auf einen bestimmten Platz zu setzen usw. usf. Nonverbale Illokution Sprechakttheoretischen Grundsätzen zufolge ist jeder propositionale Akt immer auch ein illokutiver Akt, und das trifft prinzipiell auch auf nonverbale Zeichen zu.133 Gleichwohl gilt der sprechakttheoretische Grundsatz der Ein131 Vgl. ebd. 38-41. 132 Der Begriff umfaBt mehr als das, was oben als die »metasprachliche Funktion« bezeichnet wurde (vgl. Kap. A.2), nämlich nicht nur den Kode betreffende, sondern den gesamten Kommunikationsakt betreffende Äußerungen: »In einem metakommunikativen Sprechakt spricht Sp, über Aspekte des Gesprächs, das er gerade mit Sp2 fuhrt.« (HINDELANG 1983, 34). Zum Verständnis des Begriffs in der Sprechakttheorie vgl. ebd. 34-37. 133 Eine deiktische Bewegung z.B. gibt Anweisungen, das Gezeigte zu betrachten, an sich zu nehmen, zu ihm hinzugehen usw., ein unglückliches Gesicht kann als Anweisung an den Interaktionspartner gemeint sein, rücksichtsvoll zu sein, zu helfen, zu trösten usw., eine Abwendung und Entfernung vom Interaktionspartner, in »propositionaler« Hinsicht Zeichen des Abbruchs der Interaktion, kann (z.B. im Kontext erotischen Werbungsverhai-
256
Kapitel V: Dramatische lnformationsvergabe
heit von Proposition und Illokution bei nonverbalen »Sprechakten« nicht ausnahmslos, weil nonverbale Enkodierung auch stattfinden kann, wenn der Sender allein ist oder sich unbeobachtet fühlt, also nicht interagiert. Dieser Fall ist für dargestelltes nonverbales Verhalten in Film oder Theater naheliegenderweise von besonderem Gewicht, weil hier die Möglichkeit besteht, nonverbale Enkodierungsprozesse (naheliegenderweise vor allem subjektspezifische Propositionen) zu zeigen, die eigentlich keine sind, weil sie (im inneren Kommunikationssystem) keinen Adressaten haben, nicht in kommunikativer Funktion versendet werden: Solche Zeichen haben folglich auch keine illokutiven, sondern ausschließlich propositionale Funktionen. Wo immer aber nonverbale Enkodierung im Rahmen einer Interaktionssituation stattfindet, sind nonverbale Propositionen, also alle oben klassifizierten Propositionstypen, immer auch illokutive Akte, wobei der Begriff hier nun freilich, wie schon gesagt, insofern zweckentfremdet wird, als sich diese illokutiven Akte sehr häufig unbewußt vollziehen und einen deutlich geringeren Verbindlichkeitsgrad haben als verbale Illokutionen: Nonverbale IUokutionen können sowohl von seiten des Senders verleugnet 134 als auch von seiten des Empfängers vollständig ignoriert werden. Die Unterscheidung repräsentativer und regulativer bzw. direktiver Illokutionen rekurriert auf John R. Searles Klassifikation verbaler Illokutionsakte: 135 Als illokutive Repräsentativa (1.2.1) sind nonverbale Akte immer dann anzusprechen, wenn sie den in der nonverbalen Proposition artikulierten Sachverhalt lediglich als gegeben »feststellen«, mitteilen (sollen): »Der Illokutionszweck der Sprechakte der repräsentativen Klasse besteht darin, den Sprecher (in verschiedenen Graden) darauf festzulegen, daß etwas der Fall ist, d.h. ihn an die Wahrheit der ausgedrückten Proposition zu binden«, 136 was tens) als Aufforderung gemeint sein, dem Sender zu folgen, ihn aufzuhalten, sein Interesse an der Fortsetzung der Interaktion zu beweisen usw. 134 Vgl. Anm. 54. 135 Vgl. SEARLE 1980b, 92-95. - Die drei übrigen von Searle vorgesehenen Klassen sind auf nicht-sprachbezogene nonverbale Akte nicht anwendbar: In »kommissiven« Sprechakten verspricht der Sender eine zukünftige Handlung (wofür es m.W. kein nonverbales Zeichen gibt), in »expressiven« Sprechakten artikuliert er seine innere Einstellung zum propositionalen Inhalt seiner Äußerung (was nonverbal nur in sprachbezogener Funktion denkbar ist) und in »deklarativen« Sprechakten vollzieht der Sprecher die in der Proposition artikulierte Handlung (z.B. bei Taufen: »Ich taufe dich ...«) im Akt ihrer sprachlichen Äußerung (was nonverbal nicht möglich ist, weil nonverbale Zeichen sich nicht auf sich selbst beziehen können). 136 Ebd. 92f. - Sprecher repräsentativer Sprechakte geben kund, daß sie den in der Proposition festgestellten Sachverhalt für wahr halten: »Alle Mitglieder dieser Klasse lassen sich innerhalb eines Bereichs einordnen, der die Begriffe 'wahr' und 'falsch' umfaßt« (ebd. 93).
Kapitel V: Dramatische Informationsvergabe
257
zugleich besagt, daß sie vom Empfänger kein praktisches, sondern nur ein kognitives Handeln, nämlich die Kenntnisnahme des in der Proposition referierten Sachverhalts als tatsächlich gegebenen erwirken oder erwirken sollen. Nonverbale Repräsentativa werden besonders in Situationen benutzt, in denen die Interaktionspartner durch äußere Umstände gar nicht in der Lage sind, anderslautende illokutive Verhaltensanweisungen auszuführen. 137 Als Regulativa und Direktiva (1.2.2) sind nonverbale Akte dagegen immer dann anzusprechen, wenn sie ein über die bloße Kenntnisnahme hinausgehendes Handeln des Interaktionspartners erwirken oder erwirken sollen. Diese Funktion erfüllen natürlich allererst die spezifisch regulativen und direktiven Zeichen (1.1.4), bei denen propositionale und illokutive Funktionen normalerweise zusammenfallen. Bei den Subjekt-, objekt- oder relationsspezifischen Propositionen dagegen können sich regulative oder direktive Funktionen nur als indirekte Sprechaktem erfüllen, deren »wörtlich« indizierte Illokution sich von der tatsächlich gemeinten unterscheidet. 139 Das liegt daran, daß ihre »wörtlichen« Illokutionen per definitionem repräsentativer Natur sind. 140 Daß sie indes selten als bloß zur Kenntnis zu nehmende Repräsentativa, sondern als Regulativa oder Direktiva aufgefaßt werden, verdanken sie dem Kontext, in dem sie erscheinen, und einer Reihe konventionalisierter Reaktionsregeln, die den Umgang mit solchen nonverbalen Repräsentativa steuern, allgemeinen Konventionen menschlicher Interaktion oder auch speziellen Interaktionsriten 137 Wenn etwa ein Student in einer Seminarsitzung einem anderen nonverbal anzeigt, daß er extrem müde ist, so tut er das zweifellos in repräsentativer Funktion. 138 Vgl. obenS. 219. 139 Eine depressive Mimik und Gestik etwa, in propositionaler Hinsicht einen psychischen Zustand des Senders »feststellend« (subjektspezifische Proposition), kann in illokutiver Hinsicht regulativ fungieren, etwa den Interaktionspartner anweisen, nach dem Befinden zu fragen oder tröstend, aufheiternd usw. tätig zu werden; eine »emblematische« Geste, etwa das nonverbale »Piktogramm« einer herannahenden Gefahr (objektspezifische Proposition), kann in illokutiver Hinsicht direktiv fungieren, etwa den Interaktionspartner anweisen zu fliehen; die Korrektur einer als zu intim empfundenen interpersonalen Distanz durch einen Schritt nach rückwärts, in propositionaler Hinsicht den Vertrautheitsgrad der Beziehung neu definierend (relationsspezifische Proposition), kann in illokutiver Hinsicht regulativ fungieren, etwa den Interaktionspartner von gar zu vertraulichen nonverbalen und verbalen Verhaltensweisen abhalten usw. 1^0 Subjekt-, objekt- oder relationsspezifische Propositionen selbst haben keine Möglichkeit (es sei denn durch gleichzeitige Benutzung regulativer oder direktiver Propositionen), den Empfänger darüber zu instruieren, ob sie wirklich nur repräsentativ oder nicht doch auch regulativ bzw. direktiv gemeint sind, weil sie keine Zeichen haben, die den illokutiven Indikatoren (Wort- und Satzgliedstellung, Partikeln, Modus) oder gar explizit performativen Verben (ich bitte dich, befehle dir etc.) entsprächen, mit denen in verbalen Sprechakten der illokutive Akt geklärt wird. Vgl. z.B. das schon erwähnte Zeichen »Heben der Augenbrauen«, dem selbst nicht anzusehen ist, ob es repräsentativ als Zeichen der Überraschung oder regulativ als Zeichen des Tadels (als »Monitor«, s.u.) fungiert.
258
Kapitel V: Dramatische Informationsvergabe
und Verhaltensregeln in institutionalisierten Kommunikationssituationen. Der Ausdruck von Trauer beispielsweise hat illokutiv repräsentative Funktion und wird zu einem regulativen Akt (Anweisung zu rücksichtsvollem Verhalten, Trost, Beistand etc.) erst aufgrund der Konvention, die bestimmt, wie man mit Trauernden umgehen soll (vgl. dazu unten S. 260f.). Parasemantische Funktionen Alle oben erwähnten nonverbalen Propositionen können als sprachbezogene Propositionen erscheinen und sich dabei dann zum einen auf den Inhalt der verbalen Äußerung, zum anderen auf den Gesprächsablauf selbst beziehen. Für den ersten Fall behalte ich Scherers Begriff der parasemantischen Funktionen bei, weil er deutlich machen kann, daß die nonverbalen Propositionen und/oder Illokutionen in diesem Fall nicht selbständig für sich stehen, sondern auf sprachliche Propositionen und/oder Illokutionen bezogen sind, und weil dieser Bezug ihre (propositionalen/illokutiven) Bedeutungen verändert oder doch verändern kann. Am Anfang steht dabei eine Funktion, die in Scherers Überlegungen überhaupt keine Rolle spielt, obwohl sie die bisher zweifellos am besten erforschte ist, der von sprachwissenschaftlicher Seite längst schon ausführlich untersuchte Umstand nämlich, daß nonverbale Zeichen erhebliche Bedeutung für die parasemantische Vereindeutigung verbaler Äußerungen haben. Es liegt auf der Hand, daß paralinguistische Zeichen dabei eine besondere Rolle spielen: Vor allem Zeichen der Betonung, aber auch Sprechtempo, Tonstärke, Phrasierung usw. zeigen an, wie die verbale Proposition zu verstehen ist.141 Diese vereindeutigende Kraft nonverbaler Zeichen bezieht sich aber nicht nur auf den propositionalen Gehalt sprachlicher Äußerungen, sondern auch und vor allem auf den verbalen Illokutionsakt: Nonverbale Zeichen fungieren zu wesentlichen Teilen als illokutive Indikatoren,142 wobei auch hier allererst paralinguistische Zeichen zu nennen sind: In vielen Fällen, dann nämlich, wenn die Äußerung selbst keine eindeutigen illokutiven Indikatoren enthält, ist es die nonverbale, vor allem paralinguistische Realisierung des Sprechakts, die dessen illokutive Funktion klärt. Scherers Unterscheidung amplifizierender, modifizierender oder kontradiktorischer Funktionen, die hier als Funktionen der parasemantischen Ergänzung zusammengefaßt seien, wurde oben schon erläutert. Ein Sprecher, der etwa seine psychische Disposition oder sein Verhältnis zu einer Person oder Sache zum Gegenstand verbaler Äußerungen macht und diese mit nonverbalen subjektspezifischen Propositionen begleitet, kann sie damit amplifizieren, 141 V g l . HEIKE 1 9 6 9 . 142
V g l . HINDELANG 1 9 8 3 , 15.
Kapitel V: Dramatische Informationsvergabe modifizieren oder negieren. 1 4 3 Entsprechendes gilt mit Bezug auf verbale kutionsakte.144
259 Illo-
W o der verbale Illokutionsakt überhaupt erst durch nonverbale
Zeichen artikuliert wird, fungieren diese als illokutive Indikatoren ( s . o . ) . Expressive
Funktionen
Expressive Funktionen der Bewertung betreffen nicht nur, w i e Scherer vorsieht, die Beziehung des Hörers, sondern auch und sogar allererst die Beziehung des Sprechers zum Redegegenstand. V o n ihr war bereits bei der Sichtung funktionaler Aspekte dramatischer Sprechakte die Rede (vgl. Kap. V. A . 2 ) . Sprachbezogene nonverbale Zeichen in expressiver Funktion signalisieren, w i e Sprecher oder Hörer den verbalisierten Sachverhalt bewerten, z . B . für w i e wichtig oder unwichtig sie ihn halten, ob sie ihn als positiv oder negativ, angenehm oder unangenehm empfinden usw. Auf Hörerseite sind daran vor allem kinesische Zeichen, auf Sprecherseite auch und vor allem paralinguistische Zeichen beteiligt. Deren Expressionsgrad insbesondere vermag zu klären, welche Bedeutung der Sprecher seinem Redegegenstand beimißt. 1 4 5 Gesprächsregulierende
(metakommunikative)
Funktionen
In gesprächsregulierender Funktion eingesetzte nonverbale Zeichen sind metakommunikative »Sprechakte«, 1 4 6 beziehen sich auf den Kommunikationsvor143 So fungieren z.B. nonverbale subjektspezifische Propositionen, die eine tief depressive Befindlichkeit des Senders signalisieren, im Kontext der verbalen Äußerung »Ich bin unglücklich« prepositional amplifizierend (die Äußerung wird nonverbal verstärkt), im Kontext der verbalen Äußerung »Ich bin etwas abgespannt« prepositional modifizierend (die Äußerung wird nonverbal als Untertreibung enthüllt) und im Kontext der verbalen Äußerung »Mir geht es glänzend« prepositional kontradiktorisch (die Äußerung wird nonverbal Lügen gestraft). 144 Der mit der Äußerung »Ich bin unglücklich« (vgl. Anm. 143) vollzogene Illokutionsakt etwa wird in der Regel als Bitte um Hilfe oder Zuwendung verstanden, ein Verständnis, dem eine Leidensmiene Nachdruck verleiht (illokutive Amplifikation), dem aber auch nonverbal widersprochen werden kann, etwa durch eine abweisende Miene oder Geste, die kundgibt, daß der Sprecher in Ruhe gelassen werden möchte (illokutive Kontradiktion). Und eine gefaßte Mimik, eine wegwerfende Geste usw. können den verbalen Illokutionsakt abschwächen, beispielsweise kundgeben, daß der Empfänger die Sache nicht wichtig nehmen soll, sich nicht zu kümmern braucht u.ä. (illokutive Modifikation). 145 Schwach ausgeprägte Intonation und Phrasierung, erhöhtes Sprechtempo, normale Tonstärke, u.U. zusätzlich verbunden mit einer wegwerfenden Handbewegung, können signalisieren, daß die Sache nicht so wichtig zu nehmen ist, oder verraten gar generelles Desinteresse. Akzentuiertes, phrasiertes, lautes oder gerade auch betont leises (konzentrierte Aufmerksamkeit erheischendes) Sprechen dagegen, womöglich begleitet von gestischen und mimischen Bewegungen, die Intonation und Rhythmus der Rede amplifizieren (Ekman/Friesens »Bâtons«), geben dem Redegegenstand Gewicht und differenzieren diese Gewichtung durch die Verteilung von Akzenten, Tonstärken, Tempi usw. auf bestimmte Wörter, Satzglieder oder Sätze. 146 Vgl. Anm. 132.
260
Kapitel V: Dramatische Informationsvergabe
gang selbst, im Fall sprachbezogener Funktionen nonverbaler Zeichen also auf den verbalen Kommunikationsakt. Viele der oben erörterten regulativen Propositionen oder regulativen und direktiven Illokutionen können gesprächsregulierende Funktionen übernehmen, nämlich die Verteilung der Sprecherund Hörerrolle wie generell Sprecher- und Hörerverhalten steuern: Intonation, Handgesten und Blickverhalten geben kund, ob der Sprecher seine Sprecherrolle abzugeben bereit ist oder nicht und ob er spezifische verbale Reaktionen des Hörers erwartet oder nicht; der Hörer kann mit Gesten (z.B. mit einhaltgebietenden Handbewegungen) und mimischen Zeichen seinen Anspruch auf die Sprecherrolle anmelden oder das Verhalten des Sprechers ebenso wie der Sprecher das Verhalten des Hörers - kommentieren.147 Daß auch die nicht-sprachbezogenen Funktionen nonverbaler Zeichen, sofern sie verbale Kommunikationsakte begleiten, deren Charakter und Verlauf indirekt beeinflussen können, wurde schon erwähnt: Ein Gespräch, das nonverbal von einer feindseligen »Atmosphäre« geprägt ist, verläuft selbstverständlich anders als ein von wechselseitigem Wohlwollen geprägtes.148 Verwendungs- und Reaktionsregeln Nonverbale Kommunikation unterliegt ebenso wie verbale Kommunikation konventionalisierten Verwendungs- und Reaktionsregeln, die für die meisten privaten wie öffentlichen Interaktionssituationen bestehen und die zweifellos kulturell determiniert sind. 149 Nonverbale Verwendungsregeln befinden darüber, welche nonverbalen Akte in welchen Situationen von wem und in welchem Expressivitätsgrad verwendet werden dürfen (oder müssen): Bei Beerdigungen gelten in europäisch-nordamerikanischen Kulturen Zeichen der Heiterkeit oder Erleichterung als Regelverstoß, der als um so eklatanter empfunden wird, je näher die Sender dem Verblichenen stehen; bei asymmetrischen Statusverhältnissen sind nonverbale Reziproken ein Fehltritt; Männer dürfen in unserer Kultur in der Öffentlichkeit nach wie vor allenfalls in existentiellen Ausnahmesituationen weinen, Frauen, Kinder und Jugendliche dagegen unterliegen hier erheblich geringeren Restriktionen usw. Nonverbale Reaktionsregeln befinden darüber, ob und auf welche nonverbalen Zeichen in welchen Situationen wie reagiert werden soll (oder muß): 147
Hochgezogene Augenbrauen etwa können unaufmerksames oder störendes Hörerverhalten monieren, aber auch umgekehrt, vom Hörer versendet, das Sprecherverhalten kommentieren, etwa anzeigen, daß der Sprecher unverständlich ist, konventionelle Regeln sprachlichen Verhaltens verletzt oder daß die verbalen Propositionen in Frage gestellt, bezweifelt oder als überraschend empfunden werden usw.
148 Vgl. SCHERER 1979b, 30.
149 Vgl. EKMAN 1979 und Anm. 88.
Kapitel V: Dramatische Informationsvergabe
261
Unter Freunden oder Liebenden verlangen expressive relationsspezifische Propositionen zumeist reziproke, »bindungspflegende« nonverbale oder verbale Akte. Die Nichtbeachtung dieser wie auch expressiver subjektspezifischer Propositionen, negativer vor allem (Trauer, Depression, Ärger), würde als Infragestellung der Beziehung, als Kälte oder Herzlosigkeit empfunden. In anderen, nicht-intimen Beziehungen dagegen kann das Übersehen etwa eines emotionalen »Ausbruchs« gerade als durchaus regelgerechtes, »taktvolles« Verhalten gelten. Verstöße gegen diese Verwendungs- und Reaktionsregeln für nonverbale (aber auch verbale) Zeichen werden auf nonverbaler Ebene durch sog. Monitoren geahndet, die den Regulativa oder Direktiva zuzurechnen sind: Monitoren rufen den Regelverletzer durch regulative Zeichen, etwa durch mißbilligende Blicke oder Gesten (hochgezogene Brauen, Kopfschütteln usw.), zur Ordnung. 150 1.6 Die Beschreibung nonverbaler Zeichen im Filmprotokoll Die nonverbale Kommunikationsforschung hat hochkomplexe Notationsverfahren für die Protokollierung nonverbaler Enkodierungsprozesse entwikkelt,151 die minutiös jede Muskelaktivität im Gesicht, an Kopf, Händen, Beinen und Rumpf notieren oder paralinguistische Zeichen durch technische Messungen zu erfassen suchen.152 Diese außerordentlich aufwendigen Notationsverfahren für die Beschreibung dargestellter nonverbaler Kommunikation zu übernehmen, wie etwa Fischer-Lichte fordert, 153 halte ich für abwegig: Abgesehen davon, daß der hohe Beschreibungsaufwand bei all jenen Zeichen, deren Interpretation mit Verweis auf die durchschnittliche nonverbale Kompetenz eines normal sozialisierten Menschen ausreichend legitimiert werden kann (vgl. S. 239f.), in keinem Verhältnis zu den Ergebnissen steht, abgesehen auch davon, daß diese für die statistische Auswertung und Analyse, nicht aber für die wissenschaftliche Kommunikation vorgesehenen Notationsverfahi50Vgl. SCHEFLEN 1976, 111-128 und 129-138, 139-170 pass. 151 V g l .
Z.B.
BIRDWHISTELL
1952;
EKMAN/FRIESEN
1975;
SCHERER/WALLBOTT/SCHERER
1979. 152 Vgl. z.B. die Beschieibungsverfahien mimischer Zeichen bei EKMAN/FRŒSEN 1975 oder das von FISCHER-LICHTE 1983, Bd. 3, 117 empfohlene, von Scherer (in SCHERER/WALL-
BOTT/SCHERER 1979) entwickelte Notationsverfahren. 153 Vgl. FISCHER-LICHTE 1983, Bd. 3, 112-118, bes. 116f.; Fischer-Lichte kommt dieser Forderung dann aber selbst auch nicht nach, dies allerdings nicht aufgrund der Einsicht in das Mißverhältnis von Aufwand und Ergebnis, sondern mit Verweis auf die 'Unvollständigkeit' der verhaltenswisseoschaftlichen Notationsverfahren (vgl. ebd. Bd. 3, 117f. ), die zur Folge habe, daß man sich vorerst »mit möglichst präzise gefaflten verbalen Umschreibungen behelfen« müsse (118).
262
Kapitel V: Dramatische
Informationsvergabe
ren jedes Aufführungs- oder Filmprotokoll zu einem Zerrbild wissenschaftlicher Verständigung werden ließe,154 ist der Rekurs auf diese Notationsverfahren außerhalb der verhaltenswissenschaftlichen Grundlagenforschung schon deshalb abwegig, weil das solchermaßen Notierte von Theater- oder Filmwissenschaftlern gar nicht ausgewertet werden kann, - den Konsens vorausgesetzt, daß Theater- oder Filmwissenschaft weder die Aufgabe noch die Kompetenz haben, selbst Verhaltenswissenschaft zu betreiben, daß es vielmehr darum geht, Ergebnisse der Verhaltenswissenschaften adäquat zu verarbeiten. Umgekehrt und genauer heißt das: Die im Wege verhaltenswissenschaftlicher Notationsverfahren erhobenen Datensammlungen haben in Aufführungsoder Filmprotokollen nichts zu suchen, weil diese Protokolle nicht Grundlage von verhaltenswissenschaftlichen, sondern von interpretatorischen Fragestellungen sind. Die Beschreibung des Gegenstandes hat deshalb in den mit der Auslegung von Texten befaßten Disziplinen einen anderen methodologischen Status als in den empirischen Sozialwissenschaften. In historisch-hermeneutischer Perspektive ist sie der Versuch, Analyse und Interpretation soweit als möglich zu trennen, Ergebnisse der Textanalyse darzulegen, also diejenigen Merkmale des Textes zu notieren, die der Interpret als vor und jenseits aller Interpretation gegebene, daher am Text selbst überprüfbare Merkmale auffaßt und deren Funktionen für den Prozeß der Sinnproduktion erst im Akt der Interpretation zu qualifizieren sind. Daß eine präzise Trennung von Analyse und Interpretation niemals gelingen kann, weil Vorverständnisse die Analyse immer schon leiten, ist eine banale Einsicht. Genau deshalb aber kommt der Beschreibung ja gerade - insbesondere bei so komplexen, plurimedialen Texten, wie Filme es sind - eine so eminente Bedeutung zu, eben weil sie das, was der Interpret als textanalytisches Fundament seiner Interpretationen betrachtet, dokumentiert und damit intersubjektiver Überprüfung zugänglich macht. Die Notationsverfahren der nonverbalen Kommunikationsforschung aber bilden nicht das textanalytische Fundament filminterpretatorischer Arbeit ab, sind vielmehr dazu angetan, es zu verschleiern, weil sie die Interpretation nonverbaler Zeichen gar nicht begründen. Deren Grundlage sind vielmehr kontextbezogene Verstehensprozesse, die auf der im kulturellen Sozialisationsprozeß erworbenen nonverbalen Kompetenz beruhen und für deren Begründung nur in Einzelfällen auf Ergebnisse der nonverbalen Kommunikati154 Vgl. die bei FISCHER-LICHTE 1983, Bd. 3, 206f. und 208f. dargestellten Beispiele. - Auffüihrungs- oder Filmprotokolle sind, anders als die Datensammlungen der empirischen Sozialwissenschaften, nicht nur Basis der Analysearbeit, sondern auch wissenschaftliche Kommunikate: Als verbale Replikate unwiederholbarer bzw. nicht beliebig verfügbarer Primärtexte sind sie die sekundäre Rekurs- und Verweisinstanz interpretatorischer Aussagen über diese Primärtexte.
Kapitel V: Dramatische Informationsvergabe
263
onsforschung, zum größeren Teil dagegen auf hermeneutische Begründungsverfahren zurückzugreifen ist (vgl. S. 241). Ähnliches gilt nun aber auch für Versuche, nonverbale Zeichen zwar mit herkömmlichen verbalen Umschreibungen, dabei aber mit äußerster Akribie und interpretatorischer Enthaltsamkeit zu beschreiben.155 Auch dieses Verfahren kann weder die Geltungsfähigkeit interpretatorischer Aussagen erhöhen noch ihre Überprüfung erleichtern: Zum einen hat die Verbalisierung visueller Sachverhalte ihre Grenzen und produziert deshalb, je detaillierter sie sein will, nur umso mehr Unbestimmtheitsstellen und Mißverständnisse, überfordert zudem das Vorstellungsvermögen des Lesers.156 Zum anderen verlangt eine verstehensbezogene Aussagen strikt verbietende Beschreibung, daß jede nonverbale Aktivität unterschiedslos verzeichnet werden muß, gleichgültig, ob sie für die Interaktion der Figuren und damit für die Interpretation überhaupt belangvoll ist oder nicht, was eine nachgerade absurde Hypertrophie der Beschreibung nonverbaler Enkodierung in Theater oder Film zur Folge hätte.157 Vor allem aber ist die Objektivität, die diese Beschreibungsmethode signalisieren soll, auch hier eine nur trügerische, weil diese lückenlosen Beschreibungen ebensowenig analysiert oder auch nur interpretatorisch ausgewertet werden können wie die verhaltenswissenschaftlichen Verfahren folgende Notation, denn das wäre auch hier nur dann möglich, wenn ein analytisches Instrumentarium oder aber ein »Lexikon« nonverbaler Zeichen zur Verfügung stünde, das es gestattete, jedem Zeichen bestimmte Bedeutungen zuzuordnen. Da es aber weder das eine noch das andere gibt, sind solche Beschreibungen nicht nur redundant, sondern täuschen auch darüber hinweg, daß sie gar nicht in der Lage sind, auf nonverbale Zeichen gestützte Interpretamente zu begründen. Auch hier gilt, daß die in der Interpretation vollzoge-
155 Vgl. ebd. 118. 156 Vgl. Fischer-Lichtes Protokolle von Szeneoausschnitten einer Aufführung von Pirandellos »Heinrich der Vierte« (ebd. 145-157, 166-176): Die Vorstellungskraft des Lesers ist fraglos überfordert, wenn es beispielsweise heißt, daß der Schauspieler eine »nach oben ausgeführte werfende Bewegung der rechten Hand« (S. 174) macht, eine »Schleuderbewegung« (175) mit der Hand vollzieht oder, »die Lufi zersägend«, eine Hand hebt (169). 157 Vgl. ebd: Indem Fischer-Lichte, weil sie jede Deutung vermeiden will, in ihren Protokollen sämtliche Bewegungsaktivitäten der Schauspieler unterschiedslos notiert, läBt sie ihren Leser über deren Relevanz oder Irrelevanz im Unklaren: Es fehlen die Anhaltspunkte, um zu entscheiden, wie relevant es wohl sein mag, daß beispielsweise eine Figur »mit der linken (bloßen) Hand an die Verschlußkante ihres Mantels in Brusthöhe« greift (153), »mit leicht gespreizten Beinen« dasteht und dabei »den Oberkörper stärker zur Rampe (dreht) als die Beine« (175) oder sich auf dem linken Fuß statt auf dem rechten (172) umdreht.
264
Kapitel V: Dramatische Informationsvergabe
nen Bedeutungszuordnungen nicht auf Analysen des Beschriebenen, sondern auf kontextbezogenen Verstehensprozessen beruhen.158 Wenn die Beschreibung des Gegenstands, in diesem Fall das Filmprotokoll, die textanalytischen Voraussetzungen der Interpretation offenlegen soll, wenn diese Voraussetzungen aber hinsichtlich der nonverbalen Zeichen nicht Ergebnisse analytischer Verfahren, sondern Ergebnisse von Verstehensprozessen sind, dann ist es beim gegenwärtigen Stand der nonverbalen Kommunikationsforschung nicht nur folgerichtig, sondern sogar dringend erforderlich, daß nonverbale Zeichen als Resultate von Verstehen präsentiert werden, daß also offengelegt wird, wie diese Zeichen verstanden werden. Im Filmprotokoll sind demnach, was die nonverbalen Enkodierungsprozesse angeht, Interpretamente nonverbaler Zeichen zu notieren, eben weil nonverbale Enkodierungsprozesse als immer schon interpretierte (und nicht als scheinbar objektive Daten über Muskelbewegungen) in die Filminterpretation eingehen. Deshalb hat der Leser filminterpretatorischer Arbeiten auch nur dann, wenn diese nonverbalen Interpretamente im Filmprotokoll offengelegt werden, eine reelle Chance, sie am Film selbst zu überprüfen. Statt also beispielsweise einen Gesichtsausdruck, den man als ironisches Lächeln versteht, mit akribischen Notationen etwa von Stirn-, Brauen-, Wangen- und Mundstellung festzuhalten und damit so zu tun, als könnte das etwas daran ändern, daß die Deutung des Lächelns als eines ironischen nicht bewiesen werden kann (und als könnte der Rezipient anhand dieser Beschreibungen überprüfen, ob die Deutung plausibel ist), ist es zweifellos ehrlicher, gleich das Interpretament (»X lächelt ironisch«) hinzuschreiben und dem Leser damit nicht nur explizit anzuzeigen, daß hier Interpretamente formuliert werden, sondern ihm auch Gelegenheit zu geben, dieses Interpretament am Film selbst zu überprüfen.
2.
Nicht-transitorische nonverbale Zeichen
Zu den nicht-transitorischen nonverbalen Zeichen zählen sämtliche Zeichen oder zeichenähnliche Merkmale von Figuren, die im Interaktionsprozeß nicht aktuell enkodiert werden, sondern unveränderliche, angeborene oder habitualisierte (Statur, Physiognomie, Stimme, Gang usw.) oder zumindest nicht spontan veränderliche Merkmale (Maske, Kostüm) sind. 159 In alltäglichen wie in dargestellten Interaktionssituationen werden solche Merkmale der äußeren Erscheinung beständig als Indices (für Persönlichkeit, Herkunft, Beruf usw.) 158 Vgl. das (Miß-) Verhältnis von Beschreibung und Interpretation bei Fischer-Lichte (z.B. Beschreibung und Interpretation einer Geste: ebd. 170 und 180). 159 Vgl. ebd., Bd. 1,94-131.
Kapitel V: Dramatische Informationsvergabe
265
rezipiert:160 Die äußere Erscheinung von Menschen scheint in der zwischenmenschlichen Interaktion Grundlage einer mehr oder minder komplexen Vorurteilsbildung zu sein, die eine wechselseitige soziale, mentale, charakterliche, weltanschauliche usw. Klassifikation in Gang setzt. Dabei wird offenbar auf Kriterien unterschiedlichster Herkunft rekurriert, etwa auf kollektive Erfahrungssätze (vgl. etwa das Klischee vom »gemütlichen Dicken«), auf wissenschaftliche oder pseudowissenschaftliche Ergebnisse, die in das kulturelle Wissen Eingang fanden (vgl. etwa die Wirksamkeit der Typen-, Rassen- und rassistischen Lehren in der ersten Hälfte dieses Jahrunderts), oder - was die Herrichtung des äußeren Erscheinungsbildes betrifft - auf Kleider-, Haar- und Schminkmoden, aber auch auf universale, vor allem Farben betreffende Konnotations- und Assoziationsmuster (z.B. Hell/Dunkel: Gut/Böse). Für Theater und Film darf daraus geschlossen werden, daß nicht-transitorische Merkmale eine nicht zu unterschätzende Rolle für die Figurencharakterisierung spielen: Die mit Besetzung, Maske und Kostüm entschiedene äußere Erscheinung der Figuren dürfte auf Seiten der Rezipienten Vorurteile evozieren, die die Erwartungen an die Figuren prädisponieren, weshalb umgekehrt davon auszugehen ist, daß auf Seiten der Produzenten die gezielte Steuerung dieser Vorurteilsbildung ein nicht unwesentliches Kriterium bei der Entscheidung über Besetzung, Maske und Kostüm ist. So gewiß die Bedeutung nicht-transitorischer Merkmale von Schauspielern für die Charakterisierung von Figuren ist, so gewiß ist nun aber auch, daß deren Auswertung in Filmanalyse und Filminterpretation nur begrenzte Möglichkeiten hat, weil die Rekonstruktion der mit ihnen bedienten Vorurteile erhebliche Schwierigkeiten bereitet. Das hat vor allem damit zu tun, daß die Kriterien dieser Vorurteilsbildung historischem Wandel unterliegen, der sich bei den von Moden stark mitbestimmten Merkmalen sogar sehr rasch vollzieht, einer ahistorischen Klassifizierung also die Voraussetzung entzieht. Deshalb ist hier auch von Seiten der empirischen Sozialwissenschaften keine wirksame Hilfe zu erwarten.161 Ähnlich wie beim Theater162 gibt es auch 160 Eines der ersten Massenexperimente der sprachpsychologischen Forschung in den frühen dreißiger Jahren (vgl. HERZOG 1933) konnte z.B. zeigen, daß die meisten Menschen meinen, von der Stimme eines Menschen nicht nur auf dessen Alter, Geschlecht, Körpergröße und -gewicht, sondern auch auf Bildungsstand, Beruf, Status und (zumindest grob kategorisierte) Persönlichkeitsmerkmale schließen zu können (wobei sie sogar eine gewisse Treffsicherheit entwickeln). 161 Dies um so mehr, als Psychologie und Soziologie das Problem meines Wissens nicht systematisch weiterverfolgt haben, nachdem die in der ersten Hälfte dieses Jahrhunderts betriebene charakterologische und typologische Forschung (vgl. etwa C.G. Jung, Psychologische Typen, Zürich 1921; E. Kretschmer, Körperbau und Charakter, Berlin 1921; W. Jaensch, Grundzüge einer Physiologie und Klinik der psychophysischen Persönlichkeit, Berlin 1926; E.R. Jaensch, Grundformen menschlichen Seins, Berlin 1929; W.H. Shel-
266
Kapitel V: Dramatische Informationsvergabe
beim Film einige Konventionen, doch bleiben sie hier auf einige universale Konnotations- und Assoziationsmuster beschränkt. 163 Das aber heißt, daß die Funktionen nicht-transitorischer nonverbaler Zeichen im Film und ihre Konventionalisierungen ein Gegenstand allererst der filmhistorischen Forschung sind, dessen Untersuchung hier deshalb analysetheoretisch nur grob vorgeklärt werden kann. Besetzung Die Bedeutung nicht-transitorischer nonverbaler Merkmale findet ihren unmittelbaren Ausdruck in der Bedeutung, die Produzenten wie Rezipienten der Besetzung beimessen, die sich, beim Film zumal, die äußere Erscheinung von Schauspielern zu einem kaum minder gewichtigen Kriterium macht als deren schauspielerische Fähigkeiten, eben weil Gestalt, Physiognomie, Stimme und das, was man die Ausstrahlung eines Schauspielers nennt, Vorerwartungen der Zuschauer produzieren, die die Figuren schon zu guten Teilen festlegen und umgekehrt die Schauspieler auf bestimmte Rollenfächer fixieren. 164 Die Klagen über diese Festlegungen der Schauspieler sind fast so alt wie das Kino und lauten immer gleich, berufen Wandlungsfähigkeit und Variationsbreite eines Schauspielers, die auf dem Altar schnöden Kommerzdenkens geopfert würden, das dem Verkannten ein einmal erfolgreiches Rollenfach immer wieder abverlange. Die Klagen sind, im Zeitalter der Fernsehserie schon gar, gewiß nicht unberechtigt, übersehen aber gern, daß diese Festlegungen nur funktionieren können, weil die Vorurteilsbildung der Rezipienten funktio-
don. The Varieties of Human Physique, New York 1940) nach dem zweiten Weltkrieg (mitbedingt durch ihre nicht immer unproblematischen Beziehungen zu rassistischen Theorien) keine breite Nachfolge mehr fand. Ohnehin können sie im hier in Frage stehenden Zusammenhang kaum als Rekursinstanzen fungieren, weil sie in der Regel nicht nach Vorurteilsstrukturen fragen, sondern nach den in diesen Vorurteilen vermuteten Zusammenhängen zwischen »Erscheinung und Wesen« selbst. 162 V g l . FISCHER-LICHTE 1 9 8 3 , B d . 1, 9 9 u . ö .
163 Das Hell/Dunkel-Stereotyp etwa - der hell gekleidete Held und der dunkel gekleidete Bösewicht, die blonde Unschuld und das schwarzhaarige Biest - gehört bis heute zur Rezeptur der Kino- und Fernsehmacher, und auch dessen Umkehrung ist längst zum Klischee geworden. 164 Der scheinbare Zyniker, in dessen wohlverschlossenem Inneren das Herz eines Idealisten schlägt, war Humphrey Bogarts, der amerikanische Durchschnittsbürger Gregory Pecks, der männlich-draufgängerische Liebhaber Clark Gables »Fach«; die Erwartung, daß von Anthony Perkins oder Woody Allen gespielte Figuren neurotische Persönlichkeiten sind, wird selten enttäuscht; von Katharine Hepburn erwartete man lange Zeit späte Mädchen, die unerwartet in Liebe erblühen, von Marilyn Monroe zeitlebens naive junge Frauen, deren Sexappeal ihr Glück oder Unglück besiegelt, von Doris Day die adrette Ehefrau, auf deren Kosten gelacht werden durfte. Für den europäischen Film der Vergangenheit und Gegenwart ließen sich vergleichbare Beispiele nennen.
Kapitel V: Dramatische Informationsvergabe
267
niert, weil die Neigung, von Merkmalen der äußeren Erscheinung auf die Persönlichkeit von Menschen zu schließen, eine offenbar unausrottbare menschliche Neigung ist, im Kino wie im Leben. Daß das Kino nicht nur wenig dazu beiträgt, Vorurteilsbildungen dieser Art zu unterlaufen, vielmehr gerade an ihnen verdient, ja daß es seine Massenwirksamkeit nicht selten sogar mißbraucht hat und mißbraucht, um Vorurteile gezielt zu schüren, steht außer Frage. Ebenso aber steht außer Frage, daß es dazu einer Voraussetzung bedarf, die nicht im Kino, sondern im Leben verankert und dort keineswegs harmloser ist als im Kino, wofür das nach wie vor in den Köpfen hausende Klischeebild vom »typischen« Juden (das nicht das Kino erfand) nur ein besonders eklatantes Beispiel ist. Und diese Vorurteilsbildung funktioniert auch umgekehrt: Nicht nur schließen wir gern von der äußeren Erscheinung auf die Persönlichkeit, sondern auch von Persönlichkeitsmerkmalen auf die äußere Erscheinung (weshalb bei Literaturverfilmungen schon die Besetzungsliste keinen Leser kaltläßt). Das heißt: Diese Vorurteile sind offenbar so vital, daß die Glaubwürdigkeit einer fiktiven Figur nicht zuletzt auch davon abhängt, ob ihre Persönlichkeitsstrukturen mit den »richtigen« nicht-transitorischen nonverbalen Merkmalen, also mit dem »richtigen« Schauspielertypus verkoppelt werden, weil es nur Ausnahmeschauspielern gelingen dürfte, einen Charakter gegen diese Vorurteile durchzusetzen. Die Festlegung von Schauspielern auf bestimmte Rollenfächer beruht demnach offenbar auf einem komplexen Wechselspiel zwischen »Naturausstattung« und Habitus der Schauspieler einerseits und den auf sie reagierenden Vorurteilsbildungen und ästhetischen Konzepten andererseits sowie auf kommerziellen Erwägungen, die das Ergebnis dieses Wechselspiels schließlich als »Rollenfach« festschreiben. Die dadurch entstehenden Rollentraditionen begründen eine Art »Zeichensystem«, das mit der Besetzung aktualisiert wird und das immerhin einen möglichen Ansatzpunkt der Analyse nicht-transitorischer Zeichenfunktionen im Film liefert: Sieht man von den Fällen ab, wo das »Starsystem« selbst zum Drehbuchschreiber wird, dessen Geschichten dann selten mehr als bloße Vorwände liefern dafür, daß Doris Day singen, Marika Röck tanzen, Maria Schell weinen und die Kinokasse sich füllen kann, läßt sich die Besetzung, soweit sie bekannte und »fachlich« festgelegte Schauspieler betrifft, als Indikator ansprechen, der Figurenkonzepte des Regisseurs signalisiert, sie zumindest grob konturiert und damit der Filminterpretation zumindest gewisse Chancen eröffnet, auf diesem ansonsten unwägbaren und schwer kontrollierbaren Gebiet zu einigermaßen fundierten Ergebnissen zu kommen. Darüber hinaus haben auf nicht-transitorische Merkmale gestützte Interpretamente Aussicht auf plausible Begründungsmöglichkeiten allenfalls dort, wo offensichtliche Klischees produziert werden. Das aber
268
Kapitel V: Dramatische Informationsvergabe
heißt, daß hier nur sehr grobe Raster zur Verfügung stehen, die immer dann versagen, wenn Schauspieler und Figur sich diesen Rastern versagen. Maske Ähnlich ungesichert sind Interpretamente, die sich auf die Arbeit des Maskenbildners stützen, denn sie, die künstliche Veränderung der Naturausstattung eines Schauspielers, fungiert beim Film nur in seltenen Fällen als Zeichen, dessen Künstlichkeit gerade seinen Zeichencharakter begründet, wie das im Theater häufig und bei speziellen Theaterformen (Commedia dell'arte, Nô, Kabuki) regelmäßig der Fall war oder ist, sondern sie hat hier nahezu ausnahmslos die Aufgabe, diese künstlichen Veränderungen als Natur erscheinen zu lassen. Folglich gilt für die Maske im Prinzip dasselbe, was eben über Naturausstattung und Habitus von Schauspielern gesagt wurde, nämlich daß gesicherte Aussagen über ihre Bedeutung für die Konstituierung und Konturierung einer Figur allererst im Rekurs auf das grobe Raster offensichtlicher Klischees begründet werden können, das differenzierte Signale und Nuancen nicht erfassen kann und damit für die Analyse komplexer strukturierter Figuren nur sehr begrenzt tauglich ist.165 Alle weniger stark klischierten Zutaten aber, die die Maske beisteuert, sind einer systematischen Analyse und Kontrolle kaum zugänglich: Die Aura großbürgerlicher Vornehmheit, die etwa Barbara Bruckner (Krystyna Janda) in Szabós »Mephisto«-Verfilmung (UNGARN/BRD 1980) umgibt, hat nicht zuletzt auch damit zu tun, wie sie ihr Haar trägt, doch hat dieser Eindruck schwerlich Aussicht auf eine fundierte Begründung. Das ist auch keine Katastrophe, denn um die Konzeption der Figur als Inbild bürgerlich-vornehmer Gelassenheit nachzuweisen, gibt es besser zu sichernde Argumente als den Verweis auf ihre vornehmen Frisuren oder ihr dezentes Make-up. Will sagen: Nicht in wirkungsästhetischer, wohl aber in interpretationsmethodischer Hinsicht sind Rekurse auf diese zumeist nur unzureichend objektivierbaren Aspekte mit einiger Regelmäßigkeit entbehrlich, weil das Handeln der Figuren normalerweise ausreichende Belege für die Begründung interpretatorischer Aussagen liefert. Wirkungsästhetischen Untersuchungen ist das freilich nur ein schwacher Trost. 165 Die hohe Stirn des »Intellektuellen« und die niedrige des »Triebmenschen«, der zerzauste Haarschopf des »zerstreuten Professors« und der akkurate Scheitel des Büroangestellten, die blonde »Unschuld« und das schwarzhaarige »Biest«, der altbackene Knoten der alten Jungfer und die wallende Haarpracht der Umschwärmten, der »gemütliche Dicke«, der magere Neurastheniker, der stämmige Naturbursche und wie immer diese Klischees auch lauten, sie alle mögen schon bei der Besetzung und, verschieden stark dosiert, bei der äußeren Herrichtung jeder Filmfigur eine gewisse Rolle spielen, haben aber mit zunehmendem Komplexitätsgrad der Figur, zunehmender Differenziertheit von Handlung und Dialog und mit zunehmender Ausdrucksfähigkeit des Schauspielers abnehmende Bedeutung.
Kapitel V: Dramatische Informationsvergabe
269
Kostüm Deutlich bessere Aussichten auf objektivierbare Resultate hat die Analyse der Kostüme, denn die Kleidung ist - im Kino wie im Leben - ein wenn auch labiles, ständig sich wandelndes, so doch erheblich leichter beschreibbares, weil stärker reguliertes Zeichensystem als das von der Natur (und denen, die ihr nachhelfen) geschaffene der Körpermerkmale: Daß Kleider Leute machen, daß sie über Vermögensverhältnisse, Stand und Beruf, vor allem aber über Selbstkonzepte ihrer Träger, darüber, wie diese von anderen gesehen werden wollen, Auskunft geben, ist fundamentaler Bestandteil kulturellen und sozialen Wissens und deshalb auch nicht zufällig Gegenstand sozialwissenschaftlicher Untersuchungen.166 Kleider indizieren Alter und Geschlecht, Gruppenzugehörigkeiten, etwa Zugehörigkeit zu nationalen oder regionalen Gruppen, zu kirchlichen oder staatlichen Institutionen, zu Berufsständen, sozialen Klassen und gesellschaftlichen (politischen, kulturellen) Gruppierungen; sie indizieren dabei u.U. auch den Rang (Dienstgrad) ihres Trägers innerhalb solcher Gruppen; sie indizieren die aktuelle Situation, in der sich ihr Träger befindet (Berufs- oder Amtsausübung, Freizeit, Fest etc.), 167 und sie indizieren schließlich die Individualität ihres Trägers, besser seinen Anspruch auf Individualität, der sich freilich seinerseits nicht anders denn in sozial verabredeten Zeichen äußern kann, sei es im Grad der individuellen Abweichung von oder im Verstoß gegen alters-, geschlechts-, gruppen- und situationsspezifische »Kleiderordnungen«, sei es in den informellen »Kleiderordnungen«, die informelle Typenkonzepte für die Darstellung individueller Selbstkonzepte liefern (der/ die Intellektuelle, Kultivierte, Musische, Sachliche, Verspielte, Sportliche, Elegante, Modische, Lässige, Nachlässige, Solide, Frivole, 'Nonkonformistische' usw.). Die Auflistung der für die Untersuchung der Kostüme belangvollen Kriterien deutet an, wo die Interpretation der Kostümwahl anzusetzen hätte: Alters-, geschlechts-, gruppen- und situationsspezifische »Kleiderordnungen« der Zeit und Gesellschaft, die der Film thematisiert, dürften eine allgemeine Vergleichsfolie abgeben, vor deren Hintergrund individuelle Spezifika (Abweichungen, Verstöße, informelle Typenkonzepte) erfaßt und beides, die Anpassung an die Norm wie die Abweichung von ihr, als Indikatoren von Figurenkonzepten qualifiziert werden können. So liefern etwa der akkurat sitzende Cut des Diederich Heßling und der bequeme Straßenanzug des jungen Buck (»Der Untertan«, DDR 1951) oder die dezente Abendrobe der Baronin Innstet166 Vgl. z.B. René König, Kleider und Leute. Zur Soziologie der Mode, Frankfurt/M. 1967; Erving Goffman, Wir alle spielen Theater. Die Selbstdarstellung im Alltag, 6. Aufl. München 1988. •67 Vgl. die Übersicht bei FISCHER-LICHTE 1983, Bd. 1, 123-126.
270
Kapitel V: Dramatische Informationsvergabe
ten und das kokette Rüschenkleid der Trippelli (»Der Schritt vom Wege«, D 1939) Hinweise auf figurenspezifische Konzepte und, wenn die Garderobe wie bei diesen Beispielen so deutlich kontrastierend gewählt ist, auf Figurenkonstellationen, die auf die Sinnkonzepte der Filme hindeuten. Der Symbolcharakter, der der Kleidung in der Realität immer schon anhaftet, hat naheliegenderweise zur Folge, daß Kostüme im Film zu einem gewichtigen Bestandteil symbolischer oder allegorischer Verweissysteme werden können.168 Solche symbolischen oder allegorischen Funktionen von Kostümen entfalten sich ihrerseits auf der Grundlage formeller und informeller »Kleiderordnungen«.169
C. Kategorien der Figurenanalyse Dieses Kapitel rekapituliert figurenanalytische Begriffe und Methoden der Dramenanalyse, die die Filmanalyse ohne wesentliche Abstriche oder Zusätze übernehmen kann. Es beschränkt sich deshalb auf knappe Referate der von der Dramenanalyse bereitgestellten Kategorien. Personal: Quantitative und qualitative Relationen Die Dramenanalyse beschreibt die Strukturen des dramatischen Personals als Menge quantitativer und qualitativer Relationen:170 Aus der Häufigkeit und Dauer, mit der eine Figur auf der Bühne präsent ist, und aus ihrem Redeanteil am Gesamttext leitet sie quantitative Dominanzrelationen ab. Die Auftrittshäufigkeit einer Figur ergibt sich aus den Ergebnissen der Konfigurationsanalyse (s.u.), Auftrittsdauer und Redeanteile setzen Messungen und damit einen Aufwand voraus, über dessen Nutzen im konkreten Fall zu befinden wäre. Quantitative Dominanzrelationen lassen zwar keine zuverlässigen Rückschlüsse auf die handlungslogische Funktion und Bedeutung einer Figur zu, liefern aber immerhin einen »Parameter für die zentrale bzw. periphere Posi168 vgl. dazu ebd. 128f. 169 Vgl. z.B. die Kleider der Gelsomina (Giulietta Masina) in Fellinis »La Strada« (I 1954), die Elemente der Kinder-, Männer- und Frauenkleidung, des Armenkleids, des Clownund Gaulderkostüms kombinieren. Als Anzeiger der Einfalt und der beschädigten weiblichen Identität (Kinder-/Männerkleidung), der Armut, Verlorenheit und Unbehaustheit (Armenkleid), aber auch der träumerischen Kraft der Figur (Gauklerkostüm) geraten sie zu komplexen Symbolträgern, die präzise auf das (mit Zampanos Kostümen, seinem Gefährt, den Schauplätzen u.a. vervollständigte) bildsymbolische Gesamtsystem des Films bezogen sind. 170 Vgl. PFISTER 1982, 225-232.
Kapitel V: Dramatische Informationsvergabe
271
tion einer Figur im Personal«, also für die grobe Unterscheidung von Hauptund Nebenfiguren, unter Umständen auch für feinere Differenzierungen.171 Aus Merkmalen der Figuren, etwa aus Alter, Geschlecht, Stand, Herkunft, Bildungsgrad, aber auch aus Charaktermerkmalen ergeben sich Kontrast- und Korrespondenzrelationen, die qualitative Strukturen des Personals zu erfassen in der Lage sind. 172 Die Ergebnisse solcher qualitativen Strukturanalysen lassen sich in Form einer »Matrix von Merkmalsoppositionen« darstellen,173 in der die einzelne Figur als Bündel von Kontrast- und Korrespondenzmerkmalen erscheint. Figurenkonstellation Die quantitativen und qualitativen Strukturen des Personals implizieren die möglichen Interaktionsmuster, die die Figuren miteinander und aneinander vollziehen können. Aus diesen möglichen Interaktionsmustern ergeben sich die Figurenkonstellationen.174 Für deren Beschreibung ist freilich auch die neuere Dramenanalyse noch nicht über die traditionelle Unterscheidung von Protagonist (Held) und Antagonist (Gegenspieler) hinausgekommen, der sie noch die Position des Helfers (Komplizen) hinzufügt.175 Dieses grobe Raster kann selbstverständlich nur bei Dramen oder Filmen greifen, deren Geschichten konfliktorientiert strukturiert sind. Dort immerhin ist es geeignet, die Dynamik der Interaktionsprozesse, wechselnde Oppositionen und Koalitionen zwischen den Figuren grob zu erfassen. Grundlage dafür ist die Analyse der handlungslogischen Struktur (vgl. Kap. III.C.2.3), aus der sich die handlungslogischen Funktionen der Figurenaktionen ableiten. Konfiguration Die Konfigurationsanalyse ist ein vielseitiges Instrument der Figurenanalyse, das der Dramen- wie Filminterpretation wertvolle Grundlagen zu liefern imstande ist.176 Sie rekonstruiert mit einfachen Mitteln die Konfigurationsstruktur, indem sie die jeweils gemeinsam auf der Bühne präsenten Figuren für jeden Auftritt verzeichnet. Die Grundeinheit für die filmische Konfigurationsanalyse ist, wie bei der Einführung der Konfiguration als Kriterium der nar171 Ebd. 227. 172 Vgl. ebd. 227-232. 173 Vgl. das Beispiel ebd. 231. 174 Vgl. ebd. 232-235. 175 Vgl. PFISTER 1982, 234. - Den Nutzen des generativen Systems von Souriau (Les deux cent mille situations dramatiques, Paris 1950) für die Dramenanalyse schätzt Pfíster - zu Recht, wie mir scheint, mit Verweis auf die unzureichende Operationalisierbarkeit seiner funktionalen Kategorien - skeptisch ein (vgl. 234f.). 176 Vgl. ebd. 235-240.
272
Kapitel V: Dramatische Informationsvergabe
rativen Strukturanalyse schon geklärt wurde (vgl. Kap. III.C.2.2), die filmische Szene. Die Ergebnisse lassen sich in der Form einer Matrix darstellen, die konfigurative Relationen, Konfigurationsdichte und Konfigurationsfolgen erfaßt.177 Für die Auswertung der Konfigurationsanalyse stellt Pfister folgende Kriterien bereit:178 Die szenische Distanz ermittelt die konfigurativen Beziehungen zwischen jeweils zwei Figuren. Sie bemißt sich nach der Anzahl der Szenen, in denen beide nicht konfigurieren: Je geringer sie ist, um so höher wird naheliegenderweise die Menge und/oder Intensität der Interrelationen zwischen beiden Figuren sein. Im Extremfall handelt es sich um konkomitante Figuren, die grundsätzlich gemeinsam auftreten und abgehen, oder aber um alternative Figuren, die in keinem einzigen Auftritt gemeinsam erscheinen.179 Die Häufigkeit repetitiver Konfigurationen verweist generell auf den Intensitätsgrad der Interrelationen der betreffenden Figuren und speziell auf potentielle Korrespondenzbezüge der identischen Konfigurationen, etwa auf sukzessive thematisierte Veränderungen im Verhältnis dieser Figuren zueinander.180 Die Untersuchung der Konfigurationsfolge verspricht Aufschluß über Verfahren der Figurencharakterisierung dann, wenn man sie für jede Figur gesondert durchführt, d.h. die Abfolge der Konfigurationen untersucht, in denen die Figur erscheint und die ihr je spezifische Möglichkeiten der Selbstcharakterisie177
Vgl. das folgende, von Pfister (ebd. 239) gegebene Beispiel, das die Konfigurationsstruktur von Schnitzleis »Reigen« abbildet: Figur/Szene 1 2 3 4 5 6 7 8 9 10 Dirne * - - - χ Soldat χ χ Stubenmädchen - x x Junger Herr - - x x Junge Frau - - - x x - - - - Ehemann - - - - x x - - - Süßes Mädel - - - - - χ χ - - Dichter - χ χ - Schauspielerin χ χ Graf - x x Die Übersicht dokumentiert die konfigurativen Relationen und die konstante Konfigurationsdichte (Zweier-Konfiguration), die auf die Konstanz des erotischen Interaktionsmusters verweisen; sie dokumentiert die Konfigurationsfolge, die die kettenförmige Verknüpfung der Konfigurationen, ihre zyklische Gestalt und die episodische Struktur des Stücks anzeigt. Zusammen mit den (in den Figurenbezeichnungen schon angedeuteten) Korrespondenz· und Kontrastrelationen liefert sie darüber hinaus Hinweise auf abstrakte Konzepte des Stücks, etwa auf die »Nivellierung sozialer Unterschiede« (ebd.) im Zeichen der erotischen Begegnung und auf Modelle erotischen Interaktionsverhaltens und deren Ideologie. 1 78 Vgl. ebd. 237-240. π» Ebd. 239. i«o Ebd. 240.
Kapitel V: Dramatische Informationsvergabe
273
rung durch verbales und nonverbales Verhalten verschafft.181 Die Konfigurationsdichte schließlich ergibt sich aus dem Verhältnis zwischen der Anzahl der »besetzten Matrixzellen zur Gesamtzahl der Matrixzellen«, deren - selten erreichter - Maximalwert folglich 1 wäre.182 Der Erkenntniswert solcher Rechenspiele dürfte freilich begrenzt sein. Figurencharakterisierung Um das Repertoire dramatischer Techniken der Figurencharakterisierung zu erfassen, entwirft Pfister einen hochspezifizierten Beschreibungsapparat,183 der dem Bedürfnis nach Systematisierung des Gegenstandsbereichs mehr entgegenkommt als den Bedürfnissen der Dramen- bzw. Filmanalyse nach praktikablen Kategorien und Methoden. Hier werden daher nur die übergeordneten Differenzkriterien seines Systems übernommen, nämlich die Unterscheidung zwischen figuralen und »auktorialen« (hier: erzählergebundenen), expliziten und impliziten Techniken der Figurencharakterisierung sowie zwischen Selbst- und Fremdcharakterisierung. Figurale Techniken der Figurencharakterisierung, also von den Figuren selbst vermittelte charakterisierende Informationen sind zunächst danach zu unterscheiden, ob sie selbst- oder fremdbezogen sind. Die figurale Selbstcharakterisierung vollzieht sich in sämtlichen Formen verbalen und nonverbalen Handelns der Figur, die zum größten Teil implizite Techniken der Selbstcharakterisierung darstellen. Explizite Selbstcharakterisierung vollzieht sich im ausdrücklichen (sprachlichen) Selbstkommentar. Figurale Fremdcharakterisierung vollzieht sich überwiegend explizit in ausdrücklichen sprachlichen Äußerungen einer Figur über eine andere. Ob diese Äußerungen in Monologen oder Dialogen, in Gegenwart oder Abwesenheit und vor oder nach dem ersten Auftritt der charakterisierten Figur fallen,184 kann von Bedeutung sein, etwa weil Fremdkommentare vor dem ersten Auftritt der kommentierten Figur die 181 Vgl. etwa die expositorische Funktion der Konfigurationen, in denen die Hauptfigur von Michael Curtiz' »Casablanca« (USA 1942), Rick Blaine (Humphrey Bogart), zu Beginn des Films erscheint: Der Kellner, der Rick einen Scheck zur Abzeichnung vorlegt, markiert Ricks Position als Chef; die Auseinandersetzung mit einem deutschen Nazi, dem er den Zutritt zu seinem Spielsalon verweigert, gibt Gelegenheit, auf seine politische Moral vorauszudeuten; das Gespräch mit Ugarte (Peter Lorre) schwächt diese Vorausdeutung eher wieder ab, indem sie Rick Gelegenheit gibt, seine Fassade - den politisch und moralisch Gleichgültigen - wiederherzustellen; das Gespräch mit Ferrari und dann mit Ferrari und Sam deutet wieder das Gegenteil an, nämlich die Konturen eines moralischen Nonnen verpflichteten Mannes. 182 Vgl. PFISTER 1982, 239.- Die Konfigurationsdichte des oben (Anm. 177) dargestellten Beispiels, Schnitzlers »Reigen«, wäre mit 20:100 = 0,2 also als sehr gering anzusprechen. 183 Vgl. die Übersicht ebd. 252. 184 Vgl. ebd. 251-253.
274
Kapitel V: Dramatische Informationsvergabe
Erwartungshaltung des Rezipienten erheblich prädisponieren oder weil »bei einem dialogischen Fremdkommentar in präsentia (...) mit strategischen und partnertaktischen Verzerrungen gerechnet werden muß«.185 Als implizite Techniken der figuralen Fremdcharakterisierung sind die oben erwähnten Kontrast- und Korrespondenzrelationen anzusprechen, die eine indirekte wechselseitige Charakterisierung der Figuren leisten. Die (mit Blick auf das Drama eher problematische) Annahme »auktorialer« Charakterisierungsverfahren186 ist für den Film problemlos zu übernehmen, sofern sie nicht auf das Werksubjekt, sondern auf den Erzähler, also auf das vermittelnde Kommunikationssystem bezogen wird, weshalb hier auch nicht von auktorialen, sondern von erzählergebundenen Charakterisierungsverfahren die Rede ist. Erzählergebundene Figurencharakterisierung vollzieht sich auf der Ebene des vermittelnden Kommunikationssystems, also in sämtlichen Verfahren der kinematographischen Abbildung (vgl. Kap. II, III). Die Unterscheidung zwischen figuralen und erzählergebunden Charakterisierungstechniken ist vor allem für die Frage nach dem Grad der Verbindlichkeit figurenspezifischer Informationen von Bedeutung: Erzählergebundene Charakterisierungsverfahren haben naheliegenderweise eine erheblich höhere Verbindlichkeit als die von mehr oder minder starken subjektiv-perspektivischen Verzerrungen geprägte explizit-figurale Selbst- oder Fremdcharakterisierung. Die implizit-figurale Selbst- und Fremdcharakterisierung hat dagegen in der Regel einen ebenfalls hohen Verbindlichkeitsgrad, solange sie nicht durch bewußte taktische Selbstdarstellungen der Figuren zustandekommt. Bei den explizit-figuralen Charakterisierungstechniken schließlich bemißt sich der Verbindlichkeitsgrad selbst- oder fremdcharakterisierender Aussagen allererst danach, welchen Verbindlichkeitsgrad die Perspektive der Figur besitzt, die diese Aussagen macht. Das Zusammenspiel sämtlicher Verfahren der Figurencharakterisierung ist maßgeblich an der Organisation der Perspektivenstruktur filmischer Texte beteiligt (vgl. Kap. VI).
D. Schauplätze: Funktionen des fiktiven Raumes im Film Die Auswahl, Gestaltung und Darstellung der Räume, in denen sich die fiktiven Figuren bewegen, lassen sich als eine besondere Form nonverbaler Infor185
Ebd. 253. - Das gilt freilich auch für den dialogischen Fremdkommentar »in absentia«, der seinerseits taktischen Zielen verpflichtet sein kann (z.B. dem Versuch, den Dialogpartner fur/gegen die charakterisierte Figur einzunehmen). 186 Vgl. ebd. 262 u.ö.
Kapitel V: Dramatische Informationsvergabe
275
mationsvergabe im Film ansprechen, die hochkomplexe semantische Beziehungen konstituieren kann. Ihre Basisfunktion ist zunächst die Präsentation von Räumen als Schauplätzen, als Aktionsräumen der handelnden Figuren, die hier die eigentliche Bedeutung filmischer Räume genannt sei187 und die jeder Schauplatz erzählter Geschichten erfüllt. Wo sich seine Bedeutung nicht in dieser eigentlichen Funktion als Vollzugsort von Handlungen erschöpft, entfalten sich seine potentiellen Funktionen als Träger mehr oder weniger komplex strukturierter uneigentlicher (symbolischer oder allegorischer) Bedeutungen, die wesentliche Konstituenten der uneigentlichen Bilderrede sind (vgl. Kap. VII). Die Unterscheidung eigentlicher und uneigentlicher Raumbedeutungen bezieht sich wohlgemerkt auf vom (Film-) Text hergestellte Bedeutungen, nicht auf vor- und außertextuelle Raumbedeutungen:188 Uneigentliche Bedeutungen realer Räume - etwa ritueller Räume sakraler oder profaner Bauten (Kirche, Thronsaal, Gerichtssaal u.ä.) - geben ihren filmischen Abbildern noch nicht den Status uneigentlicher Räume, sind vielmehr Bestandteil eigentlicher Raumbedeutungen.189 Die Funktionen, die Kameraverhalten und Montage für die Präsentation filmischer Räume haben, wurden in den entsprechenden Kapiteln (II, III) erörtert. Eigens hingewiesen sei hier auf die vielfältigen Funktionen, die die Beleuchtung für die Gestaltung von Räumen übernehmen kann, indem sie, um nur einige Beispiele zu nennen, Bildzentren definiert, Licht und Schatten verteilt, harte oder weiche Kontraste schafft, glänzendes oder stumpfes Licht, Atmosphäre und Stimmung (z.B. heitere, unheimliche, sachliche usw. Raumwirkungen) erzeugt. Die Beleuchtung ist ein rein produktionstechnisches Element des Films, das der Rezipient in der Regel nicht als Beleuchtung, sondern als Licht und damit als Eigenschaft der Räume selbst erfährt, und das ist auch der Grund, warum sie hier nicht speziell behandelt, sondern als Bestandteil filmischer Räume aufgefaßt wird.
1.
Eigentliche Raumkonzepte
Die Unterscheidung eigentlicher und uneigentlicher Raumbedeutungen besagt nicht, daß in ihrer eigentlichen Funktion erscheinende Räume »nichts« be187 Vgl. Kap. VII (Anm. 2). 188 V g l . d a g e g e n FISCHER-LICHTE 1 9 8 3 , B d . 1, 134f. u n d 1 4 5 f f .
189 Die sakrale Symbolik einer Kirche etwa zeigt lediglich den Schauplatz an, dessen Funktion sich in einer unendlichen Zahl von Filmen in der eigentlichen Raumbedeutung - als Vollzugsort ritueller Akte - durchaus erschöpft. Um diesen Schauplatz als Träger uneigentlicher Bedeutungen in Funktion zu setzen, bedarf es zusätzlicher Zeichen (Kap. VII.B.2).
276
Kapitel V: Dramatische Informationsvergabe
deuten:190 Die Konstitution eigentlicher Raumbedeutungen, die Inszenierung (Auswahl, Gestaltung) filmischer Räume als Vollzugsorten von Handlungen ist allererst prädisponiert durch die Art dieser Handlungen selbst und damit zugleich durch die ihnen immanenten Standards der Angemessenheit von Handlung und Raum. Eigentliche Raumbedeutungen erschöpfen sich daher nicht in den praktischen Funktionen von Räumen, etwa darin, daß eine Treppe bestiegen, eine Tür geöffnet, zu einem Fenster hinausgesehen werden kann, sondern umfassen darüber hinaus die Gesamtheit konventionalisierter Gebrauchsfunktionen von Räumen und der ihnen immanenten Indices sowie filmgeschichtlich konventionalisierter Raumfunktionen. Schauplatzauswahl und -ausstattung sind mithin prädisponiert von räumlich-praktischen Anforderungen, von konventionsbedingten Raumkonzepten und von filmspezifischen, insbesondere genretypischen Traditionen. Räumlich-praktischen Prädispositionen gehorcht jede Schauplatzwahl und -gestaltung, unabhängig davon, ob optische Erfahrungswelt abgebildet werden soll oder nicht und ob sie realistisch konzipiert ist oder nicht. Auch die unwirklichen Schauplätze des phantastischen oder surrealistischen Films sind ihrer eigentlichen Bedeutung nach Aktionsräume der Figuren und als solche mit Art und Raumbedarf der Handlungen relationiert. Jede raumsemantische Analyse wird sich dieser räumlich-praktischen Voraussetzungen der Schauplatzwahl und -gestaltung zu vergewissern haben, bevor sie sich weitergehenden Deutungen raumsemantischer Bezüge zuwendet. Konventionsbedingte Prädispositionen, zeit- und kulturspezifische Vorstellungen darüber, welche Handlungen (und welche Ausstattungen) welchen Räumen angemessen sind und welche nicht (vgl. etwa die Opposition zwischen Natur- und Kulturräumen, zwischen privaten und öffentlichen, sakralen und profanen Räumen), sind ein maßgeblicher Steuerungsfaktor für Schauplatzwahl und -ausstattung: Ein Schlafzimmer etwa bedeutet - eigentlich nicht bloß einen Raum, in dem man schläft, sondern auch - mit zeit- und kulturspezifischen Variationen - den intimsten Bezirk eines Hauses, und seine Größe und Ausstattung können eine Fülle von Indices liefern, die Auskunft über seine Bewohner (z.B. über sozialen Status, Lebensgewohnheiten etc.) geben. Die konventionellen Gebrauchsfunktionen von Räumen und die ihnen immanenten sozialen Bedeutungen prädisponieren und charakterisieren die in ihnen stattfindenden Handlungen, weshalb jeder Verstoß gegen sie einen signifikanten Interpretationsbedarf schafft. Sie verlieren an Bedeutung, je mehr 190 Das legt Pfíster nahe, wenn er in eigentlichen Raumbedeutungen lediglich sekundäre, untergeordnete Funktionen oder »Bedingungsrahmen« sieht (PFÍSTER 1982, 338f.). Ähnliches gilt für Fischer-Lichtes Unterscheidung von »praktischen« und »symbolischen« Raumfunktionen (FISCHER-LICHTE 1983, Bd. 1, 133ff. und 145-151).
Kapitel V: Dramatische Informationsvergabe
277
sich der filmische Raum von der optischen Erfahrungswelt des Rezipienten entfernt und damit konventionellen Raumkonzepten entzieht191 und/oder je weniger seine Inszenierung realistischen Konzepten verpflichtet ist. 192 Filmspezifische Traditionen schließlich, die sich im Laufe der Filmgeschichte herausgebildet und dabei eine Art filmische Topik begründet haben, die relativ feste Beziehungen zwischen bestimmten Handlungen und bestimmten Räumen herstellt, liefern einen filmhistorischen Zitatenschatz, eine Sammlung von loci communes im ganz buchstäblichen Sinn, deren normative Kraft noch in ihrer Negation, d.h. in der Kombination einer 'topischen' Handlung mit einem neuen, ungewöhnlichen Schauplatz193 oder umgekehrt, präsent ist: Wenn etwa John Ford den großen Indianerüberfall auf die Postkutsche in »Stagecoach* (USA 1939) in eine weite Ebene verlegt, dann zitiert er damit ex negativo die enge Schlucht, in der sich Filmszenen dieser Art normalerweise abspielen. Und Hitchcocks Vorliebe für Mordszenen, die auf Schauplätzen des alltäglichen Lebens und am heilichten Tag stattfinden (vgl. etwa »Frenzy«, USA 1971), hat immer auch zu tun mit den traditionellen Topoi filmischer Mordszenen, mit den nächtlich-dunklen, regennassen Gassen, den suspekten Hafenvierteln, den Hinterzimmern zweifelhafter Bars und Spelunken, den unheimlichen Parks oder den geheimnisumwitterten Landhäusern, in denen seine Vorgänger bevorzugt Mordtaten geschehen ließen. Alle diese Prädispositionen unterliegen schließlich ihrerseits aufnahmetechnischen Bedingungen, weil nicht jeder Raum (sofern er nicht im Atelier ge191 In solchen Fällen müssen die Raumkonzepte erst - durch die Handlungen - definiert werden, wobei freilich konventionelle Raumvorstellungen zumeist als implizite Nonn weiterwirken. Vgl. etwa die erst durch die Handlungen explizierten Raumfunktionen der »Oberstadt« und »Unterstadt« in Fritz Langs »Metropolis« (D 1927), die indes deutlich mit konventionellen Raumkonzepten korrespondieren (etwa mit den Gegensatz von städtischen Villen- und Arbeitervierteln). 192 Auch hier bleiben Konventionen zumeist als implizite Norm erhalten, denn gerade der Verstoß gegen sie wird dabei zum wichtigsten Signal des Inszenierungskonzepts, weil er das Wahrscheinlichkeitspostulat, das den realistisch inszenierten Film regiert, explizit destruiert. Vgl. etwa den unten (S. 281 f.) beschriebenen Schauplatz, den Fassbinder in »Fontane Effi Briest« (BRD 1974) fur einen Spaziergang von Mutter und Tochter Briest gewählt hat, eine unwegsame, düstere Moorlandschaft, die konventionellen Vorstellungen eines Spazierweges, zumal zweier Frauen, die mit ihren langen Kleidern offensichtliche Mühe haben vorwärtszukommen, deutlich widerspricht. 193 Vgl. etwa den Schauplatz, den Fellini in »Le notti di Cabiria« (I/F 1956) für die Szene wählt, in der der Buchhalter (François Périer) der Heldin (Giulietta Masina) seine Liebeserklärung macht: Der Dialog ruft alle Klischees ab, die der Liebesfilm für diese Situation bereithält, der Schauplatz aber, eine weite, öde und tote, beinahe bedrohliche Neubauwüste in der Vorstadt, destruiert die Erwartungen des Zuschauers, negiert die Gefühle, die sich hier zu entfalten scheinen, und weist damit voraus auf die weitere Entwicklung der Geschichte, in der sich diese Gefühle als kalte Berechnung und tödliche Bedrohung herausstellen.
278
Kapitel V: Dramatische Informationsvergabe
baut werden kann) kamera- und tontechnisch gleichermaßen erfaßbar ist. Aufnahmetechnische Bedingungen sind dem historischen Wandel der kinematographischen Technik und der Atelier- und Tricktechnik unterworfen und daher für filmhistorische Untersuchungen von besonderem Belang.
2.
Uneigentliche Raumkonzepte
Bei der Inszenierung (Auswahl, Gestaltung) filmischer Räume als Trägern uneigentlicher Bedeutungen werden die Konstituenten der eigentlichen Bedeutung fiktiver filmischer Räume auf einer zweiten Bedeutungsebene in neue semantische Bezüge gesetzt. Diese neuen semantischen Bezüge lassen sich, dramenanalytischen Beschreibungsverfahren folgend, grob ordnen als Ergebnisse unterschiedlicher Verfahren der Relationierung, nämlich der Relationierung von Teilen eines Schauplatzes, der Relationierung von Schauplatz und Geschehen, der Relationierung mehrerer Schauplätze und der Relationierung von Schauplatz und Off screen.194 Relationen innerhalb eines Schauplatzes Die Konstitution uneigentlicher Bedeutungen durch die Relationierung der Teile eines Schauplatzes ist allererst eine Frage der Ausstattung der Räume, betrifft die Beziehungen zwischen Ausstattungsdetails und/oder zwischen verschiedenen Bezirken eines Schauplatzes. Uneigentlichkeit wird hier vor allem durch semantische Spannungen oder gar Widersprüche zwischen Ausstattungsdetails signalisiert, wie die schon einmal beigezogene Einstellung aus Jean Renoirs »La grande illusion« (F 1937) illustrieren mag, die den Raum beschreibt, in dem Rauffenstein (Erich v. Stroheim) als Kommandant des Kriegsgefangenenlagers »Wintersborn« Quartier genommen hat. Es handelt sich um die Kapelle einer spätmittelalterlichen Burg, in der Rauffenstein sich häuslich eingerichtet hat und deren Ausstattung die Kamera mit langsamen Bewegungen sorgfältig notiert:195 In der Apsis, zwischen zwei Fenstern, hängt ein großer Kruzifix, darunter, auf dem Altartisch steht ein Bild Hindenburgs und darunter, direkt vor dem Altar, Rauffensteins Feldbett; rechts davon, auf einem Kirchenstuhl, eine kümmerlich blühende Geranie, daneben, auf Tischen, das Bildnis einer Frau, ein Band Heine, ein Band Casanova und verschiedene Utensilien eines Offiziers; an einer darüber gespannten Wäscheleine trocknen seine weißen Handschuhe, und im leergeräumten Kirchenschiff steht der Eßtisch, an dem Rauffenstein sein Frühstück ein194 Vgl. PFISTER 1982, 340-345.
195 Vgl. die Beschreibung in Kap. II, Anm. 88.
Kapitel V: Dramatische Informationsvergabe
279
nimmt. Architektur und sakrale Dingsymbole (Kruzifix, Altar) weisen den Raum als Kirchenraum aus, die zu den so offensichtlich zweckfremden Einrichtungsgegenständen in ein auffalliges semantisches Spannungsverhältnis treten. Dieses Spannungsverhältnis läßt sich zunächst in eigentlicher Bedeutung lesen, die den Raum als Notquartier kenntlich macht und damit auf die besonderen Umstände des Krieges verweist. Nun hinterläßt diese eigentliche Deutung aber semantische Defizite (vgl. Kap. VII.B.2): Sie kann z.B. nicht begründen, warum nicht nur das Kirchenschiff, sondern auch und sogar die Apsis der Zweckentfremdung unterworfen wird und warum die Kamera gerade das sie betreffende Arrangement - Kruzifix, Altar mit Hindenburg-Bild und Feldbett - so sorgfältig, mit einem langsamen vertikalen Schwenk, registriert. Die eigentliche Lesart reicht also nicht aus, um das semantische Spannungsverhältnis zwischen den Ausstattungsdetails aufzulösen. Erst in uneigentlicher Lesart enthüllt sich die Raumausstattung als symbolisches Arrangement, das sich - maßgeblich unterstützt durch die langsame, die Raumausstattung nur nach und nach enthüllende Kameraführung - das Nebeneinander sakraler und profaner Einrichtungsgegenstände zunutze macht, um deren spannungsreiche semantische Relationen als symbolische zu markieren. Es spricht fast schon für sich selbst: Die Ausstattung der Apsis, die Kruzifix, Hindenburg-Bildnis und Feldbett vor- und untereinander anordnet, notiert die geistige (Rang-) Ordnung der Welt, wie ein Rauffenstein, Aristokrat und Offizier, sie sich denkt. Sie hat die Gestalt einer schlichten Ableitung, die die Kamera mit ihrer langsamen, von oben nach unten führenden Bewegung nachvollzieht: Gott bleibt die höchste Instanz, doch nicht seine Weltordnung gilt, sondern die des Militärs, denn an die Stelle, wo Wort und Sakrament ihren Platz hätten, tritt - »unmittelbar zu Gott« - der höchste Vertreter des Militärs, der Generalfeldmarschall und Oberbefehlshaber des Heeres. Gleich danach, ohne Abstand auf horizontaler Ebene, nur um ein weniges in der Vertikalen, in der Hierarchie nach unten verschoben - in »reichsunmittelbarer« Position, möchte man sagen - folgt die Militäraristokratie, der adelige Offizier, der seinen für Gott und Hindenburg zerschossenen und mit zahlreichen Prothesen wieder zusammengeflickten Leib dem Opfertisch - Gott und Hindenburg - zu Füßen legt. Nun melden aber nicht nur die Übertreibung, die Überartikuliertheit dieses blasphemischen Arrangements, sondern auch die übrigen Raumdetails Zweifel an, ob der, der hier Quartier genommen hat, wirklich noch ganz ungebrochen in dieser Weltordnung lebt. Es sind dies der neben Casanovas Memoiren liegende, goldbedruckte Heine-Band auf dem Tisch, die kümmerlich blühende Geranie auf der Kirchenbank und nicht zuletzt Rauffenstein selbst mit seinem geschundenen Körper, mit seiner Genickstütze, ohne die er augenblicklich sterben würde, und mit seiner Position als ausgemusterter und zum
280
Kapitel V: Dramatische Informationsvergabe
Gefängniswärter degradierter Major, die seinem Selbstverständnis als Vertreter eines »reichsunmittelbaren« Standes Hohn spricht. Der Raum gerät so zu einem symbolischen Mikrokosmos, der einen säkularen historischen Prozeß andeutet: Es geht hier um den mit dem ersten Weltkrieg endgültig besiegelten Niedergang des europäischen Adels als öffentlichen, politischen Standes, der den aristokratischen Politicus vollends zum (bürgerlichen) Privatus umbildete, ein Umbildungsprozeß, den die unstandesgemäße Lektüre (Heine), die beständige Todesnähe des Majors (Genickstütze), vor allem aber der Inbegriff bürgerlichen Blumenschmucks, die Geranie (deren kümmerliche Blüte mit dem kümmerlichen Rest an Lebenskraft korrespondiert, der dem geschundenen Leib des Majors und mit ihm seinem Geschlecht und Stand noch innewohnt) und die liebevolle Pflege, die Rauffenstein ihr angedeihen läßt, markieren. Relationen zwischen Schauplatz und Geschehen Die volle Bedeutung des Kirchenraumes in »La grande illusion« entfaltet sich freilich erst später, und zwar durch die Relationierung von Schauplatz und Geschehen: Rauffensteins Feldbett, dessen Position so nachdrücklich die eigentliche Bedeutung des Altars als Opfertisch reaktiviert und so Militärdienst und Soldatentod nachgerade zum Sakrament erhebt, wird nämlich Schauplatz eines ganz anderen Opfertodes, den Rauffensteins Standesgenosse und Kriegsgefangener, der französische Aristokrat und Offizier Boeldieu (Pierre Fresnay) hier stirbt. Boeldieu opfert sich, um seinen Kameraden Rosenthal (Marcel Dalio) und Maréchal (Jean Gabin) die Flucht zu ermöglichen, aber auch, weil er sterben will. 196 Das Opfer, in subjektiver Perspektive Ausdruck standesethischer Normen und selbstironischer, im Bewußtsein der historischen Überholtheit der aristokratischen Existenz inszenierter Gestus zugleich, entfaltet seine uneigentliche Bedeutung als symbolischer Vollzug jenes säkularen Prozesses, den das Arrangement in Rauffensteins Quartier andeutet (s.o.): Boeldieus Opfer für Rosenthal und Maréchal, für den Bankierssohn und den Arbeiter, notiert die Ablösung der Aristokratie durch Kapital und Proletariat, die der Aristokrat als letzten Gestus aristokratischer Standesethik selbstironisch inszeniert. Worauf Rauffenstein, letzter kinderloser Sproß eines deutschen Adelsgeschlechts, mit der Halsstarrigkeit, die seine Genickstütze bildlich avisiert, trotzig beharrt, die Geltungsfähigkeit der aristokratischen Weltordnung, hat sein französischer Standesgenosse Boeldieu zu beglaubigen oder 196 Durch ein vorgetäuschtes Fluchtmanöver zieht Boeldieu die Aufmerksamkeit der Wachmannschaft auf sich, um damit von Rosenthals und Maréchals Flucht abzulenken, wird dabei von einer Kugel aus Rauffensteins Pistole schwer verletzt und stirbt wenig später, und zwar auf Rauffensteins Feldbett. Seine Tat ist Opfer und Vorwand zugleich, denn er erzwingt, indem er sein Ablenkungsmanöver unnötig in die Länge zieht, Rauffensteins Schuß und seinen Tod.
Kapitel V: Dramatische Informationsvergabe
281
zu verwerfen schon nicht mehr die Kraft. Deshalb stirbt er, seinen Tod als letzte Selbstvergewisserung aristokratischer Identität inszenierend und den Geltungsanspruch dieser Inszenierung doch zugleich - als Vorwand - selbstironisch negierend. Deshalb auch stirbt er an dieser Stelle und vollendet damit die absurde Symbolik des Ortes, stirbt hier gerade keinen Tod für Gott und Vaterland, sondern den Tod seines untergehenden Geschlechts, das den jungen, aufsteigenden Klassen Platz macht. Die Relationierung von Schauplatz und Handlung, die ihre Funktion für die Konstitution uneigentlicher Raumbedeutungen bei diesem Beispiel erst im Rahmen eines komplexen symbolischen Verweisungssystems entfaltet, vollzieht sich in weniger komplex strukturierten Fällen auf einfacherem Wege, nämlich durch kalkulierte Verstöße gegen konventionelle Beziehungen zwischen Räumen und Handlungen: Der Spaziergang von Mutter und Tochter Briest in Fassbinders »Fontane Effi Briest« (BRD 1974) etwa, der durch eine düstere, leblose und unwegsame Moorlandschaft, also durch eine Gegend führt, in der eine Dame von Stand nicht spazierengeht, die diesen Widerspruch vertiefende Kleidung der beiden Frauen (lange, das Vorwärtskommen im hohen Gras erschwerende Röcke), der aufgespannte Sonnenschirm, den Frau von Briest dabei unnötigerweise (denn es herrscht herbstlich-trübes Wetter) mit sich führt, und schließlich das Gespräch, das sich um Liebe, Verlobung und Hochzeit dreht (und erst gegen Ende der Szene Kontakt zur düsteren Umgebung gewinnt), signalisieren die Funktion dieses Raumes als Allegorie des Lebens-Raumes der Figuren, der Heldin vor allem, in dem alles Leben erstarrt scheint. Damit zugleich gewinnt das Handeln der Figuren seinerseits allegorische Bedeutung: Der Spaziergang durch unfreundliches, unwegsames Gelände wird zum Lebensweg, und das Gerede von Liebe und Ehe, der Sonnenschirm der Frau von Briest, Effis unbeschwerte Sprünge im toten Binsengras sind allegorische Anzeiger des Selbstbetrugs, mit dem sich die Figuren auf diesem Weg ihr trostloses Leben umzudefinieren suchen. Die semantischen Spannungen oder Widersprüche zwischen Schauplatz und Handlung, die die uneigentliche Raumkonzeption signalisieren, werden also, die Beispiele deuten es an, auf der Ebene der uneigentlichen Bedeutung aufgelöst: Das verbale und nonverbale Handeln von Mutter und Tochter gerät in Widerspruch zum Raum, wird dann aber auf der Ebene der uneigentlichen Raumbedeutung plausibel und gewinnt dabei selbst uneigentliche Bedeutung, die es als Allegorie ihres Selbstbetrugs lesbar macht. Relationen zwischen mehreren Schauplätzen Eine dritte Möglichkeit, uneigentliche Raumbedeutungen zu konstituieren, ergibt sich aus der Relationierung verschiedener Schauplätze, die allererst auf
282
Kapitel V: Dramatische Informationsvergabe
Kontrastbeziehungen beruht. Dabei spielen konventionalisierte Raumoppositionen (z.B. öffentlich vs. privat, Land vs. Stadt, Natur- vs. Kulturraum) oder konventionalisierte räumliche Gegensatzbegriffe (z.B. Weite vs. Enge, Höhe vs. Tiefe, Innen vs. Außen, Oben vs. Unten) naheliegenderweise eine besondere Rolle, weil sie fast alle mit konventionalisierten uneigentlichen Bedeutungen verkoppelt sind. So ist etwa die Opposition von Oben und Unten mit sozialen und politischen Assoziationen besetzt, die sich beispielsweise Fritz Lang in »Metropolis« (D 1927) zunutze macht, wenn er die Welt der Ausbeuter und der Ausgebeuteten entsprechend situiert und über Ausstattung und Beleuchtung zusätzlich mit der (ebenfalls mit sozialen Assoziationen besetzten) Opposition von Licht und Dunkel verbindet: In der Unterstadt, im Dunkeln, Meilen unter der Erde, abgeschnitten vom Sonnenlicht, leben die Ausgebeuteten, schuften riesige Kolonnen gesichtsloser, marionettenhafter Menschen in spärlich beleuchteten Räumen an gigantischen Maschinen. In der Oberstadt, im Licht, leben die Ausbeuter, genießen in lichtdurchfluteten Parks, auf Spiel- und Sportplätzen Freiheit und Muße. Ober- und Unterstadt werden so zur Allegorie des ebenso universalen wie schlichten politisch-sozialen Weltdeutungsmodells, das diesen Film kennzeichnet.197 Relationen zwischen Schauplatz und Offscreen Wie beim Theater die Beziehung zwischen Bühnenraum und »off stage«, so kann auch beim Film die Beziehung zwischen dem filmisch präsentierten Schauplatz und »Off screen« das »Modell einer zentralen semantischen Opposition« liefern,198 indem sie die Möglichkeit schafft, uneigentliche Bedeutungen des gezeigten Raums durch die (optische) Vorenthaltung seines räumlichen Kontextes zu vermitteln, der damit einseitig perspektiviert werden kann (z.B. als bedrohliche Außenwelt, die den Schauplatz selbst als Zufluchtsort ausweist, oder umgekehrt als verwehrte Welt, die den Schauplatz selbst als Ort des Ausgeschlossenseins ausweist, usw.). Nun schafft die potentielle Ubiquität der Kamera freilich eine andere Situation als auf der Bühne: Weil der Schauplatz im Film beliebig oft gewechselt werden kann, wird das Off screen, solange die Kamera ihre Ubiquität realisiert, vom Zuschauer gar nicht als vorenthaltener Raum empfunden, kommt also gar nicht als semantische Größe zum Zuge. Mit einer semantisch relevanten Relationie197 Eine Variante dieser Opposition, die von Höhe und Tiefe, macht sich Carol Reed in »The third man« (GB 1949) zunutze, wenn er den zunächst triumphierenden Harry Lime (Orson Welles) bei seiner ersten Begegnung mit seinem Freund Holly Martins im Riesenrad, hoch über Wien, zeigt, um ihn dann bei der zweiten Begegnung, die zugleich die SchluBszene des Films ist, tief unterhalb der Stadt, in den Kloaken Wiens, wie eine Ratte um sein Leben laufen zu lassen. 198 PFISTER 1982, 3 4 1 .
Kapitel V: Dramatische Informationsvergabe
283
rung zwischen Schauplatz und Off screen ist demnach nur dort zu rechnen, wo eine signifikante Unterschreitung der normalen Frequenz der Schauplatzwechsel, ein deutlicher Verzicht der Kamera auf ihre potentielle Ubiquität also vorliegt. Auffällig häufig - nicht nur in »Rope« (USA 1948) - hat Hitchcock sich dieses Mittels bedient, indem er das Muster des »Einortdramas« auf den Film übertrug und dabei die Relation zwischen Schauplatz und Off screen zumeist als semantische Nullrelation, als Relation der Negation in Funktion setzte, die den Schauplatz zum Mikrokosmos, zum allegorischen Spiegel von Welt schlechthin macht.199
199 .Lifeboat« (USA 1943) etwa spielt in einem kleinen Rettungsboot auf hoher See, das durch die hermetische Abriegelung von der Welt jenseits des Horizonts zu einem »Mikrokosmos des Krieges« (Hitchcock in TRUFFAUT 1982, 148) und darin zu einem Mikrokosmos der Welt von 1943 schlechthin gerät. Vgl. auch »Rear Window« (USA 1954).
Kapitel VI Die Perspektivenstruktur filmischer Texte
Der aus der Dramentheorie entlehnte Begriff Perspektivenstruktur1 bezeichnet die Organisation des gesamten Ensembles der figuralen Perspektiven und damit zugleich die Organisation der gesamten im (Film-) Text vergebenen Informationen unter dem Gesichtspunkt ihrer Funktion für die Steuerung der Rezipientenperspektive. Der größte Teil dieser Informationsmenge wird im inneren Kommunikationssystem, über die verbale und nonverbale Figurenrede vergeben, erscheint also in je subjektiven, figurenperspektivisch »verzerrten« Teilmengen, deren Geltungsfähigkeit sich für den Rezipienten erst im Verlauf des Rezeptionsprozesses und dabei allererst aus den Relationen zwischen diesen Teilmengen ergibt: Perspektivenstruktur ist allererst Resultat der Distribution und Relationierung dieser Teilmengen mit dem Ziel, die Akzeptanz und Geltungsfahigkeit der Figurenperspektiven zu regulieren, ihren »Verzerrungsgrad« zu bestimmen und so die Rezipientenperspektive zu steuern, sei es dadurch, daß dem Rezipienten bestimmte Figurenperspektiven als Leitperspektiven angeboten werden, sei es dadurch, daß sämtlichen Figurenperspektiven nur bedingte Geltungsfahigkeit zugewiesen wird, so daß der Rezipient aufgefordert ist, aus dem Gesamtensemble der Perspektiven seine eigene Perspektive zu erstellen. Diese im Rezeptionsprozeß zu leistende Arbeit wird maßgeblich gesteuert durch die Perspektive, mit der der Rezipient in den Rezeptionsprozeß eintritt (Rezeptionserwartungen, psychische Dispositionen, Normen und Wertsysteme usw). Vorannahmen des Werksubjekts über diese Prädispositionen sind Teil der Textstruktur, erscheinen im Text selbst im impliziten Entwurf des »idealen« Rezipienten (vgl. Abb.l, S. 45) und sind als solche maßgebliche Konstituenten der Perspektivenstruktur. Bei filmischen Texten gehört auch und vor allem die Erzählerperspektive zur Perspektivenstruktur, die als eine den Figurenperspektiven übergeordnete Perspektive wesentlichen Anteil an der Qualifizierung der Figurenperspektiven und damit an der Steuerung der Rezipientenperspektive hat. In sprechakttheoretischer Sicht läßt sich die Perspektivenstruktur filmischer Texte als Medium betrachten, mit dem das Gelingen des illokutiven Akts, d.h. die intendierten »perlokutionären Effekte« des Sprechakts sichergestellt 1
Vgl. PFISTER 1982, 90-103.
Kapitel VI: Perspektivenstruktur
285
werden sollen (vgl. S. 219): Im äußeren Kommunikationssystem (vgl. Abb. 1, S. 45) stellt sich der filmische Text in seiner Gesamtheit als ein hochkomplexer, über fiktive Sprechakte (Figuren- und Erzählerrede) vermittelter nonfiktiver Sprechakt dar, dessen Subjekt der empirische Autor und dessen Empfänger der empirische Rezipient ist. Die Gesamtheit der im Film über fiktive Sprechakte vergebenen Informationen repräsentiert den propositionalen Akt, der auf die dem empirischen Sprecher und seinen empirischen Empfängern gemeinsame wirkliche Welt referiert, indem er ein fiktives Modell von ihr anfertigt, und der diese \yirkliche Welt »prädiziert«, indem er ihr fiktives Modell als Sinnmodell qualifiziert. Da Filme in der Regel weder sprachliche noch praktische, sondern kognitive und/oder emotionale Reaktionen ihrer Rezipienten intendieren, kann man davon ausgehen, daß ihre illokutiven Akte, mit Searle zu reden, allererst repräsentativer Natur sind,2 d.h. daß sie das in der Proposition entworfene Modell von Welt als »wahr« beanspruchen und folglich darauf abzielen, ihre Empfanger zur Anerkenntnis dieser »Wahrheit« zu bewegen. Die Perspektivenstruktur nun enthüllt die Strategien, mit deren Hilfe das Werksubjekt das Gelingen dieses illokutiven Akts sicherzustellen, nämlich seine Empfanger dazu zu bewegen sucht, seine Propositionen als »wahr« anzuerkennen und damit den intendierten perlokutiven Akt des Sprechakts zu vollziehen, das heißt: Welt so zu sehen, wie der Film sie im fiktiven Modell präsentiert. Das heißt dann auch, daß die intendierte Rezeptionsperspektive zugleich - wenn auch nur mittelbar - die Perspektive des Werksubjekts repräsentiert, die als eine im fiktiven Modell entfaltete Wirklichkeitssicht anzusprechen ist: als Welt-Sicht. Die Autorperspektive ist indes nicht Bestandteil der Perspektivenstruktur selbst, wohl aber leitender Faktor ihrer Erzeugung.
A. Perspektiven und die Verfahren ihrer Strukturierung 1. Perspektiven und Perspektivträger im Film Die für die Perspektivenstruktur filmischer Texte relevanten Perspektiven sind die des Erzählers und der fiktiven Figuren sowie die Perspektive, mit der der Rezipient in den Rezeptionsprozeß eintritt, soweit sie - als »ideale« - im Text implizit formuliert ist. Unter Perspektive ist zunächst allgemein die Sicht des jeweiligen Perspektivträgers auf die fiktive Welt der erzählten Geschichte zu verstehen; sie umfaßt also in erster Linie die je subjektive, intellektuelle 2 Vgl. SEARLE 1980b, 92f. und oben S. 256f.
286
Kapitel VI: Perspektivenstruktur
und emotionale Einstellung des Perspektivträgers zum fiktiven Geschehen. Daneben betrifft sie auch dessen grundsätzliche Beziehung zur fiktiven Welt als Schauplatz bzw. Gegenstand seines Handelns, die besonders für Erzähler und Rezipienten von Belang ist: Für die dramatis personae ist die fiktive Welt allererst Schauplatz, für Erzähler und Rezipienten dagegen allererst Gegenstand ihres Handelns, und zwar Gegenstand der optisch-akustischen Wahrnehmung und darin der von je spezifischen Interessen geleiteten erzählerischen Vermittlung auf der einen Seite (z.B. Unterhaltung, Belehrung, Beeinflussung usw.) und je spezifischer Rezeptionsinteressen auf der anderen Seite (z.B. Unterhaltung, Zerstreuung, Auseinandersetzung usw.). Das heißt: Zur Perspektive von Erzähler und Rezipienten gehört auch das Bewußtsein, im Akt der Wahrnehmung der fiktiven Welt einen kommunikativen Akt zu vollziehen, einen Text zu produzieren bzw. zu rezipieren. Für alle an der Perspektivenstruktur beteiligten Perspektiven sind eine Reihe von Prädispositionen anzunehmen. Sie sind allererst im Informationsund Kenntnisstand des Perspektivträgers, in seinen psychologischen Dispositionen, in seinen ideologischen Normen und Wertorientierungen3 sowie in seinen (in oder mit der Geschichte verfolgten) Interessen zu suchen, wobei alle diese Prädispositionen eng - unter Umständen auch kausal - miteinander relationiert sind. Der Informations- und Kenntnisstand des Perspektivträgers betrifft sein allgemeines soziales und kulturelles Wissen, vor allem aber den Grad seiner Informiertheit über die fiktiven Ereignisse selbst wie über Informationsstand und Einstellungen der übrigen Perspektivträger. Er ist eine sehr variable Größe, die zudem von unterschiedlichen, aus der Position des jeweiligen Perspektivträgers im filmischen Kommunikationssystem resultierenden Bedingungen abhängt: Beim Erzähler bemißt er sich an der gewählten Erzählsituation, beim Rezipienten ergibt er sich aus seinem Vorwissen und - bezüglich der erzählten Geschichte - aus dem Vermittlungsverhalten des filmischen Erzählers und nimmt mit dem Fortschreiten der Geschichte sukzessive zu, während er bei den Figuren allererst vom Grad ihrer Beteiligung an den Konfigurationen abhängt. Über psychologische Dispositionen gibt der filmische Text naheliegenderweise allererst mit Bezug auf die dramatis personae Auskunft: Sie betreffen die psychischen, vor allem emotionalen Voraussetzungen der Figuren, ihres Handelns und ihrer Erfahrungsweisen. Normen und Wertorientierungen prädisponieren sowohl auf Seiten der dramatis personae als auch auf seiten des Erzählers und des Rezipienten Erfahrungsweise und Bewertung der Ereignisse sowie das Handeln und (Erzähl- bzw. Rezeptions-) Verhalten. Dasselbe gilt für die je spezifischen Interessen der Perspektivträ3
Vgl. PFISTER 1982, 90.
Kapitel VI: Perspektivenstruktur
287
ger: Sie betreffen die das Handeln leitenden Ziele der dramatis personae ebenso wie die auf den Akt des Erzählens bzw. der Rezeption bezogenen Interessen von Erzähler und Rezipienten (s.o.). Figurenperspektiven Die wichtigsten Perspektivträger in Drama wie Film sind die fiktiven Figuren selbst, denn sie sind die Hauptträger der Informationsvergabe und damit die entscheidenden Konstituenten der Perspektivenstruktur. Ihre je subjektive Sicht der fiktiven Ereignisse bestimmt ihre Aktionen wie Reaktionen, ihr sprachliches und nicht-sprachliches Handeln, das umgekehrt diese Sicht dokumentiert: Jede Replik ist »streng der Perspektive der jeweils sprechenden Figur zugeordnet (...), die nur artikulieren kann, was ihrer Disposition und Situation glaubhaft entspricht.«.4 Im Drama sind Figurenperspektiven - das ergibt sich aus der dramatischen Sprechsituation von selbst - grundsätzlich als »autonom in bezug auf die Perspektive des Autors« zu betrachten.5 Beim Film ist das nicht anders, wobei hier dasselbe auch für die Beziehung der Figurenperspektiven zur Erzählerperspektive zu postulieren ist.6 Auf der Ebene des inneren Kommunikationssystems stellt sich der filmische Text als polyperspektivischer Text dar, dessen Einzelperspektiven im Prinzip als gleichgeordnete und gleichrangige Textkonstituenten aufzufassen sind, die denselben kommunikativen Status und deshalb für den Rezipienten zunächst »prinzipiell den gleichen Grad der Verbindlichkeit« besitzen.7 Daher »kann keiner der einzelnen Figurenperspektiven von vornherein größere Bedeutung für die Konstitution der vom Autor intendierten Rezeptionsperspektive zukommen«.8 Vielmehr bedarf es besonderer Strukturierungsverfahren, um die Figurenperspektiven mit je unterschiedlichem Gewicht auszustatten (vgl. Kap. A.2). Α-perspektivische Informationen »Autonomie« gegenüber dem fiktiven Erzähler bewahren auch all jene Informationen, deren Verbindlichkeit nicht von der Perspektive der sie vermittelnden Figur abhängt: Das verbale und nonverbale Handeln der Figuren als es selbst, als Faktizität, die nicht-transitorische non-verbale Erscheinung der Figuren (Besetzung, Maske, Kostüm), die Merkmale der Schauplätze, ihre Aus4 s 6
Ebd. 91. Ebd. Zwar regelt der filmische Erzähler Art und Umfang des Erscheinens der Figuren auf der Leinwand, zwar kann er ihre Perspektiven mit seiner Perspektive konfrontieren und damit - als den Figurenperspektiven übergeordnete Instanz - qualifizieren, aber das ändert nichts daran, daß diese Perspektiven selbst strikt an ihre Träger gebunden bleiben.
1
PF1STER 1 9 8 2 , 9 2 .
8
Ebd.
288
Kapitel VI: Perspektivenstruktur
stattung, Beleuchtung usw., haben zwar, wie alle im Film vergebenen Informationen, grundsätzlich den Status narrativ vermittelter Informationen, ihre Faktizität als solche aber ist durch die Perspektive des sie vermittelnden Erzählers nicht bedingt. Will sagen: Der filmische Erzähler befindet zwar darüber, ob und wie Figuren und Schauplätze auf der Leinwand erscheinen, nicht aber darüber, wie sie aussehen, wie sie handeln etc. (vgl. S. 38f.). Mit Blick auf ihren Status im inneren Kommunikationssystem sind diese Informationen als α-perspektivische zutreffend beschrieben.9 Mit Blick auf das äußere Kommunikationssystem dagegen sind sie, weil der filmische Text als ganzer als ein zusammenhängender Sprechakt zu betrachten (vgl. S. 47) und also auf ein Subjekt, das Werksubjekt, zu beziehen ist, ihrerseits, wie jede im Film vergebene Proposition, als perspektivische anzusprechen. Dabei bezieht sich ihre Perspektivität hier nun nicht mehr auf die fiktive Welt, sondern auf Wirklichkeit: Als non-fiktiver Sprechakt entwirft der Film im Wege einer fiktiven Modellierung von Welt eine perspektivische Sicht auf Wirklichkeit, die Welt-Sicht des Werksubjekts. Das Spezifikum »a-perspektivischer« Informationen liegt darin, daß es sich dabei um Teilpropositionen des Sprechakts »Film« handelt, die ohne nennenswerte erzählperspektivische »Verzerrung« erscheinen, also relativ unverhüllt auf das Werksubjekt verweisen. Das heißt: In diesen »a-perspektivischen« Informationen - in der Besetzung der Rollen, in Maske und Kostüm, in Inszenierung und Schauspielerführung, in Schauplatzwahl, Bauten und Beleuchtung, in Art und Ablauf der Ereignisse - kommt die Perspektive des Werksubjekts, kommt sein Modell von Welt vergleichsweise unmittelbar zur Erscheinung. Und da die Autorperspektive diejenige Perspektive ist, die für den Rezipierten den höchsten Grad an Verbindlichkeit hat, kommt gerade diesen Informationen für die Organisation der Perspektivenstruktur besondere Bedeutung zu. Denn sie haben maßgeblichen Anteil an der Regelung der Akzeptanz der Figuren und damit ihrer Perspektiven (z.B. durch nicht-transitorische nonverbale Merkmale der Figuren, die die Sympathie des Rezipienten lenken; durch die Aufdeckung subjektiver »Verzerrungen« figuraler Perspektiven; durch figurencharakterisierende Funktionen uneigentlicher Raumkonzepte usw.). Erzählerperspektive Die Perspektive des filmischen Erzählers artikuliert sich - von expliziten verbalen Selbstkundgaben im voice over abgesehen - implizit, in den Verfahren der kinematographischen Abbildung (Kap. II-IV). Als Perspektive der fiktiven Vermittlungsinstanz ist sie den Figurenperspektiven hierarchisch überge»
Ebd. 94-96.
Kapitel VI: Perspektivenstruktur
289
ordnet, ist Bestandteil der Perspektivenstruktur allererst als deren Organisatorin. Diese Funktion realisiert sich im erzählerischen Umgang mit den Figuren, vor allem in der Bewertung und Gewichtung der Figurenperspektiven durch Art und Umfang ihrer kinematographischen Präsentation. Die Rekonstruktion der Erzählerperspektive ist daher immer schon Rekonstruktion der Perspektivenstruktur selbst. Rezipientenperspektive Von Rezipientenperspektive ist in einem zweifachen Sinne zu reden, denn sie ist nicht nur intendiertes Resultat der Perspektivenstruktur,10 sondern auch eine ihrer wichtigsten Voraussetzungen. Wie das Modell der filmischen Sprechsituation (vgl. Abb. 1, S. 45) zeigt, ist der Rezipient als »idealer« (E 3) immer schon im Filmtext präsent, sind die immanenten Textstrukturen immer schon auf einen mehr oder weniger bestimmt konturierten, durch Bildungsstand, Gesellschaftsschicht, Bewußtsein, Wertorientierungen, Rezeptionserwartungen usw. prädisponierten Empfanger hin organisiert, das heißt: Der Adressat ist - als »idealer« - im Film immer schon implizit mitformuliert, muß auch in ihm präsent sein, wenn die Perspektivenstruktur ihren Zweck, die Konstitution der intendierten Rezeptionsperspektive, erfüllen und damit der illokutive Akt des filmischen Sprechakts gelingen soll: Der Zuschauer hat schon eine Perspektive, bevor er im Theater- oder Kinosessel Platz nimmt, und deshalb kann, wie bei jedem Sprechakt, der illokutive Akt auch hier nur gelingen, d.h. die intendierte Rezeptionsperspektive realisiert werden, wenn die vom Sprecher vorausgesetzte mit der tatsächlichen Empfängerperspektive übereinstimmt oder zumindest partielle Kongruenzen mit ihr aufweist, denn andernfalls würde der Sprecher an seinem Empfanger vorbeireden. Für rezeptionsgeschichtliche Untersuchungen in der Filmwissenschaft, die sich vorwiegend auf Methoden der empirischen Sozialforschung zu stützen versuchen,11 liegt hier denn auch ein fruchtbarer Ansatzpunkt, der das Versagen empirischer Methoden bei der Untersuchung historischer Rezeptionsprozesse bis zu einem gewissen Grad kompensieren kann: Wenn die Annahme zutrifft, daß filmische Kommunikation nur gelingen kann, sofern der empirische Rezipient die Bedingungen erfüllt, die der Text im Entwurf seines »idealen« Rezipienten an ihn stellt, dann ist es möglich, Hypothesen über Voraussetzungen des Gelingens oder Mißlingens filmischer Kommunikation aufgrund textstruktureller Befunde zu bilden. Die Rezeptionsperspektive ist also nicht einfach als Ergebnis der Perspektivenstruktur filmischer Texte, sondern zunächst und zuerst als eine ihrer wich10 Vgl. ebd. 93-103 pass. 11 V g l . Z.B. SALBER 1 9 7 7 ; MELCHERS 1 9 7 7 ; AHREN/MELCHERS 1 9 7 9 .
290
Kapitel VI: Perspektivenstruktur
tigsten Voraussetzungen und darin als die Perspektive zu denken, die der Rezipient in das Kino mitbringt, genauer: als die Perspektive, die der filmische Text als seine Perspektive voraussetzt. Die Analyse der Perspektivenstruktur hat diese dem Rezeptionsakt selbst vorausliegende Perspektive folglich mit der Rekonstruktion des »idealen« Rezipienten systematisch zu berücksichtigen. »Rezipientenperspektive« taucht im Modell der Perspektivenstruktur also an zwei Stellen und in unterschiedlicher Gestalt auf, nämlich als Voraussetzung und Ergebnis der Perspektivenstruktur: Als vom Text unterstellte Prädisposition des Rezipienten liefert sie maßgebliche Voraussetzungen für die Organisation der Perspektivenstruktur, als vom Text intendierte und durch die Perspektivenstruktur gesteuerte Sicht des Rezipienten auf die erzählte Geschichte ist sie deren - intendiertes - Ergebnis. Um beide begrifflich zu unterscheiden, sei im weiteren von vorausgesetzter und intendierter Rezipientenbzw. Rezeptionsperspektive die Rede. Die intendierte Rezeptionsperspektive dokumentiert sich im Ergebnis der Perspektivenstrukturierung selbst, von deren Verfahren gleich zu reden sein wird. Die vom Text vorausgesetzte Rezipientenperspektive ist den oben eingeführten allgemeinen Prädispositionen subjektiver Perspektivität zufolge zunächst in den Anforderungen impliziert, die der Text an den Kenntnisstand des Rezipienten stellt und die sich in besonderen Fällen - etwa bei historischen Stoffen - schon ganz konkret auf die erzählte Geschichte selbst beziehen können, in den meisten Fällen aber den Stand sozialen und kulturellen Wissens und allgemeinen Sachwissens betreffen und sich als solche in den sprachlichen und sachlichen Kenntnissen dokumentieren, die nötig sind, um die verbalen und nonverbalen Propositionen zu verstehen. Die Ableitung psychologischer Dispositionen des »idealen« Rezipienten aus den Textstrukturen dürfte über eine sehr grobe Konturierung kaum hinausgelangen, weil sie sich auf nur bedingt objektivierbare Indikatoren stützen kann, darunter allererst auf Verfahren der Affekterregung, die - freilich nur mittelbar und nur undifferenziert - auf Vorannahmen über bestimmte emotionale Dispositionen des Rezipienten (z.B. Aggressionspotential und Aggressionsziele, sympathische und antipathische Reflexe u.a.) verweisen. Vorannahmen des Werksubjekts über moralische, politische, weltanschauliche Normen und Wertorientierungen seines Rezipienten dokumentieren sich in der kritischen Norm, die der Text als normativen Konsens voraussetzt. Normen und Wertorientierungen des Rezipienten entscheiden maßgeblich über die Akzeptanz der Figurenperspektiven, sind daher das zweifellos wichtigste adressatenbezogene Kriterium der Perspektivenstrukturierung. Die Interessen des Perspektivträgers schließlich, beim Rezipienten also seine mit dem Kinobesuch verknüpften Interessen und Erwartungen, dokumentieren sich im Text allererst in der Wahl von Gat-
Kapitel VI: Perspektivenstruktur
291
tung und Sujet (z.B. Unterhaltungs-, Kriminal-, Liebes-, »Problem-«, Action-, Science-fiction-Film usw.) und in deren Durchführung (z.B. spannungserzeugende Techniken der Handlungs- und Kameraführung, Effekte, Tricks etc.). Perspektivenstruktur und »Botschaft« Die Beziehung zwischen vorausgesetzter und intendierter Rezipientenperspektive ist der wichtigste Indikator der intendierten perlokutionären Effekte des Sprechakts »Film«, seiner »Botschaft« an den Rezipienten und damit der WeltSicht, zu deren Anerkenntnis der Sprecher seinen Empfanger zu bewegen sucht (s.o.). Diese intendierten perlokutionären Effekte wären demnach auf der weiten Skala zu verorten, die sich zwischen den zwei denkbaren Extremen erstreckt, nämlich zwischen Affirmation und Destruktion der vorausgesetzten Rezipientenperspektive. Affirmation kommt in dieser Sicht durch eine Beziehung der weitgehenden Identität zwischen vorausgesetzter und intendierter Rezipientenperspektive zustande, dadurch also, daß der Film das soziale, kulturelle und Sachwissen des Rezpienten bestätigt oder allenfalls ergänzt (nicht aber in Frage stellt), seine Rezeptionsinteressen und -bedürfnisse befriedigt (nicht enttäuscht oder umdisponiert), seine psychologischen Dispositionen bedient und schließlich und vor allem sein Weltbild, seine ideologischen Normen und Wertorientierungen festigt (nicht verändert, nicht in Zweifel zieht), den vorausgesetzten normativen Konsens also bestätigt. Daß die Masse der produzierten Filme in Geschichte und Gegenwart diesem Extrem zuneigt, bedarf keiner besonderen Betonung, ergibt sich vielmehr schon aus den kommerziellen Voraussetzungen der Filmindustrie, die einen reibungslosen Konsum naheliegenderweise bevorzugt, der um so mehr gefährdet ist, je stärker die Divergenzen zwischen empirischem und idealem Rezipienten werden. Das entgegengesetzte Extrem, die Destruktion der vorausgesetzten Rezipientenperspektive, kommt entsprechend durch eine Beziehung der Opposition zwischen vorausgesetzter und intendierter Rezipientenperspektive zustande, dadurch also, daß der Film das soziale, kulturelle und Sachwissen des Rezipienten als defizitär enthüllt oder gar seine Geltung bestreitet, seine Rezeptionsinteressen (z.B. Unterhaltungsbedürfnisse) enttäuscht, seine psychologischen Dispositionen unterläuft und schließlich und vor allem seine ideologischen Normen und Wertorientierungen negiert, den vorausgesetzten normativen Konsens also aufkündigt. Daß es keinen Film gibt, der dieses Extrem erfüllt, liegt nicht nur an den eben berufenen kommerziellen Voraussetzungen der Filmproduktion, sondern natürlich auch und vor allem daran, daß ein solcher Film mit der vorausgesetzten Rezipientenperspektive zugleich auch seine Kommunikabilität und soziale Akzeptanz destruiert, dem Rezipienten, indem er seine Perspek-
292
Kapitel VI: Perspektivenstruktur
tive radikal negiert, generell die Kompetenz abspricht, Welt zutreffend zu beurteilen.
2.
Die Organisation der Perspektivenstruktur: Techniken der Rezipientensteuerung
Die Organisation der Perspektivenstruktur vollzieht sich in erster Linie in der Relationierung der Figurenperspektiven, und zwar einerseits in der quantitativen Relationierung der von den Figuren vergebenen Informationen, in der Distribution der Redeanteile (2.1), und andererseits in der qualitativen Relationierung dieser Redeanteile (2.2). Darüber hinaus rekurriert sie auf implizite und explizite Bewertungssignale, darunter auf »a-perspektivische« Informationen (s.o.), vor allem aber auf die den Figurenperspektiven übergeordnete Perspektive des Erzählers (2.3). 2.1 Quantitative Relationierung der Figurenperspektiven Die quantitative Relationierung der Redeanteile der Figuren erzeugt zunächst quantitative Dominanzrelationen, von denen schon die Rede war (vgl. S. 270f.): Anzahl und Umfang der Auftritte und Repliken informieren den Rezipienten über die zentrale oder periphere Position der Figuren im Gesamtpersonal und damit zugleich darüber, welche Figuren als relevante Perspektivträger in Betracht kommen. Anders als beim Drama werden quantitative Dominanzrelationen beim Film maßgeblich gesteuert durch das Erzählerverhalten: Perspektivierendes (personales) Erzählen etwa oder auktoriale »Fokussierung« (vgl. S. 212) sorgen für eine deutliche quantitative Gewichtsverteilung zugunsten bestimmter Figurenperspektiven. Im Film sagen quantitative Dominanzrelationen also immer auch schon etwas über die Beziehung zwischen Erzähler und Figuren aus. Quantitative Relationen haben immer schon einen qualitativen Aspekt, weil sie, indem sie Häufigkeit und Ausführlichkeit regeln, mit der die Figuren sich selbst darzustellen Gelegenheit haben, zugleich die Menge der über sie vergebenen Informationen regeln. Je mehr aber der Rezipient über eine Figur, über ihre Perspektive und deren mentale, psychische, ideologische Prädispositionen und damit über die Beweggründe ihres Handelns erfährt, um so mehr erhöht sich in der Regel seine Bereitschaft, ihr, wenn nicht Sympathie, so doch Verständnis oder zumindest Interesse entgegenzubringen, und das selbst dann, wenn er ihr Handeln moralisch verurteilen muß, wie fast jedes Drama und jeder Film mit negativem Helden zu illustrieren vermöchte.
Kapitel VI: Perspektivenstruktur
293
2.2 Qualitative Relationierung der Perspektiven Die Geltungsfáhigkeit einer Figurenperspektive und damit ihre Funktion für die Steuerung der Rezipientenperspektive ergibt sich aber vor allem aus der qualitativen Relationierung der Perspektiven. Sie regelt zum einen den Grad der Kompetenz der Figuren und zum anderen den Grad ihrer Akzeptanz für den Rezipienten. Figurenkompetenz Figurenkompetenz resultiert aus dem Kenntnisstand der Figur, aus dem Grad ihrer Informiertheit, und aus ihrer Fähigkeit, ihr Wissen situationsadäquat zu verarbeiten, also aus dem Grad der Adäquatheit oder Inadäquatheit ihrer Perspektive. Die Beurteilung der Figurenkompetenz durch den Rezipienten wird hauptsächlich über die Relationierung von Figuren- und Zuschauerinformiertheit gesteuert.12 In der Regel gewinnt der Rezipient mit dem Fortschreiten der Geschichte einen zunehmenden Informationsvorsprung vor den Figuren, weil er sämtlichen Szenen mit ihren wechselnden Konfigurationen beiwohnt, sein Informationsstand sich also aus der Gesamtheit der in den Repliken vergebenen Informationen speist: Sein Bild der fiktiven Welt setzt sich aus einer Vielzahl je subjektiv gefärbter Einzelbilder zusammen, deren Vergleich es ihm mit zunehmendem Fortschreiten der Geschichte zunehmend besser erlaubt, die Kompetenzen der Figuren und damit die Geltungsfáhigkeit ihrer Repliken zu bestimmen, das heißt: zum einen den Kenntnisstand jeder einzelnen Figur zu qualifizieren, also darüber zu befinden, ob die Figur alle zur adäquaten Beurteilung ihrer Situation und damit zur Durchsetzung ihrer Interessen nötigen Informationen besitzt oder nicht, zum anderen den Grad ihrer subjektiven »Verzerrung« zu qualifizieren und zum dritten partnertaktische Verhaltensprogramme der Figuren (z.B. Täuschungsmanöver, Irreführung, Überredungsversuche usw.) zu identifizieren. Darüber hinaus hat der Rezipient Möglichkeiten der vergleichsweise direkten Überprüfung der Geltungsfähigkeit einer Replik natürlich immer dort, wo sich diese Replik auf Sachverhalte bezieht, über die er (aus vorhergehenden Szenen) denselben Kenntnisstand wie die Figur oder über ihn hinausreichende Kenntnis hat. In produktionsästhetischer Sicht ist die Konfrontation einer Figurenreplik mit dem (überlegenen) Kenntnisstand des Rezipienten das nächstliegende Mittel, eine Perspektive als hochgradig verzerrte, etwa durch Informationsdefizite, Realitätsverlust oder auch durch intentionale Realitätsverleugnung charakterisierte Perspektive zu qualifizieren.
12 Vgl. PFISTER 1982, 79-90.
294
Kapitel VI: Perspektivenstruktur
Die Kompetenz einer Figur ergibt sich schließlich auch aus der Relationierung ihres nicht spezifisch situationsbezogenen, sondern allgemeinen (sozialen, kulturellen, Sach-) Wissens mit dem vorausgesetzten Wissensstand des Rezipienten. Figurenakzeptanz Die Kompetenz der Figuren hat wesentlichen Einfluß auf den Grad der Figurenakzeptanz, ist deshalb aber noch nicht notwendig deren entscheidendes Kriterium, denn hier spielen nun vor allem Charaktermerkmale und Wertorientierungen der Figuren und deren Verhältnis zu den Normen und Wertorientierungen des Rezipienten eine Rolle: Die Figurenakzeptanz wird über die Relationierung der Figurenperspektiven mit der vorausgesetzten Rezipientenperspektive geregelt, d.h. in erster Linie über die Relationierung der von den Figuren vertretenen Normen und Werte mit dem vom Text unterstellten normativen Konsens des »idealen« Adressaten. Moralische, politische, weltanschauliche usw. Korrespondenz- oder Kontrastrelationen zwischen den Figurenperspektiven erzeugen u.U. eine immanente Hierarchie der figuralen Wertorientierungen (Held vs. Bösewicht u.ä.). Diese Hierarchie ist freilich dem Diktum unterworfen, wonach unter Blinden der Einäugige König ist: Über den Grad der Akzeptanz, den die Figurenperspektiven beim empirischen Rezipienten erreichen, entscheidet nicht diese immanente Hierarchie, sondern die Akzeptanz, die der vorausgesetzte normative Konsens selbst beim Rezipienten findet, entscheidet also letztlich die kritische Norm des empirischen Rezipienten. Je labiler diese allerdings ist, um so mehr Einfluß gewinnt die immanente Hierarchie der im Film vertretenen Normen. Für Filme, die diesen Einfluß ungeniert nutzen wollen, für Propagandafilme zumal, ist die Strukturierung der figuralen Wertorientierungen mithin ein zentrales Gestaltungselement, und ihr propagandistischer Erfolg oder Mißerfolg hängt entscheidend davon ab, ob das Kriterium dieser Strukturierung, der vorausgesetzte normative Konsens, richtig gewählt wurde, d.h. ob der empirische Rezipient diesen Konsens teilt, die vorausgesetzte Rezipientenperspektive also zutreffend eingeschätzt wurde. Da Propagandafilme per definitionem davon ausgehen, daß ihre propagandistische Botschaft im Publikum noch keinen allgemeinen Konsens findet (sonst wären sie nicht nötig), muß es ihnen folglich darum gehen, einen normativen Konsens zu finden, dem möglichst viele Rezipienten zustimmen können. Sie finden ihn in aller Regel in allgemeinen moralischen Normen, über die eine zunächst rein moralische Hierarchisierung des Personals initiiert werden kann, in deren Schlepptau
Kapitel VI: Perspektivenstruktur
295
dann die Normen eingeführt werden, um deren Vermittlung es eigentlich geht. 13 2.3 Bewertungssignale Implizite oder explizite Bewertungssignale steuern die Entscheidungen des Rezipienten über die Geltungsfähigkeit und Akzeptanz der Figurenperspektiven durch Informationen, deren Geltung nicht von der Geltungsfähigkeit der Figuren abhängig ist, nämlich durch das Vermittlungsverhalten des Erzählers und durch »a-perspektivische« Informationen. Auf Seiten des Erzählers gehören dazu sämtliche Verfahren der figurenbezogenen Kommentierung, darunter allererst Verfahren der kommentierenden Kameraführung: Aufnahmedistanz, Standort, Perspektive und Bewegungsverhalten der Kamera können als figurenspezifische Bewertungssignale in Funktion gesetzt werden, wobei vor allem auf die funktionalen Aspekte zu verweisen ist, die sich aus der Qualifizierung des Kameraverhaltens als Interaktionsverhalten (vgl. Kap. II) ableiten lassen. Zu den über sog. »α-perspektivische« Informationsvergabe (s.o.) vermittelten Bewertungssignalen gehören zunächst die im inneren Kommunikationssystem als natur- oder kulturbedingte Faktizitäten erscheinenden Informationen, also etwa Informationen über nicht-transitorische nonverbale Merkmale der Figuren (Körpermerkmale und habitualisierte Formen des Körperverhaltens, Maske und Kostüm) und der sie umgebenden Räume, soweit sie figurenspezifische Bewertungen zu vergeben imstande sind. 14 Auch das verbale und non13 In Hans Steinhoffs »Robert Koch« (D 1939) beispielsweise führen die moralischen Kontrastrelationen zwischen dem gütigen und selbstlosen Titelhelden (Emil Jannings) und seinem engherzigen, dogmatischen und feigen Gegenspieler Rudolf Virchow (Werner Kraufl) das Ideologem der genialen Führerpersönlichkeit und das ihm zugeordnete »Ethos« des heteronomen Subjekts (dargestellt an Kochs Assistenten) im Schlepptau, die gemeinsam das Modell einer autoritären Sozialstruktur entwickeln. Kochs Verehrung für Bismarck und Virchows Glauben an den Parlamentarismus (und seine Mitgliedschaft in der Fortschrittspartei) bieten dabei zusätzlich den assoziativen Transfer in die politische Sphäre an. 14 So wird beispielsweise der Gegenspieler des Titelhelden im eben (Anm. 13) erwähnten Hans Steinhoff-Film »Robert Koch«, Rudolf Virchow, mit allen nur erdenklichen Merkmalen des Rückschrittlichen, Überlebten, Überalterten ausgestattet, ein Programm, das sich hinsichtlich der nicht-transitorischen Merkmale der Figur in der äußeren Erscheinung eines schon vom Alter gebeugten Mannes und in einer hohen, dünnen Greisenstimme realisiert, hinsichtlich der Raumausstattung vor allem in den schier unzähligen Skeletten, Totenschädeln und Knochen, mit denen die Diensträume des »Leichenheinrich« (E 167) regelrecht überfüllt sind. Daß Virchow sich zudem, während er eine erneute Eingabe des »um des Lebens willen« (E 269) kämpfenden Koch ungelesen im Archiv versinken läßt, lebhaft für Schliemanns Ausgrabungen interessiert, daß er geschmeichelt den Ehrenvorsitz des »Vereins für märkische Gräberfunde« annimmt und, während einer Besprechung mit einem seiner Assistenten, seine ganze Aufmerksamkeit der Zusammensetzung eines zer-
296
Kapitel VI: Perspektivenstruktur
verbale Figurenverhalten selbst kann als Bewertungssignal eingesetzt werden, dessen Bewertungsfunktion vor allem dann unschwer zu identifizieren ist, wenn es handlungslogisch redundant ist.15 Als Bewertungssignal kann schließlich auch die Geschichte selbst erscheinen, vor allem ihr Ende, das, als Instrument der poetischen Gerechtigkeit in Funktion gesetzt, die Träger der »richtigen« Norm durch einen glücklichen Ausgang »belohnt« und die Träger der »falschen« Norm durch ein unglückliches Ende »bestraft«.16 Die Bedeutung, die Film- und Fernsehproduzenten dem guten oder bösen Ausgang der Geschichte als Akt der poetischen Gerechtigkeit nach wie vor beimessen, zeigt sich besonders deutlich an den ungeschriebenen Gesetzen des öffentlich-rechtlichen Fernsehens, unter denen die poetische Gerechtigkeit eines der ältesten und am stärksten tabuisierten ist, weshalb sich auch regelmäßig mehr oder minder heftige Diskussionen erheben, sobald gegen sie verstoßen wird.
B. Typen der Perspektivenstruktur Manfred Pfister skizziert die Konturen dreier Typen der Perspektivenstruktur,17 von denen zwei auch für den Film Geltung haben.18 Sie sind an Volker Klotz1 Theorie der geschlossenen und offenen Dramenform orientiert19 und entsprechend als »geschlossene« und »offene« Perspektivenstruktur kategorisiert. Dabei handelt es sich selbstverständlich um idealtypische Konstrukte. brochenen Totenschädels widmet (E 184), vervollständigt das Bild eines überlebten, dem Toten statt dem Leben zugetanen Greises, dessen demokratisches Engagement als Reichstagsabgeordneter und Führer der Fortschrittspartei damit zugleich unzweideutig als Ausdruck der Rückschrittlichkeit denunziert wird. >3 Vgl. das in Anm. 13 und 14 genannte Beispiel: Virchows Interesse für Schliemann, seine Wahl zum Ehrenvorsitzenden des »Vereins für märkische Gräberfunde«, sein Hantieren mit dem Totenschädel stehen in keinem handlungslogischen Zusammenhang mit der Geschichte, dienen ausschließlich der unübersehbar denunziatorisch-wertenden Figurencharakterisierung. 16 So darf auch Robert Koch (vgl. Anm. 13-15) am Ende den Triumph über seine Widersacher feiern: Die Apotheose des Sieges, des Sieges »eines unerschütterlichen Glaubens an die einmal erkannte Sendung« (E 284), vollzieht sich in Gestalt einer pompösen akademischen Feier, in der Studenten und Professoren dem einst Belächelten huldigen und Virchow, von niemandem beachtet, auch nicht von der Kamera, die ihn ganz klein und ganz weit unten zeigt, den Gegner öffentlich anerkennen muB. Π
PFISTER 1 9 8 2 , 9 9 - 1 0 3 .
18 Der »a-perspektivische« Typus (ebd. lOOf.), bei dem sich sämtliche Figurenperspektiven mit der des Werksubjekts decken, hat für den Film keine Relevanz. 19 Vgl. Volker Klotz, Geschlossene und offene Form im Drama, 7. Aufl. München 197S.
Kapitel VI: Perspektivenstruktur
1.
297
Geschlossene Perspektivenstruktur
Filme mit geschlossener Perspektivenstruktur zeichnen sich dadurch aus, daß sie das Widerspiel der verschiedenen Figurenperspektiven auf einer »Konvergenzlinie« zusammenführen, 20 auf der sich die Geltungsfähigkeit jeder einzelnen Figurenperspektive herausstellt: Hier gibt es ein über allen subjektiven Perspektiven angesiedeltes (faktisches, moralisches, ideologisches usw.) »Objektives«, an dem sich die Angemessenheit der subjektiven Perspektiven an die fiktive Welt bemißt, was - nicht notwendig, aber in praxi mit einiger Regelmäßigkeit - zu einer Hierarchisierung der Figurenperspektiven führt. Geschlossene Perspektivenstrukturen legen die intendierte Rezipientenperspektive eindeutig fest, sind so organisiert, daß der Rezipient zu einer schlüssigen Deutung der Geschichte nur kommen kann, wenn er jene »Konvergenzlinie«, jenes »Objektive« aus dem Widerspiel der subjektiven Perspektiven rekonstruiert. Filme, die ganz sicher gehen wollen, daß dies geschieht, verorten diese »Konvergenzlinie« gern in der Perspektive des Helden selbst, die sie als autoritative, richtungweisende Perspektive entsprechend attribuieren und damit als kaum verhülltes Sprachrohr des Werksubjekts in Funktion setzen.21 Daß dieses Verfahren nicht selten selbst schon Indikator eines autoritären Sinnmodells ist, liegt auf der Hand. In satirischen Filmen oder Filmen mit negativen Helden begegnet dasselbe Muster häufig in genauer Umkehrung, dadurch nämlich, daß die Perspektive der Hauptfigur gerade nicht die intendierte Rezipientenperspektive, sondern ihr genaues Gegenteil repräsentiert.22 Das darin sich aussprechende Vertrauen in die Funktionsfähigkeit der bei den Rezipienten vorausgesetzten kritischen Norm leitet auch komplexer strukturierte Filme mit geschlossener Perspektivenstruktur, die auf die explizite Vermittlung der kritischen Norm durch eine bestimmte Figur verzichten, es vielmehr dem Rezipienten überlassen, die intendierte Rezeptionsperspektive zu erschließen, indem sie diese implizit über die Strukturierung der Perspektiven, »als 'Resul-
20 PFISTER 1982, 101.
21 In »Robert Koch« (vgl. Anm. 13-15) geschiebt das beispielsweise auf denkbar schlichte Weise dadurch, daß der Gegenspieler des Helden rückhaltlos denunziert, die Titelfigur aber mit einer Fülle positiver Charaktermerkmale versehen wird, die seiner expliziten Formulierung tragender Ideologeme des Films dann die nötige Autorität verleihen soll. 22 Die Perspektivenstruktur von Wolfgang Staudtes »Der Untertan« (DDR 1951) etwa formuliert die intendierte Rezipientenperspektive nahezu vollständig ex negatione, verzichtet also nahezu vollständig auf Perspektivträger, die die kritische Norm explizit artikulieren, setzt vielmehr ganz auf den vorausgesetzten normativen Konsens, den sie mit den Eigenschaften und Normen der Hauptfigur kontrastiv relationiert.
298
Kapitel VI: Perspeküvenstruktur
tante' der korrespondierenden und kontrastierenden Figurenperspektiven« vermitteln. 23
2.
Offene Perspektivenstruktur
Filmen mit offener Perspektivenstruktur fehlt jene »Konvergenzlinie«, jenes »objektive« Kriterium also, an dem sich die Geltungsfahigkeit der Figurenperspektiven entscheidet: Der Rezipient sieht sich widersprüchlichen Figurenperspektiven ausgesetzt, deren Geltungsfahigkeit durch die Perspektivenstrukturierung nicht reguliert wird, und ist daher »außerstande, das Angebot der Figurenperspektiven zu einer einheitlichen Rezeptionsperspektive zu integrieren«. 24 Das heißt: Die für die Erschließung der intendierten Rezipientenperspektive wichtigste Operation des Rezipienten, der Vergleich der figuralen Perspektiven, führt zu keinem klaren Ergebnis, weil ein schlüssiges tertium comparationis fehlt. Der »Entzug fertig vorgegebener Lösungen« 25 kennzeichnet hier nicht nur die Perspektivenstruktur, sondern ist zugleich auch Teil der Botschaft der Filme, insofern er dem Rezipienten »gerade die perspektivische Relativität aller Wertnormen« erfahrbar macht. 26 Die »Konvergenzlinie« offener Perspektivenstrukturen ist also, so könnte man sagen, die Subjektivität und Relativität der perspektivischen Weltsichten selbst. 27
23 PFISTER 1982, 101. 24 25 26 27
Ebd. 102. Ebd. Ebd. 103. Ein Beispiel für einen Film mit offener Perspektivenstruktur liefert der hier schon mehrfach beigezogene Film »La grande illusion« (F 1937) von Jean Renoir (vgl. S. 278-281), und das ist kein Zufall, denn das entspricht seinem Programm, das die Relativität nationaler und standesethischer Wertsysteme im Blick hat. Folgerichtig führt er mit seinen Figuren nationale und standesethische Perspektiven vor und spricht dabei keiner dieser Perspektiven ihre subjektive Geltungsfähigkeit ab: Sie sind - als subjektive - alle gültig, eben weil es in diesem Film keine »objektive« Perspektive gibt, sondern allenfalls die Perspektive der Geschichte (vgl. S. 280f.). Jede Figur hat gleichermaßen recht und unrecht. Aus den Perspektiven aller Figuren entsteht ein Panorama der europäischen Gesellschaft am Vorabend der Revolutionen. Die offene Struktur dieser Perspektiven aber entwirft die Utopie einer im Zeichen von Humanität und Toleranz befriedeten Welt.
Kapitel VII Uneigentliche Rede im Film
Mit den Begriffen proprietas und improprietas unterscheidet die antike Rhetorik zwei Grundformen der Sprachverwendung, die eigentliche und die uneigentliche Verwendung von Wörtern (Wendungen, Sätzen, ganzen Texten): Bei der eigentlichen Verwendung eines Wortes werden - auf Seiten des Senders wie auf seiten des Empfangers - dessen Standardbedeutungen aktualisiert, werden dem Signifikanten also seine üblichen, im Lexikon verzeichneten Signifikate zugewiesen.1 Bei der uneigentlichen Verwendung eines Wortes dagegen wird dem Wort eine nicht-standardisierte Bedeutung beigelegt, dem Signifikanten also ein Signifikat zugewiesen, das ihm üblicherweise »im System der betreffenden Sprache nicht zukommt«.2 Die »Lizenz« (licentia)3 zur uneigentlichen Sprachverwendung bezieht der Redner aus dem Tropus,4 aus den die uneigentliche Sprachverwendung steuernden Regeln, die darüber entscheiden, ob ein verwendeter Ausdruck als Tropus anerkannt werden kann oder nur schlicht als falsche Verwendung eines Wortes (oder auch als verunglückter Tropus) verworfen werden muß. Diese Regeln werden im Kapitel 1 2
V g l . LAUSBERG 1960, § 5 3 3 ; LAUSBERG 1971, § 111. LAUSBERG 1971, § 117. - Die Begriffe »eigentlich« und
»uneigentlich« sind in der Literaturwissenschaft in Verruf gekommen, weil man in ihnen ein mechanistisches Sprachverständnis vermutet, das die »pluralisch(e)« Bedeutung von Wörtern (DUBOIS et.al. 1974, 157) und damit die Einsicht ignoriert, daB Wortbedeutungen erst in der aktuellen Sprachverwendung vereindeutigt werden, also so tut, als gäbe es fur jedes Ding eine »eigentliche« Bezeichnung, die durch eine andere, uneigentliche »ersetzt« wird. Dieser Verdacht knüpft sich freilich weniger an die Begriffe selbst als an überholte Theorien uneigentlicher Redeformen, in deren Kontext sie bevorzugt benutzt wurden (z.B. an die Substitutionstheorie der Metapher). Sobald aber klargestellt ist, daB unter »eigentlichen« Wortbedeutungen keine den Dingen aufgeklebten »Etiketten« zu verstehen sind (KURZ 1982, 11), die jedes Wort auf eine einzige Bedeutung festlegen, wohl aber ein Feld von »Standardbedeutungen« (ebd. 17), das die üblichen Verwendungsweisen des Ausdrucks umfaßt, und sobald klargestellt ist, daB ein uneigentlicher Ausdruck nicht einfach einen eigentlichen ersetzt, sondern in der Regel an Stellen erscheint, an denen es »kein eigentliches Wort (gibt), das den Sachverhalt richtiger und wahrer bezeichnete« (WEINRICH 1967, 10f.), daB der uneigentliche Ausdruck also Bedeutungen zu aktualisieren vermag, die ein eigentlicher nicht erzeugen könnte, dürfte gegen die Verwendung der Begriffe wenig einzuwenden sein (vgl. auch WEINRICH 1967, 10).
3
LAUSBERG 1960, § 8 , 5 3 3 ; LAUSBERG 1971, § 9 4 f .
4
LAUSBERG 1971, § 117.
300
Kapitel VII: Uneigentliche Rede
über den Redeschmuck, den Ornatus, geklärt, zu dessen wichtigsten Mitteln die Formen uneigentlicher Rede gehören. Bei Bildern ist die Unterscheidung zwischen eigentlicher und uneigentlicher Sprachverwendung entsprechend auf die Verwendung ikonischer Zeichen zu beziehen. Die Frage nach den Voraussetzungen, unter denen ikonischen Signifikanten ein Signifikat zugewiesen werden kann, das ihnen üblicherweise nicht zukommt, und nach den Formen, die der uneigentlichen Bilderrede zu Gebote stehen, ist das Thema dieses Kapitels. Schon jetzt kann gesagt werden, daß die uneigentliche Bedeutung eines Bildes seine eigentliche Bedeutung offensichtlich nicht auszulöschen oder zu verdrängen vermag, weil das abgebildete Ding als eigentliches im Bild immer gegenwärtig bleibt. Anders als in der Sprache, wo ein uneigentlich verwendeter Ausdruck seine eigentliche Bedeutung weitgehend, u.U. auch ganz verlieren kann, bleiben hier die eigentlichen Bedeutungen der abgebildeten Dinge stets erhalten:5 Bilder können, weil ihre Zeichen motivierte, auf Similaritätsbeziehungen zwischen Signifikanten und Signifikaten beruhende Zeichen sind (vgl. Kap. I, S. 6), nicht nicht bedeuten, was sie - proprie - abbilden, sondern immer nur mehr bedeuten als sie proprie abbilden. Uneigentliche Bedeutungen können sich hier deshalb stets nur als zusätzliche Bedeutungen entfalten, als Surplus, als ein Mehr an Bedeutung, das ihrer eigentlichen Bedeutung zuwächst: In uneigentlicher Funktion verwendete Bilder haben eine und noch eine andere Bedeutung, d.h. sie sind »Äußerungen« mit zwei Bedeutungen, die, weil die zweite, uneigentliche Bedeutung die erste, eigentliche Bedeutung nicht verdrängen kann, beide gleichermaßen gültig bleiben. Diese Einsicht hat einige Konsequenzen für die Möglichkeiten und Formen uneigentlicher Bilderrede und ihre Kategorisierung, die im folgenden zu diskutieren sein werden.
A. Begriffsklärungen: Terminologische Fehlentscheidungen in der Filmwissenschaft Die klassische Rhetorik unterscheidet traditionsgemäß zwischen der - im ornatus in verbis singulis geregelten - uneigentlichen Verwendung von Einzelwörtern, den Worttropen, und der - im ornatus in verbis coniunctis geregelten - uneigentlichen Verwendung von wortübergreifenden Wendungen, Sätzen 5 Von dieser Regel gibt es bei Bildern nur eine Ausnahme, die immer dann eintritt, wenn Bilder nicht mehr Abbilder, sondern abstrakte Bilder sind, die man beim Kino gern »absolute« (von der Wirklichkeit »abgelöste«) Bilder nennt. Für sie ist damit aber auch die Unterscheidung von Eigentlichkeit und Uneigentlichkeit generell hinfällig.
Kapitel VII: Uneigentliche Rede
301
oder Texten, den Gedankenfiguren (figurae sententiae).6 Diese Unterscheidung ist inzwischen unter strukturalistischen Prämissen reformuliert und dabei deutlich präzisiert worden (s.u.), weshalb die dabei eingeführten neuen Termini - Metasemem (statt Worttropus) und Metabgismus (statt Gedankenfigur) - ihre Berechtigung haben.7 In der Filmwissenschaft nun werden für die Bezeichnung uneigentlich verwendeter Bilder schon seit langem Begriffe verwendet, die die Rhetorik den Worttropen bzw. Metasememen vorbehält.8 An vorderster Stelle steht dabei der Begriff der »Filmmetapher«, der seit seiner Einführung durch die frühe Filmtheorie9 nachgerade in den Rang eines filmwissenschaftlichen Terminus aufgestiegen ist, ohne allerdings je befriedigend expliziert worden zu sein.10 Das gilt auch für die Begriffe »Metonymie« und »Synekdoche«, die in neueren Arbeiten zunehmend für die Beschreibung filmischer Sachverhalte bemüht und dabei häufig schon nicht mehr als distinkte Formbegriffe, sondern als Bezeichnungen verschiedener Bedeutungsebenen ein und desselben »Ausdrucks« (Bildes) benutzt werden.11 Diese Anwendung worttropischer (metasememischer) Kategorien auf ikonische Sachverhalte beruht auf einem grundlegenden Fehlverständnis uneigentliVgl. LAUSBERG 1960, §§ 552-598 (tropi), 755-910 (figurae sententiae)·, LAUSBERG 1971, §§ 174-236 (tropi)·, 363-447 (figurae sententiae)·, von den figurae sententiae interessieren hier die uneigentlichen, durch Immutation entstehenden figurae per immutationem (LAUSBERG 1960, §§ 893-910; LAUSBERG 1971 §§ 416^47). I Vgl. DUBOIS et.al. 1974, 56-58, 152-203, 204-238. 8 Eine Ausnahme macht dabei der Symbolbegriff, der allerdings in der Regel ganz unspezifisch als Synonym von Uneigentlichkeit benutzt wird. 9 Vgl. EJCHENBAUM 1927, 38f.; BALAZS 1980, 97 u. pass. 10 Vgl. z.B. BORSO-BORGARELLO 1984b; 1986; SŒGRIST 1986, 64-71; MÖLLER 1986, 104f.; SPRINGER 1987, 50-52 u.pass. - MONACO 1980, 144-158 komplettiert die Verwirrung der Begriffe, wenn er Kategorien des Pierceschen Zeichenmodells (Ikon, Index, Symbol) mit den tropologischen Kategorien »Metonymie«, »Synekdoche« und »Metapher« (die er »Trope« nennt) kombiniert und das ganze dann, in Anlehnung an Metz' Kategorie der »Konnotation« (METZ 1964, 110-120), unter dem Gesichtspunkt der »denotativen« und »konnotativen« Bedeutungen filmischer Bilder behandelt. II So klassifiziert etwa MÖLLER (1986, 105) das Bild vom Sturz einer Zarenstatue in Eisensteins »Oktober« (UDSSR 1928) als Einheit von Metapher und Metonymie; SIEGRIST (1986, 66f.) deutet den isolierenden Kamerablick auf die Stiefel der gegen die Menschenmenge vorwärtsmarschierenden Soldaten auf der großen Hafentreppe von Odessa in Eisensteins »Panzerkreuzer Potemkin« (UDSSR 1925) gar gleich als Einheit von Metapher, Metonymie und Synekdoche: Er sei synekdochisch, weil er Teile (Beine und Stiefel) anstelle des Ganzen (die Soldaten) zeige, metonymisch, weil er die »Militärmaschinerie des Zarenreiches« repräsentiere, und metaphorisch, weil er »Repression« und »Tyrannei« bedeute. Tatsächlich werden hier keine uneigentlichen Redeformen beschrieben, sondern Interpretáronte mit Tropen verwechselt, wobei für jeden »Durchgang« des hermeneutischen Zirkels je ein tropischer Begriff postuliert wird. 6
302
Kapitel VII: Uneigentüche Rede
cher Bilderrede. Denn, und diese Behauptung wird im weiteren zunächst zu begründen sein, Bilder sind nicht in der Lage, Metasememe zu bilden, d.h. den Worttropen (Metaphern, Metonymien, Synekdochen etc.) äquivalente Formen uneigentlicher Rede zu vollziehen. Uneigentliche Bilderrede kann sich vielmehr allein in der Form der Gedankenfiguren bzw. Metalogismen vollziehen (vgl. Kap. B.). 1 2 Metasememe Worttropen oder Metasememe werden »immer durch ein Wort manifestiert«, 13 verändern Bedeutungen einzelner Wörter. Sie verdrängen die ursprüngliche (eigentliche) Wortbedeutung (partiell oder auch vollständig) zugunsten einer neuen (uneigentlichen) Bedeutung, 14 wie etwa die metonymische Wendung »ein Glas trinken« die Bedeutung des Wortes »Glas« verdrängt und in der Richtung auf seinen Inhalt verändert. Das heißt: Metasememe beruhen auf kalkulierten Verstößen gegen das Lexikon, verändern die im Wörterbuch verabredeten Standardbeziehungen zwischen Signifikanten und Signifikaten.15 Das geschieht durch die Verwendung eines Wortes in einem »konterdeterminierenden Kontext«, 16 d.h. in einer syntagmatischen Umgebung, die mit ihm nicht kompatibel ist: 17 Dieser Kontext (»trinken«) konterdeterminiert die ursprüngliche (eigentliche) Bedeutung des Wortes (»Glas«), erlaubt es nicht mehr, diesem Wort sein standardisiertes, im Lexikon angegebenes Signifikat zuzuordnen (»Gefäß«), und zwingt damit zur Bildung eines neuen Signifikats (»Inhalt«). Metasememe sind, eigentlich gelesen, 'fehlerhafte' Wendungen, 18 12 Klaus Kanzog, der diese beiden Thesen von mir übernommen und (leider ohne mein Einverständnis einzuholen und ohne seine Quelle zu nennen) vorab veröffentlicht hat, referiert deren Begründung mißverständlich (vgl. KANZOG 1991, 69f.). 13 DUBOIS et.al. 1974, 153; vgl. auch ebd. 2 1 9 : »Die Erstreckung des Metasemems ergibt sich aus seiner Definition. Da es eine Semgruppe (Semem) durch eine andere ersetzt, bezieht es sich auf ein Wort. (...) Die Definition des Metalogismus dagegen hat keine Begrenzung der Erstreckung zur Folge«. 14 Vgl. ebd. 157: »Um unsere Definition des Metasemems erneut zu korrigieren, wollen wir nun sagen, daß es sich darum handelt, den Wortinhalt zu verändern. Wir werden sehen, daB notwendigerweise eine Parzelle des ursprünglichen Sinns erhalten bleibt. Damit haben wir die Grundlage des metasememischen Vorgangs bezeichnet.« Das »ursprüngliche Signifikat (neigt) dazu, zugunsten des neuen Signifikats zu verschwinden. Am Ende dieser Entwicklung (...) verschwindet es vollkommen« (159), wie sich an lexikalisierten Metaphern zeigen ließe. 15 Vgl. ebd. 57f. ; darin liegt zugleich der maßgebliche Unterschied zu den Metalogismen (vgl. die Übersicht ebd. 58): Bei den Metasememen geht es um die Beziehung zwischen Signifikant und Signifikat, bei den Metalogismen dagegen um die Beziehung zwischen Zeichen und Referenten (vgl. unten Kap. B. 1). 16 WEINRICH 1967, 6.
17 DUBOIS et.al. 1974, 161.
18 Vgl. ebd. 153f., 161 und 162.
Kapitel VII: Uneigentliche Rede
303
eben weil sie gegen die syntagmatischen Verträglichkeitsbeziehungen verstoßen, die die syntaktisch-semantischen Paradigmen konstituieren und deren Kombinierbarkeit regeln: Die metonymische Wendung »ein Glas trinken« ist, proprie gelesen, 'falsch', weil eine mit dem Verb »trinken« gebildete Verbalphrase ein Nomen verlangt, das einen flüssigen, eben trinkbaren Stoff bezeichnet; die (verblaßte) Metapher »am Fuße des Berges« ist »eigentlich« eine falsche Fügung, weil zwischen den in beiden Nomina repräsentierten Paradigmen (unbelebt vs. belebt) »eigentlich« keine mit dem genetivus possessivus gebildete syntagmatische Relation zuläßig ist. Diese 'Fehler' müssen daher vom Empfänger berichtigt werden: Sie initiieren die Suche nach einer anderen möglichen Bedeutung des störenden Wortes, die den 'Fehler' kompensiert und die Äußerung als sinnvolle verständlich werden läßt. Das vollzieht sich über je spezifische (von den diversen metasememischen Formen bestimmte) Operationen, bei denen dem störenden Signifikanten eine neue (aus Partikeln seiner alten, eigentlichen Bedeutung abgeleitete) Bedeutung zugewiesen wird: Bei der Wendung »ein Glas trinken« ist die metonymische Verschiebung (hier vom Gefäß auf dessen Inhalt) zu vollziehen,19 die Wendung »am Fuße des Berges« verlangt die bei metaphorischen Operationen zu vollziehende Selektion derjenigen semantischen Merkmale des uneigentlich verwendeten Ausdrucks (»Fuß«), die auf den konterdeterminierenden Ausdruck (»Berg«) als Prädikate angewendet werden können ('zuunterst', 'am Boden'). Die Veränderung der eigentlichen Bedeutungen beruht bei Metasememen also auf freiwilligen Fehlern, 20 auf Verstößen gegen die im Kode formulierten Regeln der eigentlichen Sprachverwendung: Metasememe sind »Abweichungen vom Kode«,21 Verstöße gegen die im Lexikon verabredeten Standardbedeutungen von Wörtern. Solche Verstöße gegen das Lexikon aber können Bilder nicht vollziehen, weil sie gar kein Lexikon haben. Metasememe und ikonische Zeichen Wenn Metasememe auf der Störung und Veränderung von verabredeten, standardisierten Beziehungen zwischen Signifikanten und Signifikaten beruhen, dann setzen sie Zeichen voraus, bei denen diese Beziehungen überhaupt gestört und verändert werden können, d.h. dann setzen sie Zeichen voraus, über deren Bedeutungen Verabredungen getroffen werden müssen, weil sie sich nicht von selbst verstehen, bei denen also die Beziehung zwischen Signifikanten und Signifikaten arbiträr ist, denn nur unter dieser Voraussetzung gibt es überhaupt jene Verabredungen, gegen die dann im metasememischen Akt ver19 Vgl. LAUSBERG 1960 § 568; LAUSBERG 1971, § 2 2 0 . 20 DUBOIS et.al. 1974, 162.
21 Ebd. 44.
304
Kapitel VII: Unrígentliche Rede
stoßen werden kann. Ikonische Zeichen sind nun aber motivierte Zeichen (Kap. I.A): Bei ihnen beruht die Beziehung zwischen Signifikanten und Signifikaten nicht auf Verabredungen, sondern auf Ähnlichkeit, und deshalb bedarf sie keiner in einem Lexikon zu treffenden Verabredungen. Und weil das so ist, kann diese Beziehung hier auch nicht gestört und neu geregelt werden, weder durch einen 'falschen' Kontext noch durch Verstöße gegen standardisierte Wahrnehmungsbedingungen. Verstöße gegen standardisierte Wahrnehmungsbedingungen (Wahrnehmungs- und Erkennungskodes; vgl. S. 8, 16f.) können das Signifikat verrätsein, können die Erkennbarkeit des abgebildeten Objekts beeinträchtigen, nicht aber die Beziehung zwischen Signifikanten und Signifikaten verändern. Genauer: Verstöße gegen Wahrnehmungs- und Erkennungskodes sind nicht in der Lage, das ikonische Signifikat, wie das bei Metasememen geschieht, unabhängig vom Signifikanten zu verändern. Sie können vielmehr immer nur beide verändern, denn ein verändertes ikonisches Signifikat setzt, eben weil ikonische Zeichen auf Similaritätsbeziehungen zwischen Signifikanten und Signifikaten beruhen, immer auch einen veränderten Signifikanten voraus: Die Zeichnung eines Zebras, bei der versäumt wurde, die Streifen des Fells zu markieren, erzeugt keine metasememische Mutation des ikonischen Signifikats »Zebra«, sondern ein neues Zeichen, einen neuen Signifikanten mit entsprechend neuem Signifikat (»Maulesel«). Auch eine der metasememischen Grundoperation entsprechende Einfügung ikonischer Zeichen in einen 'falschen' ikonischen Kontext kann keine metasememischen Operationen in Gang setzen: Das Bild eines Elefanten, der Flügel hat, oder eines Hundes, der auf einem Baum sitzt, verändert nicht die Bedeutung der ikonischen Zeichen, die diesen Elefanten (Hund) denotieren. Denn anders als das Wort »trinken«, das in der Wendung »ein Glas trinken« das Wort »Glas« konterdeterminiert und dessen Bedeutung deshalb in der Richtung auf den Inhalt des Glases zu verändern zwingt, kann das ikonische Zeichen »Flügel« (»Baum«) das Zeichen »Elefant« (»Hund«) nicht konterdeterminieren, deshalb auch seine Bedeutung nicht verändern. Es kann ihm nur Bedeutungen hinzußgen: Das Bild eines Elefanten mit Flügeln verändert nicht die Bedeutung der Zeichen, die den Elefanten denotieren, sondern fügt ihnen nur etwas hinzu, macht aus dem »Elefanten« einen »Elefanten mit Flügeln«. Eben weil ikonische Zeichen motivierte, auf Similaritätsbeziehungen zwischen Signifikanten und Signifikaten beruhende Zeichen sind, können sie, wie gesagt, nicht nicht bedeuten, was sie - proprie - bedeuten, sondern allenfalls mehr, und deshalb können sie, wo sie in ungewohnten Kombinationen auftreten (Elefant + Flügel), einander auch nicht konterdeterminieren. Was hier konterdeterminiert und damit verändert wird, sind nicht die Zeichen, sondern
Kapitel VII: Uneigentliche Rede
305
etwas anderes, nämlich unsere gewohnten Bilder von Wirklichkeit (vgl. S. 2022): Das Bild eines fliegenden Elefanten (eines auf einem Baum sitzenden Hundes) verstößt nicht gegen syntagmatische Kombinationsregeln, sondern gegen einen Erfahrungssatz, der besagt, daß Elefanten nicht fliegen (Hunde nicht auf Bäume klettern) können. Das ungewohnte Arrangement kann wohl »unseren Blick auf die Dinge verändern«,22 kann z.B. dem Elefanten etwas Vogelartiges oder dem Hund etwas Katzenhaftes zusprechen, nicht aber, wie Metasememe das tun, die Bedeutung der Zeichen selbst verändern. Der Rezipient muß sich hier deshalb, um das Bild zu verstehen, nicht - wie bei Metasememen - an dem gestörten Verhältnis zwischen Signifikant und Signifikat abarbeiten, denn das Bild ist ja nicht unverständlich: Der Betrachter versteht es sogleich als Bild eines Elefanten mit Flügeln. Gestört wird also nicht das Verhältnis von Signifikanten und Signifikaten, sondern das Verhältnis von Zeichen und Referenten, Zeichen und Wirklichkeit: Der Betrachter muß sich an der »Behauptung« des Bildes abarbeiten, daß Elefanten fliegen können. Bilder können also zwar gegen Erfahrungssätze der alltäglichen Wirklichkeitswahrnehmung, nicht aber gegen syntagmatische Regeln der Zeichenkombination verstoßen, denn solche Regeln kennen sie gar nicht: Ikonische Zeichen beziehen ihre Bedeutungen nicht aus der »Tatsache, daß sie erscheinen oder nicht erscheinen«,23 d.h. sie haben keinen paradigmatischen Oppositions- und Stellenwert und folglich auch kein syntagmatisches Regelwerk, das die Kombinierbarkeit von Paradigmen bestimmt (vgl. S. 19-23). Deshalb liegt der 'Fehler', den das Bild eines fliegenden Elefanten begeht, im Verstoß gegen Erfahrungssätze der Wirklichkeit, nicht im Verstoß gegen syntagmatische Kombinationsregeln. Das aber heißt: Bilder können offenkundig jene freiwilligen Fehler, auf denen Metasememe beruhen, nicht begehen, eben weil es hier kein grammatisches Regelsystem gibt, das bestimmte Zeichenkombinationen als Fehler und damit als gezielte Destruktionen eigentlicher Zeichenbedeutungen auszuweisen in der Lage wäre. Die Substitution eines 'richtigen' Satzteils (Bilddetails) durch einen 'falschen', mit dem Metasememe ihre freiwilligen Fehler begehen, hat bei Bildern also ganz andere Folgen: Da 'Richtigkeit' sich hier nicht nach syntaktischen Regeln, sondern nach Erfahrungssätzen der alltäglichen Wirklichkeitswahrnehmung bemißt, verändert sie nicht die Bedeutung des 'Satzteils' (Elefant, Hund), sondern stellt jene Erfahrungssätze in Frage.24
22 Ebd. 206. 23 ECO 1972, 217. 24 Daß diese Kollision des »Bildsatzes« mit Erfahrungssätzen der alltäglichen Wirklichkeitswahrnehmung unter Umständen Signal einer metalogischen Bedeutungsstruktur des Bildes
306
Kapitel VII: Uneigentliche Rede
Nun könnte man einwenden, daß ja doch auch die syntagmatischen Kombinationsregeln der Sprache letzthin auf solchen Erfahrungssätzen beruhen, mithin hier wie dort dieselben 'Fehler' begangen werden, die Metasememe begehen: Die konterdeterminierende Wirkung des Verbs »trinken« auf das Wort »Glas« (»ein Glas trinken«) beruht ja doch auf dem Erfahrungssatz, daß Glas nicht trinkbar ist. Warum also sollte das Bild eines fliegenden Elefanten nicht dieselben Effekte haben, d.h. warum sollte das ikonische Zeichen »Flügel« nicht auch hier das ikonische Zeichen »Elefant« konterdeterminieren und entsprechende metasememische Operationen auslösen? Warum also sollte das Bild eines fliegenden Elefanten nicht z.B. als Metapher fungieren können, die, sagen wir, die »Überwindung der Erdenschwere« bedeutet? Antwort: Wohl, vermöchte das Bild eine solche oder ähnliche uneigentliche Bedeutung zu entfalten, aber diese Bedeutung käme nicht aufgrund metasememischer, sondern aufgrund metalogischer Operationen zustande (s.u.), die das Bild als Allegorie, nicht als Metapher, als Metalogismus also, nicht als Metasemem auswiese. Metasememe benutzen die Verstöße gegen Erfahrungssätze, um die Beziehung zwischen Signifikanten und Signifikaten neu zu regeln, um den Empfänger dazu zu zwingen, dem Signifikanten ein neues, uneigentliches Signifikat zuzuweisen. Dieser Zwang entsteht bei dem Bild eines fliegenden Elefanten nicht, denn das ungewohnte Arrangement kann, wie eben gezeigt wurde, die Bedeutung der ikonischen Zeichen nicht destruieren, sondern allenfalls erweitern: Es erweitert die Information »Elefant« um die Information, daß dieser Elefant erstaunlicherweise fliegen kann, und diese erstaunliche Information kann nicht durch metasememische Operationen aus der Welt geschafft werden. Während also die metasememische Operation den in Frage gestellten Erfahrungssatz wiederherstellt, indem sie dem störenden Signifikanten ein neues Signifikat zuweist (»ein Glas trinken«: »ein Glas Whisky trinken«), bleibt im Bild die Störung erhalten: Das Bild eines fliegenden Elefanten behauptet schlichtweg, daß dieser Elefant fliegen kann. Wo diese Behauptung eine metalogische ist, kann das ungewohnte Arrangement den Rezipienten unter bestimmten, noch zu klärenden Umständen dazu anstiften zu fragen, ob das Bild nicht möglicherweise mehr meint als es 'sagt', ob es nicht möglicherweise mit der 'Behauptung', daß dieser Elefant fliegen kann, noch etwas anderes 'sagen' will, etwa dies, daß hier 'Erdenschwere überwunden' wird. Diese Bildbedeutung käme aber nicht durch die Rekonstruktion eines neuen Signifikats zustande, sondern durch die Rekonstruktion eines neuen Referenten, genauer: eines zweiten, uneigentlichen Referenten, der neben den eigentlichen Referenten des Bildes (den fliegenden Elefanten) tritt, diesen also nicht sein könnte, steht auf einem anderen Blatt (vgl. Kap. VII.B.2). Hier kommt es darauf an zu zeigen, daß Bilder keine metasememischen Strukturen erzeugen können.
Kapitel VII: Uneigentliche Rede
307
destruiert, sondern ganz im Gegenteil ihn als seinen semiotischen Repräsentanten braucht. Das metasememisch verwendete Wort »Glas« dagegen hat, weil es das Signifikat nicht verdoppelt, sondern verändert, nicht zwei, sondern einen Referenten, das je in Rede stehende Getränk. Die »Filmmetapher«, eine Metapher Die vorstehenden Überlegungen können hinreichend begründen, warum metasememische Begriffe für die Beschreibung filmischer Sachverhalte nicht in Frage kommen. Angesichts der langen Tradition des Begriffs »Filmmetapher« ist es aber wohl doch nötig, diesen Begriff eigens zu diskutieren. Metaphern sind prädikative Akte, die man in der Formel »dies ist das« (im Unterschied zur Grundformel des Vergleichs: »dies ist wie das«) zusammenfassen kann:25 »Achill ist ein Löwe«.26 Die klassische Rhetorik, die unter den verschiedenen Metapherntheorien die sog. Substitutionstheorie vertritt,27 zählt die Metapher zu den »Sprung-Tropen«, die den eigentlichen Ausdruck (»mutiger Krieger«) durch einen uneigentlichen Ausdruck (»Löwe«) ersetzen, der einem semantischen Feld (Tierwelt) entstammt, das dem des eigentlichen (Menschenwelt) »nicht unmittelbar benachbart ist«, also eine Art »Sprung« in ein fremdes semantisches Feld vollzieht.28 Die Interaktionstheorie,29 der hier gefolgt wird, leitet die Metapher nicht aus ihrer Beziehung zu dem von ihr (vermeintlich) substituierten Ausdruck ab (»Löwe« und »mutiger Krieger«), sondern aus ihrer Beziehung zu ihren Kontext, genauer: zu dem in diesem Kontext erscheinenden »Hauptgegenstand« (»principal subject«: »Achill«), den sie - als »untergeordneter Gegenstand« (»subsidiary subject«: »Löwe«)30 - prädiziert. Metaphern kommen demnach durch die Versetzung eines Wortes (»Löwe«) in eine ihm fremde semantische Umgebung (»Achill«) zustande, durch die diesem Wort eben jene semantische Verdrehung (»metaphorical twist«)31 widerfährt, die es zur Metapher macht.32 Harald Weinrich definiert die Metapher als ein »Wort in einem konterdeterminierenden Kontext«:33 Der Kontext 25 V g l . KURZ 1 9 8 2 , 2 1 . 26 V g l . LAUSBERG 1971, § 174. 27 V g l . KURZ 1 9 8 2 , 7 - 1 3 . 28 V g l . LAUSBERG 1971 § 175.
29 Vgl. KURZ 1982, 13-21. - Die Interaktionstheorie nimmt sich die Einsicht der Sprechakttheorie zum Leitfaden, derzufolge die Frage, ob eine Metapher vorliegt oder nicht, nicht immanent beantwortet werden kann, sondern erst vom gesamten Kontext entschieden wird, in dem eine Äußerung formuliert wird: Die Äußerung »Achill ist ein Löwe« wäre keine Metapher, sobald Achill Eigenname eines Löwen ist (vgl. ebd. 13f.). 30 V g l . BLACK 1 9 8 3 , 7 0 . 31 V g l . BEARDSLEY 1 9 8 3 , 1 2 0 f f . 32 V g l . RICOEUR 1 9 8 3 , 3 5 8 . 33 WEINRICH 1 9 6 7 , 6 .
308
Kapitel VII: UneigentUche Rede
destruiert die mit dem Wort normalerweise verbundene »Determinationserwartung« (Tierwelt) durch eine »Konterdetermination« (Menschenwelt). Das Wort »Achill« konterdeterminiert das Wort »Löwe« dergestalt, daß »Löwe« nicht mehr wörtlich genommen werden kann. Dieser freiwillige Fehler, den Metaphern wie alle Metasememe begehen, erzwingt die Veränderung des Signifikats. Der Satz »Achill ist ein Löwe« ist, sofern der Eigenname »Achill« nicht einen Löwen mit Namen »Achill«, sondern den griechischen Helden bezeichnet, 'eigentlich' Unsinn und muß deshalb vom Hörer korrigiert werden: Einige Merkmale der eigentlichen Bedeutung des Ausdrucks oder, wie strukturalistische Rhetoriker sagen würden,34 einige Seme des Semems »Löwe« gehen bei dieser Korrektur vollständig verloren (z.B. Fell, vier Beine etc.), andere dagegen überstehen die »Ortsveränderung«, diejenigen nämlich, die mit einem »metaphorical twist« auf den »Hauptgegenstand« (Achill) als dessen Prädikate angewendet werden können.35 Der Prozeß der Prädikation, den Metaphern vollziehen, setzt demnach die Verwendung klassifikatorischer Zeichen voraus. Denn mit nicht-klassifikatorischen Zeichen, mit Zeichen also, die - wie ikonische Zeichen - Individuelles bezeichnen, die wie Eigennamen funktionieren (vgl. S. 11-19), können keine Prädikationen vollzogen werden (vgl. S. 19-23): Sie ergäben, als Prädikate verwendet, logisch falsche Aussagen, nämlich die Identifikation eines Individuums mit einem anderen: Die Verwendung eines individuellen Löwen - sagen wir, sein Name sei »Leo« - als Prädikat des Achill ergäbe keine Metapher, sondern Unsinn: »Achill ist Leo«. Man kann zwei Individuen zwar miteinander vergleichen (»Achill ist wie Leo«), weil der Vergleich beiden ihren Status als Individuen beläßt, sie lediglich über ein tertium comparationis einem gemeinsamen Dritten zuordnet, aber man kann nicht das eine Individuum als uneigentliches Prädikat des anderen verwenden, weil dabei keine Metapher, sondern eine schlichte Identifikation entstünde.36 Das ist - über die ge34 V g l . DUBOIS et.al. 1974, 153-170, v . a . 156f.
Das setzt zum einen voraus, daß der Leser die Wörterbuchbedeutung der Metapher kennt, also »dieses Wort im wörtlichen Sinne gebrauchen kann«, zum anderen, daß er »das System miteinander assoziierter Gemeinplätze« kennt, das dieses Wort abruft und aus dem das metaphorische Prädikat auszuwählen ist (BLACK 1983, 70f.). Im Beispielfall (»Löwe«) handelt es sich um einen Sonderfall insofern, als dieses »System« nicht bloß assoziierte Gemeinplätze, sondern selbst schon fest konventionalisierte uneigentliche Bedeutungen enthält. 36 Das übersieht ALDRICH bei seinem Versuch, die »visuelle Metapher« zu definieren: Er geht von Ähnlichkeiten zwischen zwei Dingen, z.B. zwischen einer bestimmt geformten Wolke und einem Frauenkopf (vgl. ALDRICH 1983, 149ff.) aus und redet damit immer nur über Vergleiche, nicht über Metaphern. Das einzige Beispiel aber, das die Rede von der »visuellen Metapher« scheinbar legitimieren könnte, Picassos Ziege, deren Brustkorb aus einem Weidenkorb besteht (ebd. 145), ist eine nachgestellte Metapher (vgl. den folgenden
Kapitel VII: Uneigentliche Rede
309
nannten prinzipiellen Gründe für die Unvereinbarkeit von Metasememen und ikonischen Zeichen hinaus - der Grund, warum ikonische Zeichen nicht metaphorisch verwendet werden können: Nichts hindert einen Filmemacher, ein Ding in einen Kontext zu verfrachten, der gegen alle »Determinationserwartungen« verstößt, die mit dem Ding verbunden sind, nur: daraus kann beim besten Willen keine Metapher entstehen, weil es sich bei diesen nebeneinander im Raum befindlichen Dingen um je besondere Individuen handelt, die einander nicht prädizieren können dergestalt, daß Merkmale des einen zum Prädikat des anderen würden.37 Es gibt kein ikonisches Zeichen, das die räumliche Beziehung zwischen zwei optischen Sachverhalten in eine Beziehung der Prädikation verwandeln könnte (vgl. S. 19-23). Es gibt allenfalls ikonographisch konventionalisierte Zeichen, die - wie etwa die Bildattribute der vier Evangelisten (Engel, Löwe, Stier, Adler) - aufgrund bestimmter Verabredungen prädikative Bedeutung gewinnen können. Tropische Topoi: Filmische Replikate sprachlicher Tropen und ikonographischer Konventionen Filmbilder können also zwar selbsttätig keine Metaphern erzeugen, immerhin aber können sie, wie das zuletzt genannte Beispiel zeigt, Zeichenkombinationen herstellen, die eine vorfilmische Bedeutungstradition haben, optische Sachverhalte nämlich, die hochgradig konventionalisierte uneigentliche Bedeutungen haben, also schon bestehen, bevor sie im Film »nachgestellt« werden. Die Reservoirs, aus denen sie sich dabei bedienen, sind zum einen Abschnitt über »tropische Topoi«): Sie ist eine ikonische Rückübersetzung der verblaßten Sprachmetapher »Brustkorb«, setzt die Sprachmetapher »wörtlich« ins Visuelle um. Aufgefordert, die Metapher »Achill ist ein Löwe« filmisch umzusetzen, bliebe einem Filmregisseur wenig anderes übrig als die vergleichende Montage zu bemühen (vgl. S. 179-187 und Kap. VII.D), die etwa Bilder des kämpfenden Kriegshelden mit Bildern eines kämpfenden Löwen alternierend verbände, also die Metapher (»Achill ist ein Löwe«) zu einem schlichten Vergleich (»Achill ist wie ein Löwe«) mutieren ließe. Eine dem metaphorischen Akt vergleichbare Operation, die verlangte, daß Achill und der Löwe im selben Bild erscheinen und in eine prädikative Beziehung zueinander gesetzt werden müßten, wäre nicht nur abwegig, sondern auch, in jeder denkbaren Variante, mißverständlich. Um die beiden Grundelemente der Metapher im selben Bild präsent zu halten, gäbe es nun vielleicht, zwar nicht bei diesem Beispiel, aber in anderen Situationen, noch die Möglichkeit, das metaphorische Element nicht neben, sondern an die Stelle des von ihm zu prädizierenden Elements zu setzen, also die Konterdetermination nicht von dem zu prädizierenden Element selbst, sondern von dessen Umfeld ausgehen zu lassen, beispielsweise einen Esel zu zeigen, der auf einen Königsthron sitzt. Auch das ergäbe freilich keine Metapher (sondern wiederum ein allegorisches, auf Traditionen der Tierfabel rekurrierendes Bild), weil die eigentliche Bedeutung des Bildes erhalten bliebe. Zudem entfiele die Beziehung der Konterdetermination zwischen beiden Elementen, weil das zu prädizierende Element (König) nicht präsent wäre, also die Präsenz von »zwei deutlich unterschiedene(n) Gegenstände^)* fehlte (BLACK 1983, 75), die die Metapher konstituiert.
310
Kapitel VII: Uneigentliche Rede
sprachliche Konventionen, darunter vor allem konventionelle, verblaßte bzw. lexikalisierte Sprachmetaphern,38 »bildliche« Redewendungen, Sprichwörter u.ä., und zum anderen ikonographische Konventionen der bildenden Kunst.39 Das hat, mit Blick auf konventionalisierte sprachliche Metaphern, schon Ejchenbaum gesehen, als er »Filmmetaphern« als »eine Art visuelle Realisierung der Sprachmetapher« kategorisierte und feststellte, daß »Filmmetaphern« nur »vorbehaltlich der Stütze auf eine Sprachmetapher« möglich sind und deshalb »selbstverständlich nur geläufige Sprachmetaphern« nachbilden können.40 Solche »visualisierten« Metaphern sind aber selbstverständlich keine Metaphern mehr, sobald (und weil) sie »visualisiert« werden, sondern mutieren notwendig zu metalogischen Sprechakten, denn für sie gilt dasselbe, was vorhin grundsätzlich zum Verhältnis zwischen Metasememen und ikonischen Zeichen gesagt wurde. Sie spielen ihre gewichtigste Rolle denn auch dort, wo sie als metalogische Signale in Funktion treten, also an der Enkodierung metalogischer Sprechakte im Film beteiligt sind, worauf zurückzukommen sein wird (vgl. Kap. C).41 Für die zusammenfassende Bezeichnung filmischer Nachbildungen von Sprachmetaphern und ikonographischen Konventionen sei hier der Begriff »tropischer Topos« vorgeschlagen: Versteht man unter Topoi mit Ernst Robert Curtius42 nicht die Konstituenten jenes noch lebendigen Systems der rhetorischen inventio, des Systems der loci, »Fundörter« zum Auffinden von Argumenten, 43 sondern diese Argumente selbst, soweit sie zu festen Argumentationsmustern geronnen sind, nämlich loci communes, Gemeinplätze im modernen Sinn, feste Klischees oder Denk- und Ausdrucksschemata, die zum Gemeinbesitz einer kulturellen Gemeinschaft geworden sind, so schließt dieser Begriff zweifellos auch die hier gemeinten Sachverhalte ein. Da er jedoch Vgl. etwa die uneigentliche Bedeutung von »fallen«, »stürzen«, »über etwas stolpern«, die sich z.B. Tarkowskij in »Nostalghia« (I 1983) zunutze macht, wenn er Emilia im Hotelflur einen imaginierten »Wettlauf« (um Gortschakows Zuneigung) machen und dabei hinfallen, d. h. scheitern läßt. 39 Vgl. z.B. die ikonographischen Traditionen der Figuralallegorien, etwa die ¡konischen personiflcationes der Tugenden und Laster, der Justitia, usw. Letzere macht sich z.B. Wolfgang Staudte in »Der Untertan« (DDR 1951) zunutze, wenn er die Kamera nach der Gerichtsverhandlung gegen den Fabrikanten Lauer auf ein Buntglasfenster schwenken läßt, das die Justitia zeigt. 40 EJCHENBAUM 1 9 2 7 , 3 8 .
41 Die in Anm. 38 genannte Einstellung aus »Nostalghia« etwa ist eine Allegorie, die sich der konventionalisierten metaphorischen Bedeutung des Lexems »(hin)fallen« als eines metalogischen Sinnsignals, nämlich eines »Scharniers« bedient, das die Brücke von der eigentlichen zur uneigentlichen Bedeutung des eizählten Vorgangs schlägt. 42 Vgl. E.R. Curtius, Europäische Literatur und lateinisches Mittelalter, 9. Aufl. Bern 1978, 79f. 43 Vgl. LAUSBERG 1971, §§ 40-45; LAUSBERG 1960 §§ 373-399.
Kapitel VII: Uneigentliche Rede
311
nicht auf Formen uneigentlicher Rede eingeschränkt werden kann, sei als filmtheoretischer Terminus die Kombination tropischer Topos vorgeschlagen, die anzeigt, daß es sich hier um Gemeinplätze uneigentlicher Rede handelt. Der Begriff ist ausdrücklich auf feste tropische Klischees und Ausdrucksmuster einzuschränken, also nicht etwa als Synonym für jede Art von Klischees aufzufassen, sondern für filmische Nachbildungen konventionalisierter uneigentlicher Redewendungen in Sprache und bildender Kunst reserviert. Indices Der Umstand, daß Filme alles Nicht-Optische und Nicht-Akustische nicht umstandslos bezeichnen können und daher für deren Darstellung auf Ersatz sinnen müssen, hat manche Filmwissenschaftler dazu verführt, all jene ikonischen Zeichen, die als Indices solcher nicht-optischen oder nicht-akustischen Sachverhalte gelesen werden können, als Metasememe anzusprechen:44 Schweißperlen auf einer Stirn erscheinen da etwa als »eindeutig« metonymische »Indices von Hitze«, weil sie »eine abstrakte Idee heraufbeschwören)«. 45 Abgesehen davon, daß Metonymien keine abstrakten Ideen heraufbeschwören und Hitze keine »abstrakte Idee«, sondern eine Sinneswahrnehmung ist, sind Indices keine Form uneigentlicher Rede, sondern das, was ihr Name besagt: Sie sind Anzeiger von Sachverhalten, zu denen sie in logischen (v.a. kausalen) Relationen stehen, nehmen darum aber ja noch keine uneigentlichen Bedeutungen an: Bilder eines Gesichts, dem Schweißperlen auf der Stirn stehen, bekunden, daß dieser Mensch schwitzt, daß ihm also mutmaßlich sehr warm ist, d.h. die Schweißperlen haben keine uneigentliche, sondern eine höchst eigentliche Bedeutung, sind so wenig uneigentliche Zeichen wie die Schweißperlen, die meinem Nachbarn beim Umgraben seines Gartens auf der Stirn stehen, d.h. optische Indices fungieren zwar u.U. als Substitute des Indizierten, sind darum aber ja keine uneigentlichen »Ausdrücke«. Niemand würde sich zu der Behauptung versteigen, der Satz »Schweißperlen standen ihm auf der Stirn« sei eine Metonymie, bloß weil er auf dieselben logischen Relationen rekurriert, die auch bei Metonymien (Ursache/Wirkung, Gefäß/Inhalt usw.) aktualisiert werden. Ebenso verhält es sich beim Film, der übrigens unentwegt mit Indices arbeitet: Ein lächelndes Gesicht, eine zitternde Hand indizieren Empfindungen, ein rascher Gang indiziert Eile, der Eiffelturm indiziert Paris usw. Wollte man Indices als uneigentliche Redeform klassifizieren, müßte man also nahezu jedes Filmbild als uneigentliches ansprechen.
44
«
Vgl. z.B. MONACO 1980, 147-154. Ebd. 150.
312
Kapitel VII: Uneigentliche Rede
Konnotationen Wo von uneigentlichen Bildbedeutungen im Film die Rede ist, taucht in jüngeren filmwissenschaftlichen Arbeiten mit zunehmender Häufigkeit der Begriff »Konnotation« auf. Seit Roland Barthes uneigentliche Bedeutungen von Bildern generalisierend als »Konnotationen« klassifiziert 46 und Christian Metz diese linguistische Kategorie gar in den Rang eines Kriteriums für den Kunstcharakter literarischer oder filmischer Werke erhoben hat, 47 ist der Begriff »Konnotation« in der Filmwissenschaft zu einer Art Zauberwort geworden: Sobald ein Filmbild mehr zu bedeuten scheint als das, was auf ihm zu sehen ist, ist der Begriff nicht weit und avanciert dabei immer mehr zu einem Ersatzbegriff für die Bezeichnung uneigentlicher Redeformen,48 eine Begriffsverwendung, die zweifellos nicht gerechtfertigt ist, auch durch die Bedeutungserweiterungen nicht gerechtfertigt werden kann, die der Begriff seit Hjelmslev erfahren hat. 49 Konnotation ist eine linguistische Kategorie, die, als Komplement des Begriffs Denotation, das semantische Feld sprachlicher Signifikanten, nämlich den vollen Umfang der möglichen eigentlichen Bedeutungen sprachlicher Signifikanten, nicht aber die Bedeutungen beschreibt, die ihre uneigentliche Verwendung produzieren kann. 50 Konnotation spielt aber eine Rolle für die bei der Konstitution uneigentlicher Bedeutungen ablaufenden Prozesse. Denn zweifellos gehören Konnotationen zu jenem »System miteinander assoziierter Gemeinplätze«, das Wörter abrufen und das Max Black zur Voraussetzung der Metaphernbildung erklärt. 51 Vor allem innovative Metaphern und uneigentliche Redewendungen überhaupt, die nicht auf tropische Konventionen rekurrieren, sind zweifellos auf Konnotationen angewiesen, darauf, daß der Rezipient das gesamte Feld 46 V g l . BARTHES 1 9 6 9 , 162.
47 METZ 1964, 110: »Letztlich unterscheidet sich ein Roman von Proust von einem Kochbuch oder ein Film von Visconti von einem chirurgischen Dokumentarfilm - semiologisch ausgedrückt - durch den Reichtum an Konnotationen.« 18 Vgl. z.B. SPRINGER 1987, 50-52, MONACO 1980, 144-158 (bei dem sämtliche Formen uneigentlicher Rede unter dem Sammelnamen »konnotative Bedeutung« firmieren) oder SŒGRIST 1 9 8 6 , 6 7 .
Vgl. Louis Hjelmslev, Prolegomena zu einer Sprachtheorie, München 1974, 112ff. - Vgl. den Überblick über die Begriffegeschichte bei NÖTH 1985, 74ff. so Dies gilt auch dann, wenn man Konnotation, wie etwa Eco, im weitestmöglichen Sinne versteht als »die Gesamtheit aller kulturellen Einheiten, die von einer intensionellen Definition des Signifikans in Spiel gebracht werden können«, d.h. als die die begriffliche, denotative (kognitive, referentielle) Bedeutung eines Signifikanten überlagernde »Summe aller kulturellen Einheiten, die das Signifikans dem Empfänger institutionell ins Gedächtnis rufen kann« (ECO 1972, 108), also etwa stilistische, dialektale, affektive, assoziative, ideologische, axiologische u.a. Bedeutungsaspekte eines Signifikanten betrifft (vgl. ebd. 108-111). 51 V g l . BLACK 1 9 8 3 , 7 0 f .
Kapitel VII: Unägentliche Rede
313
der »kulturellen Einheiten«, die ein Signifikant evozieren kann, beherrscht.52 Das heißt: Konnotationen sind nicht die uneigentliche Bedeutung selbst, aber sie können offenbar als »Scharniere« zwischen eigentlicher und uneigentlicher Bedeutung fungieren, 53 die den Rezipienten auf die Spur der uneigentlichen Bedeutung setzen, nämlich als eines jener Sinnsignale in Funktion treten, die der Text versenden muß, um den vom Rezipienten zu vollziehenden Prozeß der uneigentlichen Bedeutungskonstitution zu steuern (s.u.). Auch Bilder evozieren Konnotationen. Das Bild einer sonnenüberstrahlten Landschaft etwa kann über seine denotative Bedeutung hinaus alle möglichen Konnotationen (z.B. Heiterkeit, Sommer, Wärme, Ferien o.ä.) abrufen, das Bild einer düsteren Landschaft eher gegenteilige Konnotationen. Und wie in der Sprache spielen sie auch hier eine gewichtige Rolle als potentielle Sinnsignale, als »Scharniere« zwischen eigentlichen und uneigentlichen Bildbedeutungen, mit denen der Bildtext die Konstitution uneigentlicher Bildbedeutungen steuern kann.
B. Voraussetzungen uneigentlicher Bilderrede 1.
Die metalogische Struktur uneigentlicher Bilderrede
Was Bildern die Realisierung metasememischer Sprechakte verwehrt, die Motiviertheit ihrer Zeichen und deren nicht-klassifikatorische Struktur, spielt bei metalogischen Redeformen keine Rolle, denn Metalogismen beruhen nicht wie Metasememe - auf Verstößen gegen das Lexikon, sondern betreffen die »materia«,54 die Beziehung der Zeichen zu ihren außersprachlichen Referenten. Der Begriff »Metalogismus« tritt in der strukturalistisch reformulierten Rhetorik von Jacques Dubois55 die Nachfolge des Begriffs der klassischen Rhetorik, »Gedankenfigur« (»figura sententiae«),56 an. Die Neufassung des Begriffs ist durch eine deutlich präzisere Explikation des Sachverhalts legitimiert, die zugleich zu einer veränderten Gruppierung der »Figuren« führt. 57 52 Celans Fügung »schwarze Milch der Frühe« etwa bezieht ihre Bedeutung nicht nur aus der durch die denotative Bedeutung des Farbadjektivs entstehenden Opposition zur Farbe von realer Milch und damit aus der gängigen Opposition »schwarz vs. weiß«, sondern auch aus den Konnotationen, die der 'Mann auf der Straße' (vgl. ebd. 71) mit dem Begriff »schwarz« verbindet (z.B. »unheimlich«, »bedrohlich«, »böse«, »tödlich«). 53 V g l . KURZ 1982, 31. 54 LAUSBERG 1971, § 363. 55 V g l . DUBOIS et.al. 1974, 5 7 f „ 2 0 4 - 2 3 8 . 56 Vgl. LAUSBERG 1960, §§ 8 9 3 - 9 1 0 ; LAUSBERG 1971, §§ 4 1 6 - 4 4 7 (vgl. Anm. 6). 57 V g l . DUBOIS et.al. 1974, 2 0 4 - 2 3 8 .
314
Kapitel VII: Uneigentliche Rede
Metalogismen Bei Metalogismen wird nicht - wie bei Metasememen - Sprache bearbeitet,58 bleibt das Zeichensystem selbst (die Beziehung zwischen ihren Signifikanten und Signifikaten) unberührt: Ein Metalogismus kann zwar »unseren Blick auf die Dinge verändern, aber nicht das Lexikon stören. Vielmehr stellt er den Sprachzustand, in dem er sich definiert, nicht in Frage. Sobald man ihn wahrnimmt, erscheint es notwendig, die Wörter in ihrem, wie manche sagen, 'eigentlichen' Sinn zu nehmen«.59 Denn Metalogismen greifen nicht, wie Metasememe, in die Beziehung zwischen Signifikanten und Signifikaten ein, wohl aber in die Beziehung zwischen Zeichen und außersprachlichen Referenten. Sie verstoßen nicht gegen das Lexikon, wohl aber gegen die Erwartung, daß einer, der etwas sagt, auch meint, was er sagt, daß der Sachverhalt, auf den im Sprechakt referiert wird, auch der vom Sprecher gemeinte Sachverhalt, der 'wahre' Referent der Rede ist: Wenn beispielsweise Chimène in Corneilles »Le Cid« zu Rodrigue sagt: »Geh, ich hasse dich nicht«,60 dann redet sie metalogisch, weil sie den 'wahren' Referenten ihrer Rede (ihre Liebe zu Rodrigue) verhehlt, indem sie ihn (mit einer Litotes)61 periphrastisch umgeht. Metalogismen »verschweigen« den 'wahren' Referenten: Das »eigentlich« Gemeinte wird nicht eigentlich gesagt, sondern uneigentlich umschrieben, erscheint als uneigentliche, verhüllte Bedeutung des metalogischen Proprium. Auch Metalogismen begehen also Regelverstöße, freiwillige Fehler, aber diese Verstöße betreffen nicht das Zeichensystem, sondern die Beziehung des Zeichens (»nicht hassen«) zu den 'in Wahrheit' gemeinten Referenten (»lieben«): Chimène sagt nicht die Wahrheit oder nur die halbe Wahrheit, verbirgt, daß sie den Angeredeten nicht nur nicht haßt, sondern auch und vielmehr liebt. Der 'Fehler', den Metalogismen begehen, besteht also darin, daß sie ihren 'wahren' Referenten 'falsch' bezeichnen (»nicht hassen« statt »lieben«), daß sie etwas anderes sagen als sie meinen. Das unterscheidet sie von Falschaussagen, von Lügen: 'Wahr' und 'falsch' sind hier nicht etwa als logische Prädikate aufzufassen, 62 die den Metalogismus als unwahre Behauptung « « 60 61
Ebd. 204. Ebd. 207. Vgl. ebd. 213. DUBOIS et. al. kategorisieren die Litotes selbst, zu Recht, wie mir scheint, als Metalogismus, während LAUSBERG sie als Worttropus klassifiziert (1960, §§ 586-588; 1971 § 211) und sie dann bei den Gedankenfiguren als Erscheinungsform der »ironia« (1971, §§ 426430), als »Dissimulations-Ironie« bestimmt (1971, § 428, 2). 62 Das legen DUBOIS et.al. 1974 mit ihrer Erörterung des Verhältnisses von »Logik und Metalogismus« nahe (ebd. 214-218): Wenn sie dabei z.B. Formen der Surrealität (die hier gar nichts zu suchen hat) ins Spiel bringen (ebd. 215) und zu dem Schluß kommen, daß »der Metalogismus den Logiker direkt an(geht), da er estensive Falsifikation bedeutet« (218), dann bestimmen sie Metalogismen als logisch falsche Aussagen über Realität.
Kapitel VII: Uneigentliche Rede
315
über Welt auswiesen: Chimène lügt ja nicht (»lieben« schließt »nicht hassen« ein), sondern redet nur von etwas anderem (»nicht hassen« statt »lieben«) als sie 'in Wahrheit' meint. Metalogismen sind 'falsch' nur insofern, als sie nicht auf den 'wahren' (in Wahrheit gemeinten) Sachverhalt, sondern auf einen anderen Sachverhalt referieren, d.h. ihre eigentliche Bedeutung ist keine falsche Aussage über Welt, bewahrt vielmehr ihre eigene Wahrheit. Sie enthält nur nicht oder nur mittelbar (eben uneigentlich) das, was der Sprecher 'in Wahrheit' meint. Daraus leitet sich die Notwendigkeit ab, daß der Hörer, um einen Metalogismus zu verstehen, nicht, wie bei Metasememen, seine Sprachkompetenz, sondern seine Weltkenntnis aktivieren muß, daß er nämlich den 'wahren' Referenten, um ihn zu erschließen, kennen muß, 63 was nicht heißt, daß er schon wissen muß, worüber der Sprecher uneigentlich reden wird, sondern nur, daß ihm der uneigentliche Referent der Rede grundsätzlich bekannt ist: Um die Äußerung »Ich hasse dich nicht« als Metalogismus zu verstehen, muß er wissen, daß Chimène Rodrigue nicht nur nicht haßt, sondern liebt. Wenn er aber - und darin liegt ein zentraler Unterschied zu den Metasememen - diese Voraussetzung für das Verstehen von Metalogismen nicht erfüllt, wenn er also den 'wahren' Referenten nicht kennt, bedeutet das nicht, daß die metalogische Äußerung für ihn unverständlich wird: Eben weil die Wörter, anders als bei den Metasememen, ihre eigentliche Bedeutung hier durchaus bewahren, eben weil der Satz nicht gegen syntagmatische Kombinationsregeln verstößt, vielmehr syntaktisch-semantisch völlig korrekt ist, kann der Hörer ihn auch als korrekten Sprechakt rezipieren, erfaßt dabei dann nur nicht die uneigentliche Bedeutung, weil ihm die Kenntnis des 'wahren' Referenten fehlt, kann also nur die eigentliche Bedeutung realisieren. Metalogismen sind also Sprechakte mit zwei Bedeutungen: Ihre eigentliche Bedeutung bleibt neben der uneigentlichen Bedeutung erhalten.64 Dies ist die Voraussetzung all jener Geheimsprachen, die auf Kommunikation mit einem esoterischen, in den 'wahren' Sachverhalt eingeweihten Publikum zielen, ohne dabei das exoterische Publikum vom Kommunikationsakt auszuschließen, sondern nur von der Kommunikation über das Arkanum (wie etwa militärische »Parolen«).65 Metalogismen haben die Struktur von Geheimsprachen: Daß deren pragmatisches Motiv, der Ausschluß unerwünschter Hörer von der Rezeption der uneigentlichen Botschaft, an der Wiege der Allego« Vgl. ebd. 213f. 64 Und das unterscheidet sie von Lügen: Metalogismen sind keine »falschen Aussagen« über Wirklichkeit, wie Dubois et. al. nahelegen (vgl. Anm. 62): Die 'Wahrheit' metalogischer Propositionen steht auf der Ebene ihrer eigentlichen Bedeutungen nicht in Frage. 65 V g l . KURZ 1 9 8 2 , 3 8 .
316
Kapitel VII: Uneigentliche Rede
rie (der »tota allegoria«)66 stand, ist deshalb auch kein Zufall. 67 Während Metasememe, weil sie gegen sprachliche Regeln verstoßen, jeden kompetenten Sprachteilnehmer zur Rekonstruktion einer uneigentlichen Bedeutung der Rede zwingen, können Metalogismen, weil sie die sprachlichen Regeln respektieren, ein exoterisches Publikum problemlos über ihre 'wahre', uneigentliche Bedeutung hinwegtäuschen, indem sie es mit ihrer eigentlichen Bedeutung abspeisen. Anders als bei den Metasememen, hat die »Definition des Metalogismus (...) keine Begrenzung der Erstreckung zur Folge«:68 Metasememe ersetzen »eine Semgruppe (Semem) durch eine andere«,69 beziehen sich also auf Wörter, Metalogismen dagegen sind Sprechakte mit zwei Bedeutungen, lassen sich also nicht auf bestimmte Semgruppen begrenzen. Sie können daher ganze Texte (z.B. Fabeln) betreffen. Die metalogische Struktur uneigentlicher Bilderrede Wenn Metalogismen nicht, wie Metasememe, das Lexikon in Frage stellen, der metalogische 'Fehler' nicht, wie der metasememische, die Beziehung zwischen Signifikanten und Signifikaten, sondern die Beziehung zwischen Zeichen und Referenten betrifft, dann sind Metalogismen, anders als Metasememe, nicht an Systeme arbiträrer und klassifikatorischer Zeichen gebunden, können vielmehr in sämtlichen Zeichensystemen realisiert werden: In jeder Sprache ist es möglich, etwas anderes als das 'in Wahrheit' Gemeinte zu bezeichen, also auch in der Sprache der Bilder. Die Radikalisierung dieser Einsicht zu der These, daß uneigentliche Bilderrede sich ausschließlich in metalogischen Formen vollziehen kann, ist der Umkehrschluß aus der These, daß Bilder keine metasememischen Sprechakte vollziehen können, weil ihre Zeichen keine arbiträren, sondern motivierte Zeichen sind. Metalogisch verwendete ikonische Zeichen sind also mit Bezug auf ihre uneigentliche Bedeutung 'falsche' Zeichen, d.h. uneigentliche Bilderrede beruht, wie der sprachliche Metalogismus auch, auf der 'fehlerhaften' Bezeichnung der 'wahren' Referenten. Dieser metalogische 'Fehler' bezieht sich, wie gesagt, nicht auf die Beziehung der abgebildeten Welt zur wirklichen Welt schlechthin, sondern nur auf ihre Beziehung zu dem uneigentlich gemeinten, 'wahren' Sachverhalt. Das sei hier deshalb nochmals ausdrücklich betont, weil daraus erstens hervorgeht, daß metalogische Bilder nicht notwendig gegen Erfahrungssätze der alltäglichen Realitätserfahrung verstoßen (also nicht66 V g l . LAUSBERG 1 9 7 1 , § 4 2 3 , 1 ; KURZ 1982, 3 9 f . 67 V g l . KURZ 1 9 8 2 , 3 8 . 68 DUBOIS e t . a l . 1 9 7 4 , 2 1 9 .
69 Ebd.
Kapitel VII: Uneigentliche Rede
317
realistische, surrealistische etc. Inszenierungsverfahren nicht voraussetzen): Das Bild eines fliegenden Elefanten ist, bloß weil es gegen Naturtatsachen verstößt, noch kein metalogisches Bild. Zwar sind Verstöße gegen Erfahrungssätze der alltäglichen Wirklichkeitswahrnehmung ein häufig benutztes metalogisches Signal, das den Rezipienten auf uneigentliche Bedeutungsstrukturen hinweisen kann, aber das hat nichts mit dem metalogischen 'Fehler' selbst zu tun, eben weil Metalogismen keine »falschen Aussagen« über Welt, 70 sondern 'falsch' nur insofern sind, als sie nicht den gemeinten, 'wahren' Sachverhalt, sondern einen anderen Sachverhalt referieren. Daraus geht zweitens hervor, daß die eigentliche Bedeutung metalogischer Bilder stets ihre eigene Wahrheit behält, nicht - als 'falsche' - ihre Geltung verliert: Wenn etwa in Andrej Tarkovskijs Film »Nostalghia« (I 1983) der Sonderling Domenico (Erland Josephson) beim Gang durch seine abbruchreife Behausung mit großer Sorgfalt eine frei im Raum stehende Tür benutzt, statt wie sein Gast Gortschakow (Oleg Jankovsky) sich die Mühe des Öffnens und Schließens zu sparen und um sie herum zu gehen, dann ist dieses metalogische Bild 'falsch' nur insofern, als es nicht das bezeichnet, was es meint: Gemeint ist ein abstrakter Gedanke, nämlich der Protest gegen die (von Gortschakow befolgten) Verhaltensnormen der instrumentellen Vernunft, der hier metalogisch formuliert wird, indem ein funktionsloses Instrument benutzt, wie ein funktionales Instrument behandelt wird. Dem eigentlichen Vorgang selbst aber geht dadurch nichts von seiner Wahrheit ab: Domenico hat die sinnlose Tür ja wirklich in seinem Haus stehen und benutzt sie auch wirklich, das heißt: »Eigentlich« - auf eigentlicher Bedeutungsebene, und das heißt in diesem Film ganz buchstäblich: im Horizont pragmatisch-rationalen Weltverstehens - ist Domenico verrückt.
2.
Metalogische Formsignale
Wenn metalogische Sprechakte auch dann als korrekte Sprechakte rezipiert werden können, wenn der Rezipient ihre uneigentliche Bedeutung nicht dekodiert (s.o.), dann müssen sie notwendig Signale vergeben, die den Empfänger darauf hinweisen, daß sie noch eine zweite Bedeutung haben. Der Umstand, daß der (esoterische) Rezipient den 'wahren' Referenten metalogischer Sprechakte immer schon kennen muß, um den Metalogismus zu verstehen (vgl. S. 315), bedeutet ja nur, daß dieser 'wahre' Referent Bestandteil seines Wissens sein muß, nicht etwa, daß er den je speziellen 'wahren' Referenten eines aktuellen metalogischen Sprechakts vorher schon kennt, also vorher 70 Vgl. oben S. 314f. und Anm. 62.
318
Kapitel VII: Uneigentliche Rede
schon weiß, worüber der Sprecher reden wird.71 Folglich muß der Sprechakt Anweisungen zur metalogischen Rezeption vergeben. Diese Anweisungen seien hier zusammenfassend als metalogische Signale bezeichnet. Die Frage nach metalogischen Signalen enthält eigentlich zwei Fragen: Zum einen geht es um die Frage, mit welchen Zeichen Metalogismen darauf hinweisen, daß ihre eigentliche Bedeutung die 'falsche' ist, daß sie noch eine zweite, 'wahre' Bedeutung haben, zum anderen um die Frage, mit welchen Zeichen sie darauf hinweisen, welche Bedeutung dies ist, welcher Art ihr 'wahrer' Referent ist. Deshalb wird hier zwischen metalogischen Formsignalen und metalogischen Sinnsignalen unterschieden: Metalogische Formsignale zeigen an, daß es sich bei der aktuellen Rede um uneigentliche Rede handelt. Metalogische Sinnsignale dagegen spielen auf die uneigentliche Bedeutung selbst an, fungieren als »Scharniere« zwischen eigentlicher und uneigentlicher Bedeutung,72 geben dem Rezipienten gewissermaßen einen Wink, der ihn auf die Spur der uneigentlichen Bedeutung setzt. Sie sind deshalb sinnvoll nur im Zusammenhang mit den verschiedenen Formen uneigentlicher Rede (Kap. C.2-4) zu erörtern, denn diese Formen resultieren aus den je spezifischen Beziehungen zwischen Proprium und Improprium, die mit eben solchen »Scharnieren« angedeutet werden können. Hier sind also zunächst nur die metalogischen Formsignale zu erörtern. Metalogische Signale müssen naheliegenderweise auf der Ebene der eigentlichen Bedeutung vergeben werden. Sie beruhen auf mehr oder weniger subtilen Störungen der eigentlichen Bedeutung des Sprechakts, die den Rezipienten verunsichern, ihm nämlich die Frage aufdrängen, ob er den Sprechakt wirklich ganz verstanden, seinen Sinn vollständig erfaßt hat. Metalogische Signale stören demnach den vom Rezipienten zu leistenden Prozess der Rekonstruktion von Sinn. Bei narrativen Texten betreffen solche Störungen naheliegenderweise vor allem den handlungslogischen Zusammenhang des Erzählten, entstehen dort, wo der Rezipient die handlungslogische Funktion einer narrativen Proposition - einer einzelnen Handlung oder auch eines ganzen Handlungszusammenhangs - nicht erkennen kann, sei es, weil sie keine erkennbare handlungslogische Relevanz für die erzählte Geschichte hat, sei es, weil schon sie selbst handlungslogisch nicht verständlich ist. Im ersten Fall ist die Handlung in sich zwar handlungslogisch nachvollziehbar, läßt aber handlungslogische Relevanz für die Geschichte vermissen, so daß der Rezipient das Wozu 71
D U B O I S et.al. 1974 geben sich mit dem Verweis auf das Vorwissen des Rezipienten über den 'wahren' Referenten weitgehend zufrieden und kommen deshalb auch nicht zu einer systematischen Klärung der Frage, wie Metalogismen sich überhaupt zu erkennen geben (vgl. z.B. 228f„ 231).
72
Vgl. KURZ 1982,
31.
Kapitel VII: Uneigentliche Rede
319
nicht versteht, nicht erkennt, wozu die Handlung überhaupt erzählt wird. Im zweiten Fall scheitert der Rezipient schon an der narrativen Proposition selbst, versteht das Was, die erzählte Handlung selbst nicht, weil sie logischkausale Folgerichtigkeit vermissen läßt. In beiden Fällen entsteht folglich ein nicht zureichender (unter Umständen auch überhaupt kein) handlungslogischer Sinn: Metalogische Formsignale in narrativen Texten sind demnach als handlungslogische Sinndefizite zu beschreiben. Die beiden wichtigsten Verfahren, mit denen Erzähltexte solche Sinndefizite erzeugen, ergeben sich daraus schon von selbst:, Handlungslogische Sinndefizite entstehen entweder durch redundante oder durch defizitäre Informationsvergabe. Redundante Informationsvergabe Von redundanter Informationsvergabe ist immer dann zu sprechen, wenn die eigentliche Bedeutung einer Einstellung oder Einstellungsfolge mit Bezug auf ihren handlungslogischen Kontext einen »zwar akzeptable(n), aber recht uninteressante(n) Sinn« ergibt und deshalb Sinndefizite, »Enttäuschung hinsichtlich des primären Sinnes« erzeugt, die dazu anreizt, »nachzuforschen, ob nicht doch eine zweite, weniger banale Isotopie existieren könnte.«73 Narrative Redundanz kann sich auf die erzählte Handlung selbst oder auf die Weise ihrer erzählerischen Vermittlung beziehen: Im ersten Fall steht der Umstand, daß eine bestimmte Handlung oder Handlungsfolge überhaupt erzählt wird, zur Diskussion, wird deren handlungslogische Relevanz selbst in Zweifel gezogen, im zweiten Fall steht nur die Art, wie eine Handlung oder Handlungsfolge erzählt wird, zur Diskussion, wird also nicht deren handlungslogische Relevanz selbst, sondern die Relevanz der Informationen in Zweifel gezogen, die die Kamera bei der Vermittlung dieser Handlung(en) aus dem Gesamtangebot an Informationen, das die Vorgänge liefern, auswählt. Im ersten Fall sei von redundanten Erzählakten, im anderen Fall von redundanten Erzählweisen gesprochen. Von redundanten Erzählakten ist also die Rede, wenn die Redundanz den gesamten Erzählgegenstand einer Szene oder Sequenz, unabhängig von der Art seiner kinematographischen Vermittlung, betrifft: Redundante Erzählakte präsentieren Handlungen oder Handlungsfolgen, die für die Handlungslogik der Geschichte irrelevant sind. Wenn z.B. die Kamera in Gustaf Gründgens' »Effi Briest«-Verfilmung (»Der Schritt vom Wege«, D 1939) eine sehr lange Sequenz mit scheinbar ganz unwichtigen Begebenheiten füllt, indem sie ausführlich von Effis erstem Tag in Kessin erzählt, dann entsteht ein so auffälliges handlungslogisches Sinndefizit, daß der Rezipient kaum umhin kommt, dieser langen, handlungsarmen und handlungslogisch »überflüssigen« Sequenz 73 DUBOIS et.al. 1 9 7 4 , 2 2 8 .
320
Kapitel VII: Uneigentliche Rede
einen uneigentlichen Sinn zu unterstellen, zumal die der Sequenz unterlegte, zunehmend dramatischer werdende Musik sich in einen auffalligen Widerspruch zu der handlungslogischen Redundanz der erzählten Vorgänge begibt: Ausführlich wird erzählt, wie Effi sich schon an ihrem ersten Tag in ihrem neuen Zuhause langweilt, wie sie dieser Langeweile mit Lesen, Klavierspielen und Fischefüttern erfolglos Herr zu werden versucht und wie sie schließlich auflebt, als sie den Hund Rollo draußen bellen hört. Der Erzähler begleitet sie dann auf ihrem Spaziergang mit dem Hund, bei dem sie zum ersten Mal ans Meer kommt und, während die Musik ihren dramatischen Höhepunkt erreicht, überrascht und begeistert von dem weiten Blick auf die endlos scheinende See, wie gebannt stehenbleibt, bevor sie die Strandböschung hinunterläuft und am Wasser ein ausgelassenes Spiel mit dem Hund beginnt, dem erst ein Verbotsschild ein Ende bereitet, auf dem das »Betreten des Strandes an dieser Stelle« untersagt wird. In handlungslogischer Sicht hat die gesamte Sequenz allenfalls insofern »Sinn«, als sie die für die Exposition dieses nach der Eheschließung mit Innstetten einsetzenden zweiten Teils der Geschichte wichtige Information liefert, daß die Heldin in ihrer neuen Lebenssituation unausgefüllt ist, ein Umstand, der indes einen Erzählaufwand, wie ihn diese lange Sequenz betreibt, nicht rechtfertigt. Die auffallige Redundanz signalisiert die metalogische Funktion der Bilder, die, indem sie Effis Spaziergang als Flucht aus dem Kulturraum in den Naturraum, aus dem Raum der Gesellschaft (Innstettens pompösem Salon) in den gesellschaftsfreien Raum (der freilich, wie das Verbotsschild ankündigt, ein nur vermeintlich gesellschaftsfreier ist) lesbar machen, das Sinnmodell des Gesamtfilms formulieren, nämlich die Opposition von individueller Selbstbestimmung und gesellschaftlicher Fremdbestimmung in der Opposition von Natur und Kultur abbilden. Von redundanten Erzählweisen ist zu reden, wenn die Redundanz nicht die handlungslogische Funktion des erzählten Vorgangs selbst, sondern die Informationen betrifft, die der Erzähler aus dem Gesamtangebot an Informationen, das der Vorgang liefert, auswählt. Auf typische Formen redundanten Erzählens im Film wurde bereits bei der Untersuchung von Verfahren kommentierenden Kameraverhaltens mehrfach hingewiesen (vgl. S. 57f. u.ö.). Und in der Tat handelt es sich bei solchen im Wege redundanter Erzählweisen realisierten Erzählerkommentaren häufig um metalogische Redeformen, so z.B. bei der erwähnten Einstellung aus »High Noon« (vgl. S. 58, 65f., 70), bei der die Kamera für die Darstellung eines einfachen Vorgangs - Kane tritt aus seinem Sheriff-Büro auf die Straße - einen unverhältnismäßigen Aufwand betreibt, nämlich eine lange Aufwärtsfahrt mit dem Kran macht: Die dadurch entstehenden redundanten Informationen signalisieren die metalogische Be-
Kapitel VII: Uneigentliche Rede
321
deutung des Bildes, die das überweite Panorama der menschenleeren Straße zu einem »Sinnbild« für die Einsamkeit des Helden macht. Ein eigens erwähnenswertes Verfahren redundanten Erzählens, das im Film häufig als metalogisches Formsignal eingesetzt wird, ist die schlichte Wiederholung schon vergebener Informationen durch die zwei- oder mehrfache Einmontierung einer schon bekannten oder ähnlichen Einstellung: Die Wiederholung gleicher oder formal ähnlicher Einstellungen, die wiederholte Abbildung desselben oder ähnlichen Sachverhalts, operiert mit der Erwartungshaltung pragmatischen, eigentlichen Filmverstehens, das einen einmal hinreichend genau wahrgenommenen Sachverhalt als verstanden kategorisiert und die insistierende Wiederholung ein und derselben Information deshalb als Infragestellung dieses Verstehens und eben damit als potentielles metalogisches Signal rezipiert. 74 Defizitäre Informationsvergabe Defizitäre Informationsvergabe entsteht durch die Vorenthaltung handlungslogisch relevanter Informationen: Der Rezipient versteht die immanente Logik einer erzählten Handlung nicht, sei es, weil die handlungslogische Trias von Ausgangssituation, Veränderungsversuch und Endsituation (vgl. S. 168f.) nicht vollständig vermittelt wird, sei es, weil diese Trias keinen logischen Zusammenhang ergibt, gleich von vornherein unverständlich ist. 75 Hierher gehören auch Verstöße gegen Erfahrungsätze der alltäglichen Wirklichkeitserfahrung, von denen als potentiellen metalogischen Signalen schon die Rede war, 7
4 Die auffälligen Wiederholungen formal gleicher oder ähnlicher Einstellungen in Fassbinders »Fontane Effi Briest« (BRD 1974) beispielsweise sind, wie später noch näher gezeigt wird (vgl. Kap. C.3), sämtlich metalogische Signale: Die Abundanz von Einstellungen, die die Figuren eingerahmt von Tür- oder Spiegelrahmen zeigen, von Einstellungen, die die Zuschauerwahrnehmung bzw. die Blickkontakte der Figuren als nicht direkte, sondern ttber Spiegel vermittelte ausweisen, oder die oft wiederholten Kamerablicke auf bestimmte Details der Raumausstattung zwingen den Rezipienten zu einer Revision seines eigentlichen Bildverstehens, die ihm dieses Insistieren auf bestimmten Sachverhalten oder Formelementen erklärlich machen kann. 75 Wenn etwa Frau von Briest (Lilo Pempeit) in der Eingangsszene von Fassbinders »Fontane Effi Briest« (BRD 1974) eine durchaus leidenschaftslose, moderate Umarmung ihrer Tochter (Hanna Schygulla) mit den Worten quittiert: »Nicht so wild, Effi, nicht so leidenschaftlich, ich beunruhige mich immer, wenn ich dich so sehe«, dann ergibt das für den Zuschauer keinen logischen Zusammenhang, verstößt vielmehr deutlich gegen erwartungsgemäßes Verhalten, weil die nonverbale Handlung der Tochter keine plausible Ausgangssituation fur die verbale Handlung der Mutter abgibt: Das zwingt den Rezipienten zur Rekonstruktion eines anderen denn handlungslogischen Sinns der Szene. Wie bei den früher erwähnten Beispielen aus diesem Film geht es auch hier um die Destruktion des im Roman - aufscheinenden Geltungsanspruchs der Utopie gelingender Identität: Die Mutter diszipliniert hier Eigenschaften der Tochter, die hier (anders als im Roman) längst schon diszipliniert, längst schon unterdrückt sind.
322
Kapitel VII: Uneigentliche Rede
ebenso die oben (Kap. III.D) erörterten Formen systematischer Montage. Die vollständige Negation handlungslogischer Zusammenhänge zwischen den Bildern markiert dort den Wechsel vom narrativen zum systematischen Textschema und nötigt den Zuschauer damit zu einem nicht mehr zeitlich und handlungslogisch orientierten, sondern vergleichenden Sehen (vgl. S. 180f.): Die Montage verweigert handlungslogische Zusammenhänge, gehorcht einer anderen als narrativen Logik, nämlich der des Vergleichs, der eine der drei Grundformen metalogischer Sprechakte im Film darstellt.
C. Formen I: Allegorie und Symbol Für den Film sind drei metalogische Redeformen von Belang: Allegorische, symbolische und vergleichende Rede.76 Von filmischen Vergleichen war schon als Formen der systematischen Textbildung die Rede (Kap. III.D.2), weshalb sie hier auch nur noch einmal unter dem Aspekt ihrer metalogischen Strukturen zu betrachten sein werden (Kap. VII.D). Die Einführung der literaturwissenschaftlichen Formbegriffe Allegorie und Symbol in die filmwissenschaftliche Terminologie dagegen macht einige Umstände und bedarf daher einer Reihe von Vorklärungen. Die klassische Rhetorik kennt symbolische Rede allenfalls als Variante der Allegorie,77 die strukturalistische Rhetorik kennt sie als metalogische Redeform überhaupt nicht. Hier wird - in Anknüpfung an Begriffsbestimmungen der historisch-hermeneutischen Literaturwissenschaft - an beiden Begriffen festgehalten und damit auf einem Formunterschied insistiert, der nicht nur in der Geschichte der Literatur, sondern auch in der des Films eine gewichtige Rolle spielt (vgl. Kap. C.5) und deshalb unverzichtbar ist. 1.
Literaturwissenschaftliche Begriffsexplikation
Die Bestimmung von Allegorie und Symbol ist in der Literaturwissenschaft selbst seit langem umstritten. Das hat mit der wechselvollen Bedeutungsgeschichte zu tun, die die beiden Begriffe in den nachantiken rhetorischen und 76 Die übrigen Metalogismen (z.B. Hyperbel, Pleonasmus, Repetition, Antithese, Euphemismus) werden hier nicht näher behandelt, weil sie im Film eine untergeordnete Rolle spielen oder nur im Kontext der hier behandelten drei Hauptformen vorkommen, sei es als metalogisches Signal (wie z.B. die Repetition), sei es als Verfahren einer dieser drei Redeformen selbst (wie z.B. Pleonasmus, Repetition oder Antithese als Verfahren vergleichender Rede). 77 Vgl. LAUSBERG 1971, §423.
Kapitel VII: Uneigentliche Rede
323
poetologischen Systemen durchlaufen haben 78 und die zu einer kaum lösbaren Verquickung systematischer mit historischen Begriffsbestimmungen geführt hat. Insbesondere die bis heute spürbare Orientierung an Goethes Begriffsverständnis (s.u.) hat insbesondere dem Symbolbegriff den Vorwurf eingebracht, er schreibe den idealistischen Begründungshorizont fest, ohne den die Goethesche Unterscheidung in der Tat nicht denkbar ist. Soweit nicht gleichwohl an Goethes Begriffsverständnis festgehalten wurde, reagierte die Literaturwissenschaft auf diesen Vorwurf mit Verunsicherung, die sich in der Verlegenheit dokumentiert, in die neuere literaturwissenschaftliche Hand- und Sachwörterbücher beim Stichwort »Symbol« geraten, 7 9 und die sie den Symbolbegriff zumeist schlicht vermeiden hieß. 8 0 Beides hatte zur Folge, daß das Problem einer systematischen Differenzierung beider Begriffe lange Zeit liegenblieb. Einer der wenigen, die die historische und ästhetische Relevanz des Formunterschieds nicht einer zweifelsfreien literaturwissenschaftlichen Terminologie geVgl. etwa die Bedeutungsgeschichte des Allegoriebegriffe: Die klassische Rhetorik versteht unter Allegorie eine »als Gedanken-Tropus fortgesetzte Metapher«, einen durch Ähnlichkeitsrelationen motivierten »Ersatz« der gemeinten Sache durch eine andere (vgl. LAUSBERG 1971, §§ 423-425). Der in der Lehre vom vierfachen Schriftsinn (vgl. LAUSBERG 1960, § 900) verankerte Allegoriebegriff des Mittelalters bestimmt den sensus allegoricus als heilsgeschichtliche praefiguratio und fordert damit keine bloßen Ahnlichkeitsrelationen, sondern typologische Bezüge zwischen buchstäblicher und allegorischer Bedeutung (vgl. Friedrich Ohly, Vom geistigen Sinn des Wortes im Mittelalter, in: ZS f. deutsches Altertum und deutsche Literatur 89, 1958/59, 1-23, hier 10 u. pass.). Seine (naturphilosophisch begründete) Nachfolge tritt bei Goethe das Symbol an (s.u.), während der Allegoriebegriff selbst seit der frühneuzeitlichen Literatur wieder stärker an antike Traditionen anschließt und Allegorie dabei zunehmend als veranschaulichendes 'Gleichnis' bestimmt (vgl. Joachim Dyck, Ticht-Kunst. Deutsche Barockpoetik und rhetorische Tradition, 2. Aufl. Bad Homburg 1969, 54f.). Daraus leitet sich zu wesentlichen Teilen die Geringschätzung ab, die der Begriff dann bei Goethe erfahren hat (s.u.). 79 Während etwa das »Sachwörterbuch der Literatur« von G. v. Wilpert (zuerst 1955) nach wie vor die Goethesche Definition von Allegorie und Symbol reproduziert (vgl. 4. Aufl. Stuttgart 1964, 9f. und 691f.), wird z.B. in dem Glossar der »Grundzüge der Literaturund Sprachwissenschaft«, hg. v. H. L. Arnold und V. Sinemus, Bd. 1: Literaturwissenschaft (zuerst 1973) der literarische Symbolbegriff durch den semiotischen ersetzt und als »Gegenteil« dessen definiert, »was die Germanistik im Gefolge der Goetheschen Symbolauffassung unter ihm versteht«, ohne daß freilich dieser 'germanistische' Symbolbegriff erläutert würde (vgl. 6. Aufl. München 1980, 494). Dem entspricht der im darstellenden Teil des Buches explizit geforderte Verzicht auf den Symbolbegriff Goethescher Konvenie r (ebd. 193). so Vgl. z.B. W. Kayser, Das sprachliche Kunstwerk, 14. Aufl. Bern/München 1969, der den Symbolbegriff ohne Begründung als nichtssagend verwirft (316); vgl. auch WEINRICH 1967, der den Metaphembegriff für einen angemessenen Ersatz des Symbolbegriffs hält. Daneben gab es Versuche, den Symbolbegriff aus seiner traditionellen Opposition zur Allegorie herauszunehmen, ihn etwa, wie Jürgen Link das versucht hat, als einen »Überbegriff« zu fassen, der die Allegorie mit einschließen soll (vgl. J. Link, Die Struktur des literarischen Symbols, München 1975).
324
Kapitel VII: Uneigentliche Rede
opfert sehen wollten und das Problem deshalb erneut in Angriff genommen haben, ist Gerhard Kurz, der Allegorie und Symbol wieder als gleichberechtigt nebenzuordnende Formen uneigentlicher Rede postuliert.81 An seine Begriffsbestimmungen wird hier deshalb angeknüpft. Das Abgrenzungsproblem und seine historischen Voraussetzungen: Goethes Begriffsbestimmung Die Frage, wo das Differenzkriterium zwischen Symbol und Allegorie zu suchen ist, ergibt sich aus der Explikation des Metalogismus von selbst: Da die metalogische Grundoperation, die Bezugnahme auf einen 'falschen' Referenten, bei allen metalogischen Formen identisch ist, muß die Differenz zwischen diesen Formen in der Art dieses 'Fehlers' liegen, d.h. in differenten Beziehungen zwischen 'falschen' und 'wahren' Referenten, zwischen Proprium und Improprium. Wie diese differenten Beziehungen bestimmt werden sollen, ist das Kardinalproblem jeder Allegorie- und Symboldefinition, weil diese Frage nicht mehr sprachliche Sachverhalte betrifft, sondern Sachverhalte der außersprachlichen Wirklichkeit und deshalb unweigerlich verknüpft ist mit der Frage nach den in allegorischen oder symbolischen Sprechakten virulenten Wirklichkeitkonzepten, also mit einer historisch wandelbaren Größe. Darin liegt die Schwierigkeit jeder theoretischen Bemühung um systematische, von historischen Implikaten möglichst freie Begriffe, die ihr offenkundig nur gelingen kann, wenn sie ihre Begriffsexplikationen freihält von bestimmten - historischen oder auch eigenen - Vorstellungen darüber, welche Beziehungen zwischen einem allegorischen oder symbolischen Proprium und seinem Improprium »wirklich« herrschen, d.h. wenn sie sie freihält von ontologischen Setzungen jeder Art, diese vielmehr dem je konkreten Text anheimstellt, also als eben jene historischem Wandel unterliegende Größe behandelt, die in einer systematischen Explikation der Begriffe nichts zu suchen hat. Daß diese notwendige Distanzierung von je historischen Konzepten von Wirklichkeit immer noch nicht recht gelungen ist, ontologische Setzungen vielmehr nach wie vor im literaturwissenschaftlichen Begriffsgebrauch mitschwingen, hat vor allem zu tun mit der immer noch spürbaren Nachwirkung der Goetheschen Begriffsbestimmungen. Goethe bestimmte die Beziehung zwischen den allegorischen bzw. symbolischen Propria und Impropria als Beziehung von »Besonderem« und »Allgemeinem« und verortete die Differenz zwischen Allegorie und Symbol dann in der Frage, ob diese Beziehung begrifflicher oder ontologischer Natur sei: Im ersten Fall, bei der Allegorie, sei das Proprium nur ein »Beispiel«, ein »Exempel« des gemeinten 'wahren'
81 V g l . KURZ 1982.
Kapitel VII: Uneigentliche Rede
325
Sachverhalts,82 beruhe seine exemplarische Funktion auf begriffsbildenden Klassifikationsprozessen. Im zweiten Fall dagegen, beim Symbol, bringe das Proprium das Improprium als dessen »lebendig-augenblickliche Offenbarung« zur Anschauung,83 habe also das »Allgemeine« immer schon an sich, weil nämlich dieses »Allgemeine« hier kein Begriff, sondern »die Idee« selbst sei, das Unaussprechliche, das im »Besonderen« zur Erscheinung komme, in ihm »unendlich wirksam«, dabei aber dem Logos »unerreichbar« und daher begrifflich nicht erfaßbar sei, sich vielmehr allein der divinatorischen Wesensschau (des Dichters) offenbare. 84 Hier wird das Differenzkriterium folglich aus der Frage nach Erscheinung und Wesen der Dinge bezogen: Das Symbol soll dadurch definiert sein, daß es eben diese Beziehung in der Beziehung von Proprium und Improprium erfaßt, d.h. daß der 'falsche' und der 'wahre' Referent Erscheinung und Wesen sind, wobei das improprie zur Anschauung kommende Wesen, »die Idee«, als eine für sich seiende, im Proprium, der Erscheinung, sich offenbarende metaphysische Wesenheit gesetzt wird. Die Allegorie dagegen illustriert, Goethe zufolge, nur die Begriffe, die wir uns von der Welt der Erscheinungen gemacht haben und die deren »Idee« nicht erfassen können, weil die »Idee« dem Logos »unerreichbar« bleibt: Allegorien beruhen nicht auf »lebendig-augenblickliche(r) Offenbarung«, sondern auf logisch-begrifflicher Aneignung von Realität, die nur die Welt der Erscheinungen erfassen kann. Daraus leitet sich dann auch der Qualitätsunterschied ab, den Goethe zwischen Symbol und Allegorie macht, eben weil danach nur das Symbol das Wesen der Dinge erfaßt, weshalb Goethe auch erst in ihm die wahre »Natur der Poesie« verwirklicht sah. 85
82 Vgl. J.W. Goethe, Maximen und Reflexionen, in: J.W.G., Werke, Hamburger Ausgabe, hg. von E. Trunz, Bd. XII, 470f. (Nr. 749-752), hier 471 (Nr. 751): »Es ist ein großer Unterschied, ob der Dichter zum Allgemeinen das Besondere sucht oder im Besonderen das Allgemeine schaut. Aus jener Art entsteht Allegorie, wo das Besondere nur als Beispiel, als Exempel des Allgemeinen gilt; die letztere aber ist eigentlich die Natur der Poesie, sie spricht ein Besonderes aus, ohne ans Allgemeine zu denken oder darauf hinzuweisen. Wer nun dieses Besondere lebendig erfaßt, erhält zugleich das Allgemeine mit, ohne es gewahr zu werden, oder erst spät.« 83 Ebd. (Nr. 752): »Das ist die wahre Symbolik, wo das Besondere das Allgemeinere repräsentiert, nicht als Traum und Schatten, sondern als lebendig-augenblickliche Offenbarung des Unerforschlichen«. Vgl. ebd. (Nr. 750): »Die Allegorie verwandelt die Erscheinung in einen Begriff, den Begriff in ein Bild, doch so, daß der Begriff im Bilde immer noch begrenzt und vollständig zu halten und zu haben und an demselben auszusprechen sei«. - Dagegen verwandelt die Symbolik »die Erscheinung in Idee, die Idee in ein Bild, und so, daß die Idee im Bild immer unendlich wirksam und unerreichbar bleibt und, selbst in allen Sprachen ausgesprochen, doch unaussprechlich bliebe« (ebd. 470, Nr. 749; Hervorheb. von mir). 85 Vgl. ebd. 471 (hier Anm. 82).
326
Kapitel VII: Uneigentliche Rede
Diese Begriffsbestimmung setzt - bei der Anwendung auf den konkreten Fall - Entscheidungen darüber voraus, ob das metalogische Improprium »nur« ein begriffliches oder aber ein ontisches »Allgemeines« ist, setzt folglich Entscheidungen darüber voraus, wie die Dinge 'sind', beruht auf ontologischen Setzungen. Das Problem aller Versuche, Allegorie und Symbol im Horizont dieser wirkungsmächtigen Begriffstradition zu bestimmen, liegt damit auf der Hand: Sie laufen beständig Gefahr, die Goethesche Ontologie fest- und fortzuschreiben. Die Begriffsbestimmungen von Gerhard Kurz Gerhard Kurz hat dieses Problem durch veränderte Begriffsexplikationen zu lösen versucht. Allerdings kommt er dabei, weil er dieses Problem ernstlich nur bei der Symboldefinition gegeben sieht,86 zu einer nur impliziten Abgrenzung von Allegorie und Symbol87 (obwohl er Allegorie und Symbol weiterhin als Komplementärbegriffe versteht).88 Ausgangspunkt ist auch hier die Annahme, daß zwischen Proprium und Improprium sowohl beim Symbol als auch bei der Allegorie Ähnlichkeitsbeziehungen herrschen,89 die aber bei beiden unterschiedlicher Natur, nämlich im ersten Fall »motiviert«, im zweiten Fall eher unmotiviert sind,90 eine Differenz, die mit der Differenz zwischen motivierten und arbiträren Zeichen vergleichbar ist. Für die Allegorie nimmt Kurz eine »diskontinuierliche«91 (insofern hilfsweise »arbiträr« zu nennende) Beziehung zwischen Proprium und Improprium an, qualifiziert also die Ähnlichkeitsbeziehung zwischen beiden (so jedenfalls ist ex negativo aus seiner Symboldefinition zu schließen)92 als eine eher äußere, zufällige, und das bedeutet, daß Proprium und Improprium hier 'eigentlich' nichts miteinander zu tun, nichts außer dieser äußeren Ähnlichkeitsbeziehung miteinander gemein haben. Für das Symbol dagegen setzt er eine »motivierte« Beziehung zwischen Proprium und Improprium an, 93 qualifiziert also die Ähnlichkeitsbeziehung zwischen beiden als nicht zufallige, und das bedeutet, daß Proprium und Improprium hier 'wirklich' etwas miteinander zu tun haben, im Verhältnis einer, wie Lausberg das nannte, »reale(n) Partizipa86 87 88 89 90 «1 92
Vgl. KURZ 1982, 71f. Vgl. ebd. 41 und 75f. Ebd. 75f. Vgl. ebd. 59, 62 und 67. Vgl. ebd. 67 und 90. Ebd. 76; vgl. auch 32. Das Referat bleibt hier recht vage, weil Kurz bei seiner Allegoriedefinition (ebd. 27-64) die 'ontologische' Qualität der Ähnlichkeit zwischen allegorischem Proprium und Improprium und deren Differenz zur symbolischen Ahnlichkeitsbeziehung (vgl. ebd. 75f.) nicht eindeutig expliziert. 93 Ebd. 67.
Kapitel VII: Uneigentliche Rede
327
tion« stehen.94 Kurz beschreibt diese Beziehung mit dem (eigentlich der Psychologie entstammenden, die Simultaneity verschiedener Erlebnisinhalte bezeichnenden) Begriff Kontiguitcit,95 der besagen soll, daß symbolisches Proprium und Improprium einander auf irgendeine Weise 'berühren', miteinander zu tun haben, und beschreibt diese Beziehung dann als eine vorwiegend auf »unmittelbaren faktischen oder existentiellen Zusammenhängen« beruhende Beziehung.96 Diese Begriffsbestimmung erfaßt die beiden Redeformen also mit unterschiedlichen Kriterien (Diskontinuität, Kontiguität). Das hat zur Folge, daß die Differenz zwischen beiden nicht unzweideutig expliziert werden kann. Davon abgesehen entsteht nun aber auch hier die Frage nach dem Kriterium, aufgrund dessen im konkreten Fall entschieden werden soll, ob die zwei Sachverhalte, die ein Metalogismus miteinander relationiert, 'faktisch' zusammenhängen oder nicht (und also ein Symbol oder eine Allegorie konstituieren). Kurz hat bei seinen Reflexionen vor allem Allegorien und Symbole vor Augen, die in einen 'eigentlichen' Kontext, in einen narrativen Text nämlich eingebunden sind, und geht deshalb davon aus, daß diese Frage im Rekurs auf den narrativen Kontext beantwortet werden kann: Das Symbol sei - anders als die Allegorie - »ein immanentes Element einer Geschichte« und deshalb gehörten symbolisches Proprium und Improprium »demselben Geschehenszusammenhang«, »demselben raum-zeitlichen Erfahrungsfeld« an, während sie bei der Allegorie »diskontinuierlich miteinander verbunden« seien.97 Diese Lösung ist aber, scheint mir, keine, zumindest keine verläßliche: Zum einen kann sie bei symbolischen und allegorischen Sprechakten, die isoliert, ohne unmittelbaren Kontext, erscheinen, bei Texten also, die durchgehend symbolice oder allegorice reden, nicht helfen, wäre der Interpret also in solchen Fällen darauf angewiesen, selbstmächtig zu entscheiden, ob Proprium und Improprium 'faktisch' zusammenhängen oder nicht, wäre also doch wieder zu ontologischen Setzungen genötigt. Zum anderen ist zu fragen, warum ein »immanentes Element einer Geschichte« notwendig als symbolisches erscheinen muß, warum es nicht auch als ein allegorisches Proprium sollte er94 LAUSBERG 1971, § 423. 95 Vgl. KURZ 1982, 75 u.ö. 96 Ebd. 80. - Diese Qualität weist Kurz all jenen (und damit den meisten) symbolischen Redeformen zu, die er von synekdochischen (Teil-Ganzes) oder metonymischen (UrsacheWirkung etc.) Zusammenhängen zwischen Proprium und Improprium bestimmt sieht (vgl. ebd. 79f.; einen dritten Symboltyp nennt er den metaphorischen). Dieser Verwendung metasememischer Begriffe für die Beschreibung metalogischer Sachverhalte wird hier mit Blick auf die grundsätzlichen Differenzen zwischen metasememischen und metalogischen Operationen nicht gefolgt. 97 Ebd. 75f.
328
Kapitel VII: Uneigentliche Rede
scheinen können. Daß dessen Improprium mutmaßlich seinerseits auf die Geschichte - sie allegorice deutend - bezogen ist, macht es ja noch nicht zum Symbol. Denn nicht die Beziehung von Proprium und Improprium zu einem gemeinsamen Dritten (der Geschichte), sondern die Beziehung zwischen diesen beiden selbst soll doch darüber entscheiden, ob ein Symbol oder eine Allegorie vorliegt: Um den Tintenfleck, den Charlotte in Goethes Roman »Die Wahlverwandtschaften« auf dem Einladungsschreiben an den Hauptmann hinterläßt, als Symbol - nicht als Allegorie - künftigen Schuldigwerdens zu deuten, 98 ist es nicht von Belang, daß der Brief und mit ihm die Ankunft des Hauptmanns dann tatsächlich der Beginn schuldhafter Verstrickungen sein werden; vielmehr wäre nachzuweisen, daß, wenn schon nicht der Tintenfleck selbst, so doch wenigstens dessen Ursache, die innere Unruhe, mit der Charlotte hier schreibt (eine »Art von Hast, die ihr sonst nicht gewöhnlich war«), im Verhältnis der Kontiguität zum Improprium steht, also selbst als schuldhaftes Handeln (was hier nicht in Frage kommt) oder doch immerhin als Ausdruck einer Vorahnung künftiger Schuld verstanden sein will. Ist diese Bedingung nicht erfüllt (eine Interpretationsfrage!), wäre der Vorgang zweifellos als allegorischer, als allegorische Vorausdeutung zu bestimmen, und daran änderte auch der Umstand nichts, daß sich sein Improprium (Schuld) in »demselben Geschehenszusammenhang« vollzieht, »demselben raum-zeitlichen Erfahrungsfeld« (der Geschichte) angehört: Auch eine allegorische Deutung des Vorgangs müßte ja doch dessen Zusammenhang mit dem Sinnmodell des Textes erweisen, sich »in einer kohärenten Deutung des ganzen Romans bewähren«.99 Mit dem Verweis auf den narrativen Kontext metalogischer Rede als Kriterium für die Qualifizierung der Beziehung zwischen Proprium und Improprium will Kurz aber auf Zentrales hinaus, auf die Entlastung nämlich des Interpreten von ontologischen Entscheidungen, von Entscheidungen darüber, ob Proprium und Improprium 'wirklich' miteinander zusammenhängen oder nicht: Mit der Anweisung, in dieser Frage den Kontext zu konsultieren, sollen die ihr inhärenten ontologischen Setzungen beim Text belassen, aus dem Text bezogen und damit in ihrer Historizität kenntlich gemacht werden. Nur: Diese Entlastung funktioniert auf diesem Wege nicht zuverlässig, zum einen, weil sie, wo der Kontext fehlt, gleich ganz wegfallt, zum anderen, weil, wie das Beispiel zeigt, die Immanenz des Metalogismus im »raum-zeitlichen Erfahrungsfeld« der erzählten Geschichte noch kein verläßliches Indiz für eine symbolische Konstruktion ist.
98 Vgl. ebd. 73-75. 99 Ebd. 74.
Kapitel VII: Uneigentliche Rede
329
Dennoch ist hier schon die einzig denkbare Richtung bezeichnet, die eine Definition der beiden Begriffe nehmen muß: Sie kann offenkundig nicht an der Einsicht vorbei, daß die Unterscheidung von Symbol und Allegorie auf ontologischen Setzungen beruht, auf Entscheidungen darüber, ob zwei Sachverhalte 'wirklich' miteinander zu tun haben oder nicht. Diese Entscheidungen aber kann (und darf) nicht der Interpret treffen, trifft vielmehr der Text, d.h. sie sind historische, mithin historisch-hermeneutischer Rekonstruktion obliegende Größen. Eine Definition der beiden Begriffe hätte diesen beiden Einsichten Rechnung zu tragen.
2.
Versuch einer Reformulierung der Begriffe
Wenn an der Unterscheidung zwischen Allegorie und Symbol festgehalten werden soll, dann muß eine Begriffsbestimmung gefunden werden, die die ihr anhaftenden, historischem Wandel unterliegenden ontologischen Implikationen fest- und fortzuschreiben nicht in Gefahr gerät. Die vorstehenden Überlegungen haben aber gezeigt, daß eine Bestimmung der Begriffe an dem ontologischen Problem nicht vorbeikommt, nicht so tun kann, als sei die Unterscheidung zwischen allegorischer und symbolischer Rede nicht unlösbar mit (je historischen) ontologischen Setzungen verquickt. Vielmehr kann sie, wie mir scheint, nur vor diesem Problem haltmachen, muß es sogar, wenn sie keine historische, sondern eine systematische Begriffsbestimmung sein will, das heißt: Sie müßte eine Möglichkeit finden, die symbolische und die allegorische Beziehung zwischen Proprium und Improprium zu definieren, ohne dabei zu präjudizieren, ob und wie diese Beziehungen ontologisch begründet werden. Sie müßte also so weit gefaßt sein, daß sie sämtliche historischen Erscheinungsformen samt ihren jeweiligen Konzepten vom Zusammenhang zwischen »Wesen« und »Erscheinung« zulassen kann, ohne eine von ihnen festzuschreiben, und sie müßte zugleich so eng sein, daß sie befriedigende Differenzkriterien liefert. Chancen für eine solche Begriffsbestimmung sehe ich allein in dem Versuch, die in den traditionellen Definitionskriterien immer schon mitgedachten formalen Kriterien als definitorische Kriterien zu explizieren und dabei das ontologische Grundproblem im Rekurs auf den Aspekt der Konventionalität und damit im Rekurs auf rezeptionsgeschichtliche Kriterien zu entschärfen. Beides hängt engstens zusammen: Allegorie und Symbol beruhen nämlich auf zwei unterschiedlichen logischen Operationen, die sich formal beschreiben lassen als zwei unterschiedliche Verfahren der Klassifikation von Sachverhalten der Realität, die im folgenden unter Zuhilfenahme mengentheoretischer
330
Kapitel VII: Uneigenttiche Rede
Begriffe expliziert werden sollen. Klassenbildungen aber haben zweifellos zu tun mit je zeitspezifischen Vorstellungen über die Ordnung der Welt. Das ontologische Problem, die Frage nach der 'faktischen' Beziehung zwischen allegorischen bzw. symbolischen Propria und Impropria, läßt sich in dieser Sicht rezeptionsästhetisch wenden, das heißt: Die historisch-hermeneutische Rekonstruktion, der die hier anfallenden ontologischen Fragen obliegen (s.o.), läßt sich in dieser Sicht als rezeptionsgeschichtliche Rekonstruktionsarbeit präzisieren, die nicht fragt, ob zwischen den zwei Sachverhalten der Realität, die der Metalogismus miteinander relationiert, 'faktische oder existentielle Zusammenhänge' bestehen oder nicht, sondern ob der zeitgenössische Rezipient solche Zusammenhänge herstellt oder nicht. Und diese Frage hat zweifellos mit dem Grad der Konventionalisierung von Klassenbildungen zu tun. 2.1 Grundbestimmungen Ausgangspunkt für den nachfolgenden Versuch einer präzisierenden Reformulierung der traditionellen Begriffsbestimmungen im eben genannten Sinne sind Basisoperationen der Mengentheorie, die hier heuristisch als Denkmodelle und Darstellungsverfahren in Funktion gesetzt werden,100 um ein kohärentes und - dies vor allem - von ontologischen Implikaten freigesetztes Beschreibungsmodell zu gewinnen. Zu diesem Zweck sind zunächst die 'falschen' (eigentlichen) und 'wahren' (uneigentlichen) Referenten metalogischer Rede - ohne Rücksicht auf ihre Größenordnung und Komplexität101 - als Elemente im mengentheoretischen Sinn zu bestimmen. Die Bestimmung eines Gegenstands als Element bedeutet, daß »von allen Eigenschaften der betrachteten Objekte abstrahiert (wird) mit Ausnahme derjenigen, Element einer bestimmten Menge zu sein«,102 und das heißt: mit Ausnahme derjenigen Eigenschaft, die das Objekt mit allen anderen Elementen dieser Menge gemeinsam hat und die die Mengenbildung begrün-
100 Das beifit: Die Annahme, daß die hier zu explizierenden Sachverhalte als mengentheoretische Sachverhalte beschrieben werden können, beruht auf der Annahme analoger Strukturen beider Sachverhalte, schließt daher nicht die Behauptung ein, daß es sich bei diesen Sachverhalten tatsächlich um mengentheoretische Sachverhalte im strengen, d.h. mathematischen bzw. logischen Sinne handelt, ιοί Da auch Mengen ihrerseits wieder Elemente von (anderen) Mengen sein können, hängt der Elementstatus der beiden Referenten - wohlgemerkt - nicht von ihrer Größenordnung ab, also nicht davon, ob sie selbst Mengen sind oder in anderen Kontexten als Menge aufgefaßt werden können. Das wird für die Bestimmung des Symbolbegriffs von Belang sein, weil der 'wahre' Referent symbolischer Rede stets eine Menge (ein »Allgemeines«) ist (vgl. S. 343f.). 102 KLAUS 1971, 173.
Kapitel VÌI: Uneigentliche Rede
331
det, also der mengenbildenden Eigenschaft.103 Wenn nun die 'falschen' und 'wahren' Referenten metalogischer Sprechakte in einem ersten Schritt als Elemente bestimmt werden, so wird dabei abstrahiert von allen ihren möglichen konkreten Eigenschaften mit Ausnahme der Eigenschaft, 'wahr' oder 'falsch' zu sein. Mit Blick auf diese formale Eigenschaft können die 'falschen' und 'wahren' Referenten metalogischer Sprechakte hier im vorhinein formal als Elemente zweier disjunkter Mengen beschrieben werden: Wenn die eigentlichen Referenten metalogischer Sprechakte als 'falsche' Referenten zu qualifizieren sind, die an die Stelle der 'wahren' ('in Wahrheit' gemeinten) Referenten treten, Proprium und Improprium also - wohlgemerkt nur im Horizont des metalogischen Sprechakts104 - die Opposition 'falsch vs. wahr' aufweisen (vgl. Kap. B.l), dann sind sie aufgrund dieser Opposition als Elemente zweier differenter Mengen zu beschreiben, und zwar, weil diese Opposition zwei einander wechselseitig ausschließende Merkmale ('falsch' vs. 'wahr') betrifft, als Elemente zweier disjunkter Mengen,105 der Menge Mf, der der 'falsche' Referent rf angehört, und der Menge M w , der der 'wahre' Referent r w zugehört. Mit dieser Operation ist zunächst nichts weiter erreicht als eine mengentheoretische Beschreibung der zwischen den Propria und Impropria metalogischer Sprechakte herrschenden logischen Opposition 'falsch vs. wahr'. Sie kann, wie sich zeigen wird, behilflich sein, das, was an den 'falschen' 103 Ein Objekt ist Element a einer Menge Mj mit Blick auf eine (oder mehrere) bestimmte Eigenschaft(en), was bedeutet, daß es hinsichtlich anderer Eigenschaften Element anderer Mengen, also potentiell Element vieler verschiedener Mengen sein kann. Die Elementbeziehung (a e M,) bezeichnet die Beziehung des Elements zu seiner Menge (»Bello ist ein Neufundländer«) und ist nicht zu verwechseln mit der Beziehung des Enthaltenseins (Inklusion), die nur zwischen zwei Mengen, einer Teilmenge M t und der diese Teilmenge enthaltenden Inklusionsmenge M2, bestehen kann (»Neufundländer sind Hunde«) und die besagt, daß alle Elemente von Mj zugleich auch Elemente von M2 sind, weil alle Elemente von M) auch die Eigenschaft aufweisen, die Kriterium der Mengenbildung M 2 ist (»Bello« ist Element sowohl der Menge aller Neufundländer als auch der aller Hunde). 104 Die Opposition »wahr vs. falsch« sagt, um das nochmals zu betonen, selbstverständlich nichts Uber den Wahrheitswert der Elemente von Mf und Mw aus, sondern über ihren 'Wahrheitswert' hinsichtlich des metalogischen Sprechakts. ios Zwei Mengen A und Β sind disjunkt, wenn die Elemente der Menge A nicht zugleich Elemente der Menge Β sein können, so daß ihr Durchschnitt die leere Menge φ ergibt: M A Π M b = φ (vgl. WELTE 1974, 362; KLAUS 1971, 151f.). Das heißt: Die Eigenschaft der
Elemente, aufgrund deren Mf gebildet werden kann, muß eine Eigenschaft sein, die die Elemente von Mw nicht aufweisen (oder umgekehrt). Das heißt wohlgemerkt nicht, daß die Elemente von Mf und Mw keine Eigenschaften gemeinsam haben dürfen, wohl aber, daß die mengenbildende Eigenschaft (Ef^), aufgrund deren sie 'falsch' oder 'wahr' und also Elemente zweier disjunkter Mengen Mf und Mw sind, im einen Fall vorhanden sein muß, im anderen Fall nicht vorhanden sein darf. Auf dieser Grundlage müßte sich dann auch klären lassen, inwiefern das Proprium 'falsch' ist, worin bei Allegorie und Symbol der jeweils formtypische 'Fehler' besteht, den Metalogismen begehen.
332
Kapitel VII: Uneigentliche Rede
Referenten 'falsch' ist, näher zu bezeichnen (vgl. S. 340, 344). Sie kann aber noch nichts über die je differente Beziehung zwischen allegorischem bzw. symbolischem Proprium und Improprium aussagen. Um das zu tun, um also das Differenzkriterium, aufgrund dessen die allegorische und die symbolische Beziehung zwischen 'falschen' und 'wahren' Referenten unterschieden werden kann, mengentheoretisch zu bestimmen, muß deren disjunktives Merkmal 'wahr vs. falsch' außerachtgelassen und nach denjenigen Merkmalen gefragt werden, die sie überhaupt metalogisch aufeinander beziehbar macht, d.h. muß nach den Merkmalen gefragt werden, die den 'falschen' Referenten mit dem 'wahren' verbinden dergestalt, daß er als dessen Stellvertreter fungieren kann. Diese Frage wird im weiteren zu dem Ergebnis führen, daß der 'falsche' Referent des symbolischen Sprechakts diese Fähigkeit aus dem Umstand bezieht, daß er mit dem 'wahren' Referenten eine Elementbeziehung unterhält, während der 'falsche' Referent des allegorischen Sprechakts diese Fähigkeit aus dem Umstand bezieht, daß er derselben Menge angehört wie der 'wahre' Referent. Der Unterschied zwischen Symbol und Allegorie, genauer: zwischen der symbolischen und der allegorischen Beziehung von Proprium und Improprium, wird sich mengentheoretisch beschreiben lassen als der Unterschied, der zwischen einer Elementbeziehung und der Beziehung zwischen den Elementen einer Menge besteht·. Die Elementbeziehung betrifft die Beziehung eines Elements zu seiner Menge und besagt, daß ein Objekt a hinsichtlich einer bestimmten Menge M¡ ein Element ist (a e Mi), während die Beziehung zwischen den Elementen einer Menge besagt, daß die Elemente a, b ...n eine Eigenschaft gemeinsam haben, aufgrund deren sie Element derselben Menge sind (Mj = {a, b, ...n}). Die Beziehung zwischen symbolischem Proprium und Improprium wird sich also als Elementbeziehung (rf e r w ), die Beziehung zwischen allegorischem Proprium und Improprium dagegen als Beziehung zweier Elemente einer Menge (M A = {rf, r w }) herausstellen. Das heißt dann zugleich, daß beim Symbol der 'wahre' Referent r w kein individueller Sachverhalt, sondern eine Menge ist, während bei der Allegorie beide Referenten r f und r w individuelle Sachverhalte repräsentieren.106 106 Damit wird die Goethesche Fixierung des allegorischen Impropium auf Begriffe, auf ein logisches »Allgemeines« aufgehoben und zugleich sichtbar gemacht, daB Goethes Begriffsbestimmung außerordentlich eng, nämlich eine unter ontologischen Prämissen vorgenommene Ausgliederung zweier metalogischer Verfahren ist, die hier beide als symbolische Verfahren klassifiziert werden müssen: Was Goethe Allegorie nennt und vom Symbol unterschieden wissen will, wird hier ebenfalls als Symbol bestimmt, und was hier Allegorie genannt wird, die metalogische Relationierung zweier individueller, »besonderer« Sachverhalte, kommt bei Goethe, eben weil er das allegorische Improprium auf Begriffe fixiert, gar nicht vor.
Kapitel VII: Unägentliche Rede
333
Diese zunächst noch sehr abstrakten Bestimmungen sollen nun im weiteren hergeleitet und an zwei Beispielen illustriert werden, nämlich an der in der Literatur rekurrenten Verwendung Venedigs als metalogischen Bildes für Tod und Verfall, die vor allem an Thomas Manns Erzählung »Tod in Venedig« exemplifiziert werden soll, und an einem von Gerhard Kurz übernommenen Beispiel, an Werner Fincks Gedicht »Gang durch die Kuhherde«:107 Nächtlich auf der dunklen Weide Grasen viele große Kühe, Kauen, Schauen, Tun mir nichts zuleide, Während ich mich durch sie durch bemühe. Wenn sie wollten, könnten sie mich überrennen, Doch sie werden nicht dran denken. Da sie Quasi Gar kein Denken kennen. Außerdem sind sie nicht abzulenken. Und so geh' ich lautlos durch die Herde Auf dem Gras, daran sie kauen, Eilig, Weil ich Plötzlich bange werde, Daß sie meine schwache Position durchschauen.
Dabei wird von der Hyothese ausgegangen, daß die Stadt Venedig in Thomas Manns Erzählung als Symbol anzusprechen ist, dessen Komplexität hier auf die Aspekte Tod und Verfall reduziert wird, und daß Werner Fincks »Gang durch die Kuhherde« ein allegorischer Text ist, der die bedrohliche Situation eines regimekritischen Bürgers (Künstlers) im NS-Staat zum Thema hat. Der folgende Definitionsversuch müßte imstande sein, diese Hypothese zu begründen, müßte also begründen können, inwiefern die Beziehung zwischen dem Verfall einer Stadt und dem anderer Körper eine andere Qualität haben soll als die Beziehung zwischen der Bedrohung eines Einzelnen durch eine Kuhherde einerseits und durch eine Masse gläubiger Nationalsozialisten andererseits. 2.2 Allegorie In Werner Fincks »Gang durch die Kuhherde« sind die 'falschen' Referenten Of) Kühe (und ihr Verhalten), die 'wahren' Referenten (r w ) - wie eine kontextbezogene Interpretation erweisen könnte108 - Nationalsozialisten (und ihr 107 V g l . KURZ 1 9 8 2 , 6 1 . 108 V g l . KURZ 1 9 8 2 , 6 1 f .
334
Kapitel VII: Uneigentliche Rede
Verhalten), also, wie oben schon angedeutet wurde, zwei bestimmte, individuelle Sachverhalte: Es geht - proprie - um eine bestimmte Kuhherde (nicht um Kuhherden überhaupt) und - improprie - um eine bestimmte Gruppe Menschen, um Nationalsozialisten (nicht um menschliche Gruppen überhaupt). Proprium und Improprium als Elemente disjunkter Mengen Sucht man nun nach der disjunktiven Eigenschaft (Ef^,), aufgrund deren die beiden Referenten 'falsch' und 'wahr' und daher - im Horizont des allegorischen Sprechakts - Elemente zweier disjunkter Mengen - Mf und M w - sind (S. 330f.), dann ist dies zweifellos die Eigenschaft »± Mensch«, derzufolge die Menge Mf durch das Merkmal »- Mensch« (ergänzt um das Merkmal »+Tier«), die Menge M w durch das Merkmal »+Mensch« zustandekommt. Das Beispiel zeigt, daß die zwischen Proprium und Improprium bestehende Opposition 'wahr vs. falsch' offenbar auf konventionellen Klassifikationskriterien beruht, ein Umstand, auf den noch zurückzukommen sein wird: Sie ist offenbar fundiert in konventionellen Oppositionen, hier in dem Konsens, daß zwischen Tier und Mensch ein fundamentaler Unterschied besteht. Man kann also vorläufig sagen, daß es offenbar konventionelle Klassenbildungen sind, aufgrund deren das allegorische Proprium als 'falscher' Referent beurteilt wird. Proprium und Improprium als Elemente der allegorischen Menge MA Die allegorische Operation besteht nun allererst darin, daß sie eben dieser konventionellen Klassenbildung widerspricht: Sie hebt die Disjunktion zwischen Mf und M w auf, indem sie das disjunktive Merkmal ( E ^ ) ignoriert und eine (oder mehrere) andere Eigenschaft(en), hier »allegorische Eigenschaften)« (E a ) genannt, wählt, aufgrund deren sie beide Referenten zu Elementen ein und derselben Menge, und zwar einer neuen, dritten, nicht mit Mf und M w identischen Menge umdefiniert, die hier allegorische Menge (M A ) genannt sei (M A = {rf, r w }). Im Beispielfall sind es zunächst die Merkmale »Herdenbildung« und das damit verbundene »Ausgrenzungsverhalten« gegenüber Fremden, die diese Operation begründen: Ignoriert man die konventionelle Opposition »Tier vs. Mensch«, dann kann man Kühe und Nationalsozialisten derselben Menge zuordnen mit der Begründung, daß beide in »Herden« organisiert sind und »artfremde« Individuen ausschließen und dabei unter Umständen lebensgefährlich bedrohen. Damit ist die Bildung der Menge M A legitimiert, die ein »Vergleichsfeld« schafft, auf dem sich nun die Allegorese entfalten kann, die dem Rezipienten nämlich die Lizenz erteilt, alle weiteren Prädikate, die der Text seinem 'falschen' Referenten r f beilegt, daraufhin zu überprüfen, ob sie nicht ebenfalls auf den 'wahren' Referenten r w »übertra-
Kapitel VII: Uneigentliche Rede
335
gen« werden, also ebenfalls als Merkmale der Menge M A aufgefaßt werden können. 109 Dieser Vergleich setzt nun aber voraus, daß die beiden disjunkten Ausgangsmengen Mf und Mw im Rezeptionsprozeß präsent bleiben, denn ihr Verschwinden hätte, wie gerade Fincks Text besonders drastisch zeigt, u.U. katastrophale Folgen für das Sinnmodell allegorischer Texte. Sobald nämlich die Opposition »Tier vs. Mensch« nicht mehr aufrechterhalten wird, verschwindet das Skandalon, um das es diesem Text geht, der Umstand nämlich, daß Menschen sich wie Tiere verhalten: Würde die allegorische Menge M A die disjunkten Ausgangsmengen Mf und M w vollständig verdrängen, so daß zwischen tierischem und menschlichem Sozialverhalten kein Unterschied mehr eingefordert würde, wäre das 'tierische' Verhalten der Nationalsozialisten (als »Natur«) legitimiert. Die allegorische Menge M A liefert also nur die Legitimation für die Behauptung, die Allegorien aufstellen, nämlich daß Merkmale des Elements r f , des 'falschen' Referenten, auf das Element r w , den 'wahren' Referenten, »übertragen« werden können, soll aber die ursprüngliche Disjunktion zwischen beiden zweifellos nicht in Frage stellen. Daraus ist für diese von der Allegorie eigens gebildete allegorische Menge M A eine entscheidende Bedingung abzuleiten: Sie darf offensichtlich nicht die Kraft haben, die Disjunktion der beiden konventionellen Ausgangsmengen Mf und M w wirklich aufzuheben. Wenn sie aber eine gegenüber diesen Ausgangsmengen sozusagen »schwache« Menge sein muß, dann ist sie zweifellos eine unkonventionelle Menge, die nur für die Dauer des allegorischen Sprechakts Geltung und Bestand beanspruchen kann, die nicht in Gefahr kommen kann und darf, vom Rezipienten ernst genommen zu werden, d.h. es muß sich bei M a um eine Menge handeln, die nicht als verbindliche Klassifikation von Wirklichkeit aufgefaßt werden kann, sondern - als in der Tat »uneigentliche« Klassifikation - nur für die Dauer des allegorischen Sprechakts toleriert wird. Um diese Bedingung zu erfüllen, muß sie also offenbar gegen konventionelle Mengenbildungen verstoßen.110 Folglich muß die Eigenschaft E A , 109 Dieses »Vergleichsfeld·« ist ein Interpretationsfeld: Welche Merkmale »übertragbar« und damit definitorische Merkmale der allegorischen Menge MA sind und welche nicht, ist eine Frage der Interpretation. Bei jeder Allegorese erhebt sich zudem die Frage, ob auch Merkmale, die der Text nicht nennt, die der 'falsche' Referent aber in der außersprachlichen Realität regelmäßig oder häufig aufweist, für die Interpretation eine Rolle spielen dürfen oder nicht: Immerhin gibt es Allegorien, deren Propria einen derart hochkonventionalisierten Eigenschaftenkatalog haben, daß der Text sie möglicherweise gar nicht mehr eigens nennen muß, sondern darauf vertrauen kann, daß der Rezipient sie selbst aktualisiert. ι io Genauer: Die allegorische Menge muß gegen nicht-allegorische Realitätsmodelle verstoßen, denn die allegorischen Mengenbildungen selbst sind ja zu guten Teilen - aber eben
336
Kapitel VII: Uneigentliche Rede
aufgrund deren der Text seine beiden Referenten rf und r w als Elemente dieser allegorischen Menge M A definiert, eine Eigenschaft sein, die zumindest bei einem der beiden in Frage stehenden Referenten r f und r w konventionellerweise nicht als mengenbildendes Merkmal verwendet, d.h. als akzidentielles Merkmal betrachtet wird.111 Konventionen und das Problem von Essenz und Akzidens Jedes Ding kann prinzipiell als Element vieler verschiedener Mengen betrachtet werden, eine Möglichkeit, die wir aber bei der alltäglichen Realitätsaneignung in nur begrenztem Maße realisieren, weil wir immer schon mit konventionellen Mengenbildungen operieren, immer schon einen mehr oder weniger festgelegten »Begriff« von den Dingen haben, der die Möglichkeiten ihrer Klassifikation begrenzt: Einen Apfel würden wir spontan der Menge aller eßbaren Früchte zuordnen, kaum dagegen der Menge aller runden oder ovalen, roten, grünen oder gelben Gegenstände. Offenbar also haben konventionalisierte mengenbildende Kriterien sehr viel mit lebenspraktisch begründeten Annahmen über »wesentliche« und »unwesentliche« Eigenschaften der Dinge zu tun: Die Eigenschaft »eßbare Frucht« halten wir zweifellos für eine »wesentliche« Eigenschaft von Äpfeln, während wir die Frage, ob Äpfel rot, gelb oder grün, rund oder oval sind, für ihre Klassifikation für »unwesentlich« oder sekundär halten. Das spricht dafür, daß konventionelle Mengenbildungen immer schon Annahmen über das »Wesen« der Dinge mitenthalten können, und wenn das so ist, dann hat es den Anschein, als werde das ontologische Problem der Allegorie- und Symboldefinitionen mit dem Rekurs auf konventionelle bzw. unkonventionelle Mengenbildungen nicht beseitigt, sondern auch wieder nur verschleiert. Tatsächlich aber wird dieses Problem damit ganz erheblich entschärft, denn der Rekurs auf Konventionen hat zur Folge, daß die ontologische Frage gar nicht mehr gestellt zu werden braucht, weil sie rezeptionsästhetisch-historisch gewendet, nämlich als Frage nach den je zeit- und kulturspezifischen Beziehungen einer kulturellen Gemeinschaft zur Wirklichkeit gestellt wird: Wenn Konventionalität als das maßgebliche Kriterium für die Beals allegorische Mengenbildungen, als allegorische Traditionen - konventionalisiert, wie das z.B. bei Tierfabeln der Fall ist. m Die Merkmale »Herdenbildung« und »Ausgrenzungsverhalten« erkennt der Hörer zwar sofort als mögliche gemeinsame Eigenschaften von Kühen und Nationalsozialisten an, würde sie aber nicht als klassifikatorische Merkmale beiziehen, wenn man ihn aufforderte, Kühe bzw. Nationalsozialisten zu klassifizieren, denn normalerweise definieren wir Kühe aufgrund zoologischer und Nationalsozialisten aufgrund politischer Kriterien. Die von der Allegorie für die Mengenbildung beigezogenen Eigenschaften sind also offenbar Merkmale, die wir fur akzidentielle Merkmale halten.
Kapitel VII: Uneigentliche Rede Schreibung
metalogischer
Mengenbildungsverfahren
bestimmt
wird,
337 dann
muß nicht mehr nach »faktischen oder existentiellen Zusammenhängen« zwischen D i n g e n , 1 1 2 sondern nur noch gefragt werden, ob es sich dabei um Eigenschaften handelt, die den v o m Text vorausgesetzten, j e zeit- und kulturspezifischen Konventionen zufolge als mengenbildende Eigenschaften und eben deshalb als »wesentliche« Eigenschaften betrachtet werden oder nicht. Und dabei kann dann sogar offenbleiben, ob diese »wesentlichen« Eigenschaften v o m Werksubjekt als ontologische Setzungen gedacht und v o m Rezipienten als solche verstanden werden oder nicht. Mit dem Rekurs auf konventionelle und unkonventionelle Mengenbildungen wird also die Frage nach Essenz und Akzidens und damit das in ihr virulente ontologische Problem bewußtseinsgeschichtlich gewendet, auf eine andere Ebene, nämlich von der Ebene ontologischer Setzungen transponiert auf die Ebene zeitspezifischer Konsensbildungen über die »Ordnung der Welt«. Das heißt freilich nicht, daß das ontologische Problem nicht wieder ins Spiel kommen kann, sobald diese Begriffsbestimmung auf konkrete Texte angewandt werden soll, w i e im nächsten Abschnitt noch näher illustriert wird. Immerhin kann jetzt aber die Stelle klar markiert werden, an der die Begriffsbestimmung, w i e eingangs gefordert, »haltmachen« muß: U m das Zustandekommen der Mengen M f , M w und M A zu begründen und um zu klären, w i e es kommt, daß die allegorische Menge M A die beiden disjunkten Ausgangsmengen M f und M w nicht verdrängt und nicht als verbindliche Klassifikation v o n Wirklichkeit mißverstanden wird, kann im Rahmen dieser Definition nur gesagt werden, daß das die disjunkten Ausgangsmengen M f und M w konstituierende Merkmal Ef^, ein Merkmal ist, das den vom Text vorausgesetzten Konventionen zufolge bei den in Frage stehenden Referenten rf und r w üblicherweise als mengenbildendes Merkmal verwendet, insofern also in nicht-allegorischen Kontexten für »wesentlich« gehalten wird, und daß umgekehrt das die allegorische M e n g e M A konstituierende allegorische Merkmal E A
ein
Merkmal ist, das diesen Konventionen zufolge (zumindest bei einem der beiden Referenten) üblicherweise nicht als mengenbildendes Merkmal verwendet, insofern also in nicht-allegorischen Kontexten für »unwesentlich« gehalten wird. Über die Frage aber, ob die konventionellen Mengen v o m W e r k subjekt als ontologisch begründbare gedacht und v o m Rezipierten als solche verstanden werden, ist damit weder positiv noch negativ entschieden: kann offengelassen werden.
112 KURZ 1982, 80.
Sie
338
Kapitel VII: Uneigentliche Rede
Konvention und Konventionswandel: Anwendungsprobleme Die hier vorgeschlagene Begriffsbestimmung weist dem mit je konkreten Fällen befaßten Interpreten allegorischer Texte die Aufgabe zu, die vom Text vorausgesetzten Konventionen zu rekonstruieren, d.h. zu prüfen, welchen konventionellen Klassifikationen von Wirklichkeit, welcher »Ordnung der Welt« der Text verpflichtet ist. Die Bedeutung dieser Aufgabe kann nicht überschätzt werden. Denn auch wenn der Allegoriebegriff mit dieser Begriffsbestimmung von ontologischen Setzungen freigehalten wird, so schützt das nicht vor einer unbewußt ontologischen Anwendung. Wenn die Bestimmung der allegorischen Beziehung zwischen Proprium und Improprium als Beziehung zweier Elemente einer allegorischen Menge M A die Bestimmung einschließt, daß diese Menge den Status einer unkonventionellen Menge hat, also gegen konventionelle Mengenbildungen und damit gegen den vom Text vorausgesetzten Konsens über die »Ordnung der Welt« verstößt, dann heißt das selbstverständlich auch, daß Allegorien ihren Status als Allegorien verlieren (und zu Symbolen mutieren) können, sobald der Rezipient (Interpret) eine andere als die vom Text vorausgesetzte »Ordnung der Welt« voraussetzt, also nicht mehr demselben Konsens über Realität verpflichtet ist wie der Text. Werner Fincks »Gang durch die Kuhherde« wäre zweifellos nicht mehr widerspruchslos als Allegorie zu definieren, sobald die allegorische Menge M A nicht mehr als unkonventionelle Menge verstanden wird. Das wäre etwa im Rahmen eines biologistischen Weltbilds denkbar, das den Unterschied zwischen Mensch und Tier nicht mehr als essentiellen Unterschied anerkennt und entsprechend das disjunktive Merkmal E ^ »± Mensch« nicht mehr als disjunktives Merkmal auffaßt. Dann nämlich könnten auch die allegorischen Eigenschaften E a (»Herdenbildung«, »Ausgrenzungsverhalten«) ihren Status als unkonventionelle mengenbildende Merkmale verlieren: Sie könnten dann z.B. als Ausdruck eines allgemeinen Gesetzes sozialen Verhaltens, etwa der Ausschließung Fremder aufgefaßt werden, ein »Gesetz«, dem dann gar der Status eines Naturgesetzes zugewiesen würde. Unter diesen Umständen entstünde zweifellos Unsicherheit darüber, wo das Improprium verortet werden soll. Denn wenn das Sozialverhalten der Kuhherde als Ausdruck eines allgemeinen, das Sozialverhalten aller in sozialen Verbänden lebender Lebewesen steuernden »Gesetzes« verstanden wird, dann könnte das allegorische Proprium »Kuhherde« unter Umständen zu einem symbolischen Proprium mutieren dergestalt, daß es nicht mehr auf ein bestimmtes Einzelnes, einen bestimmten Sozialverband (Nationalsozialisten), sondern auf eine Menge bezogen wird, die dann die Stelle des Improprium einnähme, nämlich in diesem Fall auf die Menge aller Sozial verbände, deren mengenbildendes Merkmal dann eben jenes allgemeine »Gesetz« sozialen Verhaltens wäre. Das Pro-
Kapitel VII: Uneigentliche Rede
339
prium, die Kuhherde, wäre dann also als Element einer Menge (»Sozialverbände«) und damit als symbolisches Proprium ausgewiesen, das mit dem Improprium die für das Symbol definitorische Elementbeziehung (r f e r w ) unterhält. Die uneigentliche Bedeutung des Textes würde also nachgerade in ihr Gegenteil verkehrt. Das heißt nun allerdings nicht, daß Werner Fincks »Gang durch die Kuhherde« unter diesen Voraussetzungen problemlos als symbolisches Gedicht gelesen werden könnte, denn die Textstruktur setzt einer symbolischen Interpretation denn doch unüberwindliche Widersprüche entgegen." 3 Wohl aber zeigt dieses Gedankenspiel, daß aus derselben »materia«, unter Verwendung desselben 'falschen' Referenten, im Horizont einer veränderten Vorstellung von der »Ordnung der Welt« durchaus ein symbolisches Gedicht entstehen könnte, was nur abermals unterstreicht, daß die Differenz zwischen Allegorie und Symbol nicht in ontologischen Bestimmungen der »materia* verortet werden kann. Resümee: Mengentheoretische Definition der Allegorie Das allegorische Verfahren läßt sich nun also zunächst zusammenfassend definieren als Verfahren, bei dem zwei Sachverhalte rf und r w , die aufgrund einer als mengenbildendes Merkmal konventionalisierten und auf beide Referenten alternativ zutreffenden Eigenschaft ( E ^ ) als Elemente zweier konventioneller disjunkter Mengen Mf und M w aufzufassen sind, aufgrund der als
mengenbildendes Merkmal nicht konventionalisierten Eigenschaft E A zu Elementen einer dritten, unkonventionellen Menge, der allegorischen Menge M a , umdefiniert werden, die es erlaubt, weitere Merkmale, die der Text dem 'falschen' Referenten rf zuweist, als Merkmale auch des 'wahren' Referenten r w zu lesen (rf e Mf, r w e M w , Mf Π M w = φ; M A = {rf, r w }; dabei gilt für Efvy, Mf und M w : -(-konventionell, für E A und M A : -konventionell).
113 Das gilt etwa schon für die Prädikation der Kühe als 'dumme Kühe' (»Da sie / Quasi / Gar kein Denken kennen«).
340
Kapitel VII: Uneigentliche Rede
Der allegorische 'Fehler' Der 'Fehler', den Metalogismen begehen, die 'falsche' Bezeichnung des 'wahren' Referenten, beruht bei der Allegorie also auf dem mit der Bildung der allegorischen Menge M A begangenen Verstoß gegen die konventionelle Disjunktion der beiden Mengen Mf und M w , denen ihre beiden Referenten angehören: Allegorien referieren proprie auf Sachverhalte (rf), die außerhalb des allegorischen Sprechakts mit ihren 'wahren' Referenten (r w ) keine konventionelle Menge bilden, nicht als Elemente derselben Menge aufgefaßt werden. Eben darin liegt bei der Allegorie jener Geheimcode, der die Metalogismen zur Entwicklung von Geheimsprachen, zum Ausschluß unerwünschter Hörer und zur Kommunikation mit einem esoterischen Publikum befähigt, das im Beispielfall das regimekritische Publikum des Berliner Kabaretts »Katakombe« war, wo Werner Finck seinen »Gang durch die Kuhherde« in den dreißiger Jahren vortrug. 114 Die Allegorie ist, wie sich im Vergleich mit dem Symbol zeigen wird, diejenige Form metalogischer Rede, die den höchsten Grad an Esoterik erreichen kann, eben weil die allegorische Menge M A , in der der 'wahre' Referent versteckt ist, keine konventionelle Menge ist, ihre Rekonstruktion daher bei Bedarf außerordentlich erschwert werden kann. Damit aber stellt sich in rezeptionsästhetischer Sicht die Frage, woher der Rezipient überhaupt die Informationen bezieht, die er braucht, um die Allegorie zu verstehen, um den 'wahren' Referenten zu identifizieren. Der allegorische Praetext Aus rezeptionsästhetischer Perspektive verläuft der Prozeß der Rekonstruktion der allegorischen Bedeutung nicht in der hier gewählten Reihenfolge, sondern in umgekehrter Richtung: Der Rezipient hat nur das allegorische Proprium und muß, um das Improprium zu erschließen, zuerst die allegorische Menge M a bilden, bevor er die Mengen M f und MW bilden und als disjunkte Mengen erkennen kann. Gerade weil nun aber die allegorische Menge M A eine unkonventionelle Mengenbildung ist und weil im Prinzip sämtliche dem Proprium zugewiesenen Eigenschaften als mengenbildende Merkmale in Frage kommen, muß er zweifellos irgendeine Vorstellung davon haben, auf welche anderen Sachverhalte die Eigenschaften des Proprium ebenfalls zutreffen könnten, das heißt: Um den 'wahren' Referenten zu identifizieren, muß er ihn schon kennen, und zwar nicht nur kennen, sondern auch einen ähnlichen »Begriff« von ihm haben wie der Text. Es müssen ihm nämlich die dem Proprium zugewiesenen Eigenschaften als mögliche Prädikate des Improprium geläufig sein, wenn er beide als Elemente der allegorischen Menge M A erkennen soll. 114 V g l . KURZ 1982, 62.
Kapitel VÌI: Uneigentliche Rede
341
Diese für das Verstehen der Allegorie erforderlichen Vorkenntnisse des Rezipienten seien, literaturwissenschaftlichem Sprachgebrauch folgend, der allegorische Praetext genannt,115 ein Begriff, der das präzisiert, was bei der strukturalistischen Definition des Metalogismus gemeint ist, wenn es heißt, das Verstehen von Metalogismen setze die Kenntnis des 'wahren ' Referenten voraus (vgl. S. 315). Der allegorische Praetext hat seinen Ort demnach im Bewußtsein des Rezipienten: Er ist »das schon Gesagte, Bekannte, das Gewußte und Erinnerbare«,116 meint also das von der Allegorie vorausgesetzte kulturelle Wissen des Publikums, das hier als Reservoir der möglichen Sachverhalte fungiert, auf die das Proprium vergleichend bezogen werden kann. Der Praetext von Werner Fincks »Gang durch die Kuhherde« etwa ist die aktuelle politische Realität des NS-Regimes und ein regimekritischer Konsens, den der Autor beim Publikum der »Katakombe« voraussetzen konnte. Der Spezifikationsgrad des Praetextes bemißt sich nach dem Exklusivitätsgrad des anvisierten Publikums. Die Allegorie definiert ihr esoterisches Publikum über ihren Praetext, über das von ihr vorausgesetzte kulturelle Wissen: Je spezifischer es ist, um so exklusiver ist auch das esoterische Publikum. Der Grad dieser Exklusivität unterliegt historischem Wandel: Der Praetext von Orwells »Animal Farm« etwa, der kommunistische Gesellschaftsentwurf und seine depravierte Praxis im Stalinismus, war im Erscheinungsjahr des Buches (1945), in der Geburtsstunde des Kalten Krieges, einem breiten Publikum geläufig. Heute dagegen haben die ideologischen Fronten von damals ihre Schärfe verloren, und dieser Prozeß wird den Kreis derer, die den Praetext dieser Allegorie aktualisieren können, sukzessive auf die einschränken, die sich an Stalinismus und Kalten Krieg erinnern können, sei es aufgrund eigener Erfahrung, sei es aufgrund vermittelter Erfahrung, historischen Wissens. Allegorische Sinnsignale Wo der allegorische Text darauf vertraut, daß sein aktueller Kontext den Praetext hinreichend klärt, kann eine Allegorie demnach entweder hermetisch oder aber hochgradig mehrdeutig werden, sobald sie aus diesem Kontext herausgelöst erscheint, - ein Schicksal, dem gerade jene Allegorien kaum je entgehen, die das Kabarett produziert: Werner Fincks »Gang durch die Kuhherde« könnte, heute und ohne Kenntnis seines historischen Kontextes gelesen, auf alle möglichen verfügbaren Praetexte bezogen werden, eben weil er seinen Rezipienten keine genaueren Anweisungen gibt, wo sie den Praetext sun s Vgl. ebd. 40-42; der Begriff geht auf Quilligan zurück (M. Quilligan, The Language of Allegory, London 1979). Π 6 KURZ 1 9 8 2 , 4 0 .
342
Kapitel VII: Uneigentliche Rede
chen sollen. Das war in diesem Fall auch nicht nötig: Der Praetext verstand sich für das Publikum der »Katakombe« von selbst. In weniger eindeutigen und weniger simplen Fällen ist das anders: Der kompetente Rezipient verfügt ja über eine Vielzahl möglicher Praetexte, von denen unter Umständen mehrere als Impropria in Frage kommen, und deshalb muß der Text, wenn der allegorische Sprechakt gelingen soll, zweifellos Hinweise liefern, die den gemeinten Praetext abrufen können, muß jene »Scharniere« (Kurz) einbauen, die die Verbindung zwischen Proprium und Improprium herstellen, das heißt: Er muß über die metalogischen Formsignale hinaus auch metalogische Sinnsignale vergeben, die hier nun genauer als solche Signale bestimmt werden können, die den allegorischen Praetext im Bewußtsein des Rezipienten zu aktualisieren in der Lage sind. Wie das im Film geschieht, wird noch eigens zu erörtern sein. Die literarische Allegorie arbeitet dabei in erster Linie mit Polysemien,117 mit Wörtern oder Aussagen, die bereits auf der Ebene ihrer eigentlichen Bedeutung mehrdeutig sind, darunter vorzugsweise mit verblaßten Metaphern.118 Polysemien erzeugen semantische Ambiguità! und sind eben dadurch in der Lage, die »Scharniere« zwischen Proprium und Improprium zu bilden, die der Rezipient braucht, um das zweite Element der allegorischen Menge M A , den 'wahren' Referenten, zu identifizieren. Werner Fincks »Gang durch die Kuhherde« verwendet allegorische Sinnsignale aus den genannten Gründen nur spärlich. Deshalb weist der Text auch nur ein polysemes Lexem auf, nämlich das Adjektiv »groß« (»viele große Kühe«), das sowohl auf räumliche als auch auf soziale oder geistige Sachverhalte bezogen werden kann und sich hier unschwer als Anspielung auf das Idiom »große Tiere« zu erkennen gibt. Stärker ist hier ein anderes, zumeist freilich plumperes Verfahren der Vergabe allegorischer Sinnsignale vertreten, nämlich die Verwendung unpassender Prädikate, solcher Prädikate nämlich, die im eigentlichen Kontext, bezogen auf den 'falschen' Referenten, als sprachliche Mißgriffe erscheinen, im uneigentlichen Kontext aber, bezogen auf den 'wahren' Referenten, durchaus mit den syntagmatischen Verträglichkeitsregeln harmonieren und eben deshalb einen Hinweis auf das Improprium zu liefern imstande sind (wie z.B. die mit Bezug auf Kühe unpassenden Wörter wie »durchschauen«, »Denken«), 2.3 Symbol Thomas Manns Erzählung »Der Tod in Venedig«, genauer: ihre symbolische Raumstruktur verwendet als ihren 'falschen' Referenten die Stadt Venedig 117 Vgl. ebd. 31 f. ne Vgl. ebd. 31.
Kapitel VII: Uneigentliche Rede
343
(r f ), der symbolice den 'wahren' Referenten (r w ) repräsentiert, der hier (vereinfachend) als das allgemeine Phänomen des Verfalls oder, mengentheoretisch gesprochen, als die Menge aller durch die Eigenschaft »Verfall« ausgezeichneten Sachverhalte bestimmt sei.119 Die Elementbeziehung zwischen Proprium und Improprium Bei Symbolen ist demnach die Beziehung zwischen Proprium und Improprium als Elementbeziehung anzusprechen: Das Proprium ist Element des Improprium (rf e r w ), weist diejenige Eigenschaft auf, die als mengenbildendes Merkmal der improprie gemeinten Menge fungiert. Diese Eigenschaft, aufgrund deren die metalogische Relation zwischen Proprium und Improprium zustandekommt, sei hier die symbolische Eigenschaft (E$) und die durch sie konstituierte, improprie gemeinte Menge die symbolische Menge (Mg) genannt. Am Beispiel: »Venedig« ist Element der improprie gemeinten symbolischen Menge (M s ) aller Verfallsphänomene, weil es die Eigenschaft (E$) »Verfall« aufweist, die diese improprie gemeinte Menge konstituiert. Das heißt: Das Improprium (r w ) ist hier, anders als bei der Allegorie, selbst eine Menge, die symbolische Menge (r w Ξ M s ). Damit stellt sich zunächst die Frage, inwiefern unter diesen Umständen davon gesprochen werden kann, daß die beiden Referenten metalogischer Sprechakte, r f und r w , als Elemente zweier disjunkter Mengen bestimmt werden können (S. 330f.), welcher Art hier also das disjunktive Merkmal (Ef^,) und damit das, was den 'falschen' Referenten zu einem 'falschen' macht, eigentlich ist. Proprium und Improprium als Elemente disjunkter Mengen Die 'falschen' und 'wahren' Referenten symbolischer Rede unterscheiden sich demnach nur dadurch, daß der eine ein besonderer Fall dessen ist, was der andere als allgemeines Phänomen ist: Der 'wahre' Referent ist nicht, wie bei der Allegorie, ein zweites Individuelles, sondern eine Menge, und zwar eben jene Menge (M$), zu deren Elementen der 'falsche' Referent zählt. Das aber scheint dann ja den Schluß zu erzwingen, daß der 'wahre' Referent r w identisch ist mit der Menge MF, daß also die eingangs postulierte Zugehörigkeit der beiden Referenten metalogischer Sprechakte zu disjunkten Mengen (S. 330f.) hier nicht zutrifft. Das ist ein Fehlschluß: Denn die disjunktive Eigenschaft (Efo), die beide Referenten zunächst - im Horizont des metalogischen Sprechakts - als Elemente zweier disjunkter, durch die Opposition 'wahr vs. falsch' gekennzeichneter Mengen zu bestimmen fordert, ist hier kein gegenstandsbezogenes Merkmal mehr, sondern ein logisches, nämlich genau diejeΠ9 Daß der Text komplexere Bedeutungszusammenhänge konstituiert als nur den des Verfalls, wird hier aus Vereinfachungsgründen außer acht gelassen.
344
Kapitel VII: Uneigentliche Rede
nige Eigenschaft, durch die sie sich logisch unterscheiden, die Eigenschaft »±Menge«: Den Elementen der Menge Mf, den symbolischen Propria, fehlt die Eigenschaft »+Menge«, nicht dagegen den Elementen der Menge M w , den symbolischen Impropria. Mf und M w sind hier demnach Mengen, die allein aufgrund einer logischen Eigenschaft ihrer Elemente, der Eigenschaft »± Menge« gebildet werden. Das heißt: Bei Symbolen ist M w eine hochabstrakte Menge, nämlich die Menge aller Mengen, ein Fall, in dem Mengentheoretiker nicht mehr von »Menge«, sondern von der Klasse aller Mengen reden. 120 Deshalb sei auch hier mit Bezug auf das Symbol hinfort nicht mehr von der Menge M w , sondern von der Klasse K w die Rede. Die Mengen Mf und K w sind also disjunkte Mengen aufgrund des mengenbildenden Merkmals (Efty) »±Menge«: Der 'falsche' Referent r f ist ein 'Besonderes' und kann deshalb nur Element einer Menge, nicht selbst eine Menge sein (zumindest nicht im Horizont des symbolischen Sprechakts), während der 'wahre' Referent r w ein 'Allgemeines', eine Menge ist, wobei der für das Symbol definitorische Umstand hinzukommt, daß er eben jene Menge (Ms) ist, zu deren Elementen der 'falsche' Referent gehört. Der symbolische 'Fehler' 'Falsch' ist das symbolische Proprium also nur insofern, als es ein 'Besonderes' und damit nicht das ist, was gemeint ist, das 'Allgemeine', der allgemeine Sachverhalt r w (M s ). Das verweist darauf, daß der 'Fehler', den Symbole begehen, gewissermaßen nur ein relativer ist, denn die symbolische Elementbeziehung besagt ja, daß der 'falsche' Referent immerhin am 'wahren' Referenten - als dessen Element - teilhat. Die ¡Conventionality der symbolischen Elementbeziehung Es ist diese durch die Elementbeziehung begründete Teilhabe des symbolischen Proprium am Improprium, die den Eindruck hervorruft, daß dem symbolischen Proprium gewissermaßen eine größere Legitimation zukommt, metalogischer Stellvertreter des Improprium zu sein, als dem allegorischen Proprium, das ja erst über eine zusätzliche Operation, über die Bildung der (zudem unkonventionellen) Menge M A , mit dem Improprium in Verbindung tritt. An der Begründung dieses gar nicht zu leugnenden Eindrucks scheiden sich die Geister, entscheidet sich nämlich die Frage, ob die Symboldefinition in ontologischen Setzungen verankert wird oder nicht. Der Rekurs auf mengentheoretische Denkmodelle schafft zwar die Möglichkeit, ontologische Setzungen mit dem Argument abzuweisen, daß es hier nicht um Wesensbestimmungen, sondern um Mengenbildungsverfahren geht, die sich Wesensbestim120 Vgl. dazu KLAUS 1971, 301.
Kapitel VII: Uneigentliche Rede
345
mungen gegenüber indifferent verhalten, aber damit ist ja noch kein plausibler Grund für den Eindruck gefunden, daß die symbolischen Propria und Impropria »enger« zusammenhängen als die allegorischen.121 Dieser Unterschied läßt sich vielmehr auch hier nur im Rekurs auf Konventionen, nämlich mit dem Argument begründen, daß die den Zusammenhang zwischen Proprium und Improprium herstellende Mengenbildung im einen Fall - bei der Bildung der allegorischen Menge M A - durch ein unkonventionelles mengenbildendes Kriterium (E A ), im anderen Fall - bei der Bildung der symbolischen Menge Mg (r w ) - durch ein konventionelles mengenbildendes Kriterium (Es) zustandekommt: Das mengenbildende Merkmal E$ rekurriert demnach auf den je zeit- und kulturspezifischen Konsens über die »Ordnung der Welt«, den der Text voraussetzt, ist ein konsensfähiges »Ordnungskriterium«. Folglich handelt es sich bei der symbolischen Menge M s (r w ), anders als bei der allegorischen Menge (M A ), um eine konventionelle Menge. Und das muß auch so sein, denn andernfalls wäre der Rezipient hier gar nicht in der Lage, den 'wahren' Referenten zu erkennen: Wenn der 'wahre' Referent metalogischer Sprechakte dem Rezipienten immer schon verfügbar sein muß, dann heißt das hier, daß der Rezipient die symbolische Menge M§ schon kennen muß, genauer: daß ihm das mengenbildende Merkmal (E22 Vgl. Anm. 84. Wenn für die symbolische Menge M s nicht mehr gefordert wird, daß sie auf Wesensbestimmungen ihrer Elemente beruhen muß, dann kann das symbolische Improprium durchaus eine auf Merkmalen der Erscheinung der Dinge, nicht auf »Wesensmerkmalen« beruhende begriffliche Abstraktion sein.
346
Kapitel VII: Uneigentliche Rede
Konvention und Konvenlionswandel: Anwendungsprobleme Auch hier ist nun aber mit Nachdruck darauf zu hinzuweisen, daß diese Begriffsbestimmung ebensowenig vor unreflektierten ontologischen Setzungen schützt wie die Bestimmung der Allegorie. Denn auch Symbole können ihren Status als Symbole verlieren (und zu Allegorien mutieren), sobald der Rezipiert (Interpret) eine andere als die vom Text vorausgesetzte »Ordnung der Welt« voraussetzt, also nicht denselben Konventionen verpflichtet ist wie der Text. 123 So dürfte etwa ein heutiger Leser ohne spezifische Vorkenntnisse schwerlich in der Lage sein, mittelalterliche Naturallegorien, die der hier vorgelegten Definition zufolge als Symbole zu bestimmen sind, 124 als solche zu dechriffrieren: Er würde sie als Allegorien (im hier definierten Sinn) lesen. Denn wo der Grundsatz »omnis natura Deum loquitur« nicht mehr gilt, wo Natur nicht mehr als Sprache Gottes, nicht mehr als eine Welt versiegelten heilsgeschichtlichen, moralischen oder eschatologischen Sinns aufgefaßt werden kann, können auch die Texte, die diesen Sinn aufdecken, nicht mehr als Symbole gelesen werden. 125 Resümee: Mengentheoretische Definition des Symbols Das symbolische Verfahren läßt sich nun zunächst zusammenfassend definieren als Verfahren, bei dem zwei Sachverhalte rf und r w , die aufgrund der logischen, auf beide Referenten alternativ zutreffenden Eigenschaft (E^,) »± Menge« als Elemente zweier disjunkter Mengen M f und M w (K w ) aufzufassen sind, über eine als mengenbildendes Merkmal konventionalisierte Ei-
genschaft Es in eine Elementbeziehung gebracht werden mit der Folge, daß r w eine konventionelle Menge (M s ) all jener Elemente repräsentiert, die die Eigenschaft Es aufweisen, und rf aufgrund dieser Eigenschaft Eg als Element von r w ( s M j ) bestimmt und so als symbolischer Repräsentant von r w in 123 An Thomas Manns Erzählung läßt sich das schwerlich illustrieren, weil ihre Raumsymbolik auf universale menschliche Erfahrungen (Verfall, Sterben, Tod) rekurriert, die eine nur geringe zeit- und kulturspezifische Bedingtheit aufweist, ein Merkmal, das für einen großen Teil der Symbolik der neuzeitlichen Literatur zutrifft. Insofern ist die Gefahr ahistorischer Lektüre hier zumindest graduell geringer. 124 Vgl. Anm. 78. 125 Vgl. dazu F. Ohly, Vom geistigen Sinn des Wortes im Mittelalter, in: ZS f. dt. Altertum und dt. Literatur 89 (1958/59), 1-23.
Kapitel VII: Uneigentliche Rede
347
Funktion gesetzt werden kann (r f e r w ; r w ξ M s ; für Mg und E s gilt die Eigenschaft »+konventionell«). Der symbolische Praetext Die Konventionalität der symbolischen Menge M$ ist die Voraussetzung für das Verstehen von Symbolen: Um die symbolische Menge bilden zu können, muß der Rezipient die symbolische Eigenschaft E s als mengenbildendes Kriterium schon kennen. Er muß schon einen »Begriff« von der Menge haben, als deren Element er das symbolische Proprium erkennen soll, muß also im Beispielfall schon einen »Begriff« von Verfall haben, wenn er das verfallende Venedig als Repräsentanten der Menge aller Verfallsphänomene erkennen können soll. Das heißt wohlgemerkt nicht, daß ihm jedes Element der Menge M§, also das symbolische Proprium selbst (Venedig) schon als Element der Menge M s geläufig sein muß, sondern nur daß ihm die symbolische Eigenschaft (Eg), die der Text diesem Proprium zuschreibt, als mengenbildendes Kriterium vertraut sein muß. Der Rezipient ist hier daher nicht notwendig auf die Kenntnis des je besonderen Proprium angewiesen, sondern kann bei der Rekonstruktion des Improprium, der Menge M$, auf die Prädikate rekurrieren, die der Text dem Proprium zuweist: Um ein Symbol als Symbol zu verstehen, genügt es also, einen »Begriff« vom Improprium haben. Dieser »Begriff« vom Improprium, eben jenes konventionelle mengenbildende Kriterium E s , das die Bildung der symbolischen Menge M s begründet, ist der symbolische Praetext. Symbolische Sinnsignale Da es nun eine Fülle konventioneller Mengenbildungen gibt und deshalb die meisten Propria verschiedenen konventionellen Mengen zugeordnet werden können, müssen symbolische Texte dafür sorgen, daß der Rezipient genügend Hinweise darauf erhält, welcher der ihm geläufigen Mengen er das Proprium zuordnen soll. Symbolische Sinnsignale sind demnach wie allegorische Sinnsignale zu bestimmen als Signale, die den symbolischen Praetext im Bewußtsein des Rezipienten zu aktualisieren in der Lage sind. Da es sich bei diesem Praetext aber nicht, wie bei der Allegorie, um einen bestimmten, individuellen Sachverhalt, sondern um ein konventionelles mengenbildendes Merkmal (Eg) handelt, beruht die Vergabe symbolischer Sinnsignale auf einem einfachen Verfahren, nämlich auf der hinreichend deutlichen Prädikation des Proprium: Dem 'falschen' Referenten muß eben jenes als mengenbildendes Kriterium konventionalisierte Merkmal Eg als ein herausragendes Prädikat zugewiesen werden, wenn er als Element des 'wahren' Referenten und damit dieser 'wahre' Referent, die Menge M$, erkannt werden soll.
348
Kapitel VII: Uneigentliche Rede
So läßt denn auch Thomas Manns Erzählung keine der konventionellen Mengenbildungen zu, für die der 'falsche' Referent Venedig außer der vom Text intendierten in Betracht zu ziehen wäre (z.B. Handelsstädte, Hafenstädte usw.). Vielmehr entwickelt der Text mit seinen rekurrenten Verweisen auf die zunächst unbestimmte Sehnsucht Aschenbachs nach einem ihm gemäßen Ferienort, auf die faulig riechende Lagune oder auf die schleichend um sich greifende Cholera-Epidemie, mit den Anspielungen auf die griechische Mythologie (Acheron, Charon, Hades, Toteninsel) oder mit dem rekurrenten Motiv des überschminkten Alters, des geschminkten Todes, ein symbolisches Verweissystem, das Venedig in vielfachen Brechungen und Spiegelungen als komplexes Symbol des Verfalls, als Symbol der Koinzidenz von Schönheit und Tod, Schönheitssehnsucht und »Lebensschwäche«, Ästhetizismus und Décadence ausweist.
3.
Allegorische Rede im Film
Die hier vorgelegte Begriffsbestimmung ist medienunspezifisch und daher auf sprachliche Sachverhalte ebenso anwendbar wie auf filmische. Deshalb wird es in diesem und im folgenden Kapitel auch nur noch darum gehen, die spezifisch filmischen Voraussetzungen allegorischer bzw. symbolischer Rede zu klären. Bilderrede erfaßt die sichtbare Erscheinung der Dinge, und die nichtklassifikatorische Natur ihrer Zeichen bindet sie an das je Besondere, an die je individuelle Erscheinung der Einzeldinge. Wo sie diese Bedingungen transzendieren, nämlich Sachverhalte referieren will, die nicht sichtbar oder kein Individuelles, sondern ein Allgemeines sind, muß sie uneigentlich reden. Es gibt hier also, anders als bei der Sprache, eine Art Zwang zur Uneigentlichkeit immer dann, wenn der Gegenstand filmischer Rede »unsichtbar« ist. Um das (sichtbare) Proprium als Zeichen eines 'anderen' (unsichtbaren) Sachverhalts lesbar zu machen, bedarf es vergleichsweise umständlicher Prozeduren. Sie unterscheiden sich danach, ob allegorisch oder symbolisch geredet wird. Allegorische Mengenbildungen Das allegorische Proprium Of) muß dem bisher Gesagten zufolge Merkmale (E A ) aufweisen, die es mit dem Improprium (r w ) gemeinsam hat und die beider Zuordnung zur allegorischen Menge M A begründen. Da nun beim Film das Improprium in der Regel etwas »Unsichtbares« ist, betreffen diese gemeinsamen Merkmale folglich im einen Fall Merkmale der äußeren physischen Gestalt eines Einzeldinges, im anderen Fall Merkmale der inneren psychischen Gestalt - der »Gedankenfigur« eben - eines »unsichtbaren« Sachver-
Kapitel VII: Uneigentliche Rede
349
halts, Merkmale einer Denkfigur, Vorstellung u.ä. Wenn das Improprium im sichtbaren Proprium Gestalt gewinnen soll, dann muß also die physische Gestalt des sichtbaren Einzeldinges seiner psychischen Gestalt ähnlich sein. Mustergültige Beispiele für diesen Vorgang liefern die rekurrenten »Rahmenbilder« in Fassbinders »Fontane Effi Briest« (BRD 1974): Hier läßt die Kameraperspektive die Figuren (Effi, Innstetten) immer wieder durch Spiegel- oder Türrahmen »eingerahmt« erscheinen, und eine wohlkalkulierte Choreographie sorgt dafür, daß die Figuren, zur Bewegungslosigkeit erstarrt, auffällig lange in diesen »Rahmen« verharren. Das Improprium dieser Bilder, die Einschränkung individueller Selbstbestimmung durch gesellschaftliche Fremdbestimmung, hat mit seinem visuellen Proprium das Merkmal der »Einrahmung« gemeinsam. Der »unsichtbare« Sachverhalt, die Denkfigur der Einschränkung mentaler, innerer Freiheit durch fremdbestimmte Normen, gewinnt Gestalt in dem sichtbaren Sachverhalt einer durch räumliche Begrenzungen eingeschränkten Bewegungsfreiheit, die deshalb ganz buchstäblich zur »Gedankenfigur« werden kann, die besagt, daß die Figuren ebenso im »Rahmen« gesellschaftlicher Normen verharren wie sie hier in den Spiegel- oder Türrahmen festgenagelt stehen. Daß sie das tun, obwohl sie ja »eigentlich« nichts daran hindert, diese »Rahmen« zu verlassen (die Tür- und Spiegelrahmen schränken ihre Bewegungsfreiheit »eigentlich« nicht ein), gibt darüber hinaus allegorice kund, daß sie das von diesen »Rahmen« abgesteckte Feld als ihren »Bewegungsspielraum« akzeptiert haben. Tür- und Spiegelrahmen bilden mit gesellschaftlichen »Rahmenbedingungen«, mit gesellschaftlichen Beschränkungen individueller Selbstbestimmung keine konventionelle Menge. Die Unkonventionalität der allegorischen Menge M A (»Rahmen«), als deren Elemente der Rezipient die 'falschen' und 'wahren' Referenten (Tür- und Spiegelrahmen, »Gesellschaftsrahmen«) erkennen soll, verhindert eine symbolische Bedeutungskonstitution: Tür- und Spiegelrahmen können nicht als symbolische Repräsentanten gesellschaftlicher Fremdbestimmung aufgefaßt werden, weil sie (anders als beispielsweise die Schranken in einem Gerichtssaal, als die Wände einer Gefängniszelle, als polizeiliche Absperrungen usw.) nicht gesellschaftlich bedingt sind, sondern sich technischen Notwendigkeiten, ästhetischen Bedürfnissen u.ä. verdanken. Damit ist die Disjunktion der Mengen Mf (gegenständliche Rahmen) und M w (abstrakte »Rahmen«, normative Setzungen), denen allegorische Propria und Impropria im Horizont konventioneller Mengenbildungen angehören, gewährleistet. Allegorische Sinnsignale Der metalogische Rezeptionsprozeß wird durch metalogische Formsignale (vgl. Kap. B.2) in Gang gesetzt, im Beispielfall vor allem durch das lange,
350
Kapitel VII: Uneigentliche Rede
bewegungslose Verharren der Figuren in bestimmten Positionen, das auffallige handlungslogische Sinndefizite erzeugt. Um den Rezipienten zur Aktualisierung des richtigen Praetextes zu bewegen, muß der allegorische Text darüber hinaus metalogische Sinnsignale vergeben, die diesen Praetext abzurufen in der Lage sind. Eben darin liegt nun ein Kardinalproblem filmischer Allegorien. Literarische Allegorien arbeiten, wie erwähnt, vor allem mit Polysemien, die semantische Ambiguität erzeugen und eben dadurch jene »Scharniere« (Kurz) bilden, die Proprium und Improprium miteinander verbinden. Die Oberflächengenauigkeit, der »Naturalismus« filmischer Bilder macht es nun aber schwer, auf der Ebene der eigentlichen Bedeutung fotografierter Bilder solche semantischen Ambiguitäten zu erzeugen. Das ist der Grund, warum filmische Allegorien in aller Regel auf sprachliche Polysemien zurückgreifen. Ein zweiter, nicht an sprachliche Voraussetzungen gebundener Weg führt über Konnotationen. Die filmische Reproduktion sprachlicher Polysemien sucht semantische Ambiguität durch die Abbildung von Gegenständen zu erzeugen, deren sprachlicher Begriff polysem ist oder bereits selbst eine konventionalisierte uneigentliche Bedeutung hat, ein tropischer Topos ist (vgl. S. 309-311). Die Tür- und Spiegelrahmen in Fassbinders Film sind selbst keine semantisch mehrdeutigen, sondern höchst eindeutige Zeichen. Eben deshalb kann der Rezipient mit diesen Bildern nichts anfangen, solange er nicht auf sprachlich präformierte Bedeutungsbeziehungen rekurriert: Er muß die dargestellten Dinge zuerst auf den Begriff bringen, bevor er die semantische Ambiguität entdecken kann, die das »Scharnier« zwischen Proprium und Improprium liefert, muß nämlich die Tür- und Spiegelrahmen dem Begriff »Rahmen« zuweisen, dessen Mehrdeutigkeit ihn dann zum Praetext führt, die hier schon in einem tropischen Topos fixiert ist, nämlich in der verblaßten, schon lexikalisierten Metaphorik des Begriffs »Rahmen«. Erst wenn mit Hilfe dieser Prozedur die allegorische Menge M A gebildet ist, entsteht jenes »Vergleichsfeld«, das es erlaubt, auch die übrigen Merkmale des Proprium daraufhin zu prüfen, ob sie ebenfalls auf das Improprium anwendbare Merkmale sind (vgl. S. 334f.). Konnotationen sind keine Form uneigentlicher Bilderrede (vgl. S. 312f.), aber sie können als metalogische Sinnsignale in Funktion treten. Unter Konnotationen werden hier wohlgemerkt Konnotationen ikonischer Zeichen verstanden, nicht etwa Konnotationen der das Abgebildete bezeichnenden sprachlichen Begriffe. Ikonische Konnotationen beruhen allererst auf der sinnlichen Erfahrung der Natur- und Kulturwelt. Dazu gehören zunächst solche »Mit-« oder »Nebenbedeutungen« eines sinnlichen, hier also eines optischen (oder akustischen) Eindrucks, die aufgrund vorausliegendender sinnlicher Erfahrun-
Kapitel VII: Uneigentliche Rede
351
gen die Vorstellung eines ihrerseits sinnlichen Eindrucks evozieren: Das Bild eines Cellos kann eine Klangvorstellung und umgekehrt der Klang eines Cellos eine Vorstellung von seiner optischen Erscheinung abrufen, das Bild einer gebratenen Gans evoziert die Vorstellung von ihrem Duft und Geschmack, das Bild eines im Strahl der Spätwintersonne tanzenden Mückenschwarms die Vorstellung von Wärme usw. Bilder können neben sinnlichen aber auch kognitive Nebenbedeutungen entfalten, nämlich mit sinnlichen Erfahrungen verkoppeltes soziales, politisches, historisches, ästhetisches oder Naturwissen abrufen, also die Gesamtheit dessen aktivieren, was man als das kulturelle Wissen einer soziokulturellen Gemeinschaft ansprechen kann: Ein Zimmer, in dem ein Cello steht, kann etwa Kultur und Bildungsstand seines Bewohners, das Bild einer gebratenen Gans das gesamte Vorstellungsfeld eines (deutschen) Weihnachtsabends, ein in einem Strahl der Spätwintersonne tanzender Mückenschwarm den nahenden Frühling konnotieren. Konnotationen sind demnach offenbar in der Lage, der eigentlichen Bedeutung der Bilder ein erweitertes Sinnpotential zu verschaffen, ein Sinnpotential, das der Rezipient vermutlich unbewußt beständig aktiviert, wenn er Bilder sieht, das er aber immer dann bewußt und gezielt zu aktivieren genötigt ist, wenn metalogische Formsignale das Proprium selbst als nicht ausreichende Voraussetzungen des Sinnverstehens ausweisen. Anders als bei mehrdeutigen Lexemen handelt es sich dabei nun freilich nicht um konventionalisierte Polysemien, sondern um Assoziationsfelder, die ein hohes Maß an Unbestimmtheit zulassen und der Interpretation daher einen weiten Spielraum geben. Zwar müssen sie, wenn sie als metalogische Sinnsignale funktionieren sollen, auf gemeinsamen Erfahrungen der Subjekte beruhen, deren interpretatorische Verifikation aber wird selten mehr als empirische Plausibilität herstellen können. Über Konnotationen vergebene allegorische Sinnsignale zeigen beispielsweise die weiter oben schon erwähnten Einstellungen aus Fassbinders »Effi Briest«-Film, die Mutter und Tochter Briest auf einem Spaziergang durch eine Moorlandschaft zeigen (vgl. S. 281). Die handlungslogischen Sinndefizite der Szene liefern die allegorischen Formsignale, während allegorische Sinnsignale hier ausnahmsweise nicht über bildliche Anspielungen auf sprachliche Polysemien, sondern über ikonische Konnotationen Zustandekommen: Die unwegsame Moorlandschaft, deren Melancholie durch das trübe, glanzlose Licht eines grauen, bedeckten Himmels wirkungsvoll verstärkt wird, evoziert eine Fülle natur- und kulturgeschichtlich begründeter Nebenbedeutungen, die ein Assoziationsfeld schaffen, in dem Vorstellungen von Unheimlichkeit, Einsamkeit, Verlorenheit, Trauer und Tod zusammenfließen, die das »Scharnier« zwischen Proprium und Improprium herzustellen vermögen, nämlich die Moorlandschaft als allegorisches Panorama der psychischen und sozialen Le-
352
Kapitel VII: Uneigentliche Rede
benswirklichkeit der Figuren zu lesen erlauben, aus dem sich dann die weitere Allegorese ableiten läßt.126
4.
Symbolische Rede im Film
Symbolische Mengenbildungen Da das symbolische Improprium eine Menge (M s ) ist, versteht sich von selbst, daß es grundsätzlich ein Abstraktum, ein Allgemeines ist, das vom Kameraauge nicht wahrgenommen werden kann. Entsprechend soll der Rezipient das Proprium hier nicht, wie bei der Allegorie, mit einem zweiten individuellen Sachverhalt vergleichen, sondern einer schon gebildeten, konventionellen Menge als ihr Element zuweisen. Deshalb sind die umständlichen Verfahren der filmischen Allegorie hier nicht erforderlich: Hier kommt es allein darauf an, daß der Rezipient optische (oder akustische) Merkmale des Proprium als konventionelle mengenbildende Kriterien erkennt und anwendet, indem er das Proprium als Element der symbolischen Menge und damit eben diese Menge, das symbolische Improprium, identifiziert. Die weiter oben schon beschriebene Sequenz aus Gustaf Gründgens' Effi Briest-Verfilmung (»Der Schritt vom Wege«, D 1939), die Effis ersten Tag in Kessin, ihre Langeweile in dem landrätlichen Haus und ihren Spaziergang ans Meer erzählt (vgl. S. 319f.), zeigt den besonderen Fall einer doppelten symbolischen Mengenbildung, weil ihr Improprium eine Opposition ist, nämlich die universale Opposition von Natur und Kultur: Sie weist ihren 'falschen' Referenten - dem Landratshaus, der Strandlandschaft - mit einer effektvollen Kontrastierung von Innen und Außen, von Enge und Weite, von kultiviertem Innenraum und nicht-kultiviertem Außenraum Merkmale zu, die diese als symbolische Repräsentanten einerseits des durch menschliche Zivilisation geprägten Kulturraums, andererseits des menschlicher Kultivierung entzogenen 126 Vgl. S. 281: Das (hier ausnahmsweise rasche, agile) Bewegungsverhalten der Titelheldin, ihr kindliches Umherspringen im toten, abgestorbenen Gras, setzt sich ebenso in einen Widerspruch zu der tristen Umgebung wie der Sonnenschirm der Frau von Briest, die damit so tut, als ob die Sonne schiene, Widersprüche, die nun ihrerseits als allegorische lesbar werden, als Indiz nämlich für die Bereitschaft der Figuren, Realität normengerecht umzudeuten, die schlechte Empirie in eine gute (das tote Gras in eine grüne Wiese, das trübe Licht in Sonnenlicht) umzudefinieren, für die im Untertitel des Films angeprangerte Bereitschaft der Figuren also, »das herrschende System« schon »in ihrem Kopf« zu »akzeptieren«, die Deformation ihres Bewußtseins willig hinzunehmen, statt der »Ahnung« zu folgen, die sie »von ihren Möglichkeiten und ihren Bedürfnissen« haben. Die Bilder erweisen sich so als allegorische Paraphrase und Kommentierung der simultanen verbalen Handlung, des Gesprächs der beiden Frauen, in dem sie eben jene nonnengerechte Umdeutung der Realität vollziehen.
Kapitel VII: Uneigentliche Rede
353
Naturraums in Funktion setzt und so beide als bildsymbolische Kontrafaktur des universalen Gegensatzes von Kultur und Natur zu lesen erlauben. Und indem die Bilder Effis Fremdheit, Verlorenheit und Langeweile im Landratshaus nachdrücklich betonen, ihren Spaziergang mit dem Hund Rollo aber, vor allem ihren ersten Blick auf das Meer, als Erlebnis der Befreiung deuten, weisen sie der Heldin den Naturraum als den ihr gemäßen Lebensraum zu, führen Meer und Strandlandschaft ein als symbolische Signatur ihrer »Natur« und machen damit zugleich klar, daß diese Natur allein hier, im gesellschaftsfreien Raum, gelingen könnte. Das Beispiel zeigt, daß Symbole im Film deutlich problemloser eingeführt werden können als Allegorien, eben weil das Improprium eine schon gebildete, konventionelle Menge ist, deren symbolische Darstellung sich im Film all jener sichtbaren Dinge bedienen kann, an denen das als mengenbildendes Kriterium konventionalisierte Merkmal Es hinreichend deutlich zur Anschauung kommt, während die Allegorie gerade ein Merkmal des Proprium als mengenbildendes Merkmal wahrzunehmen verlangt, das konventionellerweise gerade nicht als mengenbildendes Merkmal gilt und deshalb bei dessen visueller Wahrnehmung auch nicht oder nur beiläufig registriert wird. Daß Türoder Spiegelrahmen sich aus einer bestimmten Perspektive als Rahmen um eine in oder vor ihnen stehende Figur legen können, nehmen wir in nicht-allegorischen Wahrnehmungssituationen entweder gar nicht zur Kenntnis oder messen ihm allenfalls ästhetisches Gewicht bei. Daß aber Meer und Strand ein der menschlichen Kulturarbeit entzogener Raum sind (waren), gehört zumindest noch für die Zuschauer des Jahres 1939 - zu den offensichtlichsten optischen Merkmalen dieses Naturraums, die deshalb auch schon bei seiner alltäglichen, nicht-symbolischen Wahrnehmung im Vordergrund stehen und sogar schon Klischee sind.127 Symbolische Sinnsignale Anders als bei der Allegorie bereitet die Vergabe symbolischer Sinnsignale, die den symbolischen Praetext im Bewußtsein des Rezipienten abrufen, dem filmischen Medium keine Schwierigkeiten, denn diese Sinnsignale, die bei sprachlichen Symbolen vor allem durch eine hinreichend deutliche Prädikation des Proprium Zustandekommen (vgl. S. 347f.), kommen beim Film entsprechend zustande durch die Auswahl solcher 'falscher' Referenten und sol-
ill Daß die symbolischen Propria des Gründgens-Films heute, da die Weltmeere vergiftet sind, ernstlich nicht mehr verwendbar wären, verweist auf die Bedeutung, die Konvention und Konventionswandel auch in dieser Hinsicht für das Verstehen allegorischer und symbolischer Rede haben.
354
Kapitel VII: Uneigentliche Rede
cher Kamerastandorte, die das mengenbildende Merkmal Eg signifikant zur Anschauung bringen. Im Beispielfall wird die Rekonstruktion der leitenden Opposition von Kultur und Natur schon durch die Auswahl der Handlungsräume (Innen- und Außenraum, Kultur- und Naturraum) in Gang gesetzt, die bereits ein ganzes Ensemble stark konventionalisierter Konnotationen (Enge vs. Weite usw.) abrufen. Die Vereindeutigung dieser Räume als Repräsentanten der Opposition von Kultur und Natur und deren Verkoppelung mit der Opposition von Fremd- und Selbstbestimmung vollzieht sich über die erzählte Handlung selbst: Die im Haus, im Kulturraum sich vollziehenden Handlungen der Heldin bestehen nämlich sämtlich aus Tätigkeiten, wie sie einer Dame von Stand angemessen sind (Lesen, Klavierspielen, Fischchen füttern), die indes ganz offensichtlich - Effi führt keine dieser Handlungen zuende - nicht imstande sind, die Langeweile zu vertreiben. Der anschließende Spaziergang dagegen läßt alle Merkmale einer standesgemäßen Strandpromenade vermissen, wird vielmehr als deutlicher Verstoß gegen standesgemäßes Verhalten qualifiziert. 128 Diese Verkoppelung der Handlungen mit standesspezifischen Merkmalen qualifiziert den Spaziergang nicht nur als Erlösung von Langeweile, sondern auch und vor allem als Befreiung von normativen Verhaltensprogrammen, als Ausbruch aus dem Raum gesellschaftlicher Normen. Und die Kamera, die eine Großaufnahme der Heldin, die tief beeindruckt auf das Meer blickt, in harter Montage mit einer sehr weiten Totalaufnahme kombiniert, die diesen Blick auf das Meer perspektivierend nachvollzieht, macht schließlich vollends klar, daß es hier nicht bloß um Naturerfahrung im gegenständlichen Sinn, sondern um die Erfahrung der Entgrenzung geht. Eine nicht zu unterschätzende Rolle spielt dabei die Filmmusik von Mark Lothar, die diese Erfahrung (sehr) nachdrücklich als aufwühlendes Erlebnis deutet, indem sie ihren dramatischen Höhepunkt auf die eben beschriebene Totalaufnahme setzt.
5.
Allegorie und Symbol: Zwei Konzepte erzählerischer Weltaneignung und ihre Bedeutung für den Film
Das Symbol rekurriert bei der Bildung der symbolischen Menge M s auf je zeit- und kulturspezifische Konventionen der Klassifikation von Welt, die Al128 Das enge Schleppenkleid, das Effi in dieser Szene trägt, markiert ihre gesellschaftliche Position als Dame von Stand, gegen deren Verhaltensnormen sie hier signifikant verstößt: Sie ist allein, begleitet nur von dem Hund, sie benutzt keine Wege, sondern läuft mühsam, behindert eben durch ihr enges Kleid, durch den Dünensand und spielt mit kindlicher Ausgelassenheit, wiederum sichtlich behindert durch das Kleid, mit dem Hund.
Kapitel VII: Uneigentliche Rede
355
legorie dagegen verstößt mit der Bildung der allegorischen Menge M A gegen diese Konventionen. Das Symbol bestätigt den zeitgenössischen Konsens über die Ordnung der Dinge, die Allegorie dagegen negiert ihn. Symbolische Rede scheint demnach davon auszugehen, daß das, was sie zu sagen hat, in dieser konventionellen Ordnung der Welt aufbewahrt ist, in ihr immer schon gegenwärtig ist. Allegorische Rede dagegen scheint davon auszugehen, daß das, was sie zu sagen hat, in der konventionellen Ordnung der Welt gerade nicht aufbewahrt, in ihr noch nicht oder nicht mehr gegenwärtig ist, weshalb sie sie verändern muß. Daraus, läßt sich die Annahme ableiten, daß Symbol und Allegorie zwei verschiedenen Konzepten ästhetischer Weltaneignung verpflichtet sind, die auf zwei unterschiedlichen Modellen von Realität beruhen. Diese Annahme begründet die Bedeutung, die der traditionellen Unterscheidung von Allegorie und Symbol hier beigemessen wird, und damit auch den Aufwand, der hier betrieben wurde, um den Formunterschied zu klären und begrifflich zu erfassen. Das symbolische Realitätsmodell Wenn symbolische Rede davon ausgeht, daß das, was sie zu sagen hat, in der von ihr vorausgesetzten Ordnung der Welt immer schon aufbewahrt ist, dann erkennt sie diese Ordnung der Dinge als gültige Ordnung und zugleich - indem sie den Sinn ihres 'falschen' Referenten aus dieser Ordnung ableitet - als Sinnordnung an: Indem sie ein Besonderes als legitimen Repräsentanten eines Allgemeinen einsetzt, gibt sie kund, daß das Besondere seinen Sinn immer schon an sich hat. Das heißt dann auch, daß symbolische Rede darauf vertraut, daß die von ihr vorausgesetzte Ordnung der Dinge an ihren Erscheinungen zur Anschauung kommt. Denn nur unter dieser Voraussetzung ist ihr Verfahren plausibel: Wenn sie ein Element an die Stelle einer Menge setzt und darauf vertraut, daß der Rezipient diese Menge aus ihrem Element erschließen kann, dann vertraut sie darauf, daß das Allgemeine im Besonderen zur Erscheinung kommt, daß, wer die Erscheinung der Dinge wahrnimmt, damit immer auch schon ihren Sinn zu erschließen auf dem Wege ist. Das Goethesche Argument, wonach die »wahre Symbolik« auf der Anschauung der Erscheinungen beruht, das Wesen der Dinge in der Anschauung ihrer Erscheinungen als »lebendig-augenblickliche Offenbarung des Unerforschlichen« erschließt (s.o), bleibt als Denkprinzip folglich auch dann noch gültig, wenn man ihm seine ontologischen Prämissen entzieht und nicht mehr vom Wesen der Dinge und von der Welt ihrer »Ideen« als an ihren Erscheinungen zutage tretende »Offenbarung«, sondern nur noch von dem je zeitund kulturspezifischen Konsens über die Ordnung der Dinge spricht: Indem symbolische Rede auf der Geltung der Erscheinungswelt als Erfahrungswelt
356
Kapitel VII: Uneigentliche Rede
des Subjekts, deren Ordnung sich dem Subjekt an ihr selbst erschließt, besteht, besteht sie auf der Vermittelbarkeit von Ich und Welt: Im Symbol sind Subjekt und Objekt versöhnt. Symbolische Rede indiziert so zugleich ein Konzept realistischen Erzählens, das Wirklichkeit im repräsentativen Ausschnitt, das Ganze im Teil noch gültig erfassen zu können überzeugt ist, eben weil sie auf einer - wie auch immer begründeten - Ordnung der Welt als einer sinnhaften Ordnung, auf einem Zusammenhang der Einzeldinge besteht, der sich an diesen Einzeldingen erschließen läßt. Für den Film und seine Geschichte sind diese Schlußfolgerungen von besonderem Belang, weil filmische Weltaneignung ganz auf die Welt der Erscheinungen angewiesen ist. Das trug ihr den Vorwurf ein, bloße Imitate von Wirklichkeit hervorbringen zu können. Der Zwang zur Reproduktion der optischen Erscheinungswelt wurde ihr von Anfang an als Manko angelastet, das filmischen Realismus zu einem bloßen »Realismus der Oberfläche« abqualifiziert. Im Horizont des symbolischen Realitätsmodells, das gerade auf der Geltung der Welt der Erscheinungen als Erfahrungswelt des Subjekts besteht, konnte filmisches Erzählen sich dieser Vorwürfe erwehren: Symbolische Erzählkonzepte zeigten dem Erzählkino insbesondere in der ersten Phase des Tonfilms Wege, den photographischen Realismus der Oberfläche zu überwinden und sich als Erzählkunst zu legitimieren, die Wirklichkeit nicht einfach nur reproduziert, sondern ihren »Sinn« im Akt ihrer photographischen Abbildung freizulegen vermag. Sie prägten in den dreißiger Jahren das filmästhetische Programm vor allem französischer Regisseure (u.a. René Clair, Marcel Carné, Julien Duvivier, besonders aber Jean Renoir), das Filmhistoriker unter dem Stichwort »poetischer Realismus« führen,129 ein Begriff, der in der Filmgeschichtsschreibung zwar keinen klaren Inhalt, aus literaturgeschichtlicher Sicht aber volle Berechtigung hat, weil er die deutlichen Korrespondenzen anzeigen kann, die dieses Konzept realistischen Erzählens mit dem des poetischen Realismus in der Literatur des 19. Jahrhunderts verbinden.130 Daß sich diese Korrespondenzen zu einem Zeitpunkt einstellten, da das symbolische Realitätsmodell in der Literatur seine Geltung schon eingebüßt hatte,131 markiert die Verspätung, mit der der Film auf Probleme realistischen Erzählens in der Moderne reagierte. 129 Vgl. Z.B. GREGOR/PATALAS 1980, Bd 1, 146-179. 130 Zu Funktion und Bedeutung symbolischer Rede im poetischen Realismus vgl. die grundlegende Arbeit von Hubert Ohl, Bild und Wirklichkeit. Studien zur Romankunst Raabes und Fontanes, Heidelberg 1968. 131 Vgl. dazu die zusammenfassende Darstellung der in den literarischen Diskussionen der zwanziger Jahre virulenten Grundprobleme modernen Erzählens von Karl Robert Mandelkow, Hermann Brochs Romantrilogie »Die Schlafwandler«, 2. Aufl. Heidelberg 1975, 3556.
Kapitel VII: Uneigentliche Rede
357
Das allegorische Realitätsmodell Allegorische Rede ist eine »Andersrede«, ein »diversiloquium« oder »alieniloquium«,132 das an die Stelle des 'wahren' Referenten einen 'ganz anderen' setzt. Eben damit bestreitet allegorische Rede die Geltung der geltenden Ordnung: Wenn sie - mit ihrer allegorischen Menge M A - gegen die konventionelle Ordnung der Dinge verstößt, dann geht sie, anders als symbolische Rede, davon aus, daß das, was sie zu sagen hat, in dieser Ordnung gerade nicht mehr aufbewahrt ist, gibt kund, daß sie diese Ordnung nicht mehr als sinnhafte Ordnung erkennen kann. Vielmehr verweigert sie sich ihr, indem sie konventionelle Elementbeziehungen in Frage stellt, der Zuordnung ihrer Referenten zu ihren konventionellen Mengen widerspricht, und entwirft stattdessen - mit der Bildung der allegorischen Menge M^ - eine neue Ordnung. Anders als symbolische Rede vertraut allegorische Rede offenbar nicht darauf, daß die 'wahre' Ordnung der Dinge in ihren Erscheinungen zur Anschauung kommt, denn anders läßt sich ihr Verfahren nicht begründen. Wenn sie, um ihren 'wahren' Referenten zu bezeichnen, einen 'ganz anderen' Referenten braucht, dann heißt das, daß sie nicht mehr davon ausgeht, daß die Erscheinung ihres 'wahren' Referenten dessen 'wahren' Sinn enthüllt. Damit ist die Geltungsfähigkeit der Erscheinungswelt als Erfahrungswelt des Subjekts, deren 'wahre' Ordnung sich in der Anschauung ihrer Erscheinungen erschließt, grundsätzlich in Zweifel gezogen: Allegorische Rede, im Kino zumal, gibt kund, daß die Ordnung der Welt nicht in ihren Erscheinungen zu haben ist, daß die Erscheinungen diese Ordnung nicht ent-, sondern vielmehr gerade verhüllen, daß folglich die sie bezeichnenden Wörter oder Bilder, eben weil sie nur die Erscheinungen erfassen, Welt 'falsch' abbilden, weshalb sie auch nur noch als »alieniloquium« taugen, als Andersrede, die die 'wahren' Referenten notwendig 'falsch' bezeichnet. Allegorische Rede bestreitet demnach, worauf symbolische Rede vertraut, negiert die Vermittelbarkeit von Ich und Welt, destruiert die Versöhnung von Subjekt und Objekt, die symbolische Rede, indem sie die Unmittelbarkeit der Anschauung als immer noch gültiges Prinzip der Welterfahrung anerkennt, betreibt. Allegorische Rede negiert damit zugleich, worauf symbolische Rede besteht, bestreitet die Fähigkeit der Kunst, das Ganze im Teil gültig erfassen zu können. Sie verwirft die Idee einer symbolischen Repräsentativität der Teile und damit, im Kino zumal, den Erkenntniswert der angeschauten Realität, die das Kameraauge wahrnimmt. Filmische Allegorie erweist sich in dieser Perspektive als Konsequenz eines veränderten Konzepts realistischen Erzählens, als Konsequenz eines Reali132 Vgl. KURZ 1982, 30.
358
Kapitel VII: Uneigentliche Rede
tätsmodells, das den Oberflächenzusammenhang, den das filmische Bild liefert, als Scheinzusammenhang verwirft, dessen Reproduktion als Prinzip erzählerischer Weltaneignung nicht mehr begründbar ist, weil sie, indem sie »die Fassade reproduziert, nur dieser bei ihrem Täuschungsgeschäfte hilft«, wie Adorno mit Blick auf den realistischen Roman befand. 133 Wo die Destruktion des Oberflächenzusammenhangs, den das filmische Bild liefert, der Versuch, »die dem Film durch zuviel Anschauung anhaftende Oberflächengenauigkeit wieder zu zerstören«,134 zum Programm wird, ist die Allegorie in ihre Rechte eingesetzt: Als Verfahren filmischer Rede, die die Welt der Erscheinungen, die das Kameraauge wahrnimmt, nurmehr als »alieniloquium« benutzt, mit dem das 'ganz andere', das, was die angeschaute Wirklichkeit gerade nicht mehr preisgibt, filmisch zur Darstellung kommen soll, weist sie diesem Programm eines filmischen Realismus, der die 'wahre' Ordnung der Dinge in der Anschauung ihrer Erscheinungen anzutreffen keine Möglichkeit mehr sieht, einen denkbaren Weg zu seiner Realisierung. Daß dieses Programm so recht erst in den sechziger Jahren zur Entfaltung kam, in der »Nouvelle vague« und in der Bundesrepublik bei den führenden Vertretern des sog. Autorenfilms (Kluge, Reitz, Straub u.a.), verweist abermals auf die Verspätung, mit der das Kino auf Erzählprobleme der Moderne reagierte. Es wäre aber wohl voreilig, daraus den Schluß zu ziehen, symbolische Rede sei eine antiquierte filmische Redeweise und deshalb nurmehr als filmhistorisches Phänomen von Interesse: Daß führende Vertreter gerade des Autorenfilms in den siebziger und achtziger Jahren wieder auf symbolische Redeformen zurückgreifen, so etwa Edgar Reitz in »Die Reise nach Wien« (1973) und vor allem in »Heimat« (1984), ist kein Indiz für eine Rückkehr zum »Unterhaltungskino relativ konservativen Zuschnitts«,135 wie Kritik und Filmgeschichtsschreibung meinten feststellen zu können, sondern verweist vielmehr darauf, daß das symbolische Realitätsmodell auch im Horizont moderner Wirklichkeitserfahrung neu und durchaus plausibel begründet werden kann.136 133 Theodor W. Adorno, Form und Gebalt des zeitgenössischen Romans, in: Akzente 1 (1954), H. 5, 410-416, hier 412. 134 REITZ/KLUGE/REINKE 1 9 8 0 , 13f. 135 GREGOR 1 9 8 3 , B d . 3, 1 3 1 .
136 in »Heimat« wird das Entfremdungstheorem, das die Ästhetik des Autorenfilms der sechziger Jahre nachhaltig prägte, entschieden relativiert: Die Alltagserfahrung des Subjekts und das mit ihr korrelierende Stilprinzip eines von »Respekt vor den Dingen« (Reitz) geleiteten filmischen Realismus der alltäglichen Wahrnehmung werden hier zum Garanten dafür, daß die Vermittlung von Ich und Welt doch und immer noch authentisch möglich ist. Deshalb gewinnt die Welt der Dinge hier im Medium der subjektiven Alltagserfahrung ihre Dignität als nicht-entfremdete Wirklichkeit, als Lebenszusammenhang des Subjekts zurück. An die Stelle eines Programms, das diesen Lebenszusammenhang als Scheintotalität entlarven will, tritt hier ein - deutlich vom geschichtswissenschaftlichen Paradig-
Kapitel VII: Uneigentliche Rede
359
D. Formen II: Vergleichende Rede im Film Über den Vergleich, der sich im Film in Formen der systematischen Montage realisiert, wurde bereits im Kapitel über die Montage gehandelt (vgl. III. D. 2). Deshalb wird es hier nur noch darum gehen, die dort nur angedeutete Kategorisierung des Vergleichs als metalogische Rede zu begründen und seine Formen zu charakterisieren.
1.
Die metalogische Struktur filmischer Vergleiche
Die systematische Montage ist, so hieß es oben (S. 181), ein im Vergleich zur Sprache höchst umständliches Verfahren, mit bildlichen Mitteln Begriffe zu bilden, genauer: den Zuschauer zur Bildung von Begriffen oder, wie hier jetzt gesagt werden kann, zur Bildung von Mengen zu veranlassen: Die Parallelmontage verlangt die Zuordnung der nacheinander dargestellten Sachverhalte zu einer gemeinsamen Menge von Sachverhalten, die Kontrastmontage verlangt die Zuordnung der nacheinander dargestellten Sachverhalte zu zwei einander ausschließenden, also disjunkten Mengen von Sachverhalten. Auf dieser Grundlage können die Bilder dann als partielle »Synonyme« oder als »Antonyme« aufeinander bezogen werden (vgl. S. 181): Die uneigentlichen Bedeutungen dieser Bildkombinationen sind entweder die so gebildeten »Begriffe« selbst oder aber bestimmte, über diese Mengenbildungen legitimierte »Prädikationen« des einen Bildes durch ein Merkmal des anderen (vgl. S. 186).
Der metalogische 'Fehler' filmischer Vergleiche Diese Impropria, diese »Begriffe« oder »Prädikate« stehen aber nicht in den Bildern zu lesen, existieren vielmehr nur im Bewußtsein des Rezipienten, kommen ikonisch nicht zur Erscheinung (vgl. S. 181): Die Erschießungsszenen in Eisensteins »Streik« (vgl. S. 142, 180, 185f.) reden weder von »Abschlachten« noch von »Schlachtvieh« und die Schlachtszenen weder von »Erschießen« noch von »Arbeitern«, denn vergleichende Bilderrede kann nur ma der Alltagsgeschichte und »oral history« beeinfluBtes - Konzept, das diesem Lebenszusammenhang auch da, wo er verzerrte, falsche Perspektiven auf Wirklichkeit begründet, in sein Recht einsetzen will, ohne diese Perspektiven damit schon zu legitimieren, das vielmehr einen Weg findet, die Verzerrung freizulegen, ohne das Subjekt, das ihr erliegt, zu denunzieren. Daß unter diesen Voraussetzungen eine der »subjektiven Symbolik« des poetischen Realismus Fontanescher Prägung (vgl. Anm. 130) vergleichbare filmische Symbolik als Darstellungsverfahren benutzt und legitimiert werden kann, ist denn auch nicht verwunderlich.
360
Kapitel VII: Uneigentliche Rede
von dem einen und dem anderen, nicht von dem einen als dem anderen reden. Das »Prädikat«, das die Erschießung der Arbeiter als »Abschlachtung« qualifiziert, wird erst vom Rezipienten gebildet. Auch hier wird also die gemeinte Sache nicht in den Bildern selbst formuliert, und deshalb sind auch hier die Bilder 'falsch' insofern, als sie das Gemeinte 'falsch' bezeichnen. Eben deshalb sind filmische Vergleiche als Formen metalogischer Rede zu klassifizieren, als Redeformen die auf einer 'fehlerhaften' Zuordnung von Zeichen und 'wahren' Referenten beruhen. 137 Metalogische Form- und Sinnsignale Vergleichende Bilderrede kann nur von dem einen und dem anderen, nicht von dem einen als dem anderen reden, kann daher den Betrachter nur dazu anstiften, das 'und' in ein 'als' (oder 'wie') umzuwandeln. Das geschieht durch ein metalogisches Formsignal, das hier immer dasselbe ist, nämlich der Wechsel vom narrativen zum systematischen Textschema: Die systematische Montage erzeugt, indem sie eine handlungslogisch sinnlose Verbindung herstellt (vgl. S. 180), Sinndefizite, die den Rezipienten zur Suche nach einem anderen als narrativen Sinn der Bilder anstiften, der sich dann über die vergleichenden Operationen erschließt. Um diese vergleichenden Operationen zu steuern, muß der Text metalogische Sinnsignale vergeben, die den Rezipienten anweisen, unter welchem Aspekt er die Bilder vergleichen, welche Merkmale der nacheinander dargestellten Sachverhalte er als tertium comparationis betrachten soll. Diese Hinweise werden über jene formalen und thematischen Rekurrenzen (vgl. S. 143f.) vergeben, von denen schon die Rede war und deren Funktion als visuelle Vergleichsparameter, die den Rezipienten bei der Auffindung des richtigen tertium comparationis steuern, bereits an Beispielen demonstriert wurde (vgl. S. 180). Die Unnabhängigkeit filmischer Vergleiche von Praetexten und Konventionen Anders als filmische Allegorien und Symbole initiieren filmische Vergleiche die vom Rezipienten zu vollziehenden mengenbildenden Operation dadurch, daß sie sämtliche Comparando ins Bild setzen: Während Allegorien und Symbole jeweils nur ein Element der zu bildenden Menge (M^ bzw. M§), eben ihre 'falschen' Referenten zeigen, aus denen die 'wahren' Referenten dann erschlossen werden müssen, liefern Vergleiche das gesamte (aus mindestens •37 DUBOIS et.al. 1974 rechnen Vergleiche zu den Metasememen (vgl. 187-194), gestehen aber zu, daß sie immer dann als Metalogismen anzusprechen sind, wenn sie »nicht gegen den lexikalischen Kode verstoßen« (187). Warum sie dem Vergleich dennoch keinen Platz in ihrer Systematik der Metalogismen einräumen, bleibt unklar.
Kapitel VII: Uneigentliche Rede
361
zwei Bildern bestehende) Vergleichsmaterial. Das heißt: Anders als Allegorien und Symbole sind filmische Vergleiche nicht auf Praetexte angewiesen.13* Das heißt dann auch, daß sie aus jener Bindung an konventionelle Mengenbildungen, die Allegorie und Symbol zur Voraussetzung haben, im Prinzip entlassen sind: Sie sind nicht auf Konventionen angewiesen, eben weil sie den Prozeß der Mengenbildung je aktuell und neu initiieren können. Aus dieser Sicht erscheint die Bestimmung der vergleichenden Montage als Verfahren der Begriffsbildung denn auch als zu eng, zumindest dann, wenn man dieses Verfahren auf die »Nachbildung« schon vorhandener Begriffe beschränkt: Filmische Vergleiche sind offenbar auch in der Lage, neue Mengen, innovative Begriffe zu bilden. Die einzige Bedingung für das Gelingen vergleichender Sprechakte im Film ist demnach die hinreichend deutliche, von den metalogischen Sinnsignalen, den thematischen bzw. formalen Rekurrenzen, zu leistende Markierung des mengenbildenden Merkmals.
2.
Formen vergleichender Rede
Die durch Vergleiche initiierten Mengenbildungen haben zwei durchaus unterschiedliche Funktionen, die hier das Kriterium der formalen Klassifikation liefern: Wie schon angedeutet, kann sich die Funktion vergleichender Rede zum einen in den über den Vergleich der Bilder initiierten Mengenbildungen selbst, in dem dadurch entstehenden Begriff erschöpfen, zum anderen kann sie diese Mengenbildungen zur Grundlage einer Art bildlicher »Prädikation« machen, indem Merkmale des einen Comparandum als Prädikate des anderen in Funktion gesetzt werden. Die erste Form nenne ich symbolische Vergleiche, die zweite Form allegorische Vergleiche. Symbolische Vergleiche Bei symbolischen Vergleichen soll der Rezipient die Bilder aufgrund eines tertium comparationis, eines oder mehrerer gemeinsamer Merkmale einer Menge zuordnen und so die referierten Sachverhalte auf einen »Begriff« bringen, der dann das Improprium darstellt. Die weiter oben ausführlicher untersuchte Schlußsequenz aus Eisensteins »Panzerkreuzer Potemkin«, in der die Angriffsfahrt der »Potemkin« gegen das zaristische Geschwader erzählt wird 138 Allegorische Vergleiche liefern ihre 'wahren' Referenten immer schon mit (s.u.), und symbolische Vergleiche gehen gewissermaßen hinter ihre Praetexte zurück, indem sie ihre Rezipienten in die Situation zurückversetzen, die der Bildung von (symbolischen) Praetexten vorausliegt, versetzen ihn nämlich in die Lage, die Abstiaktionsarbeit, die der (symbolischen) Begriffsbildung zugrunde liegt, die Aufdeckung von Ähnlichkeiten und Analogiebeziehungen zwischen den Dingen, noch einmal neu zu vollziehen.
362
Kapitel VII: UnägentUche Rede
(vgl. S. 182-185), gehört hierher: Alle Einzelbilder evozieren, indem sie sämtlich die vorwärtsdrängende Kraft des Schiffes thematisieren, einen Begriff revolutionärer Entschlossenheit und revolutionären Fortschritts, und eben dieser Begriff ist das symbolische Improprium, das den erzählten Vorgang, dem die Bilder entnommen sind, charakterisiert. Es kommt hier also zu einer der symbolischen Mengenbildung (M$) entsprechenden Bedeutungskonstitution insofern, als es auch hier darum geht, ein Allgemeines als den 'wahren' Referenten der Rede zu identifizieren. Der metalogische 'Fehler' liegt hier denn auch - wie beim Symbol - allein darin, daß keines der Bilder den 'wahren' Referenten, das Allgemeine selbst, zu bezeichnen in der Lage ist, weil sämtliche Bilder besondere Sachverhalte zeigen. Darstellungstechnisch unterscheidet sich dieses Verfahren von dem des Symbols dadurch, daß es nicht nur ein, sondern viele Elemente der zu bildenden Menge präsentiert und folglich, weil der Rezipient auf diese Weise Gelegenheit hat, den jeder Mengenbildung zugrundeliegenden Vergleich selbst aktuell durchzuführen, auch nicht mehr auf konventionelle Mengen angewiesen ist. Gerade weil dieses Verfahren aber von der Voraussetzung ausgeht, daß das Allgemeine aus dem Besonderen, die symbolische Menge aus ihren einzelnen Elementen abgeleitet werden kann, daß mithin der »Sinn« der Einzeldinge an ihnen selbst zur Anschauung kommt, ist die Beziehung zwischen Symbolen und symbolischen Vergleichen auch mehr als eine nur formale. Denn beide vertrauen auf Sinnimmanenz: Hier wie dort wird der Sinn der Dinge aus einer Elementbeziehung abgeleitet, und hier wie dort wird diese Elementbeziehung als ein in der Anschauung der Einzeldinge erfahrbarer Sinn ausgewiesen (vgl. Kap. C.5). Allegorische Vergleiche Bei allegorischen Vergleichen wird die Mengenbildung zur Voraussetzung »prädikativer« Akte, die Merkmale des einen Comparandum auf das andere als dessen Prädikate anwenden. Hierher gehören die meisten der schon erwähnten Beispiele systematischer Montage, etwa die Schlachtszenen aus Eisensteins »Streik« (vgl. S. 142, 180, 185f.), die Digression in »Panzerkreuzer Potemkin«, die Löwenbilder (vgl. S. 187), oder auch der Vergleich einer zur Arbeit hetzenden Menschenmenge mit einer Schafherde am Beginn von Chaplins »Modern Times« (vgl. S. 143, 180, 185f.). Die über ein tertium comparationis (töten, erwachen, gehetzt werden) in Gang gesetzte Zuordnung beider Comparanda zu einer gemeinsamen Menge eröffnet jenes »Vergleichsfeld«, das auch bei der Allegorie entsteht und das die Verwendung von Merkmalen des einen Bildes als Prädikaten des anderen legitimiert: Die Erschießung der Streikenden soll als »Abschlachtung«, der Angriff der »Potemkin« auf den Sitz
Kapitel VII: Unágentliche Rede
363
des zaristischen Generalstabs in Odessa als »Erwachen« einer ungeheuren Kraft (des »Löwenmuts« des Volkes), und die zur Arbeit hetzenden Menschenmassen sollen als fremdbestimmte, »von fremder Hand getriebene Herde« gelesen werden. Die Beispiele machen deutlich, daß der Begriff des 'wahren' Referenten hier präzisiert werden muß. Denn hier tritt der Fall ein, daß der 'wahre' Referent, das also, worauf Bezug genommen wird, sehr wohl im Bild erscheint (die Erschießung der Arbeiter, der Angriff der »Potemkin«, die zur Arbeit hastenden Menschenmassen) und nurmehr dessen Prädikation, das, was über ihn ausgesagt werden soll, 'falsch' ist, indem es auf einen 'falschen' Referenten (Schlachtvieh, Löwenstatuen, Schafherde) bezogen wird. Wie bei der Allegorie geht es auch hier um die Relationierung individueller Sachverhalte, und hier wie dort legitimiert die Mengenbildung einen prädikativen Akt: Wie die Menge M A in Werner Fincks allegorischem »Gang durch die Kuhherde« die Prädikation der Nationalsozialisten als von tierischen Verhaltensnormen geleitete Menschen legitimiert, so legitimiert die Mengenbildung in Eisensteins »Streik« die Prädikation der Erschießung der Streikenden als Abschlachtung unschuldiger Menschen. Der Unterschied zur Allegorie besteht darin, daß die 'wahren' Referenten hier nicht »verheimlicht« werden, also nicht, wie bei der Allegorie, aus den Prädikaten der 'falschen' Referenten (Kuhherde) erst erschlossen werden müssen. Den metalogischen 'Fehler' begehen allegorische Vergleiche also nur insofern, als sie die Prädikate auf die 'falschen' Referenten (Schlachtvieh) beziehen. Wie bei symbolischen Vergleichen ist auch die Beziehung zwischen Allegorien und allegorischen Vergleichen keine nur formale, denn hier wie dort ist der Rekurs auf Merkmale eines 'falschen' Referenten und deren Verwendung als Prädikaten der 'wahren' Referenten Ausdruck nicht einfach bloß der Schwierigkeiten des Bildmediums, auf visuellem Wege Prädikationen zu vollziehen, sondern vielmehr des Verlusts eines auf Sinnimmanenz vertrauenden Realitätsmodells (vgl. Kap. C.5).
Literatur ÄHREN, YIZHAK/CHRISTOPH MELCHERS (1979): Zur Psychologie des Propagandafilms. Film und Beeinflussung am Beispiel »Jud Süß«, in: medium 9 (1979), H. 4, 29-35. ALBERSMEIER, FRANZ-JOSEF (1979) (Hrsg.): Texte zur Theorie des Films, Stuttgart 1979. ALDRICH, v.C. (1983): Visuelle Metapher (1968), in: HAVERKAMP 1983, 142-162. APEL, KARL-OTTO (1976): Transformationen der Philosophie (zuerst 1973), 2 Bde., Frankfurt 1976 (stw 164/165). ARGYLE, MICHAEL (1972): Soziale Interaktion, Köln 1972. ARNHEIM, RUDOLF (1979): Film als Kunst (zuerst Hamburg 1932), Frankfurt/M. 1979 (Fischer TB 3656). BALAZS, BELA (1980): Der Film. Werden und Wesen einer neuen Kunst (dt. zuerst 1949), 6., erw. Neuausgabe Wien 1980. - (1982a): Schriften zum Film, Bd. 1 (Der sichtbare Mensch, 1924; Kritiken und Aufsätze 1922-1926), hg. v. Helmut H. Diederichs, Wolfgang Gersch u. Magda Nagy, München 1982. - (1982b): Schriften zum Film, Bd. 2 (Der Geist des Films, 1930; Artikel und Aufsätze 1926-1931), hg. v. Helmut H. Diederichs, Wolfgang Gersch u. Magda Nagy, München 1982. - (1982c): Zur Kunstphilosophie des Films (zuerst 1938), in: WITTE 1982, 149-170. BARTHES, ROLAND (1969): Rhetorik des Bildes (frz. zuerst 1964). dt. Übers, (gekürzt) in: SCHIWY 1969, 158-166.
BAWDEN, LIZ-ANNE (1981) (Hrsg.): Filmlexikon (engl, zuerst 1976 u.d.T. »The Oxford Companion to Film«), dt. Ausgabe hg. v. Wolfram Tichy, 6 Bde., 3. Aufl. Reinbek b. Hamburg 1981 (rororo handbuch 6228-6233). BAZIN, ANDRE (1945): Ontologie des fotografischen Bildes (frz. zuerst 1945), in: BAZIN 1975, 21-27. - (1948): Der kinematografische Realismus und die italienische Schule der Befreiung (frz. zuerst 1948), in: BAZIN 1975, 130-155. - (1950-55): Die Entwicklung der kinematografischen Sprache (frz. zuerst 1950-55), in: BAZIN 1975, 28-44. - (1951): Theater und Kino I/II (frz. zuerst 1951), in: BAZIN 1975, 68-110. - (1975): Was ist Kino? Bausteine zur Theorie des Films [dt. Auswahl aus: A.B., Qu'est-ce que le cinéma, Paris 1958-62], hg. v. Hartmut Bitomsky, Harun Farocki u. Ekkehard Kaemmerling, Köln 1975. BEARDS LEY, MONROE c. (1983): Die metaphorische Verdrehung (1962), in: HAVERKAMP 1983, 120-141. BECKER, WOLFGANG/NORBERT SCHOELL (1980): Methoden und Praxis der Filmanalyse, Leverkusen 1980. BEILENHOFF, WOLFGANG (1974) (Hrsg.): Poetik des Films. Deutsche Erstausgabe der filmtheoretischen Texte der russischen Formalisten, München 1974. BENTELE, GÜNTER (1980): Filmsemiotik in der Bundesrepublik Deutschland, in: Zeitschr. f. Semiotik 2 (1980), 119-138. - (1981) (Hrsg.): Semiotik und Massenmedien, München 1981. BENTELE, GÜNTER/ERNEST w. B. HESS-LÜTTICH (1985) (Hrsg.): Zeichengebrauch in den
Massenmedien. Zum Verhältnis von sprachlicher und nichtsprachlicher Information in Hörfunk, Film und Fernsehen, Tübingen 1985 (Medien in Forschung + Unterricht, Serie A, Bd. 17).
366
Literatur
BIRDWHISTELL, RAY L. (1952): Introduction to Kinesics, Washington 1952. - (1970): Kinesics and Context. Essay on Body Motion, Philadelphia 1970. - (1979): Kinesik, in: SCHERER/WALLBOTT 1979, 192-202. BITOMSKY, HARTMUT (1972): Die Röte des Rots von Technicolor. Kinorealität und Produktionswirklichkeit, Darmstadt/Neuwied 1972. BLACK, MAX (1983): Die Metapher (1954), in: HAVERKAMP 1983, 55-79. BLUMENBERG, HANS (I960): Paradigmen zu einer Metaphorologie, in: Archiv für Begriffsgeschichte 6 (1960), 7-142. - Gekürzter Wiederabdr. in: HAVERKAMP 1983, 285-315. BLUMENSATH, HEINZ (1972) (Hrsg.): Strukturalismus in der Literaturwissenschaft, Köln 1972. BONJTZER, PASCAL (1971): Le gros orteil, in: Cahiers du Cinéma 232 (1971), 14-23. BORSO-BORGARELLO, VITTORIA (1984a): Metapher und Wirklichkeit im Roman, in: K. Oehler (Hrsg.), Zeichen und Realität, Tübingen 1984, 453-467. - (1984b): Uccellacci e Uccellini: Eine poetische Metapher, in: H. Wetzel (Hrsg.), Pier Paolo Pasolini, MANA 2 (1984), 87-102. - (1985): Die Metapher: Erfahrungs- und Erkenntnismittel, Tübingen 1985. - (1986): Metaphorische Verfahren in Literatur und Film, in: KLOEPFER/MÖLLER 1986, 183208. BRANIGAN, EDWARD (1975): Formal Permutations of the Point-of-View Shot, in: Screen 16 (1975), H. 3, 54-64. BREMOND, CLAUDE (1964): Le message narratif, in: Communications 4 (1964), 4-32. - (1966): La logique des possibles narratifs, in: Communications 8 (1966), 60-76. - (1970): Morphology of the French folktale, in: Semiotica 2 (1970), 247-276. - (1973): Logique du récit, Paris 1973. BRINCKMANN, CHRISTINE N. (1986): Der voice-over als subjektivierende Erzählstruktur des Film noir, in: KLOEPFER/MÖLLER 1986, 101-118. BÜHLER, KARL (1934): Sprachtheorie. Zur Darstellungsfunktion der Sprache, Jena 1934 (Neudruck: Stuttgart 1982). - (1968): Ausdruckstheorie (zuerst 1933), 2. Aufl. Stuttgart 1968. BUGENTAL, DAPHNE E./JAQUES w . KASWAN/LEONORE R. LOVE ( 1 9 7 9 ) : D i e W a h r n e h m u n g
von Mitteilungen mit Widersprüchen zwischen verbalen und nichtverbalen Komponenten, in: SCHERER/WALLBOTT 1979, 256-270.
BUSELMEIER, MICHAEL (1974) (Hrsg.): Das glückliche Bewußtsein. Anleitung zur materialistischen Medienkritik, Darmstadt/Neuwied 1974. BUSSMANN, HADUMOD (1983): Lexikon der Sprachwissenschaft, Stuttgart 1983 (Kröners TB 452). COHEN, L. JONATHAN (1980): Sprechakte (zuerst 1974), in: KUSSMAUL 1980, 9-52. COHEN-SEAT, GILBERT (1962): Film und Philosophie (frz. zuerst 1946; dt. Ausg. der 2. Aufl. Paris 1958) Gütersloh 1962 (Neue Beiträge zur Film- und Fernsehforschung, hg. v. E. Feldmann, Bd. 1). COHN, DORRIT (1966): Narrated Monologue: Definition of a Fictional Style, in: Comparative Literature 18 (1966), 97-112. - (1969): Erlebte Rede im Ich-Roman, in: GRM 19 (1969), 303-313. DADEK, WALTER (1968): Das Filmmedium. Zur Begründung einer allgemeinen Filmtheorie, München/Basel 1968. DENZER, KURT (1985): Charakteristische Merkmale der NS-Filmdramaturgie, in: Lebende Bilder. Aufsätze zur Medienpädagogik, hg. v. Klaus-Ove Kahrmann und Ulrich Ehlers, Scheersberg 1985, 112-126. DUK, TEUN A. VAN (1972): Some Aspects of Text Grammar, Den Haag 1972.
Literatur
367
- (1980): Textwissenschaft. Eine interdisziplinäre Einführung (zuerst 1978), München 1980 (dtv Wissenschaft 4364). DOLOZEL, LUBOMIR (1972): Die Typologie des Erzählers: 'Erzählsituationen' ('Point of View') in der Dichtung, in: Literaturwissenschaft und Linguistik, hg. v. Jens Ihwe, Frankfurt 1972, Bd. 3, 376-392. DUBOIS, JACQUES ET.AL. (1974): Allgemeine Rhetorik, übers, v. Armin Schütz, München 1974 (UTB 128). ECO, UMBERTO (1971): Die Gliederung des filmischen Code, in: KNILLI 1971, 70-93. - (1972): Einfuhrung in die Semiotik (ital. zuerst 1968), München 1972 (UTB 105). EDER, KLAUS/ALEXANDER KLUGE (1980) (Hrsg.): Ulmer Dramaturgien. Reibungsverluste, München 1980 (Arbeitshefte Film 2/3). EFRON, DAVID (1972): Gesture, Race, and Culture (zuerst New York 1941), Den Haag 1972. EIBL-EIBESFELDT, IRENAUS (1972): Grundriß der vergleichenden Verhaltensforschung, 3. Aufl. München 1972. - (1984): Der vorprogrammierte Mensch. Das Ererbte als bestimmender Faktor im menschlichen Verhalten (zuerst 1973), 5. Aufl. München 1984. - (1985): Liebe und Haß. Zur Naturgeschichte elementarer Verhaltensweisen (zuerst 1970), 12. Aufl. München 1985. EISENSTEIN, SERGEJ M. (1926): Béla vergißt die Schere (zuerst 1926), in: EISENSTEIN 1973, 134-141. - (1934): »E!« Zur Reinheit der Kinosprache (zuerst 1934), in: ALBERSMEIER 1979, 58-72. - (1939): Montage 1938 (russ. zuerst 1939), in: S.M.E.: Gesammelte Aufsätze I, Zürich O.J., 229-280. - (1973): Schriften 2. Panzerkreuzer Potemkin, hg. v. Hans-Joachim Schlegel, München 1973. - (1974): Schriften 1. Streik, hg. v. Hans-Joachim Schlegel, München 1974. EISENSTEIN, SERGEJ M./ w.i. PUDOWKIN/G.W. ALEXANDROW (1928): Manifest zum Tonfilm
(zuerst 1928), in: ALBERSMEIER 1979, 42-45. EJCHENBAUM, BORIS (1927): Probleme der Filmstilistik (zuerst 1927), in: BEILENHOFF 1974, 12-39. EKMAN, PAUL (1979): Zur kulturellen Universalität des emotionalen Gesichtsausdrucks, in: SCHERER/WALLBOTT 1979, 50-58.
EKMAN, PAUL/WALLACE V. FRIESEN (1969): The Repertoire of Nonverbal Behavior: Categories, Origins, Usage, and Coding, in: Semiotica 1 (1969), 49-98. - (1975): Unmasking the Face, Englewood Cliffs 1975. - (1979): Handbewegungen, in: SCHERER/WALLBOTT 1979, 108-123. EKMAN, PAUL/WALLACE v . FRIES EN/PHOEBE c . ELLSWORTH ( 1 9 7 4 ) : G e s i c h t s s p r a c h e , W i e n -
Köln-Graz 1974. ELLING, ELMAR (1984): Zum Begriff des ¡konischen Zeichens bei Charles Sanders Pierce, in: Die Einstellung als Größe einer Filmsemiotik (zuerst 1978), 3. Aufl. Münster 1984 (papmaks 7), 31-43. ELLING, ELMAR/KARL-DŒTMAR MÖLLER (1985) (Hrsg.): Untersuchungen zur Syntax des Films II. Alternation/Parallelmontage, Münster 1985 (papmaks 13). FAULSTICH, WERNER (1980): Einführung indie Filmanalyse, 3. Aufl., Tübingen 1980. FAULSTICH, WERNER u n d INGEBORG FAULSTICH ( 1 9 7 7 ) : M o d e l l e d e r F i l m a n a l y s e , M ü n c h e n 1977.
FISCHER-LICHTE, ERIKA (1983): Semiotik des Theaters. Eine Einführung, 3 Bde., Tübingen 1983. FRANK, MANFRED (1977): Das individuelle Allgemeine. Textstrukturierung und -interpretation nach Schleiermacher, Frankfurt 1977.
368
Literatur
- (1982): Textauslegung, in: Erkenntnis der Literatur. Theorien, Konzepte, Methoden der Literaturwissenschaft, hg. v. Dietrich Harth/Peter Gebhardt, Stuttgart 1982, 123-160. FRASER, BRUCE (1980): Wie läßt sich die Illokutionskraft von Sätzen erklären? (zuerst 1973), in: KUSSMAUL 1980, 53-81.
FÜGER, WILHELM (1972): Zur Tiefenstruktur des Narrativen. Prolegomena zu einer generativen 'Grammatik' des Erzählens, in: Poetica 5 (1972), 268-292. GOFFMAN, ERVING (1971): Verhalten in sozialen Situationen. Strukturen von Regeln der Interaktion im öffentlichen Raum, Gütersloh 1971. - (1986): Interaktionsrituale. Über Verhalten in direkter Kommunikation, Frankfurt/M. 1986 (stw 594). GRAF, GERHARD (1985): Komplementäre Zeichen zur Interaktion von verbalem und nonverbalem Verhalten im Fernsehen, in: BENTELE/HESS-LÜTTICH 1985, 67-92. GREGOR, UUUCH/ENNO PATALAS (1980): Geschichte des Films, Bd. 1-2 (1895-1960), Reinbek b. Hamburg 1980 (rororo handbuch 6193-6194). GREGOR, ULRICH (1983): Geschichte des Films, Bd. 3-4 (ab 1960), Reinbek b. Hamburg 1983 (rororo handbuch 6293-6294). GREIMAS, ALGIRDAS J. (1970): Strukturale Semantik (zuerst 1966), Braunschweig 1970. - (1972): Elemente einer narrativen Grammatik, in: BLUMENSATH 1972, 47-67. GUMBRECHT, HANS ULRICH (1977): Fiktion und Nicht-Fiktion, in: H. Brackert/E. Lämmert (Hrsg.), Funk-Kolleg Literatur, Bd. 1, Frankfurt 1977, 188-209. HAGEMANN, WALTER (1952): Der Film. Wesen und Gestalt, Heidelberg 1952. HALL, EDWARD τ. (1959): The Silent Language, New York 1959 - (1966): The Hidden Dimension, New York 1966. HAMBURGER, KÄTE (1956): Zur Phänomenologie des Films, in: Merkur X (1956), H. 9, 873880. - (1965): Noch einmal: Vom Erzählen, in: Euphorion 59 (1965), 46-71. - (1968): Die Logik der Dichtung, 2. veränd. Aufl. Stuttgart 1968. HARTH, DIETRICH/GERHARD VOM HOFE (1982): Unmaßgebliche Vorstellung einiger literaturtheoretischer Grundbegriffe, in: Erkenntnis der Literatur. Theorien, Konzepte, Methoden der Literaturwissenschaft, hg. v. Dietrich Harth/Peter Gebhardt, Stuttgart 1982, 8-32. HAVERKAMP, ANSELM (1982) (Hrsg.): Theorie der Metapher, Darmstadt 1983 (WdF 389). HEKE, GEORG (1969): Suprasegmentale Analyse, Marburg 1969 (Marburger Beiträge zur Germanistik Bd. 30). HEMPFER, KLAUS w. (1973): Gattungstheorie. Information und Synthese, München 1973 (UTB 133). HERZOG, HERTA (1933): Stimme und Persönlichkeit, in: ZS f. Psychologie 130 (1933), 300369. HICKETHIER, KNUT/JOACHIM PAECH (1979) (Hrsg.): Modelle der Film- und Fernsehanalyse, Stuttgart 1979 (Didaktik der Massenkommunikation 4.) HINDELANG, GÖTZ (1983): Einführung in die Sprechakttheorie, Tübingen 1983 (Germanistische Arbeitshefte 27). HOFFMANN, HILMAR (1969): Marginalien zu einer Theorie der Filmmontage, Bochum 1969 (Bochumer Texte zur visuellen Kommunikation. 1). IROS, ERNST (1957): Wesen und Dramaturgie des Films (zuerst 1938), neue, bearb. Aufl. Zürich 1957. KAEMMERLING, EKKAT (1971): Rhetorik als Montage, in: KNILLI 1971, 94-109. KAHRMANN,
CORDULA/GUNTER
REISS/MANFRED SCHLUCHTER
(1986):
Erzähltextanalyse.
Eine Einführung, überarb. Neuausgabe Königstein (Ts.) 1986 (Athenäum TB 2184). KANDORFER, PŒRRE (1990): DuMont's Lehrbuch der Filmgestaltung. Theoretisch-technische Grundlagen der Filmkunde, 4. Aufl. Köln 1990.
Literatur
369
KANZOG, KLAUS (1980): Die Literarizität des Drehbuchs und des Filmprotokolls. Über die Aufgaben einer zukünftigen Filmphilologie, in: Akten des 6. Intern. Germanisten-Kongresses, Basel 1980, Bd. 3, S. 259-264. - (1981a): Die Standpunkte des Erzählers und der Kamera. Peter Handke und Wim Wenders: »Die Angst des Tormanns beim Elfmeter«. Point-of-view-Probleme im Film-Text und in der Text-Verfilmung, in: Erzählung und Erzählforschung im 20. Jahrhundert, hg. v. R. Kloepfer/G. Janetzke-Dillner, Stuttgart 1981, S. 15-168. - (1981b) (Hrsg.): Erzählstrukturen - Filmstrukturen. Erzählungen Heinrich von Kleists und ihre filmische Realisation, Berlin 1981. - (1989a): Konstruktivistische Probleme der Filmwahrnehmung und Filmprotokollierung, in: KORTE/FAULSTICH 1989, 20-30.
- (1989b) (Hrsg.): Der erotische Diskurs. Filmische Zeichen und Argumente, München 1989 (Diskurs Film 3). - (1991): Einfuhrung in die Filmphilologie, München 1991 (diskurs film 4). KENDON, ADAM (1979): Die Rolle des sichtbaren Verhaltens in der Organisation sozialer Interaktion, in: SCHERER/WALLBOTT 1979, 202-235. KLAUS, GEORG (1971): Wörterbuch der Kybernetik, 2 Bde, Frankfurt 1971 (Fischer Bücherei 6141-2). KLOEPFER, ROLF (1977): Zum Problem des »narrativen Kode«, in: LiLi Zeitschr. f. Literaturwiss. u. Linguistik H. 27/28 (1977), 69-90. KLOEPFER, ROLF/KARL-DIETMAR MÖLLER (1986) (Hrsg.): Narrativität in den Medien, Mannheim 1986 (papmaks 19). KNILLI, FRIEDRICH (1971) (Hrsg.): Semiotik des Films, München 1971 (Lizenzausgabe Frankfurt: Fischer Athenäum o.J.). KNILLI, FRIEDRICH/ERWIN REISS (1971): Einführung in die Film- und Fernsehanalyse. Ein
ABC für Zuschauer, Steinbach 1971. KOCH, WALTER A. (1971): Varia Semiotica, Hildesheim 1971. KÖRTE, HELMUT/WERNER FAULSTICH (1989) (Hrsg.): Filmanalyse interdiszplinär. Beiträge zu einem Symposium an der Hochschule für Bildende Künste Braunschweig, Göttingen 1989 (ZS f. Literaturwiss. u. Linguistik, Beiheft 15). KRACAUER, SIEGFRIED (1973): Theorie des Films. Die Errettung der äußeren Wirklichkeit (zuerst 1960), Frankfurt/M. 1973 (S.K., Schriften, hg. v. Karsten Witte, Bd 3). - Textund seitenidentische TB-Ausgabe Frankfurt/M. 1985 (stw 546). - (1974): Kino. Essay, Studien, Glossen zum Film, hg. v. Karsten Witte, Frankfurt/M. 1974. KREUZER, HELMUT (1977) (Hrsg.): Literaturwissenschaft - Medienwissenschaft, Heidelberg 1977. - (1979) (Hrsg.): Filmtheorie und Filmanalyse. Zeitschrift für Literaturwissenschaft u. Linguistik, Sonderheft 36, Göttingen 1979. KUCHENBUCH, THOMAS (1978): Filmanalyse. Theorien, Modelle, Kritik, Köln 1978. KURZ, GERHARD (1982): Metapher, Allegorie, Symbol, Göttingen 1982. KUSSMAUL, PAUL (1980) (Hrsg.): Sprechakttheorie, Wiesbaden 1980 (Schwerpunkte Linguistik und Kommunikationswissenschaft 17). LÄMMERT, EBERHARD (1968): Bauformen des Erzählens, 3. Aufl. Stuttgart 1968. LAUSBERG, HEINRICH (I960): Handbuch der literarischen Rhetorik, München 1960. - (1971): Elemente der literarischen Rhetorik, 4. Aufl. München 1971. LEIBFRIED, ERWIN (1970): Kritische Wissenschaft vom Text. Manipulation, Reflexion, Transparente Poetologie, Stuttgart 1970. LOTMAN, JURü M. (1977): Probleme der Kinoästhetik. Einführung in die Semiotik des Films, Frankfurt/M. 1977.
370
Literatur
LUDWIG, HANS-WERNER (1985) (Hrsg.): Arbeitsbuch Romananalyse, Darmstadt 1985. MARQUARD, ODO (1984): Frage nach der Frage, auf die die Hermeneutik die Antwort ist (zuerst 1981), in: O.M., Abschied vom Prinzipiellen, Stuttgart 1984, 117-146. MAUSS, MARCEL (1975): Die Techniken des Körpers, in: M.M., Soziologie und Anthropologie (frz. zuerst 1950), 2 Bde., Bd. 2, München 1975, 197-217. MEHRABIAN, ALBERT/JOHN Τ. FRIAR (1979): Die Übermittlung von Einstellungen durch Körperhaltung und Körperorientierung, in: SCHERER/WALLBOTT 1979, 176-185. MELCHERS, CHRISTOPH (1977): Untersuchungen zur Wirkungspsychologie nationalsozialistischer Propagandafilme, Diss. Köln 1977. METZ, CHRISTIAN (1964): Das Kino: 'Langue' oder 'Langage'? (frz. zuerst 1964), in: METZ 1972, 51-129. - (1965): Zum Realitätseindruck im Kino (frz. zuerst 1965), in: METZ 1972, 20-35. - (1966a): Bemerkungen zu einer Phänomenologie des Narrativen (frz. zuerst 1966), in: METZ 1972, 35-50.
- (1966b): Das moderne Kino und das Narrative (frz. zuerst 1966), in: METZ 1972, 238-289. - (1966c): Einige Gedanken zur Semiologie des Kinos (frz. zuerst 1966), in: METZ 1972, 130-150. - (1966/67): Probleme der Denotation im Spielfilm (frz. zuerst 1966 und 1967), in: METZ 1972, 151-198. - (1967a): Aufstellung der 'autonomen Segmente' des Films »Adieu Philippine« von Jacques Rozier (frz. zuerst 1967), in: METZ 1972, 199-231. - (1967b): Syntagmatische Analyse des Films »Adieu Philippine« von Jacques Rozier (frz. zuerst 1967), in: METZ 1972, 232-237. - (1972): Semiologie des Films, München 1972. - (1973): Sprache und Film, München 1973. MITRY, JEAN (1963): Esthétique et psychologie du cinéma. Bd. 1: Les structures, Paris 1963. - (1965): Esthétique et psychologie du cinéma. Bd. 2: Les formes, Paris 1965. MÖLLER, KARL-DIETMAR (1978): Diagrammatische Syntagmen und einfache Formen, in: Untersuchungen zur Syntax des Films I, Münster 1978 (papmaks 8), 37-82. - (1984): Schichten des Filmbildes und Ebenen des Films, in: Die Einstellung als Größe einer Filmsemiotik. Zur Ikontheorie des Filmbildes (zuerst 1978), 3. Aufl. Münster 1984 (papmaks 7), 45-90. - (1985): Zum Verhältnis von Interaktion, nonverbaler Kommunikation und Dialog im Spielfilm, in: BENTELE/HESS-LÜTTICH 1985, 303-315. - (1986): Filmsprache. Eine kritische Theoriegeschichte. Münster 1986. MONACO, JAMES (1980): Film verstehen, Hamburg 1980. MORIN, EDGAR (1958): Der Mensch und das Kino. Eine anthropologische Untersuchung (zuerst 1956), Stuttgart 1958. MUCKENHAUPT, MANFRED (1986): Text und Bild. Grundfragen der Beschreibung von TextBild-Kommunikationen aus sprachwissenschaftlicher Sicht, Tübingen 1986 (Tübinger Beiträge zur Linguistik. 271) NÖTH, WINFRIED (1985): Handbuch der Semiotik, Stuttgart 1985. PAECH, JOACHIM (1975) (Hrsg.): Film- und Fernsehsprache 1. Texte zur Entwicklung, Struktur und Analyse der Film- und Fernsehsprache, Frankfurt/Berlin/München 1975. - (Hrsg.) (1984): Methodenprobleme der Analyse verfilmter Literatur, Münster 1984 (papmaks 17). PETERS, JAN MARIE (1971): Bild und Bedeutung. Zur Semiologie des Films, in: KNILLI 1971, 56-69. - (1980): Van woord naar beeld. De vertaling van romans in film, Muiderberg 1980. - (1982): Die Struktur der Filmsprache (zuerst 1962), in: WITTE 1982, 171-186.
Literatur
371
- (1983): De ik-vertelling in de film, in: Communicatie (Leuven, Centrum voor communicatiewetenschappen), 3 (1983), 2-8. - (1984): Sprechakttheoretische Ansätze zum Vergleich Roman-Film, in: PAECH 1984, 5371. - (1986): Theorie und Praxis der Filmmontage von Griffith bis heute, in: KLOEPFER/MÖLLER 1986, 119-140. PFISTER, MANFRED (1982): Das Drama. Theorie und Analyse, 3. Aufl. München 1982. PROKOP, DŒTER (1971) (Hrsg.): Materialien zur Theorie des Films. Ästhetik - Soziologie Politik, München 1971. PUDOWKIN, WSEWOLOD 1. (1961): Filmtechnik. Filmmanuskript und Filmregie (dt. zuerst
1928), Zürich 1961. - (1979): Über die Montage (zuerst Anfang der vierziger Jahre), in: ALBERSMEŒR 1979, 7799. RAUH, REINHOLD (1984): Worte und Blicke im Film, in: Sprache im technischen Zeitalter. H. 89 (1984), 30-53. REisz, KAREL/GAVIN MILLAR (1988): Geschichte und Technik der Filmmontage (zuerst 1953), München 1988. REITZ, EDGAR/ALEXANDER KLUGE/WILFRIED REINKE (1980): Wort und Film (zuerst 1965), i n : EDER/KLUGE 1 9 8 0 , 9 - 2 7 . RICOEUR, PAUL ( 1 9 8 3 ) :
Die Metapher und das Hauptproblem der Hermeneutik (6z. zuerst
1 9 7 2 ) , i n : HAVERKAMP 1 9 8 3 , 3 5 6 - 3 7 5 .
(1977): Wirkungsanalyse des Films, Köln 1977. (1973): Communicational Structure. Analysis of a Psychotherapy Transaction, Bloomington 1973. - (1976): Körpersprache und soziale Ordnung. Kommunikation als Verhaltenskontrolle, Stuttgart 1976. - (1979): Die Bedeutung der Körperhaltung in Kommunikationssystemen, in: SCHERER/
SALBER, WILHELM SCHEFLEN,
ALBERT E.
WALLBOTT 1979, 151-175.
(1972): Non-verbale Kommunikation. Ansätze zur Beobachtung und Analyse der außersprachlichen Aspekte von Interaktionsverhalten, 2. Aufl. Hamburg 1972 (IPK-Forschungsberichte Bd. 35). - (1979a): Kommunikation, in: SCHERER/WALLBOTT 1979, 14-24. - (1979b): Die Funktionen des nonverbalen Verhaltens im Gespräch, in: SCHERER/WALLBOTT 1979, 25-32. SCHERER, KLAUS R./HARALD G. WALLBOTT (1979) (Hrsg.): Nonverbale Kommunikation: Forschungsberichte zum Interaktionsverhalten, Weinheim/Basel 1979. SCHERER, KLAUS R./HARALD G. WALLBOTT/URSULA SCHERER (1979): Methoden zur Klassifikation von Bewegungsverhalten. Ein funktionaler Ansatz, in: ZS f. Semiotik 1 (1979), 177-192. SCHIWY, GÜNTHER (1969) (Hrsg.): Der französische Strukturalismus. Mode, Methode, Ideologie, Reinbek b. Hamburg 1969 (rde 310). SCHNEIDER, HASKO (1984): Zur Theorie der Filmsprache bei Jan Marie Peters, in: Die Einstellung als Größe einer Filmsemiotik (zuerst 1978), 3. Aufl. Münster 1984 (papmaks 7), 19-30. SCHNEIDER, IRMELA (1981): Der verwandelte Text. Wege zu einer Theorie der Literaturverfilmung, Tübingen 1981 (Medien in Forschung und Unterricht. Serie A.4) SCHULZ, WINFRIED/NORBERT WALDMANN (1985): Effekte der Film-Montage. Experimentelle Überprüfung der Wechselwirkung einiger Gestaltungsmittel von AV-Medien, in: BENTELE/ SCHERER, KLAUS R.
HESS-LÜTTICH 1985, 332-348.
372
Literatur
SEARLE, JOHN R. (1971): Sprechakte. Ein sprachphilosophischer Essay (zuerst 1969), Frankfurt 1971. - (1980a): Indirekte Sprechakte (zuerst 1975), in: KUSSMAUL 1980, 127-150. - (1980b): Eine Klassifikation der Illokutionsakte (zuerst 1976), in: KUSSMAUL 1980, 82108. SIEGRIST, HANSMARTIN (1986): Textsemantik des Spielfilms. Zum Ausdruckspotential der kinematographischen Formen und Techniken, Tübingen 1986 (Medien in Forschung + Unterricht, Serie A, Bd. 19). SILBERMANN, ALPHONS/MICHAEL SCHAFF/GERHARD ADAM (1980): Filmanalyse. Grundlagen,
Didaktik, München 1980. SPRINGER, BERNHARD (1987): Narrative und optische Strukturen im Bedeutungsaufbau des Spielfilms. Methodologische Überlegungen, entwickelt am Film »Falsche Bewegung« von Peter Handke und Wim Wenders, Tübingen 1987 (Medienbibliothek, Serie B: Studien 10). STANZEL, FRANZ κ. (1982): Theorie des Erzählens, 2. Aufl. Göttingen 1982 (UTB 904). STŒRLE, KARLHEINZ (1975): Text als Handlung. Perspektiven einer systematischen Literaturwissenschaft, München 1975. - (1979a): Die Einheit des Textes, in: H. Brackert/E. Lämmert (Hrsg.), Funk-Kolleg Literatur, Bd. 1, 2. Aufl. Frankfurt/M. 1979, 168-187. - (1979b): Die Struktur narrativer Texte, in: H. Brackert/E. Lämmert (Hrsg.), Funk-Kolleg Literatur, 2. Aufl. Frankfurt/M. 1979, Bd. 1, 210-233. - (1985): Für eine Öffnung des hermeneutischen Zirkels, in: Poetica 17 (1985), 340-354. SZONDI, PETER (1970): Theorie des modernen Dramas, 7. Aufl. Frankfurt 1970 (es 27). ΤΓΓΖΜΑΝΝ, MICHAEL (1989): Strukturale Textanalyse. Theorie und Praxis der Interpretation, 2. Aufl. München 1989. TODOROV, TZVETAN (1967): Littérature et signification, Paris 1967. - (1973): Poetik, in: Einführung in den Strukturalismus (frz. zuerst 1968), hg. v. François Wahl, Frankfurt 1973 (stw 10), 105-179. TRUFFAUT, FRANÇOIS (1982): Mr. Hitchcock, wie haben Sie das gemacht? (zuerst 1966 u. d. T. »Le cinéma selon Hitchcock«), übers, ν. F. Gräfe und E. Patalas, 6. Aufl. München 1982. VERTOV, DZIGA (1922): Wir. Variante eines Manifestes (zuerst 1922), in: ALBERSMEIER 1979) 19-23. - (1923): Kinoki - Umsturz (zuerst 1923), in: ALBERSMEIER 1979, 24-38. WATSON, MICHAEL O. (1970): Proxemic Behaviour, Den Haag 1970. WEGSCHEIDER, MICHAEL (1989): Räume, Figuren und point-of-view. Zur nonverbalen Kommunikation in Nikiaus Schillings Videofilm »Die Frau ohne Körper und der Projektionist« (1984), in: KANZOG 1989b, 171-192. WEINRICH, HARALD (1963): Semantik der kühnen Metapher, in DVJS 37 (1963), 325-344. Wiederabgedr. in: HAVERKAMP 1983, 316-339. - (1967): Semantik der Metapher, in: Folia linguistica 1 (1967), 3-17. WELTE, WERNER (1974): Moderne Linguistik: Terminologie/Bibliographie, 2 Bde., München 1974. WEMBER, BERNWARD (1972): Objektiver Dokumentarfilm? Modell einer Analyse und Materialien für den Unterricht (zuerst 1971), erw. Neuausg. Berlin 1972. WITTE, KARSTEN (1982) (Hrsg.): Theorie des Kinos, 3. Aufl., Frankfurt 1982 (es 557). WOLLEN, PETER (1969): Signs and Meanings in the Cinema, London 1969. WULFF, HANS J. (1984): Zur Kritik des Bildbegriffes bei Christian Metz, in: Die Einstellung als Größe einer Filmsemiotik (zuerst 1978), 3. Aufl. Münster 1984 (papmaks 7), 9-18.